D1-kifpool

هوش مصنوعی گوگل اجسام را به‌نحو واقع‌ گرایانه وارد تصاویر می‌کند

شنبه ۲۴ آذر ۱۳۹۷ - ۱۷:۱۵
مطالعه 3 دقیقه
اخیرا پژوهشگران سیستم هوش مصنوعی (Artificial Intelligence) تازه‌ای توسعه داده‌اند که می‌تواند اجسام را به‌نحو واقع‌گرایانه و باورپذیر به تصاویر اضافه کند.
تبلیغات
D4-mci

استفاده از نرم‌افزار پس‌تولید برای قراردادن واقع‌گرایانه‌ی اشیاء در صحنه‌ها، برای کامپیوترها به‌مراتب دشوارتر از انسان‌ها است. انجام این کار نه‌تنها نیازمند تعیین مکانی مناسب برای شیء مدنظر است؛ بلکه به تلاش برای پیش‌بینی ظاهر شی‌ء در محل هدف شامل مقیاس، انسدادها، حالت، شکل و... نیز احتیاج دارد.

خوشبختانه هوش مصنوعی وعده‌ی کمک در انجام این کار را می‌دهد. در مقاله‌ای به‌نام ترکیب و جای گذاری آگاه به متن نمونه‌های شیء که هفته‌ی گذشته در کنفرانس NeurIPS 2018 پذیرفته شد، پژوهشگران در دانشگاه ملی سئول و دانشگاه کالیفرنیا در مرسد و هوش مصنوعی گوگل سیستمی را توصیف می‌کنند که قراردادن شی‌ء را درون یک تصویر به‌نحو «معنادار و هماهنگ» یا به‌عبارت‌دیگر، قانع‌کننده آموزش می‌بیند.

پروهشگران در مقاله‌ی خود می‌نویسند:

قراردادن اشیاء درون تصویر که به‌نحو معناداری با صحنه مطابق باشند، کار هیجان‌انگیز و جالب‌توجه‌ای است. این کار با بسیاری از کاربرد‌های دنیای واقعی، ازجمله ترکیب تصویر و ویرایش محتوای واقعیت افزوده و مجازی و تصادفی‌سازی دامنه به‌شدت مرتبط است. چنین مدل قرارگیری اشیایی به‌صورت بالقوه می‌تواند کاربردهای بی‌شماری از ویرایش تصویر و تجزیه‌وتحلیل صحنه را تسهیل کند.

چهارچوب دوطرفه‌ی پژوهشگران دربردارنده‌ی دو ماژول است: یکی محل قرارگیری شیء و دیگری ظاهری را تعیین می‌کند که آن شیء باید داشته باشد. این دو ماژول از شبکه‌های خصمانه‌ی مولد (GANs) یا شبکه‌های دوبخشی عصبی بهره می‌گیرند که شامل مولدهای ایجادکننده‌ی نمونه‌ها و تفکیک‌دهنده‌هایی هستند که برای تمایز بین نمونه‌های ایجادشده و نمونه‌های دنیای واقعی تلاش می‌کنند. ازآنجاکه سیستم به‌طور هم‌زمان توزیع را با‌توجه‌به تصویر قرارداده‌شده مدل‌سازی می‌کند، به هر دو ماژول امکان می‌دهد با یکدیگر ارتباط برقرار و همدیگر را بهینه‌سازی کنند.

Google’s AI

مؤلفان مقاله‌ی مذکور می‌نویسند:

مهم‌ترین ویژگی تازه و فنی این کار، ساخت شبکه‌ی عصبی آموزش‌پذیر و دوطرفه‌ای است که بتواند از توزیع مشترک خود، مکان‌ها و اشکال مناسب را برای شیء جدید نمونه‌برداری کند. نمونه‌های ترکیب‌یافته‌ی شی‌ء برای ایجاد تصاویر جدید می‌توانند به‌عنوان ورودی برای روش‌های مبتنی بر شبکه‌ی خصمانه‌ی مولد یا برای بازیابی نزدیک‌ترین بخش از مجموعه داده‌ی موجود استفاده شوند.

آن‌طورکه پژوهشگران توضیح می‌دهند، مولد در این حالت مکان مناسب را برای ایجاد پوشش‌های شیء با مقیاس‌ها و حالت‌ها و شکل‌های «معنادار و هماهنگ»، به‌ویژه چگونگی توزیع اشیاء در صحنه و نحوه‌ی قراردادن طبیعی شیء پیش‌بینی می‌کند تا اشیاء به‌عنوان بخشی از صحنه به‌نظر برسند. سیستم Artificial Intelligence به‌تدریج در مسیر آموزش، توزیع مختلفی را برای هر دسته‌بندی شی‌ء یاد می‌گیرد که در صحنه قرار دارد. برای مثال، هوش مصنوعی این حقیقت را می‌فهمد که در تصاویری از خیابان‌های شهر، مردم معمولا در پیاده‌روها و خودروها اغلب در جاده‌ها حضور دارند.

در آزمایش‌ها، مدل پژوهشگران با ورود واقع‌گرایانه‌ی اشیای شکل‌یافته عملکردی بهتری درمقایسه‌با حالت اولیه از خود نشان داد. وقتی تشخیص‌دهنده‌ی تصویر (YOLOv3) روی تصاویر ساخته‌شده‌ی هوش مصنوعی اجرا شد، می‌توانست اشیای ترکیب‌شده را شناسایی کند. در برآورد کارکنان سرویس ترک مکانیکی آمازون، به‌نحو مؤثرتر ۴۳درصد از شرکت‌کنندگان به این باور رسیدند که اشیای ساخته‌شده‌ی هوش مصنوعی واقعی هستند.

پژوهشگران در انتها می‌نویسند:

این نشان می‌دهد رویکرد ما قادر به انجام وظیفه‌ی ترکیب و ورود اشیاء است. همان‌طورکه روش ما به‌طور مشترک مکان و ظاهر اشیاء را مدل‌سازی می‌کند، برای حل دیگر مشکلات بینایی کامپیوتری نیز می‌تواند به‌کار گرفته شود. یکی از جالب‌توجه‌ترین اقدامات آتی رسیدگی به انسدادهای بین اشیاء خواهد بود.
مقاله رو دوست داشتی؟
نظرت چیه؟
تبلیغات
D5-b3IranServer
داغ‌ترین مطالب روز
ساخت اپل اکانت
آموزش ساخت اپل آیدی Apple ID رایگان (آپدیت جدید ۱۴۰۴)

ساخت اپل آیدی یکی از اقدامات اولیه پس از خرید آیفون است، در ادامه آموزش رایگان گام به گام ساخت اپل آیدی را مشاهده می‌کنید.

351
20 ساعت پیش
بهترین هارد اکسترنال های موجود در بازار ایران - تصویر اصلی
بهترین هارد و SSD اکسترنال بازار [بهار ۱۴۰۴]

تنوع زیاد هارد اکسترنال در بازار، انتخاب مدل مناسب را دشوار می‌کند. در این مقاله با بهترین هاردهای اکسترنال موجود در بازار ایران آشنا می‌شویم.

74
یک روز پیش
محاسبه درصد
چگونه درصد بگیریم؟ نحوه محاسبه درصد در چند ثانیه

از تغییر قیمت‌ها تا محاسبه‌ی تخفیف، درصدگیری نقش مهمی در زندگی روزمره دارد. در این مطلب با روش‌های دقیق محاسبه درصد آشنا می‌شوید.

31
2 روز پیش
شناسنامه جدید و شناسنامه قرمز قدیمی
راهنمای کامل تعویض شناسنامه‌‌ قدیمی در سال ۱۴۰۴

اگر هنوز شناسنامه‌‌ی قدیمی‌تان با جلد قرمز و عکس نوجوانی را عوض نکرده‌اید، این راهنما به شما کمک می‌کند تا در مدت کوتاه شناسنامه‌‌ جدید بگیرید.

31
2 روز پیش
لوگو گوگل / Google روی دیوار چوبی
آیکون G گوگل پس‌از ۱۰ سال اصلاح شد؛ نسخه جدید را ببینید

گوگل از آیکون جدید حرف G پرده‌برداری کرد و حالا با زبان طراحی هوش مصنوعی جمنای هماهنگی بیشتری دارد.

87
2 روز پیش
آنتی ویروس ویندوز
چگونه آنتی ویروس ویندوز ۱۰ را غیر فعال کنیم؟

بعضی از کاربران ویندوز به‌دنیال روش های خاموش كردن آنتي ويروس ویندوز ۱۰ هستند، زیرا این سیستم امنیتی بومی گاهی برای آن‌ها دست‌وپاگیر می‌شود.

26
یک روز پیش
بهترین تبلت های بازار ایران [بهار ۱۴۰۴]

برای خرید تبلت مناسب، نیازی نیست حتماً پول زیادی پرداخت کنید. در راهنمای خرید پیش‌ رو، بهترین تبلت‌های بازار ایران را معرفی می‌کنیم.

285
یک روز پیش
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات