D1-lg

قابلیت جدید هوش مصنوعی برای تولید تصاویر بر اساس کپشن

جمعه 11 مهر 1399 - 14:00
مطالعه 2 دقیقه
پژوهشگران مؤسسه‌ی هوش مصنوعی آلن، الگوریتمی را طراحی کردند که قادر است بر اساس توصیفی متنی، تصاویر مختلفی را تولید کند.
تبلیغات
D4-mcid4

 پژوهشگران مؤسسه‌ی هوش مصنوعی آلن (AI2)، الگوریتم یادگیری ماشینی را طراحی کردند که قادر است تنها بر اساس کپشن‌های متنی، تصاویری را تولید کند. نتایج کمی ترسناک هستند اما گامی مهم در جهت پژوهش‌های هوش مصنوعی و پردازش تصویر به شمار می‌روند. بر خلاف الگوریتم‌های دیگر یادگیری ماشین، این الگوریتم صرفا آزمایشی در جهت اثبات قابلیت‌های هوش مصنوعی است. ایده‌ی اصلی ساخت مدل بینایی کامپیوتری بود که قادر است تصاویر را بر اساس آنچه در تصویر می‌بیند کپشن‌گذاری کند یا برعکس تصاویر را بر اساس کپشن آن‌ها تولید کند.

مدل به دست‌آمده، محدودیت‌های الگوریتم‌های بینایی کامپیوتر را ثابت کرد. حتی یک کودک هم می‌تواند تصاویر را با کلمات توصیف کند یا با شنیدن کلمه‌ای تصویر آن را در ذهن خود تجسم کند؛ اما پژوهشگران مؤسسه‌ی آلن در پیاده‌سازی این فرآیند روی  مدلی به نام LXMERT به نتایج خوبی نرسیدند. این سیستم با دریافت کپشن، خروجی‌های عجیب و دور از واقعیتی را برگرداند.

پژوهشگران با اعمال تغییراتی در LXMERT مدلX-LXMERT را ساختند. با اینکه نتایج X-LXMERT کاملا منطبق با کپشن ورودی نبودند، حداقل تصاویر قابل درکی تولید کرد. با اینکه محدودیت‌ها و نتایج X-LXMERT چندان الهام بخش تحولات AI نیستند، روش ماسک‌گذاری به کار رفته در این سیستم، اولین گام مهم در آموزش عمل «جای گذاری» به هوش مصنوعی است. یکی از پیامدهای مثبت پژوهش فوق، بهبود بینایی کامپیوتر و تشخیص چهره است. به بیان دیگر هرچقدر توانایی کامپیوتر در درک مفاهیم توصیفی یک تصویر یا ویرایش تصویر افزایش پیدا کند، قادر به اعمال وظایف پیچیده‌تری روی تصاویر خواهد بود.

مقاله رو دوست داشتی؟
نظرت چیه؟

داغ‌ترین مطالب روز
نمای جلو KGM اکتیون
این شاسی‌بلند کره‌ای، تکنولوژی‌های پیشرفته و قیمت منطقی دارد

اکتیون نام باسابقه‌ای در صنعت خودروسازی است که حالا در قالب شاسی‌بلندی چشم‌نواز و پیشرفته راهی بازار می‌شود.

61
1 روز قبل
خودرو بت موبیل
پایان انتظار سه‌ساله؛ نیمار حالا مالک ماشین بتمن است!

ماشین جدید نیمار بیشتر به وسیله‌ی فیلم‌برداری شباهت دارد تا خودروی واقعی؛ اما ماجرای جذابی پشت آن نهفته است.

100
2 روز قبل
سدهای تأمین‌کننده آب شرب کشور به پایین‌ترین سطح ممکن رسیده‌اند
تهران در بدترین وضعیت آبی یک قرن اخیر؛ فقط دو هفته تا روز صفر فاصله داریم

استاد مدیریت منابع آب دانشگاه تهران هشدار داد با ادامه روند فعلی، از شهریور ماه سدهای اصلی تهران یکی پس از دیگری از دست خواهند رفت.

213
1 روز قبل
نمای سه‌چهارم جلو جنگنده‌ی F-35
حداکثر سرعت جنگنده F-35 چقدر است؟

F-35، جنگنده‌ی پیشرفته‌ی نسل پنجمی، توان عملیاتی چشمگیری دارد. حداکثر سرعت این جنگنده چقدر است؟

169
2 روز قبل
نمای جلو پیکان وانت در جنگل
پیکان وانت فیس‌لیفت؛ تجسم آیند‌ه‌نگرانه AI از ماشین محبوب ایران‌خودرو

تصور کنید ایران‌خودرو سراغ مدل فیس‌لیفت خودرو پیکان می‌رفت؛ از هوش مصنوعی خواستیم تا چنین خودرویی را به تصویر بکشد.

107
2 روز قبل
بهترین گوشی های پوکو در بازار ایران
بهترین گوشی پوکو در بازار ایران [تابستان ۱۴۰۴]

بهترین گوشی‌های پوکو کدام مدل‌ها هستند؟ در مقاله‌ی پیش‌ رو، بهترین مدل‌های پوکو از نظر دوربین، باتری و قدرت پردازشی معرفی می‌شوند.

142
1 روز قبل
نمای سه‌چهارم جلو خودرو نیسان آلتیما ۲۰۱۹
یک مکانیک از خودروهایی می‌گوید که ارزش خرید ندارند

یکی از مکانیک‌های آمریکایی از ۵ خودرویی می‌گوید که بسیار مشکل‌ساز هستند و ارزش خرید ندارند.

41
1 روز قبل
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات