نابغه هوش مصنوعی گوگل از نوآوری جدیدی در شبکه‌های عصبی رونمایی کرد

چهارشنبه 17 آبان 1396 - 12:00

مطالعه 5 دقیقه

یکی از پژوهشگران برجسته‌ی هوش مصنوعی با انتشار دو مقاله‌ی دانشگاهی، رویکرد جدیدی در شبکه‌های عصبی هوش مصنوعی معرفی کرده است.

تبلیغات

اگر می‌خواهید یک نفر را به خاطر هیاهوی موجود پیرامون هوش مصنوعی سرزنش کنید، جف هینتون، پژوهشگر ۶۹ ساله‌ی گوگل، یکی از گزینه‌های خوب برای این کار به شمار می‌رود.

این استاد بااستعداد دانشگاه تورنتو، در اکتبر ۲۰۱۲ این حوزه را وارد مسیر تازه‌ای کرد. هینتون با همراهی دو دانش‌آموخته‌ی دیگر، نشان داد که شبکه‌های عصبی مصنوعی، فناوری غیر معمولی که برای دهه‌ها مشغول پشتیبانی از آن بود، می‌توانند پیشرفت بزرگی در توانایی ماشین‌ها برای درک تصاویر فراهم کنند. این سه پژوهشگر، ظرف ۶ ماه در فهرست حقوق‌بگیران گوگل قرار گرفتند. امروزه شبکه‌های عصبی از گفتار ما رونویسی می‌کنند، حیوانات خانگی ما را تشخیص می‌دهند و با ترول‌های اینترنتی مقابله می‌کنند.

اما هینتون در حال حاضر از همان فناوری‌ که نقش اصلی را در پدید آوردنش داشت، انتقاد می‌کند. وی می‌گوید:

من عقیده دارم که نحوه‌ی استفاده‌ی ما از بینایی کامپیوتری واقعا اشتباه است. این شیوه در حال حاضر بهتر از هر روش دیگری جواب می‌دهد؛ اما این به معنی درستی آن نیست.

هینتون از ایده‌ی قدیمی دیگری رونمایی کرده است که نحوه‌ی مشاهده و تغییر شکل هوش مصنوعی توسط کامپیوترها را دگرگون می‌کند. این ایده به علت اهمیت حیاتی بینایی کامپیوتری در زمینه‌هایی همچون خودروهای خودران و تهیه‌ی نرم‌افزاری که نقش پزشک را برعهده بگیرد، موضوعی مهم به‌حساب می‌آید.

اواخر ماه گذشته، هینتون با انتشار دو مقاله‌ی تحقیقی اعلام کرد ایده‌ا‌ی که نزدیک به ۴۰ سال در نظر داشته، نتیجه‌بخش بوده است. او می‌گوید:

مدت بسیار زیادی این ایده برای من کاملا قابل درک بود و اکنون نه‌تنها عملکرد آن رضایت‌بخش است؛ بلکه ما سرانجام به چیزی دست یافته‌ایم که چنین عملکردی دارد.

رویکرد جدید هینتون به نام «شبکه‌های کپسولی» شناخته می‌شود. این رویکرد یک نوآوری در شبکه‌های عصبی است و قصد دارد توانایی ماشین را در درک جهان از طریق تصویر یا ویدئو بهبود ببخشد. در یکی از مقالاتی که ماه گذشته منتشر شد، دقت شبکه‌های کپسولی هینتون با بهترین تکنیک‌های موجود در یک آزمایش استاندارد با عنوان «نحوه‌ی یادگیری نرم‌افزار برای تشخیص ارقام دست‌نویس» مطابقت داشت.

در مقاله‌ی دوم، شبکه‌های کپسولی بهترین نرخ اشتباه پیشین در آزمایشی که توانایی نرم‌افزار در تشخیص اسباب‌بازی‌هایی نظیر کامیون و خودرو را از زوایای مختلف به چالش می‌کشد، تقریبا به نصف رساند. هینتون به همراه همکارانش، سارا سبور و نیکولاس فراست در دفتر تورنتوی گوگل مشغول کار روی تکنیک‌های جدید خود است.

شبکه‌ی کپسولی قصد دارد ضعف امروزی سیستم‌های یادگیری ماشینی را که منجر به محدودیت در کارایی آن‌ها می‌شود، رفع کند. نرم‌افزار تشخیص تصویری که امروزه توسط گوگل و دیگر شرکت‌ها به کار گرفته می‌شود، نیازمند تعداد بسیار زیادی تصویر نمونه است تا به نحو قابل اطمینانی نحوه‌ی تشخیص اشیاء را در هر وضعیتی یاد بگیرد. این موضوع بدین خاطر است که نرم‌افزار در تعمیم معلومات خود به سناریوهای جدید عملکرد تقریبا ضعیفی دارد. برای مثال، اگر یک شیء را از زوایای جدید به نرم‌افزار نشان دهیم، نمی‌تواند دریابد که این همان شیء پیشین است.

برای آنکه به کامپیوتر یاد بدهیم یک گربه را از زوایای گوناگون تشخیص دهد؛ نیازمند هزاران تصویر از گربه در حالت‌های مختلف خواهیم بود. در‌حالی‌که یک کودک برای آنکه نام حیوان خانگی را یاد بگیرد، نیازمند چنین آموزش مشخص و گسترده‌ای نخواهد بود.

ایده‌ی هینتون برای از میان برداشتن شکاف بین بهترین سیستم‌های هوش مصنوعی و انسان‌های خردسال، قرار دادن قدری دانش بیشتر از جهان در نرم‌افزار بینایی کامپیوتری است. کپسول‌ها که دسته‌های کوچکی از نورون‌های مجازی هستند، به‌منظور ردیابی اجزای مختلف یک شیء نظیر بینی و گوش‌های یک گربه و موقعیت‌های نسبی آن‌ها در فضا طراحی شده‌اند. یک شبکه‌ی متشکل از کپسول‌های فراوان می‌تواند با به‌کارگیری این آگاهی، دریابد هنگامی که صحنه‌ای جدید از یک شیء می‌بیند؛ نه یک شیء جدید، بلکه در واقع تنها منظره‌ای جدید از همان شیء مشاهده می‌کند.

هینتون در سال ۱۹۷۹ - هنگامی که در تلاش برای آگاهی از این موضوع بود که چگونه انسان‌ها از تصاویر ذهنی استفاده می‌کنند - به این نتیجه رسید که سیستم‌های بصری نیازمند چنین ادراک حسی هندسی هستند. وی در ابتدا در سال ۲۰۱۱ از یک طراحی اولیه برای شبکه‌های کپسولی رونمایی کرد. پژوهشگران این حوزه، برای مدت‌ها در انتظار تصویر کامل‌تری بودند که دو هفته‌ی پیش از آن رونمایی شد. کیانهان چو، استاد دانشگاه نیویورک که از پژوهشگران تشخیص تصویر محسوب می‌شود، می‌گوید: «همه منتظر این [نوآوری] و به دنبال دورخیز بزرگ بعدی جف بودند.»

هنوز برای تشخیص بزرگی قدم برداشته‌شده توسط هینتون بسیار زود است و خودش نیز این را می‌داند. این کهنه‌کار عرصه‌ی هوش مصنوعی ترجیح می‌دهد به جای افتخار به اینکه ایده‌اش اکنون توسط شواهد پشتیبانی می‌شود؛ به شرح این موضوع بپردازد که عملکرد شبکه‌های کپسولی هنوز نیازمند اثبات با مجموعه‌ی تصاویر بزرگ است و پیاده‌سازی فعلی آن در مقایسه با نرم‌افزار تشخیص تصویر رایج، سرعت پایینی دارد.

هینتون امیدوار است که بتواند این کمبودها را برطرف کند. دیگر افراد فعال در حوزه‌ی هوش مصنوعی نیز درباره‌ی تکامل ایده‌ی او در درازمدت امیدوار هستند.

رولان ممیزویچ، هم‌بنیان‌گذار استارتاپ تشخیص تصویر توونتی بیلیون نورونز و استاد دانشگاه مونترال، می‌گوید طراحی اولیه‌ی هینتون در مقایسه با سیستم‌های موجود، باید قادر به استخراج ادراک بیشتری از یک مقدار داده‌ی مشخص باشد. اگر عملکرد این ایده در اندازه‌ی مورد نیاز ثابت شود؛ به‌کارگیری آن می‌تواند در حوزه‌هایی نظیر مراقبت‌های بهداشتی که داده‌ی تصویری برای آموزش سیستم‌های هوش مصنوعی بسیار کمیاب است، سودمند باشد.

از برخی جنبه‌ها، شبکه‌های کپسولی یک انشعاب از جریان اخیر در هوش مصنوعی به‌حساب می‌آیند. یک تفسیر از موفقیت اخیر شبکه‌های عصبی این است که انسان‌ها تا حد ممکن باید دانش کمتری در نرم‌افزار هوش مصنوعی رمزنگاری کنند و در عوض آن‌ را وادار کنند تا خود مسائل را از ابتدا دریابد. گری مارکوس، استاد روانشناسی در دانشگاه نیویورک که سال گذشته اقدام به فروش یک استارتاپ هوش مصنوعی به اوبر کرد، می‌گوید اقدام اخیر هینتون نشان‌دهنده‌ی یک تنفس خوشایند از هوای تازه است. مارکوس استدلال می‌کند که پژوهشگران هوش مصنوعی باید اقدامات بیشتری در راستای شبیه‌سازی چگونگی کارکرد مغز و توانایی ذاتی آن برای یادگیری مهارت‌های حیاتی نظیر بینایی و زبان انجام دهند. وی می‌گوید:

هنوز بسیار زود است که پیش‌بینی کنیم این ساختار مشخص تا کجا پیش خواهد رفت؛ اما تماشای اینکه هینتون مشغول شکستن چارچوبی است که ظاهرا این حوزه را در بر گرفته، فوق‌العاده است.

مقاله رو دوست داشتی؟

نظرت چیه؟

میلاد میرکانی

نظرات