گوگل به ربات ها یاد میدهد که به یکدیگر آموزش دهند
در حالی که ما انسانها میتوانیم تجربیات و تخصص خود را از طریق زبان با یکدیگر به اشتراک بگذاریم، رباتها هم این پتانسیل را دارند تا مهارتهایی را که آموختهاند، با انتقال اطلاعات روی شبکه به یکدیگر منتقل کنند. در "رباتیک ابری" محققان گوگل به دنبال این هستند تا با ایجاد همکاری در بین رباتها، مهارتهای آنها را سریعتر ارتقا دهند.
مغز انسان دارای میلیاردها سلول عصبی است و بین آنها تعداد نامحدودی اتصال برقرار است. هنگامی که ما انسانها مشغول فکر کردن و یادگیری هستیم، سلولهای عصبی با یکدیگر وارد ارتباط میشوند و مسیرهای خاصی که مرتبط با رفتار پاداشی است در طول زمان تقویت خواهند شد. از این رو احتمال دارد که این مسیرها در آینده برای آموزش و شکلدهی به اقدامات ما انتخاب شوند.
یک شبکهی عصبی مصنوعی همین ساختار را در یک مقیاس کوچکتر دارد. ممکن است وظیفهای به ربات داده شود و او با استفاده از حدس و خطا، بهترین راه انجام آن را پیدا کند. اوایل، رفتار آنها از نظر ناظر خارجی ممکن است کاملا تصادفی به نظر برسد. اما پس از تلاش رباتها در امتحان کردن راه حلهای مختلف، آنها یاد خواهند گرفت که چطور راه حل نزدیکتر به هدف را انتخاب کنند و به این ترتیب، تواناییهای آنها به طور مستمر بهبود پیدا خواهد کرد.
اما این فرآیند در حین موثر بودن، وقتگیر هم است. در اینجا رباتیک ابری از راه میرسد تا در زمان صرفهجویی کند. از این رو، به جای این که هر ربات به شکل جداگانه تحت آزمایش قرار بگیرد، رباتها تجربههای خود را به صورت جمعی در اختیار یکدیگر قرار میدهند. برای مثال یک ربات به ربات دیگر آموزش میدهد که چطور کار سادهای مانند در باز کردن را انجام دهد یا جسمی را جابهجا کند. در فواصل زمانی معین، رباتها آنچه را که یاد گرفتهاند به سرور آپلود میکنند. ضمن این که آخرین نسخه از یادگیری آن موضوع را هم دانلود میکنند تا به این وسیله هر ربات به تصویر جامعتری از تجربههای فردی خود دست پیدا کند.
با استفاده از آموزش مبتنی بر ابر، تیم تحقیقاتی گوگل سه نوع آزمایش مختلف را انجام داد تا به رباتها آموزش دهد تا از بین راههای مختلف، دقیقترین و کارآمدترین روش را انتخاب کند.
نخست این که، چند ربات مجزا با اتصال به یک شبکهی عصبی مشترک، اقدام به باز کردن در با سعی و خطا کردند. همان طور که ویدیوی زیر نشان میدهد، در ابتدا به نظر میرسید که ربات فاقد مهارت است و کورکورانه به دنبال راهی میگردد که به هدف نزدیکتر باشد.
پس از چند ساعت، ربات توانست به دستگیره برسد و در را باز کند. این بار ربات میدانست که کدام راه حل به یک نتیجهی موفق ختم میشود. بدون این که لازم باشد تا مدلی صراحتا به آنها بگوید که چه کار کنند.
در آزمایش دوم، محققان یک مدل پیش گویانه را بررسی کردند. یک سینی پر از اشیای روزمره به رباتها داده شد تا با محتویات آن بازی کنند. با هر فشار و تماسی که به اشیا وارد میکردند، بخشی از درک علت و معلولی خود را توسعه میدادند. یک بار دیگر رباتها، یافتههای خود را به اشتراک گذاشتند تا درک علت و معلولی خود را بهبود دهند و اقدامات منجر به نتیجه را پیشبینی کنند.
با استفاده از یک رابط کامپیوتر که منطقهی آزمایش را نشان میداد، محققان از رباتها خواستند که با کلیک روی یک شی آن را انتخاب کنند و سپس روی مکان مورد نظر کلیک کنند تا شی به آن نقطه جابهجا شود. به این ترتیب رباتها توانستند تا بر اساس تجربیات به اشتراک گذاشته شده، بهترین راهکار را برای رسیدن به هدف انجام دهند.
در نهایت، تیم از راهنمای انسان برای آموزش دستهی دیگری از رباتها استفاده کرد تا در بسته را باز کنند. هر ربات از نظر فیزیکی، توسط یک محقق به سمت هدف منتقل میشد و پس از آن به تنهایی زنجیرهای از همان کارها به شکل یک فرآیند مشخص، برای باز کردن در انجام میداد.
سپس به رباتها اجازه داده شد که از حدس و خطا برای بهبود این فرآیند استفاده کنند. برای هر ربات شرایط، تغییرات جزیی پیدا میکرد. از این رو وقتی به صورت جمعی وارد فعالیت شدند بهتر توانستند تغییرات ایجاد شده را مدیریت کنند.
شاید بپرسید که فایدهی این کارها چیست؟ در شبکههای عصبی، هر چه تعداد دادهها بیشتر باشد، رباتها بهتر میتوانند به شکل همزمان یاد بگیرند و آموزش دهند. از این رو میتوانند عملکرد بهتری از یک ربات تنها نشان دهند. بنابراین افزایش سرعت این روند، میتواند رباتها را برای انجام کارهای پیچیدهتر آماده کند.
نظرات