گوگل به ربات ها یاد می‌دهد که به یکدیگر آموزش دهند

محققان گوگل در تلاش هستند تا با برقراری تعامل و همکاری بین ربات‌ها به ارتقای مهارت‌های آن‌ها کمک کنند.

در حالی که ما انسان‌ها می‌توانیم تجربیات و تخصص خود را از طریق زبان با یکدیگر به اشتراک بگذاریم، ربات‌ها هم این پتانسیل را دارند تا مهارت‌هایی را که آموخته‌اند، با انتقال اطلاعات روی شبکه به یکدیگر منتقل کنند. در "رباتیک ابری" محققان گوگل به دنبال این هستند تا با ایجاد همکاری در بین ربات‌ها، مهارت‌های آن‌ها را سریع‌تر ارتقا دهند.

مغز انسان دارای میلیاردها سلول عصبی است و بین آنها تعداد نامحدودی اتصال برقرار است. هنگامی که ما انسان‌ها مشغول فکر کردن و یادگیری هستیم، سلول‌های عصبی با یکدیگر وارد ارتباط می‌شوند و مسیرهای خاصی که مرتبط با رفتار پاداشی است در طول زمان تقویت خواهند شد. از این رو احتمال دارد که این مسیرها در آینده برای آموزش و شکل‌دهی به اقدامات ما انتخاب شوند.

یک شبکه‌ی عصبی مصنوعی همین ساختار را در یک مقیاس کوچک‌تر دارد. ممکن است وظیفه‌ای به ربات داده شود و او با استفاده از حدس و خطا، بهترین راه انجام آن را پیدا کند. اوایل، رفتار آن‌ها از نظر ناظر خارجی ممکن است کاملا تصادفی به نظر برسد. اما پس از تلاش ربات‌ها در امتحان کردن راه حل‌های مختلف، آن‌ها یاد خواهند گرفت که چطور راه حل نزدیک‌تر به هدف را انتخاب کنند و به این ترتیب، توانایی‌های آن‌ها به طور مستمر بهبود پیدا خواهد کرد.

اما این فرآیند در حین موثر بودن، وقت‌گیر هم است. در اینجا رباتیک ابری از راه می‌رسد تا در زمان صرفه‌جویی کند. از این رو، به جای این که هر ربات به شکل جداگانه تحت آزمایش قرار بگیرد، ربات‌ها تجربه‌های خود را به صورت جمعی در اختیار یکدیگر قرار می‌دهند. برای مثال یک ربات به ربات دیگر آموزش می‌دهد که چطور کار ساده‌ای مانند در باز کردن را انجام دهد یا جسمی را جابه‌جا کند. در فواصل زمانی معین، ربات‌ها آنچه را که یاد گرفته‌اند به سرور آپلود می‌کنند. ضمن این که آخرین نسخه از یادگیری آن موضوع را هم دانلود می‌کنند تا به این وسیله هر ربات به تصویر جامع‌تری از تجربه‌های فردی خود دست پیدا کند.

با استفاده از آموزش مبتنی بر ابر، تیم تحقیقاتی گوگل سه نوع آزمایش مختلف را انجام داد تا به ربات‌ها آموزش دهد تا از بین راه‌های مختلف، دقیق‌ترین و کارآمدترین روش را انتخاب کند.

نخست این که، چند ربات مجزا با اتصال به یک شبکه‌ی عصبی مشترک، اقدام به باز کردن در با سعی و خطا کردند. همان طور که ویدیوی زیر نشان می‌دهد، در ابتدا به نظر می‌رسید که ربات فاقد مهارت است و کورکورانه به دنبال راهی می‌گردد که به هدف نزدیک‌تر باشد.

پس از چند ساعت، ربات توانست به دستگیره برسد و در را باز کند. این بار ربات می‌دانست که کدام راه حل به یک نتیجه‌ی موفق ختم می‌شود. بدون این که لازم باشد تا مدلی صراحتا به آن‌ها بگوید که چه کار کنند.

در آزمایش دوم، محققان یک مدل پیش گویانه را بررسی کردند. یک سینی پر از اشیای روزمره به ربات‌ها داده شد تا با محتویات آن بازی کنند. با هر فشار و تماسی که به اشیا وارد می‌کردند، بخشی از درک علت و معلولی خود را توسعه می‌دادند. یک بار دیگر ربات‌ها، یافته‌های خود را به اشتراک گذاشتند تا درک علت و معلولی خود را بهبود دهند و اقدامات منجر به نتیجه را پیش‌بینی کنند.

با استفاده از یک رابط کامپیوتر که منطقه‌ی آزمایش را نشان می‌داد، محققان از ربات‌ها خواستند که با کلیک روی یک شی آن را انتخاب کنند و سپس روی مکان مورد نظر کلیک کنند تا شی به آن نقطه جابه‌جا شود. به این ترتیب ربات‌ها توانستند تا بر اساس تجربیات به اشتراک گذاشته شده، بهترین راهکار را برای رسیدن به هدف انجام دهند.

در نهایت، تیم از راهنمای انسان برای آموزش دسته‌ی دیگری از ربات‌ها استفاده کرد تا در بسته را باز کنند. هر ربات از نظر فیزیکی، توسط یک محقق به سمت هدف منتقل می‌شد و پس از آن به تنهایی زنجیره‌ای از همان کارها به شکل یک فرآیند مشخص، برای باز کردن در انجام می‌داد.

سپس به ربات‌ها اجازه داده شد که از حدس و خطا برای بهبود این فرآیند استفاده کنند. برای هر ربات شرایط، تغییرات جزیی پیدا می‌کرد. از این رو وقتی به صورت جمعی وارد فعالیت شدند بهتر توانستند تغییرات ایجاد شده را مدیریت کنند.

شاید بپرسید که فایده‌ی این کارها چیست؟ در شبکه‌های عصبی، هر چه تعداد داده‌ها بیشتر باشد، ربات‌ها بهتر می‌توانند به شکل هم‌زمان یاد بگیرند و آموزش دهند. از این رو می‌توانند عملکرد بهتری از یک ربات تنها نشان دهند. بنابراین افزایش سرعت این روند، می‌تواند ربات‌ها را برای انجام کارهای پیچیده‌تر آماده کند.

منبع newatlas

از سراسر وب

  دیدگاه
کاراکتر باقی مانده

بیشتر بخوانید