ساخت رباتی که هات داگ میپزد و سرو میکند
آمادهکردن هاتداگ را درنظر بگیرید. درحالیکه ممکن است برای انسانها بسیار ساده بهنظر برسد، آموزش ربات برای آماده و سروکردن هاتداگ کار سادهای نیست. این ربات باید بتواند هاتداگ را بگیرد و آن را روی دستگاه کبابکن قرار دهد و به آن اجازه دهد مدت زمان مناسبی بپزد. سپس هاتداگ را در نان بگذارد و چاشنی به آن اضافه کند و بهآرامی تحویل دهد.
پژوهشگران دانشگاه بوستون اخیرا موفق شدهاند رباتی را آموزش دهند تا این کار را انجام دهد. این پژوهشگران با استفاده از سیستم آزمایش و خطایی که «یادگیری تقویتی» نامیده میشود، توانستند نوعی هوش مصنوعی توسعه دهند که بتواند یاد بگیرد و از دانش پیشین برای انجام بهتر وظیفهی خود استفاده کند. این سیستم هوش مصنوعی برای به کار واداشتن دو بازوی رباتیک استفاده شد. قبل از اینکه سیستم مذکور روی بازوها بهکار برده شود، در شبیهسازیهای کامپیوتری آزموده شد.
اگر ربات نان همبرگر را بیشازحد فشار دهد و لِه کند، از اشتباه خود درس میگیرد و از آن بهبعد، دیگر آن اشتباه را تکرار نمیکند. این تقریبا همان چیزی است که ما در زندگی هنگام تجربهی موضوعات جدید یاد میگیریم. به این شیوه ربات خودآگاه شد. او باید یاد میگرفت چه کاری باید انجام شود و چگونه میتوان آن کار را انجام داد و از انجام اشتباهات تکراری حین انجام وظایف خودداری کرد.
پژوهشگران زبان سادهای را توسعه دادند که به آنها کمک میکرد هر بخش از وظیفه را به وظایف کوچکتری تجزیه کند. آنها میتوانند جملاتی مانند «کبابپز را روشن کن» و «سوسیس را بردار» و «آن را روی کبابپز بگذار» را برای آغاز وظیفه تعریف کنند. زکری سرلین، یکی از پژوهشگران این پروژه، میگوید تا وقتی از اطلاعات از پیش تعریفشده استفاده کنید، الگوریتم میفهمد چه کاری انجام دهد. سرلین میگوید:
باید از قبل چیزهایی را تعریف کنید. تا موقعی که بدانم وقتی میگویید «کبابپز» منظور شما چیست، میتوانم یاد بگیرم هر کاری را انجام دهم که در آن از این کلمه استفاده شده است.
گنجاندن دانش پیشین در الگوریتم موجب میشود تلاش هوش مصنوعی برای رسیدن به اهدافش محدود شود. بهجای اینکه اجازه دهید او ضمن تلاش برای انجام وظیفه هر کاری میخواهد انجام دهد، محدودیتهایی درزمینهی کارهایی تعیین کنید که او حین تلاش برای پختن انجام میدهد. سرلین میگوید پژوهشگران دیگری که پیش از این برای توسعهی هوش مصنوعی از یادگیری تقویتی استفاده کردهاند، همیشه چنین کاری انجام ندادهاند. او توضیح میدهد:
در سیستم ما، ساختاری متشکل از جملات وجود دارد که میتوانید در آنها کلمات دیگری قرار دهید؛ مانند «نمیتوانید دو چیز را باهم بلند کنید». این همان دانش پیشینی است که شما دارید.
ربات جدید نهتنها یاد میگیرد چگونه هاتداگ را آماده و سرو کند؛ بلکه مطمئن میشود دچار اشتباهات خطرناک نشده است. این میزان امنیت که در سیستم گنجانده شده است، توابع مانع کنترل (Control Barrier Functions) نامیده میشود.
سرلین میگوید اجازه میدهید الگوریتم با دانش قبلی و جملاتی اجرا شود که به آن دادهاید. لایهای نیز وجود دارد که به آن اجازه نمیدهد کارهای خطرناک انجام دهد. این امر موجب میشود حتی بدون تلاش، چنین سطحی از امنیت وجود داشته باشد. بهجای اینکه بازوی رباتیک تلاش کند هاتداگ را از روی کبابپز دارد و حین این کار بهطور تصادفی چنگکهایش در کبابپز گیر کند، این لایهی ایمنی تضمین میکند ربات بداند تنها زمانیکه میخواهد این بخش از وظیفهی خود را کامل کند، میتواند به کباپپز خیلی نزدیک شود. سرلین میگوید گروه او میکوشند بیشتر روی این فناوری کار کنند و ببینند چگونه میتوان در آینده ربات را آموزش داد تا وظایف پیچیدهتری انجام دهد.
نظرات