D1-kifpool

هوش مصنوعی خودآموز در ۴۴ ساعت مهارت حل مکعب روبیک پیدا می‌کند

سه‌شنبه 5 تیر 1397 - 05:00
مطالعه 4 دقیقه
دیپ‌کیوب سیستم جدید هوش مصنوعی است که توانسته در ۴۴ ساعت و بدون نیاز به دخالت انسان، در این پازل سه‌بعدی به مهارت برسد.
تبلیغات
D4-mcid4

دیپ‌کیوب (DeepCube) یک سیستم هوش مصنوعی (AI) است که مهارت آن در حل مکعب روبیک با مهارت بهترین حل‌کننده‌های انسانی برابری می‌کند. این سیستم تنها در ۴۴ ساعت و بدون نیاز به مداخله‌ی انسان، توانسته است در این پازل سه‌بعدی کلاسیک مهارت پیدا کند.

به گفته‌ی یکی از مؤلفین این مقاله، یک عامل هوشمند به‌طور کلی باید بتواند مسائل دامنه‌های پیچیده را با حداقل نظارت انسانی حل کند. در واقع برای دستیابی به هوش ماشینی شبه‌انسان باید سیستم‌هایی توسعه داد که قادر به یادگیری باشند و سپس آموخته‌های خود را در کاربردهای زمان واقعی پیاده‌سازی کنند.

حاصل پیشرفت‌های اخیر یادگیری ماشین، سیستم‌هایی بوده است که بدون دانش قبلی به یادگیری و کسب مهارت در بازی‌هایی مثل شطرنج و گو پرداخته‌اند؛ اما این روش‌ها برای مکعب روبیک به‌خوبی تفسیر نشده‌اند. مشکل اینجا است که یادگیری تقویتی (استراتژی به‌کاررفته برای آموزش بازی شطرنج و گو به ماشین‌) به اندازه‌ی کافی مناسب پازل‌های پیچیده نیست. برخلاف شطرنج و گو (بازی‌هایی که تشخیص حرکت خوب یا بد برای سیستم آسان است)، کاملا واضح نیست کدام حرکت AI در تلاش برای حل مکعب روبیک، می‌تواند وضعیت کلی پازل درهم‌ریخته را بهبود دهد. وقتی یک سیستم هوش مصنوعی قادر به تشخیص درستی یا نادرستی حرکتی برای حل پازل نباشد، پاداشی نمی‌گیرد و عدم دریافت پاداش به معنی عمل نکردن یادگیری تقویتی است.

مکعب روبیک

یک مثال از استراتژی دیپ‌کیوب. در حرکت ۱۷ از ۳۰، AI یک گوشه‌ی ۲×۲×۲ می‌سازد و در عین حال گوشه‌ها و لبه‌های مجاور را در یک گروه قرار می‌دهد، این تکنیک قبلا توسط حل‌کننده‌های سرعتی به کار می‌رفت.

مکعب روبیک ساده به نظر می‌رسد ولی احتمال‌های متناوب زیادی ارائه می‌کند. یک مکعب روبیک ۳×۳×۳، فضای حالتی با ۴۳,۲۵۲,۰۰۳,۲۷۴,۴۸۹,۸۵۶,۰۰۰ ترکیب دارد (برابر با ۴۳ کوینتیلیون)، اما تنها یک ترکیب برنده است، یعنی فضایی که هر ۶ وجه مکعب یک‌رنگ باشند. استراتژی‌های یا الگوریتم‌های زیادی برای حل مکعب روبیک وجود دارند. ارنو روبیک یک ماه کامل را صرف اختراع این الگوریتم‌ها کرد. چند سال پیش، ثابت شد کمترین تعداد حرکت‌ها برای حل مکعب روبیک با هر روش تصادفی، ۲۶ حرکت است.

 از زمان پیدایش مکعب روبیک در سال ۱۹۷۴، اطلاعات زیادی در مورد این پازل سه‌بعدی و روش حل آن به دست‌ آمده است، اما ترفند واقعی جست‌وجوی هوش مصنوعی این است که ماشین بدون استفاده از اطلاعات تاریخی بتواند مسئله را حل کند. یادگیری تقویتی می‌تواند به حل این مسئله کمک کند؛ اما همان‌طور که اشاره شد، این استراتژی برای مکعب روبیک عملکرد خوبی ندارد. یک تیم پژوهشی از دانشگاه ایروین کالیفرنیا برای غلبه بر این محدودیت به توسعه‌ی یک روش جدید AI معروف به تکرار یادگیری خودکار (Autodidactive Itereation) پرداخته است. به گفته‌ی پژوهشگرهای این بررسی:

برای حل مکعب روبیک با استفاده از یادگیری تقویتی، الگوریتم یک روش را یاد می‌گیرد. این روش حرکت‌ مربوط به هر حالت مشخص را تعیین می‌کند.

دیپ‌کیوب برای فرمول‌بندی این روش، سیستم داخلی پاداش‌های خود را می‌سازد. این سیستم بدون هیچ کمک خارجی و با تغییرات مکعب به‌عنوان ورودی، به ارزیابی حرکات خود می‌پردازد؛ اما این کار را به یک روش هوشمندانه (البته متمرکز بر تلاش) انجام می‌دهد. وقتی AI حرکتی را انجام می‌دهد، در واقع از تمام مسیرهای مربوط به مکعب کامل پرش می‌کند و به سمت هدف مورد نظر برمی‌گردد. به این صورت سیستم می‌تواند توان و کارآیی کلی حرکت را ارزیابی کند و زمانی که داده‌های کافی مرتبط با موقعیت فعلی خود را به دست آورد، از یک روش جست‌وجوی درختی سنتی استفاده می‌کند که تمام حرکت‌های احتمالی را بررسی و بهترین حرکت را برای حل مکعب انتخاب می‌کند. البته این سیستم بهترین راه‌ حل نیست اما به رسیدن به پاسخ کمک می‌کند.

کمترین تعداد برای حل مکعب روبیک، ۲۶ حرکت است

پژوهشگرها با رهبری استفن مک الیر، فارست اگوستینلر و الکساندر شماکف، با استفاده از ۲ میلیون تکرار مختلف در ۸ میلیارد مکعب (شامل بعضی تکرارها) به آموزش دیپ‌کیوب پرداختند و این سیستم هوش مصنوعی روی یک ماشین با سرور ۳۲ هسته‌ای Intel Xeon E5-2620 با سه GPU NVIDIA Titan XP به مدت ۴۴ ساعت آموزش دید.

این سیستم در طول فرآیند آموزشی موفق شد بخشی زیادی از اطلاعات مکعب روبیک را به دست آورد؛ این اطلاعات شامل یک استراتژی است که حل‌کننده‌های سرعتی معمولا از آن استفاده می‌کنند، در این تکنیک گوشه‌ها و لبه‌های مکعب قبل از قرارگیری در موقعیت صحیح خود با یکدیگر منطبق می‌شوند. به گفته‌ی مؤلفان:

الگوریتم ما قادر به حل ۱۰۰ درصد از مکعب‌های درهم‌ریخته‌ی تصادفی است و در عین حال به یک طول میانه‌ی ۳۰ حرکتی دست پیدا می‌کند (کمتر یا مساوی با حل‌کننده‌هایی که از دانش دامنه‌ای انسانی استفاده می‌کنند). این سیستم هنوز نیاز به بهبود و پیشرفت دارد؛ زیرا دیپ‌کیوب در یک زیرمجموعه‌ی کوچک از مکعب‌ها دچار مشکل می‌شود و راه‌ حل‌هایی تولید می‌شود که حل آن‌ها نیازمند زمانی طولانی است.

پژوهشگرها با نگاهی به جلو به دنبال تست یک روش جدید استنتاجی خودکار در مکعب‌های دشوارتر با ۱۶ وجه هستند. از نظر کاربردی از این پژوهش می‌توان برای حل مسائل زمان واقعی مثل پیش‌بینی شکل سه‌بعدی پروتئین‌ها استفاده کرد. تاخوردگی پروتئینی هم مثل مکعب روبیک یک مسئله‌ی بهینه‌سازی ترکیبی به شمار می‌رود؛ اما به‌جای محاسبه‌ی حرکت بعدی، سیستم توالی مناسب آمینواسیدها را در یک شبکه‌ی سه‌بعدی پیش‌بینی می‌کند. حل پازل‌ یک عمل مفید و بهینه است، اما هدف نهایی از ساخت چنین سیستمی، حل مسائل دشوار جهان واقعی مثل کشف‌های دارویی، تحلیل DNA و ساخت‌ ربات‌هایی است که بتوانند در یک دنیای انسانی به فعالیت بپردازند.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
مشکل نقشه GPS تاکسی اینترنتی ایران
مبدا: میدان آزادی، مقصد: آفریقای جنوبی

اختلال‌ها در جی‌پی‌اس، زندگی‌ راننده‌های تهرانی اسنپ و تپسی را مختل کرده و درآمد آن‌ها را بسیار کاهش داده است.

130
حدود 18 ساعت قبل
گیت
دسترسی به 70 هزار دوره آموزشی گیت برای ایرانیان رایگان شد

پلتفرم آموزشی گیت اعلام کرد که مجموعه‌ای عظیم شامل بیش از ۷۰ هزار دوره آموزشی خود را به‌صورت کاملاً رایگان برای کاربران ایرانی در دسترس قرار داده ...

26
1 روز قبل
ایتان گائو خلبان ۱۹ ساله در هواپیما
بازداشت خلبان ۱۹ ساله در قطب جنوب، سروصدای زیادی به پا کرد

جسارت خلبان جوان در عبور از مرزهای جنوبگان، پای قانون را وسط کشید و سرنوشت سفر او را به بن‌بست رساند.

47
1 روز قبل
بهترین اپلیکیشن های مسیریابی
بهترین اپلیکیشن های مسیریابی ایرانی و خارجی ۱۴۰۴

با معرفی بهترین اپ‌های مسیریابی برای آیفون و اندروید و همچنین بهترین گزینه برای مسیریابی آفلاین، به شما در پیدا کردن مسیر و مقصدتان کمک خواهیم کرد.

36
1 روز قبل
حمله به زیرساخت‌های ارتباطی کشور
حملات سایبری به زیرساخت ارتباطی کشور دوباره اوج گرفت

درحالیکه هنوز ارتباطات در کشور به وضعیت قبل از جنگ، بازنگشته اما شاهدیم که در سه روز گذشته حملات سایبری به زیرساخت ارتباطی کشور شدت گرفته است.

131
حدود 15 ساعت قبل
واتساپ روی آیفون
دختر شهید سردار شادمانی:‌ ترور پدرم ربطی به واتساپ نداشت؛ ردیابی فراتر از این حرف‌هاست

دختر شهید سردار شادمانی با اشاره به برخی ادعاها مبنی بر تاثیر استفاده از واتساپ بر ترورهای اخیر گفت: «ترور پدرم ربطی به استفاده از «واتس‌اپ» نداشت.»

107
1 روز قبل
بازسازی چهره‌ی فرد باستانی مصری با استفاده از داده‌های اسکن سه‌بعدی جمجمه و تحلیل ساختار استخوان‌ها
برای نخستین‌بار ژنوم کامل یک انسان از دوران مصر باستان رمزگشایی شد

اسکلتی که درون یک ظرف سفالی کشف شده، نخستین فرد باستانی مصری است که کل ژنوم او مورد تجزیه‌ و تحلیل قرار گرفته است.

6
1 روز قبل
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات