بررسی سیستم جدید یادگیری عمیق IBM

دوشنبه ۲۳ مرداد ۱۳۹۶ - ۱۳:۰۰
مطالعه 4 دقیقه
سیستم جدید یادگیری عمیق توسعه داده‌شده برای سخت‌افزارهای اختصاصی IBM، می‌تواند نقطه‌ی عطفی در دنیای هوش مصنوعی باشد.
تبلیغات

کمپانی IBM طی هفته‌ی گذشته از روش جدیدی پرده برداشت که قرار است به‌طور قابل توجهی زمان یادگیری را برای سیستمهای یادگیری توزیع‌شده (DDL) کاهش دهد. این تکنیک با استفاده از شمار زیادی سخت‌افزار قوی، می‌تواند به انجام این وظیفه کمک کند. طرز کار روش جدید، بر پایه‌ی بهینه‌سازی تبادل داده‌ میان اجزای سخت‌افزاری بنا می‌شود که یک شبکه‌ی عصبی یادگیری عمیق روی آن در حال اجرا است.

موضوع اصلی که آی‌بی‌ام در فرایند جدید خود قصد مقابله با آن و حلش را داشته، مربوط به مقاطع کندکننده‌ای است که در شبکه‌بندی سیستم‌های یادگیری توزیع‌شده وجود دارند. درحالی‌که گسترش دادن بارگذاری‌های محاسباتی برای تمرین دادن یک شبکه‌ی عصبی یادگیری عمیق روی بسیاری کامپیوترها وجود دارد؛ باید توجه کنیم که بازده این فرایندها در حالت متداول، رفته‌رفته کمتر می‌شود و دلیل آن‌، اتصال‌های با تأخیر بالایی است که میان سخت‌افزارهای انجام‌دهنده‌ی محاسبات در دنیای واقعی وجود دارد.

یک کتابخانه‌ی ارتباطی جدید با عنوان PowerAI DDL در ارتباط با یک مقاله‌ی پژوهشی تشریحی به‌تازگی منتشر شده است. هدف از انتشار چنین سیستمی، تقویت بازده با حصول اطمینان از این نکته است که آیا تمامی سیستم‌های در حال کار در یک پروسه، از تمامی ظرفیت اتصالات با عملکرد بالای خودشان بهره می‌برند یا خیر.

کمپانی آی‌بی‌ام با استفاده از کتابخانه‌ی PowerAI DDL، توانسته است شبکه‌ی عصبی محبوب Resnet-50 را روی مجموعه‌ی داده‌ی ImageNet در مدت‌زمان ۵۰ دقیقه تمرین دهد. این کار با استفاده از ۶۴ سرور انجام شد و هر یک از این سرورها دارای چهار واحد پردازش گرافیکی بودند.

کمپانی‌هایی با سخت‌افزار کافی واقعا می‌توانند از ظرفیت‌های PowerAI DDL بهره ببرند و شاهد تقویت‌های چشمگیری باشند که در عملکرد آن‌ها ایجاد می‌شود و اصلی‌ترین تفاوت، مربوط به مدت‌زمانی می‌شود که دانشمندان این کمپانی‌ها برای اجرای فرایندهای مشخص صرف می‌کنند. طبیعتا اگر آزمایش‌ها سریع‌تر اجرا شوند، دانشمندان خواهند توانست شمار بیشتری آزمایش‌ انجام دهند و این موضوع در ادامه باعث حصول نتایج بهتر خواهد شد.

کتابخانه‌ی ارتباطی آی‌بی‌ام به‌عنوان بخشی از بسته‌ی نرم‌افزاری PowerAI منتشر شده است و به دانشمندان فعال در حوزه‌ی داده و همین‌طور به مهندسان این زمینه امکان می‌دهد که وظایف مربوط به یادگیری ماشین را روی سرورهای بسیار قوی این غول دنیای فناوری انجام دهند. سرورهایی که با عنوان سرورهای پاور سیستمز شناخته می‌شوند.

این کمپانی برای آزمایش روند اخیر از ۶۴ سرور از نوع Power8 S822LC استفاده کرده است که هر کدام از این سیستم‌ها به‌صورت پیش‌فرض با چهار واحد پردازش گرافیکی انویدیا از مدل Tesla P100-SXM2 ارائه می‌شوند.

 این سخت‌افزارها در نگاه نخست بسیار گران به نظر می‌رسند؛ ولی برای سازمان‌هایی که دارای پول و سرمایه‌ی کافی در زمینه‌ی پژوهشی هستند و نیاز به انجام محاسبات با عملکرد بالا در زمینه‌ی هوش مصنوعی دارند، چنین هزینه‌هایی گران تلقی نمی‌شود.

منتشر کردن این فناوری از طریق بسته‌ی نرم‌افزاری PowerAI، می‌تواند کار را برای افرادی ساده‌تر کند که قصد بهره‌ بردن از پژوهش‌های آی‌بی‌ام دارند؛ زیرا این مجموعه با بخش نرم‌افزاری موجود برای اجرا روی سخت‌افزارهای Power Systems همگام شده است.

با این وجود، مزایای سیستم جدید IBM بهایی نیز دارد؛ این شرکت سیستم جدید را تنها برای سخت‌افزارهای اختصاصی خودشان ارائه کرده‌ است و از طرفی این سیستم‌ و کدهای آن را نمی‌توانیم در ردیف سیستم‌های منبع باز قرار دهیم.

چنین رویکردی با سیستم شبکه‌ی عصبی توزیع‌شده‌ای که کمپانی فیسبوک به‌تازگی معرفی کرده، در تضاد است. این غول شبکه‌‌های اجتماعی، کدهای سیستم خود را به‌صورت منبع باز در دسترس قرار داده است.

البته باید اشاره کنیم که کمپانی IBM هم با ارائه‌ی پروژه‌های منبع باز در زمینه‌ی یادگیری عمیق میانه‌ی بدی ندارد و صرفا تصمیم گرفته است در پروژه‌ی اخیرش این کار را نکند.

با وجود تفاوت‌هایی که در روند توزیع وجود دارد، می‌توان گفت هر دوی آن مقالات پژوهشی، دارای دستاوردهای پیشتازانه‌ای در زمینه‌ی پژوهش‌های یادگیری عمیق هستند. کارهای انجام‌شده از سوی هر دو کمپانی نشان می‌دهد که ما  راه زیادی در زمینه‌ی تقویت سیستم‌های یادگیری ماشینی پیش رو داریم. دستاورد این روند پرشتاب همچنین می‌تواند در زمینه‌های دیگر هم کاربرد داشته باشد و به این ترتیب روی زندگی انسان‌ها تأثیر بیشتری بگذارد.

یکی از نکات حائز اهمیت در بحث فوق این است که با وجود مفید بود تمرین‌ Resent به‌عنوان یک بنچمارک در هر دوی این پژوهش‌ها، هنوز مشخص نیست که نتایج به‌دست‌آمده تا چه حدی قابل انتقال به سایر برنامه‌ها و کاربردها باشند. درحالی‌که به نظر می‌آید روش‌های ارائه‌شده در مقاله‌ی BM باید مزایای عملکردی بیشتری  به همراه خود ارائه دهند؛ اما نباید فراموش کنیم که این کمپانی، هنوز به‌طور رسمی تست‌های لازم برای سایر کاربردها را انجام نداده است.

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات