مدل هوش مصنوعی مایکروسافت در بنچمارک SuperGLUE بهتر از انسان ظاهر شد

دوشنبه ۲۹ دی ۱۳۹۹ - ۱۵:۳۰
مطالعه 2 دقیقه
مایکروسافت نسخه‌ی جدید مدل DeBERTa را با ۱٫۵ میلیارد پارامتر تعلیم داده است تا امکان انجام کارهای بیشتر را با سرعت بالاتر فراهم کند.
تبلیغات

طی سال‌های اخیر پیشرفت‌های عظیمی در تعلیم شبکه‌های هوش مصنوعی با میلیون‌ها پارامتر به دست آمده و مایکروسافت به‌تازگی مدل هوش مصنوعی DeBERTa را از طریق تعلیم نسخه‌ی عظیم‌تر آن با ۴۸ لایه‌ی ترنسفورمر، با ۱٫۵ میلیارد پارامتر به‌روزرسانی کرده است.

تقویت چشمگیر عملکرد DeBERTa باعث شده است این مدل برای نخستین بار، در پردازش و فهم زبان SuperGLUE از نظر نمره‌ی متوسط کلان، سریع‌تر از انسان ظاهر شود. در این آزمایش مدل DeBERTa امتیاز ۸۹٫۹ کسب کرد و انسان موفق‌ به کسب امتیاز ۸۹٫۸ شد. تفاوت امتیازها با درنظرگرفتن معیارهای پایه‌ بیشتر می‌شود (۹۰٫۳ در برابر ۸۹٫۸).

بنچمارک SuperGLUE شامل وظایف متنوع مبتنی‌ بر پردازش زبان طبیعی (NLP) است؛ شامل مواردی نظیر پاسخ‌دهی به سؤال و استنتاج زبان طبیعی. مدل DeBERTa مایکروسافت با کسب نمره‌ی متوسط کلان ۹۰٫۸، در رتبه‌ی نخست بنچمارک SuperGLUE جای می‌گیرد. 

براساس گزارش MSPoweruser، مدل DeBERTa می‌تواند PLM-های پیشین نظیر BERT،اRoBERTa و UniLM را با استفاده از سه تکنیک نوین، بهبود ببخشد. یکی از این تکنیک‌ها، مکانیسم دقت منظم‌شده (Disentangled Attention) نام دارد و تکنیک دوم در حقیقت نسخه‌ی بهبودیافته‌ی ابزار Mask Decoder محسوب می‌شود. مایکروسافت همچنین به نوعی تعلیمِ رقابتی‌ مجازی برای بهینه‌سازی مدل DeBERTa اشاره می‌کند.

نتایج تست مدل هوش مصنوعی DeBERTa مایکروسافت در بنچمارک SuperGlue

مدل ۱٫۵ میلیارد پارامتری DeBERTa در مقایسه ‌با T5 گوگل که شامل ۱۱ میلیارد پارامتر است، مصرف انرژی بسیار کمتری دارد و به ‌شکلی ساده‌تر امکان فشرده‌سازی اپلیکیشن‌ها با تنظیمات مختلف را فراهم می‌کند. عملکرد بهتر DeBERTa hc انسان در بنچمارک SuperGLUE دستاورد بسیار مهمی در حوزه‌ی هوش مصنوعی عمومی محسوب می‌شود.

با وجود نمایش عملکرد خوب، مدل مایکروسافت با هیچ متر و معیاری به سطح هوش انسان در زمینه‌ی درک زبان طبیعی (NLU) دست پیدا نمی‌کند. ذهن انسان در زمینه‌ی یادگیری دانش از وظایف مختلف برای حل کردن وظیفه‌ای جدید، عملکردی بسیار هوشمندانه دارد. 

مایکروسافت قصد دارد این فناوری را با نسخه‌ی جدید مدل بازنمایی زبان طبیعی Microsoft Turing ادغام کند. شرکت ردموندی از این مدل در Bing،اOffice،اDynamics و Azure Cognitive Services برای ممکن ‌شدن انواع کارها نظیر تعاملات انسان-انسان و تعاملات انسان-دستگاه استفاده می‌کند. مایکروسافت تصمیم دارد مدل ۱٫۵ میلیارد پارامتری DeBERTa و کد منبع آن را در دسترس عموم قرار دهد.

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات