بهبود ۶۱ درصدی در عملکرد سیستم معنایی الکسا آمازون

شنبه 14 اردیبهشت 1398 - 19:40

مطالعه 3 دقیقه

محققان بخش هوش مصنوعی الکسا آمازون موفق شده‌اند با سیستم‌های مبتنی بر هوش مصنوعی جدید، عملکرد تجزیه‌ی معنایی الکسا آمازون را تا ۶۱ درصد بهبود ببخشند.

تبلیغات

چگونه دستیار هوشمند الکسا آمازون می‌تواند فرمان‌های صوتی پبچیده‌‌ای مثل «الکسا، کره بادام زمینی و شیر را به فهرست خرید اضافه کرده و فرمان «موسیقی پخش کن» را به‌درستی متوجه شود و انجام دهد؟

محققان بخش تحقیقات هوش مصنوعی الکسا آمازون، به‌تازگی مقاله‌ی جدیدی تحت عنوان «تجزیه و تحلیل معنایی کاربردی برای تفسیر زبان عامیانه» منتشر کرده‌اند. این مقاله به بررسی سیستمی مبتنی بر هوش مصنوعی می‌پردازد که می‌تواند ساختار و معنی هر فرمانی که به دستیار هوشمند الکسا آمازون داده می‌شود، حتی در صورت پیچیده یا تا حدی مبهم بودن، تجزیه و تحلیل کرده و ساختار و معنی فرمان مربوطه را تشخیص دهد.

مقاله‌های مرتبط:

فروش الکسا آمازون از مرز ۱۰۰میلیون دستگاه گذشت

دستیار صوتی الکسا آمازون روی ۲۰ هزار دستگاه فعال است

راهول گوئل، یکی از نویسندگان این مقاله‌ی تحقیقاتی توضیح می‌دهد که طراحی مدل ازطریق دو تکنیک یادگیری ماشین انجام می‌شود. یکی از تکنیک‌های مورد استفاده، تکنیک یادگیری انتقال نام دارد. در تکنیک یادگیری انتقال برای کاهش مقادیر دیتای مورد نیاز برای آموزش مدل جدید، اطلاعات از سیستم مبتنی بر هوش مصنوعی موجود انتقال داده می‌شوند. تکنیک دیگر، مکانیزم کپی کردن است که در آن، سیستم با داده‌هایی که تاکنون و پیش از آن ندیده‌ است، سرو‌کار دارد.

به‌صورت سنتی، الکسا درخواست‌های دریافتی را بررسی می‌کند. مثلا درخواست‌های مربوط‌به پخش موسیقی، نام یک خواننده و نام یک آهنگ را دریافت می‌کند. اما فرمان‌های دستوری هستند که ممکن است با خطا همراه شوند. برای مثال، فرمان «در فهرست خرید، سیب و پرتغال را اضافه کن و موسیقی پخش کن.» از دو قسمت اصلی تشکیل شده است؛ یک قسمت اضافه کردن اقلام به فهرست خرید و قسمت دوم پخش کردن موسیقی، که با حرف ربط «و» دو فرمان درکنار یکدیگر قرار گرفته‌اند و در کدنویسی به‌ صورت (addToListIntent (add (ItemName (Apples)) (ItemName (Apranges)))) (PlayMusicIntent (Mediatype (Music)))) نمایش داده می‌شوند.

محققان به‌جای آنکه به‌صورت خودکار داده‌های برچسب‌گذاری‌شده را براساس دستور و فرمان مشخص‌شده به نمودار درختی تجزیه تبدیل کنند، تصمیم گرفتند ابتدا ساختار دستور زبان جملات را مورد بررسی قرار دهند. تیم تجزیه‌ی معنایی فرمان‌ها، نمودار درختی تجزیه را برمبنای برخی عملیات جابه‌جایی و کاهشی تهیه کردند. درنتیجه عملیات جابه‌جایی یا شیفت، دستور به کلمه‌ی بعدی در ورودی تغییر موقعیت پیدا کرد و درنهایت عملیات کاهشی، جایگاه نهایی آن فرمان را در نمودار درختی تعیین کرد.

در سیستم جدید، مکانیزمی وجود دارد که به داده‌هایی که توسط تجزیه‌کننده مورد بررسی قرار می‌گیرند، توجه نشان می‌دهد. این مکانیزم تعیین می‌کند که آیا کلمات یا اصطلاحات استفاده‌شده در فرمان مربوط‌به یک جریان ورودی هستند یا باید تفکیک شوند.

در آزمایش‌های انجام‌شده روی داده‌های مربوط‌به فهم زبان‌های طبیعی یا NLU از تعاملات الکسا، مکانیزم کپی کردن به‌تنهایی توانست دقتی برابر با میانگین ۶۱ درصد را به‌نمایش بگذارد. این در حالی است که مکانیزم انتقال توانست با حدود ۶.۴ درصد دقت بیشتر و ازطریق آزمایش‌های پرسش و پاسخ جداگانه در پاسخ‌دهی به سوالات عمومی عملکرد بهتری را به‌نمایش بگذارد. درمورد سوالات عمومی شامل سوالاتی نظیر «در کدام رستوران و چه ساعتی می‌توانید برای صرف غذا حضور داشته باشید؟» یا «کوببریانت چندین سرقت در سال ۲۰۰۴ انجام داده است؟»، مکانیزم انتقال یادگیری بهبود عملکرد ۱۰.۸ درصدی را نشان داد. راهول گوئل در ادامه‌ اضافه کرد:

واقعیت این است که سیستم تجزیه‌ی معنایی جدید ما، از هر دو منظر عملکردی یعنی هم از نظر درک زبان و هم از نظر پرسش و پاسخ، بهبود عملکردی خوبی را نشان می‌دهد و درنتیجه می‌تواند به‌عنوان یک مکانیزمی با اهداف عمومی برای بیان معنا مورد توجه قرار گیرد و کاربردهای دیگری را نیز به‌نمایش بگذارد.

انتظار می‌رود این برنامه در شانزدهمین فصل انجمن زبان شناسی محاسباتی سالانه‌ی آمریکای شمالی در نیواورلئان، لوئیزیانا در ماه ژوئن ارائه شود.

مقاله رو دوست داشتی؟

نظرت چیه؟

تینا پورشاهید

نظرات