بهبود ۶۱ درصدی در عملکرد سیستم معنایی الکسا آمازون
چگونه دستیار هوشمند الکسا آمازون میتواند فرمانهای صوتی پبچیدهای مثل «الکسا، کره بادام زمینی و شیر را به فهرست خرید اضافه کرده و فرمان «موسیقی پخش کن» را بهدرستی متوجه شود و انجام دهد؟
محققان بخش تحقیقات هوش مصنوعی الکسا آمازون، بهتازگی مقالهی جدیدی تحت عنوان «تجزیه و تحلیل معنایی کاربردی برای تفسیر زبان عامیانه» منتشر کردهاند. این مقاله به بررسی سیستمی مبتنی بر هوش مصنوعی میپردازد که میتواند ساختار و معنی هر فرمانی که به دستیار هوشمند الکسا آمازون داده میشود، حتی در صورت پیچیده یا تا حدی مبهم بودن، تجزیه و تحلیل کرده و ساختار و معنی فرمان مربوطه را تشخیص دهد.
راهول گوئل، یکی از نویسندگان این مقالهی تحقیقاتی توضیح میدهد که طراحی مدل ازطریق دو تکنیک یادگیری ماشین انجام میشود. یکی از تکنیکهای مورد استفاده، تکنیک یادگیری انتقال نام دارد. در تکنیک یادگیری انتقال برای کاهش مقادیر دیتای مورد نیاز برای آموزش مدل جدید، اطلاعات از سیستم مبتنی بر هوش مصنوعی موجود انتقال داده میشوند. تکنیک دیگر، مکانیزم کپی کردن است که در آن، سیستم با دادههایی که تاکنون و پیش از آن ندیده است، سروکار دارد.
بهصورت سنتی، الکسا درخواستهای دریافتی را بررسی میکند. مثلا درخواستهای مربوطبه پخش موسیقی، نام یک خواننده و نام یک آهنگ را دریافت میکند. اما فرمانهای دستوری هستند که ممکن است با خطا همراه شوند. برای مثال، فرمان «در فهرست خرید، سیب و پرتغال را اضافه کن و موسیقی پخش کن.» از دو قسمت اصلی تشکیل شده است؛ یک قسمت اضافه کردن اقلام به فهرست خرید و قسمت دوم پخش کردن موسیقی، که با حرف ربط «و» دو فرمان درکنار یکدیگر قرار گرفتهاند و در کدنویسی به صورت (addToListIntent (add (ItemName (Apples)) (ItemName (Apranges)))) (PlayMusicIntent (Mediatype (Music)))) نمایش داده میشوند.
محققان بهجای آنکه بهصورت خودکار دادههای برچسبگذاریشده را براساس دستور و فرمان مشخصشده به نمودار درختی تجزیه تبدیل کنند، تصمیم گرفتند ابتدا ساختار دستور زبان جملات را مورد بررسی قرار دهند. تیم تجزیهی معنایی فرمانها، نمودار درختی تجزیه را برمبنای برخی عملیات جابهجایی و کاهشی تهیه کردند. درنتیجه عملیات جابهجایی یا شیفت، دستور به کلمهی بعدی در ورودی تغییر موقعیت پیدا کرد و درنهایت عملیات کاهشی، جایگاه نهایی آن فرمان را در نمودار درختی تعیین کرد.
در سیستم جدید، مکانیزمی وجود دارد که به دادههایی که توسط تجزیهکننده مورد بررسی قرار میگیرند، توجه نشان میدهد. این مکانیزم تعیین میکند که آیا کلمات یا اصطلاحات استفادهشده در فرمان مربوطبه یک جریان ورودی هستند یا باید تفکیک شوند.
در آزمایشهای انجامشده روی دادههای مربوطبه فهم زبانهای طبیعی یا NLU از تعاملات الکسا، مکانیزم کپی کردن بهتنهایی توانست دقتی برابر با میانگین ۶۱ درصد را بهنمایش بگذارد. این در حالی است که مکانیزم انتقال توانست با حدود ۶.۴ درصد دقت بیشتر و ازطریق آزمایشهای پرسش و پاسخ جداگانه در پاسخدهی به سوالات عمومی عملکرد بهتری را بهنمایش بگذارد. درمورد سوالات عمومی شامل سوالاتی نظیر «در کدام رستوران و چه ساعتی میتوانید برای صرف غذا حضور داشته باشید؟» یا «کوببریانت چندین سرقت در سال ۲۰۰۴ انجام داده است؟»، مکانیزم انتقال یادگیری بهبود عملکرد ۱۰.۸ درصدی را نشان داد. راهول گوئل در ادامه اضافه کرد:
واقعیت این است که سیستم تجزیهی معنایی جدید ما، از هر دو منظر عملکردی یعنی هم از نظر درک زبان و هم از نظر پرسش و پاسخ، بهبود عملکردی خوبی را نشان میدهد و درنتیجه میتواند بهعنوان یک مکانیزمی با اهداف عمومی برای بیان معنا مورد توجه قرار گیرد و کاربردهای دیگری را نیز بهنمایش بگذارد.
انتظار میرود این برنامه در شانزدهمین فصل انجمن زبان شناسی محاسباتی سالانهی آمریکای شمالی در نیواورلئان، لوئیزیانا در ماه ژوئن ارائه شود.
نظرات