ربات تشخیص گفتار مایکروسافت به دقتی مشابه انسان رسیده است

پنج‌شنبه 29 مهر 1395 - 08:00

مطالعه 2 دقیقه

این سیستم احتمالا در محصولات مختلف مایکروسافت از جمله کورتانا استفاده خواهد شد.

تبلیغات

تیمی از مهندسان مایکروسافت که در زمینه ی هوش‌مصنوعی و تحقیقات مرتبط با آن فعالیت می‌کنند، گزارش داده‌اند که ربات تشخیص گفتار این شرکت به درصد خطایی معادل ۵.۹ رسیده است. این خطا تقریبا مشابه توانایی‌های یک انسان است.

ژدونگ هوانگ، دانشمند ارشد تشخیص گفتار مایکروسافت، اعلام کرده است که «این شرکت با توانایی‌های یک انسان به برابری رسیده و به دستاوردی تاریخی دست پیدا کرده است».

پس از دهه‌ها آزمون و خطا، مایکروسافت توانسته خطای ۶.۳ درصد (که ماه گذشته بدست آورد) را بهبود بخشد. این موفقیت می‌تواند رقابت شرکت‌های تکنولوژی برای تصاحب بازار دستیار‌های دیجیتال را پیچیده‌تر کند. همچنین محصولات مختلف مایکروسافت از جمله کورتانا، اکس‌باکس و ویندوز می‌توانند از این تکنولوژی به نفع خود استفاده کنند.

برای دستیابی به این دقت، پژوهشگران مایکروسافت شبکه‌های عصبی عمیق را به کار گفته‌اند تا با ارائه‌ی میزان بسیار گسترده‌ای از دیتا (یا به عبارتی ست‌های تمرینی)، به سیستم کمک کنند که الگوی گفتار انسان را با دقت بالاتری فرا گیرد. مایکروسافت از صدا و تصویر برای استفاده‌ی بهتر از این دیتاها و بالابردن بازده آزمایش خود استفاده کرده است.

با وجود این دستاورد، پژوهشگران اشاره می‌کنند که شباهت به انسان با بی‌نقص بودن تفاوت زیادی دارد. نباید فراموش کنیم که انسان‌ها نیز در تشخیص گفتار اشتباه‌های زیادی دارند.

اعضای این تیم امیدوارند که در آینده به سطحی بالاتر از دقت تشخیص گفتار دست یابند و بتوانند درصد خطای دستگاه خود را در موقعیت‌های واقعی (مانند رستوران‌های شلوغ و شرایط جوی نامساعد) بهبود ببخشند. اعضای این تیم امیدوارند به سیستمی دست یابند که نه تنها گفتار را تشخیص می‌دهد؛ بلکه آن را درک و تحلیل خواهد کرد.

با اینکه هنوز از رسیدن به این هدف فاصله‌ی زیادی داریم. اما در آینده نیازی نیست که انسان‌ها به دنبال یادگیری کامپیوترها باشند؛ بلکه آن‌ها رفتارهای ما را فرا خواهند گرفت.

مقاله رو دوست داشتی؟

نظرت چیه؟

محمد روزبه

نظرات