دقت فناوری تشخیص گفتار مایکروسافت افزایش یافت

دوشنبه ۳۰ مرداد ۱۳۹۶ - ۱۵:۰۰
مطالعه 2 دقیقه
نرخ خطای کلمه در فناوری تشخیص گفتار شرکت مایکروسافت هم‌اکنون به ۵.۱ درصد کاهش یافته است.
تبلیغات

 فناوری تشخیص گفتار شرکت مایکروسافت تقریبا به دقتی در سطح انسان رسیده است. تیم تحقیقاتی مایکروسافت اعلام کرده که نرخ خطای کلمه‌ی سیستم تشخیص گفتار این کمپانی اکنون فقط ۵.۱ درصد است. درحالی‌که نرخ خطای کلمه (WER) در سیستم یادشده قبلا ۵.۹ درصد بود. در سپتامبر سال گذشته، ردموندی‌های موفق شدند نرخ خطای کلمه‌ی فناوری تشخیص گفتار خود را به ۶.۳ درصد برسانند و حالا این کمپانی با پیشرفته‌ کردن مداوم این سیستم، طی سال جاری توانسته است نرخ خطای کلمه را به ۵.۱ درصد کاهش دهد. این شرکت همچنین در طول سال گذشته موفق شد نرخ خطای فناوری تشخیص گفتارش را به میزان قابل توجه ۱۲ درصد کاهش دهد.

در گزارش‌های پیشین عنوان شده که نرخ خطای کلمه‌ی انسان‌ در حال حاضر معادل ۵.۱ درصد است و این یعنی سیستم تشخیص گفتار مایکروسافت دقتی در حد دقت انسان دارد. رسیدن به چنین نقطه‌ای برای شرکت مایکروسافت یک موفقیت بسیار بزرگ محسوب می‌شود؛ زیرا این کمپانی در ۲۵ سال گذشته سعی زیادی کرده است تا بتواند خدماتی در سطح توانایی انسان‌ ارائه دهد.  

ردموندی‌ها در یک گزارش فنی به ذکر جزئیاتی در این رابطه پرداخته‌اند. این شرکت در گزارش نامبرده توضیح داده است که چگونه با استفاده از ترکیب یک شبکه‌ی عصبی کانولوشن و حافظه‌ی بلندمدت و کوتاه‌مدت دوطرفه، موفق شده به چنین نرخ خطای پایینی دست یابد. مهندسان مایکروسافت همچنین روی ارتقاء مدل‌های زبان مبتنی بر شبکه‌های عصبی کار کرده‌اند تا با بهره گرفتن از آن بتوانند نرخ خطای کلمه را در تکنولوژی تشخیص گفتار این کمپانی، کاهش دهند. مایکروسافت همچنین مدعی شده است که سرمایه‌‌گذاری‌های انجام‌شده توسط این کمپانی در بخش کسب‌وکارهای مرتبط با فضای ابری، باعث شده فرآیند آموزش برای مدل‌های زبان این شرکت با سرعت بیشتری انجام شود.

فناوری تشخیص گفتار مایکروسافت در سراسر سیستم‌عامل ویندوز، دستیار دیجیتال کورتانا، مجموعه‌ی آفیس و سرویس‌های شناختی مورد استفاده قرار گرفته است. حال با افزایش دقت این سیستم، احتمالا کاربران مایکروسافت طی ماه‌های آینده از مزایای آن بهره خواهند برد. البته نباید فراموش کنیم که هم‌اکنون کمپانی‌ رقیب مایکروسافت یعنی گوگل، موفق شده‌ است نرخ موفقیت سیستم تشخیص گفتار خود را به ۹۵ درصد برساند.

نظر شما در این مورد چیست؟

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات