الگوریتم تشخیص گفتار علی بابا می‌تواند صدا را در محیط‌های شلوغ تشخیص دهد

الگوریتم تشخیص گفتار مبتنی بر هوش مصنوعی علی‌بابا می‌تواند گفتار را در محیط‌های شلوغ و پرسروصدا تشخیص دهد.

علی بابا، یکی از شرکت‌های تجارت الکترونیک بزرگ جهان است که به‌صورت فزاینده‌ای توجه خود را به حوزه‌ی هوش مصنوعی (AI) معطوف کرده است.

در مارس۲۰۱۷، بخش سرویس‌های مبتنی بر هوش مصنوعی علی‌بابا محصولاتی در حوزه‌ی مراقبت‌های بهداشتی معرفی کرد. همچنین در سپتامبر همان سال، بخش فضای ابری عمومی موسوم به Alibaba Cloud و برنامه‌هایی برای ایجاد زیرمجموعه‌‌‌‌ای تابع شرکت معرفی شد تا تراشه‌ی اختصاصی مبتنی بر هوش مصنوعی را برای استفاده در خودروهای خودران عرضه کند. پیش‌تر گفته شده بود

علی‌بابا در بسیاری از پروژ‌های مبتنی بر هوش مصنوعی دستی بر آتش دارد که نیازی به برشمردن آن‌ها نیست. در رویداد NeurIPS ۲۰۱۸ مونترال، معرفی و به‌روز‌رسانی دیگری از تلاش‌های مرتبط این شرکت در حوزه‌ی هوش مصنوعی را شاهد بودیم. رونگ جین، معاون مؤسسه‌ی علوم داده‌های علی‌بابا گفت: 

درحال‌ارائه‌ی راهکار برای سناریوهایی با مشکلات ناشناخته هستیم. هوش مصنوعی به‌همراه نوآوری‌های خود می‌تواند راهکارهایی برای حل مشکلات مختلف ارائه دهد. 

یکی از این مشکلات، تشخیص گفتار در محیط‌های پرسروصدا مثل مترو و اتاق کنفرانس‌ است. بخشی از راهکار علی‌بابا سخت‌افزاری و بخشی از آن نرم‌‌افزاری است. برای مثال، ارائه‌ی میکروفن ازراه‌دور و الگوریتم‌های پیشرفته‌ی یادگیری عمیق که می‌توانند گفتار سوژه را از صدای محیط تشخیص بدهند و این کار را با حداقل خطای ممکن انجام دهند.

درمقایسه‌با دقت ۸۴درصدی بهترین فناوری‌های تشخیص گفتار که فقط از یک میکروفون استفاده می‌کنند، علی‌بابا ادعا می‌کند این سیستم می‌تواند حتی برای سوژ‌ه‌هایی که لهجه دارند یا کلمات را بدتلفظ می‌کنند، دقتی درحدود ۹۴ تا ۹۵درصد داشته باشد. هم‌اکنون، از این فناوری به‌عنوان بخشی از سیستم صدور بلیط در متروی شانگهای استفاده می‌شود و علی‌بابا درحال‌مذاکره است تا بتواند فناوری خود را در سایر شهرها هم توسعه دهد. رونگ جین درادامه‌ی صحبت‌هایش گفت:

اگر سیگنالی که باید تشخیص داده شود به‌اندازه‌ی کافی قدرتمند نباشد، هیچ کار خاصی نمی‌توانید برای تشخیص آن انجام دهید.

علی‌بابا

کلماتی که ادا می‌شوند، تنها حوزه‌ای نیست که علی‌بابا قصد داشته باشد درزمینه‌ی هوش مصنوعی به آن توجه نشان دهد. با استفاده از پردازش زبان طبیعی، این سیستم می‌تواند در زمان واقعی کار ترجمه‌ی خودکار را در فضای ابری انجام دهد. درنتیجه، مشتریان خرده‌فروشی علی‌بابا در کشورهایی مانند روسیه و مالایا می‌توانند با زبان مادری با کارمندان این شرکت درارتباط باشند و صحبت کنند. علی‌بابا درنظر دارد از این الگوریتم (Algorithm) برای بخش عظیمی از ده‌هاهزار تماسی کمک بگیرد که مرکز پشتیبانی این شرکت هرروز ازطریق Alime، موتور سرویس هوشمند مشتری دریافت می‌کنند. Alime، به گوگل Duplex بسیار شبیه است و می‌تواند مکالمه‌ی تلفنی برقرار کند و به برخی سؤالات کلی بدون نیاز به دخالت نیروی انسانی پاسخ دهد. همچنین در حالت چت ربات، به‌صورت فوق‌العاده‌ای می‌تواند متن و تصویر را حتی بهتر از انسان‌ها از داخل فایل مستندات استخراج کند. 

در نسخه‌‌ی نمایشی، یکی از مشتریان از دیان شیائومی (Dian Xiaomi ربات سخن‌گوی علی‌بابا، درباره‌ی تبلیغات فروش اسپیکر بلوتوث سؤالی کرد. سؤال وی چیزی شبیه به این بود که هدایای رایگان این مدل اسپیکر چیست و این هدایا چگونه برای کاربر ارسال می‌شود. شایان ذکر است در نسخه‌ای که قرار است در آینده‌ای نزدیک در سال جاری معرفی شود، قابلیت بررسی احساسات و همچنین هشدار خودکار برای موارد اولویتدار اضافه خواهد شد. در نسخه‌ی نمایشی، ربات چت به‌نام جین به مخاطبان با حرکات چشم و لب و سر پاسخ داد. 

این توانایی می‌تواند برای سرویس‌هایی همچون AliExpress فوق‌العاده باشد که بیش از ۱۵۰میلیون کاربر و میلیون‌ها نفر کاربر تاجر و فناوری Cainiao دارد و نیز کارگران انسانی و ربات‌هایی که بیش از یک‌میلیارد سفارش را هر سال انجام می‌دهند. در ۱۱نوامبر (مصادف با روز مجردها در چین)، حجم تراکنش‌های مالی علی‌بابا به ۳۰.۸میلیارد دلار رسید. کارمندان این شرکت اعلام کردند در آن بازه‌ی زمانی ۲۴ساعته، حجم تماس‌های تلفنی به پنج برابر روزهای عادی رسید و تقریبا ناممکن است بدون کمک هوش مصنوعی بتوان پاسخ‌گوی این‌همه تماس بود.

alibaba

علی‌بابا اعلام کرده هم‌اکنون دیان شیائومی می‌تواندروزانه به ۳.۵میلیون کاربر سرویس دهد؛ اما پردازش زبان طبیعی، تنها ویژگی منحصربه‌فرد هوش مصنوعی علی‌بابا است. علی‌بابا با کمک Xian Yu، ربات مذاکره‌کننده‌ی قیمت برای بازار خرده‌فروشی می‌تواند درباره‌ی قیمت‌ها با خریداران مذاکره کند.

این ربات باید اصول و استراتژی‌های مذاکره را بلد باشد و بتواند بر مبنای بحث، متن مدنظر را به مخاطب ارائه دهد. توسعه‌ی چنین رباتی کاری ساده و آسان نبوده و درواقع، می‌توان گفت نتیجه‌ی کار بسیار درخورتوجه بوده است. با حضور دَه‌میلیون کاربر در پلتفرم، ربات چت توانست  ۲۰درصد موفق‌تر از نیروی انسانی مذاکره را به‌نتیجه برساند و قرارداد فروش منعقد کند. جین در ادامه گفت:

اکثر کاربران، فروشندگان حرفه‌ای نیستند و نمی‌دانند چگونه باید قیمت را تعیین و با خریداران صحبت کنند.

در زمینه‌ی مدیریت موجودی و جست‌وجوی تصویری، علی‌بابا از معماری بینایی ماشین استفاده می‌کند که قابلیت سنجش و غربال صدها میلیون شرکت و سازمان‌ را دارد. الگوریتم جست‌وجوی تصویر مبتنی بر فضای ابری این شرکت می‌تواند اشیا را تشخیص دهد و تصاویری حاوی سوژه‌های یکسان یا مشابه را پیدا کند. یکی از اپلیکیشن‌های مدیریت فروشگاه قادر است در قفسه‌ای با اجناس مختلف از برندهای مختلف، بیش از صدهزار شناسه‌ی SKU را با دقت زیاد تشخیص دهد. علی‌بابا تلاش می‌کند این رقم را به دَه‌میلیون شناسه‌ی SKU‌ برساند. 

هر دو سیستم‌عامل هوشمند ASSC که به تاجران کمک می‌کند با استفاده از ابزارهای میزان تقاضای محصول را پیش‌بینی کنند‌، فهرست موجودی را انتخاب می‌کند و راهبردهایی برای قیمت‌گذاری ارائه می‌دهد. 

عملکرد بینایی ماشین علی‌بابا با تصاویر ماهواره‌ای توسعه می‌یابد. با استفاده از داده‌های جمع‌آوری‌شده ازطریق AutoNavi که بزرگ‌ترین ارائه‌دهنده‌ی نقشه‌ی ناوبری چین با بیش از هفتادمیلیون کاربر است، این سیستم می‌تواند ساختمان‌های جدیدی را شناسایی کند که اخیرا ساخته شده‌اند و داده‌های مربوط‌به فعالیت در مسیر جاده‌ها و سایر نقاط دلخواه کاربر را جمع‌آوری کند. 

همچنین، علی‌بابا از بینایی ماشین برای جلوگیری از سرقت از فروشگاه هم استفاده می‌کند. در بیش از ۶۶ فروشگاه، الگوریتم‌های آفلاین در کیوسک‌های خودپرداز به اسکن اولین جنسی که مشتری در سبد می‌گذارد تا آخرین جنس گذاشته‌شده در سبد خرید ادامه می‌دهد و ازطریق دوربین‌های نصب‌شده هرگونه پنهان‌کردن اجناس را رصد می‌کند. جین درباره‌ی این موضوع گفت:

هدف ما این است که سیستم بینایی رایانه‌ای داشته باشیم که اگر مشتری عمدا یا سهوا مانع اسکن یکی از اقلام شد، سیستم بتواند اقلام اسکن‌نشده‌ را شناسایی کند. 

این سستم به الگوریتم یادگیری عمیق AliFPGA-X100 مجهز است که روی سیستمی برنامه‌ریزی‌شدنی و ازطریق مدار مجتمع داخل کیوسک‌ها قابلیت اجرا دارد. علی‌بابا معتقد است این سیستم می‌تواند تصاویر را تا ۱۷۰ برابر سریع‌تر از سیستم مبتنی بر GPU مقایسه کند.

alibaba

علی‌بابا درحال‌انتشار هوش مصنوعی به Youku، سرویس هاستینگ ویدئویی است. الگوریتم‌های یادگیری ماشین می‌تواند هرروز بیش از دویست‌هزار تامبنیل (Thumbnail) از ویدئوهای بیش از ده‌ها میلیون کاربر فعال را به‌صورت خودکار ایجاد کند و با کمک این تامبنیل‌ها برخی مخاطبان را هدف قرار دهد. ممکن است کاربران خانم تصویر پیش‌نمایش متفاوتی از ویدئو را بتوانند مشاهده کنند و کاربران آقا تصویر پیش‌نمایش دیگری را. این مسئله به افزایش ۱۵درصدی تعداد کلیک‌ها و افزایش ۱۲درصدی زمان حضور در وبسایت منجر می‌شود. 

نظرسنجی امروز، بعد از گذشت بیش از یک سال از معرفی مرکز تحقیقات علی‌بابا یا DAMO انجام شده و هدف آن به‌کارگرفتن فناوری‌های نوین همچون یادگیری ماشین و امنیت شبکه و بازگشایی آزمایشگاه‌هایی در سن‌ماتئو کالیفرنیا، سیاتل، واشنگتن، مسکو، روسیه، تل‌آویو، فلسطین اشغالی و سنگاپور است. یکی دیگر از اهداف انجام این کار، مقدمه‌ای برای معرفی Tmall Genie علی‌بابا است که دستیار صوتی مبتنی بر هوش مصنوعی محسوب می‌شود و تاکنون، بیش از پنج‌میلیون واحد آن از زمان راه‌یافتن به قفسه‌ی فروشگاه‌ها در ژوئیه‌۲۰۱۷ فروخته شده است. براساس اعلام علی‌بابا به کوارتز در اکتبر۲۰۱۷، این شرکت قصد دارد تا سال ۲۰۲۰ بیش از پانزده‌میلیارد دلار در حوزه‌ی تحقیق و توسعه سرمایه‌گذاری کند. 

منبع venturebeat

از سراسر وب

  دیدگاه
کاراکتر باقی مانده
تبلیغات

بیشتر بخوانید