آینده‌ای که از آن صدا است؛ چرا دستیارهای صوتی هوشمند هدف بزرگ بعدی هستند

پنج‌شنبه ۱ شهریور ۱۳۹۷ - ۱۲:۰۰
مطالعه 12 دقیقه
توسعه‌ی فزاینده دستیارهای صوتی AI باعث شده، گوگل، اپل و آمازون بر سر فتح بازار دستیارهای صوتی هوشمند به رقابت بپردازند.
تبلیغات

در اکتبر ۲۰۱۶، یک مجموعه از شرکت‌های بزرگ فناوری به بازدید از محصول جدید استارتاپی به نام Doppler Labs رفتند. بیل‌ گیتس، بنیان‌گذار مایکروسافت و مدیرعامل آن ساتیا نادلا؛ سرپرست بخش اینترنت اپل، ادی کیو و جیمی آیوین، سرپرست گروه هدفون Beats اپل به بازدید از این نمایشگاه رفتند. قبلا هم نمایندگانی از آمازون، فیسبوک، گوگل و تنسنت به این نمایشگاه رفته بودند.

آن‌ها با بررسی نسخه‌های اولیه‌ی ایربادهای بی‌سیم Here One شرکت داپلر به قابلیت این دستگاه در حذف نویزهای ناخواسته‌ی پس‌زمینه و قابلیت‌های دیگری مثل تقویت صدای یک شخص معین در اتاق و امکان مکالمه با افراد غیر انگلیسی‌زبان پی بردند. برای مثال در تست زبان، یک سؤال به زبان اسپانیایی پرسیده می‌شود و شنونده ترجمه‌ی کامپیوتری آن را به انگلیسی می‌شنود.

حداقل دو شرکت، پیشنهادهای خود را برای این محصول ارائه دادند؛ اما قیمت‌ها قانع‌کننده نبودند و باعث نشدند Doppler از رویای خود برای پیاده‌سازی یک محصول جدید و مهم دست بردارد. فروش این کالا شکست خورد و یک سال بعد این شرکت تعطیل شد؛ اما این پایان داستان نبود. چند هفته بعد از تعطیل‌شدن شرکت بیش از نیمی از مهندسان ارشد Doppler به استخدام شرکت‌های بزرگ فناوری درآمدند.

الکسا

به گزارش Fast Company، آمازون، اپل و گوگل در حال کار روی پروژه‌هایی در زمینه‌ی دستیارهای صوتی هوشمند هستند. هر سه شرکت روی محصولاتی ترکیبی شامل کاربرد کمک‌های شنیداری و کاربرد سرگرمی هدفون‌های پیشرفته کار می‌کنند. ازآنجا که هر سه شرکت، طرح‌های خود را برای حوزه‌ی بهداشت و درمان اعلام کرده‌اند؛ می‌توانند از حسگرهای نظارتی بهداشت و تناسب‌ اندام برای اندازه‌گیری ویژگی‌هایی مثل شمردن قدم‌ها تا اندازه‌گیری اشباع اکسیژن استفاده کنند. شاید چند سال زمان لازم باشد تا این برنامه‌ها عملی شوند؛ اما هیچ‌کدام از این شرکت‌ها نمی‌خواهند عقب بمانند و هدف کلی آن‌ها ساخت کامپیوترهای شنیداری است که به‌واسطه‌ی این فناوری، کاربر تلفن همراه خود را در کشوی میزش قرار دهد. گینتز کلیمنتز، سرپرست سابق مهندسی صوت Doppler می‌گوید:

ایده‌ی نهایی، سرقت زمان از تلفن هوشمند است. تلفن هوشمند کاملا کنار نمی‌رود؛ بلکه ترکیبی از دستورات صوتی و شنیداری برای انجام کارها به‌کار برده می‌شود.

چرا دستیارهای صوتی هوشمند، چرا حالا؟

داپلر و استارتاپ‌های دیگر به مدت نیم دهه به‌دنبال ساخت یک دستگاه شنیداری هستند و برای تسلط بر بازار روی معیارهایی مثل کیفیت صورت، عمر باتری، خنک‌کننده و موارد دیگر تمرکز کرده‌اند؛ اما دلیل علاقه‌ی ناگهانی شرکت‌های بزرگ به این فناوری چیست؟ می‌توان گفت دلیل اصلی، محبوبیت دستیارهای صوتی شخصی مثل Amazon Alexa، Apple Siri، Google Assistant و Microsoft Cortana است؛ پس از محبوبیت صفحه‌نمایش لمسی اپل و تلفن همراه آیفون، این دستیارها بزرگ‌ترین تحول در عرصه‌ی دستیارهای صوتی کاربری هستند.

ارسال صوتی پیام در حین رانندگی خطر تصادف را کاهش می‌دهد

به‌گفته‌ی کلیف راسکایند، تحلیل‌گر استراتژی، تمایل افراد به استفاده از فناوری بدون دست زدن به آن، سخنگو‌های هوشمند را به پرطرفدارترین سخت‌افزارهای موجود در بازار سخت‌افزار تبدیل کرده است. تا سال ۲۰۲۳ تقریبا ۶۳ درصد از خانه‌های ایالات‌ متحده مجهز به دستگاه‌هایی مثل Amazon Echo یا Google Home خواهند شد؛ این میزان، در سال ۲۰۱۴ به ۰.۳ درصد و در سال ۲۰۱۷ به ۱۶ درصد رسیده بود.

آمریکایی‌ها با این امکانات، دیگر نیازی به تایپ اغلب پرس‌وجوهای جستجوی‌ گوگل و پیشگویی Comscore نخواهند داشت و می‌توانند دستورات را به‌صورت صوتی صادر کنند. بر اساس پژوهش‌های ژونیپر، ارزش تبلیغات دریافتی در پاسخ به پرس‌وجوهای صوتی ۱۲ میلیارد دلار خواهد بود. درصورتی‌که مشتری‌ها در ساعت‌های بیداری از کامپیوترهای داخل گوش استفاده کنند، داده‌های شخصی بیشتری از جمله علایق و کارهای خود را در اختیار شرکت‌های فناوری قرار می‌دهند؛ به این منظور یک کانال در مغز ایجاد می‌شود و خرید به‌سادگی گفتن یک جمله مثل «الکسا ... را بخر» خواهد شد.

آینده به گوش وابسته است

ساتیو چاهیل، مدیر سابق بازاریابی اپل، فناوری‌های شنیداری Starkey را در سال‌های اخیر معرفی کرده است؛ او می‌گوید:

 شرکت‌ها با فناوری شنیداری می‌توانند امکاناتی فراتر از تقویت موسیقی و تماس تلفنی را در اختیار کاربر قرار دهند. دستیار مجازی در کل روز در گوش کاربران زمزمه می‌کند؛ درعین‌حال می‌تواند سلامت و بهداشت آن‌ها را هم بهبود دهد.

گوش، عضو ارزشمندی است که در فاصله‌ی چند اینچی از دهان قرار گرفته؛ بنابراین بهتر از سخنگوهای هوشمند می‌تواند صداها را دریافت و درک کند. گوش‌ برخلاف چشم حتی هنگام خواب هم فعال است و می‌توان آن‌ را عضوی چندوظیفه‌ای دانست. هرساله هزاران نفر به‌دلیل ارسال پیام در حین رانندگی و حواس‌پرتی دچار حادثه می‌شوند و جان خود را از دست می‌دهند. اما اغلب افراد با حرف زدن در حین رانندگی و تبدیل آن به متن مشکلی ندارند (حتی اگر موسیقی در حال پخش باشد). گوش‌ها مقابل صورت شما نیستند؛ بر همین اساس، طرح‌های جدید و نامرئی جانی ایو برای دستیارهای صوتی هوشمند آینده ایده‌ی خوبی خواهند بود (Google Glasses را به یاد می‌آورید؟).

ایرپاد

دستیارهای صوتی هوشمند با سنسورها و پردازش مناسب تشخیص می‌دهند که سر شما به سمت قفسه‌ی یک فروشگاه قرار گرفته یا به سمت یک بیلبورد داخل خیابان. به‌گفته‌ی پاپی کرام، سرپرست علمی آزمایشگاه‌های دالبی، با اضافه شدن ناظر ضربان قلب برای اندازه‌گیری استرس و حسگر نوار مغزی برای تحلیل فعالیت‌های مغزی، این دستیارهای صوتی می‌توانند تا اندازه‌ای افکار شما را توصیف کنند؛ برای مثال می‌توانند بگویند توجه شما تا چه اندازه به صدای قدم‌های پشت سرتان جلب شده است.

ادراک و قابلیت‌های دستیارهای صوتی هوشمند در آینده حتی از کلماتی که به زبان می‌آورید، فراتر خواهد رفت. در حال حاضر یک استارتاپ بریتانیایی در کمبریج به نام Audio Analytic در تلاش برای دریافت مجوز نوعی دستگاه است که صداهایی مثل شکستن پنجره یا گریه‌ی نوزاد را تشخیص می‌دهد. البته اخیرا آمازون با تشخیص صدای سرفه تبلیغات Robitussin را ارسال می‌کند که یک نوع دارو برای سرماخوردگی است.

چالش شنیداری

گوش و دستیارهای صوتی، مشکلات جدیدی را برای شرکت‌های عرضه‌کننده‌ی محصولات محاسباتی به‌وجود خواهند آورد. دستگاه‌های محاسباتی شنیداری کوچک و سبک هستند که می‌توانند به مدت طولانی و بدون آزار برای کاربر در مجرای گوش او قرار بگیرند. البته قدرت باطری این دستگاه‌ها باید به اندازه‌ی تلفن هوشمند باشد و تا وقتی تلفن همراه روشن است به فعالیت خود ادامه دهند. بدیهی است که نیاز به یک آنتن و پردازنده‌ی قوی را نباید نادیده گرفت. البته دو چالش دیگر وجود دارند: یکی جرم گوش و دیگری استفاده از دستگاه‌های شنیداری بدون لرزش سر یا دست، ضربه خوردن به گوش و حتی حرف زدن با خود (بقیه فکر کنند شخص با خود حرف می‌زند). بر اساس بررسی‌های اخیر، تنها ۶ درصد از آمریکایی‌ها برای صحبت با دستیار صوتی خود در ملاء عام احساس راحتی می‌کنند.

یک تصور نادرست دیگر هم در مورد سمعک‌ها وجود دارد. به نقل از انجمن کمبود شنوایی بااینکه صدها میلیون نفر به سمعک نیاز دارند؛ از میان ۴۸ میلیون نفر آمریکایی که به سمعک نیاز دارند، تنها ۱۶ درصد اقدام به خرید آن می‌کنند. افرادی هم که آن را می‌خرند، معمولا پس از مدت میانگین هفت سال کنار می‌گذارند.

مقررات این صنعت بی‌فایده بوده است؛ به این دلیل که سمعک‌ها یا کمک‌های شنیداری، دستگاه‌هایی پزشکی هستند و در درجه‌ی اول به تصویب وزارت غذا و دارو نیاز دارند و مشتریان هم با تشخیص پزشک و شنوایی‌سنج (بدون پوشش بیمه) می‌توانند از آن‌ها استفاده کنند. به گزارش Consumer Report بر اساس نسبت حاشیه‌ی سود به رشد فروش، پنج شرکت می‌توانند در طول یک سال بر بازار ۶ میلیارد دلاری سمعک‌ها مسلط شوند و محصولاتی با ارزش میانگین ۲۷۰۰ دلار را به فروش برسانند. قیمت بهترین نوع سمعک هم ۱۰٬۰۰۰ دلار خواهد بود.

الکسا

حال این قانون در حال کمرنگ شدن است. آگوست سال گذشته، کنگره قانون کمک‌های شنیداری OTC را تصویب کرد. وقتی این قانون در آگوست ۲۰۲۰ تصویب شود، شرکت‌ها می‌توانند برای افراد با اختلال شنوایی کم تا متوسط به تولید سمعک و کمک‌های شنیداری بپردازند و آن را در هر داروخانه‌ای عرضه کنند. در گذشته، تولید‌کنندگان عینک برای افرادی که قصد مراجعه به چشم‌پزشک را نداشتند دست به تولید قرائتگرهای ده دلاری زدند.

به این ترتیب این دستگاه‌ها بازار بزرگ و روبه‌رشدی را خواهند داشت. به‌گفته‌ی سازمان سلامت جهانی، ۱.۱ میلیارد کودک و جوان بالغ در سراسر دنیا در معرض خطر از دست دادن شنوایی قرار دارند، آن‌ها مرتب از ایرفون‌هایی با محدوده‌ی صدای بسیار بالا و مستقیم استفاده می‌کنند.

این قانون تأثیر چشم‌گیری خواهد داشت. اگر بعد از شنیدن هر سخنی از طرف مقابل پرسیدید «چی؟» بهتر است فکری برای حل این مشکل کنید. به‌احتمال‌زیاد، شرکت‌های عرضه‌کننده این دستگاه را در دسته‌ی وسایلی مثل کاورهای رنگارنگ آیفون و فیت‌بیت‌ها قرار می‌دهند؛ نه در دسته‌ی Depends و دیگر محصولات مرتبط با افراد میانسال. این دستگاه نباید با عنوان سمعک بازاریابی و تبلیغ شود، بلکه باید به‌عنوان ایرفون بلوتوث با امکاناتی مثل «بهبود شنیداری» یا شخصی‌سازی عرضه شود.

کی آر لیو، معاون سابق دسترسی داپلر می‌گوید تقریبا برای بیست سال منتظر این لحظه بوده است؛ او تنها سه سال داشت که از سمعک برای مبارزه با زوال شدید شنوایی خود استفاده کرده بود. به عقیده‌ی او، با قدرت بالای شرکت‌ها در زمینه‌ی برندسازی می‌توان تصورات غلط را نسبت به سمعک‌ها و دستیارهای صوتی هوشمند از بین برد.

تأثیر داپلر

داپلر، دستیار صوتی هوشمند را اختراع نکرد؛ بلکه در دوره‌ی کوتاه فعالیت خود توانست نفوذ و تأثیرگذاری آن را بالا ببرد.  یکی از مدیران صنعت موسیقی نوآ کرفت و مدیر سابق مایکروسافت، فریتز لانمان، داپلر را در سال ۲۰۱۳ تأسیس کردند؛ تا محصولی را برای فستیوال Coachella به‌منظور سفارشی‌سازی موسیقی زنده با امکاناتی مثل افکت fuzz یا قرار دادن حد بالاتری روی حجم صوت عرضه کنند. در اوایل ۲۰۱۶، تیمی قوی از کارشناسان صوتی روی Here One کار کردند که از  امکانات صوتی و همین‌طور توانایی تماس تلفنی و موزیک استریم برخوردار بود.

پس از توسعه‌ی محصولات، داپلر از طرف شرکت‌های بزرگ فناوری علاقه‌مند، پیشنهاد‌هایی را دریافت کرد. اگرچه قرار بود Here One در طی چند ماه به بازار عرضه شود؛ کرافت، مدیرعامل شرکت اعلام کرد اکتبر نسخه‌ی دمو ارائه خواهد شد. یک تیم کوچک فروشگاهی را در یک اتاق کنفرانس مجلل در دفتر Universal Music Group (یکی از اولین سرمایه‌گذاران Doppler) ترتیب دادند.

بازدیدکنندگان شامل سرمایه‌گذارهای اقتصادی مثل مری میکر و یوری میلنر و تیم‌هایی از آمازون و واحد R&D آن در سیلیکون‌ولی و همین‌طور Lab 126، گوگل، اپل و فیسبوک بودند. با این‌که چند شرکت پیشنهادهای خود را روی میز گذاشتند، اما هیچ‌کدام نتوانستند نظر کرافت و هیئت‌مدیره‌ی داپلر را به خود جلب کنند.

پس از به فروش گذاشتن Here One، تمام رؤیاپردازی‌های افسانه‌ای این محصول از بین رفتند. مطبوعات فناوری این دستگاه را به‌خاطر طراحی نوآورانه‌ی آن مورد تحسین قرار دادند؛ اما مشکلاتی مثل طول عمر باتری و  بی‌سیم نبودن ایرفون فروش پائین آن را به‌دنبال داشت. البته یک نقطه‌ی روشن هم وجود داشت. تقریبا یک‌چهارم خریدارها با قیمتی کمتر این دستگاه را خریدند و آن را جایگزین واسطه‌های قدیمی خود کردند؛ البته داپلر هم زیاد برای بازاریابی محصول تلاش نکرده بود. پس‌ از آنکه ایرپاد اپل بازار ایرفون را به تسخیر خود درآورد، داپلر تصمیم گرفت مسیر خود را تغییر دهد. درحالی‌که تیم مهندسی بر قابلیت شنیداری متمرکز بود، لیو به‌دنبال لابی‌گری برای فروش بدون نسخه‌ی محصول (OTC) بود.

کارکنان داپلر

نوآ کرافت (سمت راست بالا) و تیم آزمایشگاه داپلر. هفت نفر از این تیم حالا در آمازون کار می‌کنند، سه نفر در اپل، سه نفر در گوگل و سه نفر دیگر هم در دالبی مشغول به فعالیت هستند

تا آگوست سال گذشته که این طرح قانونی شد، داپلر در وضعیت بدی قرار داشت. کرافت مجددا با پیشنهاددهندگان بالقوه تماس گرفت و آن‌ها هم بلافاصله درخواست ملاقات را پذیرفتند. یک تیم از مایکروسافت ازجمله مدیرعامل آن، نادلا به بررسی تأثیر دستگاه‌های شنیداری بر بهره‌وری کارکنان پرداختند. شرکت‌ها در مورد ایده‌های جذابی به همکاری با یکدیگر پرداختند. از آنجا که Here One مجهز به یک میکروفون داخلی برای تقویت صدای کاربر بود، استفاده از آن برای صدور دستورات ورد و اکسل ایده‌ی خوبی بود؛ اما در پایان مایکروسافت تصمیم گرفت این پیشنهاد را نادیده بگیرد. تیم‌های مختلفی از گوگل ازجمله یک نفر از X moonshot factory و یک نفر از بخش سخت‌افزار  که به‌دنبال تکمیل پیکسل بادها بودند هم به بررسی‌های خود ادامه دادند؛ اما هیچ کدام پیشنهاد قابل‌توجهی را ارائه ندادند.

در سپتامبر ۲۰۱۷، اپل تیم بزرگی را برای مذاکره‌ی بیشتر ارسال کرد. واضح بود که اپل نیازی به داپلر نداشت؛ زیرا از سال ۲۰۱۱ یعنی زمانی که با سازندگان سمعک‌ها و کمک‌های شنیداری به همکاری می‌پرداخت، روی فناوری شنیداری کار می‌کرد و فناوری را ارائه داد که به‌واسطه‌ی آن مصرف‌کنندگان می‌توانستند صدای ضبط‌شده‌ی میکروفون آیفون خود را به‌صورت مستقیم به سمعک خود انتقال دهند (برای مثال یک دانش‌آموز می‌توانست آیفون خود را نزدیک به معلم و در مقابل کلاس قرار دهد تا سخنرانی را به‌خوبی بشنود).

با فناوری شنیداری آمازون می‌توان مستقیما از طریق الکسا خرید کرد

این شرکت، سرمایه‌ی زیادی را صرف ساخت یک فناوری مشابه تراشه‌ی ارتباطی W1 کرد؛ که از نظر کیفیت صوت، عمر باتری و سهولت کاربرد به ساخت ایرپاد کمک می‌کرد. به نقل از گروه NPD، ایرپادها ۲۴ درصد از فروش ایرفون بی‌سیم را در نیمه‌ی اول امسال از آن خود کردند (۳ درصد بیشتر از هدفون‌های Beats). البته اپل هنوز هم به خرید فناوری‌های کلیدی داپلر به‌ویژه‌ فناوری‌های مرتبط با الگوریتم‌های شنیداری علاقه‌مند بود؛ اما مبلغ پیشنهادی آن نتوانست نظر داپلر را جلب کند.

با دستیار صوتی هوشمند قدرتمند آمازون، کاربرها می‌توانند از طریق الکسا (حتی اگر نزدیک به گوینده‌ی هوشمند نباشند) و بدون وابستگی به دستگاه اندروید یا iPhone خود خرید کنند. تیم Lab 126 به مدت سال‌ها روی پروژه‌ی خارج کردن الکسا از محیط خانه کار می‌کرد. فروشندگان آمازون  پس از اطلاع از رکورد مالی سریع داپلر (همین‌طور اطلاع از فناوری داپلر و مذاکره‌های تجاری) قیمت پائینی را برای مزایده پیشنهاد دادند.

کرافت به‌جای پذیرش پیشنهادها، تصمیم گرفت چند هفته بعد، شرکت را کاملا تعطیل کند. او بعدها دارایی داپلر را به دالبی فروخت. شرکت دالبی در زمینه‌ی نرم‌افزارهای صوتی و بهبود صوت فیلم‌ها و رسانه‌های دیگر تخصص دارد. دالبی هیچ محصول جدیدی را بر اساس مجوزهای داپلر تأیید نکرد؛ اما  کرام، سرپرست علمی این شرکت می‌گوید:

در حال حاضر بر شناسایی نحوه‌ی ارتباط فناوری، اکوسیستم‌ها و دانش خود با بازار شنیداری کار می‌کنیم. فناوری داپلر با وجود تعطیلی این شرکت توانست به حیات خود ادامه دهد. ما به محصول خود و تیم داپلر برای توسعه‌ی فناوری کامپیوتر داخل گوش افتخار می‌کنیم.

آینده

داپلر از میدان خارج شده است، اما علائم حیاتی بازار شنیداری روزبه‌روز قوی‌تر می‌شوند. دستمزد فناوری‌های صوتی بالا رفته‌ است؛ به‌طوری‌که شرکت‌های بزرگ فناوری معمولا ۲۰۰ هزار دلار را به استعدادهای برتر استارتاپ‌ها و شرکت‌های فعال در زمینه‌ی شنیداری می‌پردازند. کوالکام به‌عنوان یک شرکت بزرگ در زمینه‌ی تولید تراشه‌ی موبایل، اولین گروه تراشه‌ی خود برای واسطه‌های شنیداری را در ماه مارس معرفی کرد و انتظار می‌رود شرکت‌های دیگر تا پایان سال این راه را دنبال کنند.

ایرپاد

آمازون، گوگل و اپل آمادگی خود را در این زمینه حفظ کرده‌اند. به نقل از سه کارمند سابق داپلر، آمازون همزمان با مذاکره با داپلر در سال‌ گذشته با تیمی شامل ۷۰ کارمند روی دستگاه‌های شنیداری کار می‌کرد. درحالیکه تیم سخت‌افزاری گوگل روی  پیکسل بادز و محصولات دیگر کار می‌کند؛ واحد X گوگل به‌دنبال توسعه‌ی کامپیوترهای کاملا مستقل داخل گوش است و بخش Google Voice هم در مورد روش‌هایی برای دستیار شخصی به پژوهش می‌پردازد که دسترسی به آن‌ها از دستیارهای صوتی هوشمند امکان‌پذیر باشد.

اپل نیز به روش خود پیشتاز است. به نقل از منابع این شرکت به‌جای ساخت یک محصول انقلابی و کاملا جدید در عصر شنیداری، به‌دنبال اضافه کردن قابلیت‌ها و امکانات جدید و آشنا برای کاربر است. به نقل از بلومبرگ، این شرکت تا پایان سال هدفون‌های پیشرفته‌ای را برای دوستداران موسیقی معرفی می‌کند و علاوه‌بر این، به عرضه‌ی یک نسخه‌ی ارتقاءیافته و مقاوم در برابر آب ایرپاد می‌پردازد که با جمله‌ی «Hey Siri» فعال می‌شود.

دیگر شرکت‌های پیشتاز در این فناوری خود را برای عرضه‌ی محصولات جدید خود آماده می‌کنند. براگی شرکتی آلمانی است که کمی قبل‌تر از داپلر تأسیس شده و اخیرا به‌دنبال دریافت مجوز نرم‌افزارش، فروش دستگاه‌های شنیداری خود را متوقف کرده است. مدیرعامل این شرکت نیکولاج هیوید می‌گوید:

وقتی اپل و شرکت‌های دیگر به‌دنبال شما حرکت کنند، باید محل سرمایه‌گذاری خود را تغییر دهید. از سوی دیگر، داشتن این‌همه همراه و دنباله‌رو جذاب است.
تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات