D1-lg

آمازون هوش مصنوعی جدیدی برای پردازش صدای طبیعی معرفی کرد

سه‌شنبه ۱۹ فروردین ۱۴۰۴ - ۱۴:۳۹
مطالعه 2 دقیقه
لوگو آمازون
هوش مصنوعی جدید آمازون مخصوص پردازش صدا است و ادعا می‌شود که عملکردی مناسب برای رقابت با رقبا دارد.
تبلیغات
D4-mcid4

آمازون مدل جدید هوش مصنوعی مولد خود با نام Nova Sonic را معرفی کرد؛ مدلی که توانایی پردازش صوت به‌صورت بومی و تولید گفتار طبیعی دارد. آمازون ادعا می‌کند که عملکرد Nova Sonic در زمینه‌هایی مانند سرعت و تشخیص گفتار و کیفیت مکالمه، با پیشرفته‌ترین مدل‌های صوتی OpenAI و گوگل رقابت‌کردنی است.

Nova Sonic پاسخ آمازون به مدل‌های جدید صوتی هوش مصنوعی همچون مدلی است که حالت گفتاری ChatGPT را قدرت می‌بخشد. مدل‌ها در مقایسه با نمونه‌های اولیه‌ی دستیار صوتی الکسا، بسیار طبیعی‌تر به نظر می‌رسند. پیشرفت‌های اخیر در حوزه‌ی فناوری باعث شده‌اند تا مدل‌های قدیمی و دستیارهای دیجیتال سنتی، مانند سیری اپل یا نسخه‌ی اولیه‌ی الکسا، بسیار خشک و ماشینی به نظر برسند.

Nova Sonic ازطریق پلتفرم Bedrock، بستری برای توسعه‌ی اپلیکیشن‌های هوش مصنوعی سازمانی و ازطریق API جدید دوطرفه‌ی استریم، در دسترس توسعه‌دهندگان قرار می‌گیرد. آمازون در بیانیه‌ای مطبوعاتی، Nova Sonic را «به‌صرفه‌ترین مدل صوتی هوش مصنوعی بازار» توصیف کرده و گفته است که هزینه‌ی استفاده از آن حدود ۸۰ درصد کمتر از GPT-4o است.

بخش‌هایی از Nova Sonic اکنون در نسخه‌ی ارتقایافته‌ی دستیار صوتی آمازون با نام +Alexa به کار گرفته شده‌اند. به گفته روهیت پراساد، معاون ارشد آمازون و رئیس واحد AGI، این مدل برپایه‌ی تجربه‌ی گسترده‌ی آمازون در سیستم‌های ارکستراسیون بزرگ توسعه یافته است. این‌ها همان زیرساخت‌های فنی هستند که عملکرد الکسا را ممکن می‌کنند.

پراساد می‌گوید که Nova Sonic در هدایت درخواست‌های کاربر به APIهای مختلف عملکردی برتر دارد. این توانایی باعث می‌شود تا مدل بتواند تشخیص دهد چه زمانی باید اطلاعاتی را از اینترنت دریافت و منبع داده‌ی اختصاصی را پردازش کند یا اقدامی را در اپلیکیشن خارجی انجام دهد و ابزار مناسب برای هرکدام را به‌درستی انتخاب کند.

براساس اظهارات آمازون، در جریان مکالمه‌ی دوطرفه، Nova Sonic منتظر زمان مناسب برای پاسخ‌گویی می‌ماند و مکث‌های احتمالی در صحبت را در نظر می‌گیرد. همچنین، برای گفتار کاربران متن پیاده‌سازی‌شده (Transcript) تولید می‌کند که توسعه‌دهندگان می‌توانند از آن در کاربردهای مختلف استفاده کنند.

پراساد می‌گوید که دقت تشخیص گفتار Nova Sonic در مقایسه با بسیاری از مدل‌های صوتی هوش مصنوعی دیگر بیشتر است؛ به‌گونه‌ای که این مدل حتی در شرایطی که کاربر در صحبتش مکث می‌کند و اشتباه حرف می‌زند یا در محیطی پرسر‌وصدا قرار دارد، بازهم در تشخیص منظور کاربر عملکرد موفقی از خود نشان می‌دهد.

براساس آزمایشی با نام Multilingual LibriSpeech برای ارزیابی تشخیص گفتار در زبان‌ها و لهجه‌های مختلف، Nova Sonic به نرخ خطای کلمه‌ای (WER) برابر با ۴٫۲ درصد در زبان‌های انگلیسی، فرانسوی، ایتالیایی، آلمانی و اسپانیایی دست یافت. این یعنی تنها ۴ کلمه از هر ۱۰۰ کلمه با نسخه‌ی انسانی متفاوت بوده‌اند.

مقاله رو دوست داشتی؟
نظرت چیه؟
تبلیغات
D5-b3IranServer
داغ‌ترین مطالب روز
مستربیست با هودی مشکی و دلار در گوش
یوتیوبر ۲۷ ساله معروف حالا جوان‌ترین میلیاردر خودساخته دنیا است

مستر بیست با ترکیب خلاقیت و جسارت و استفاده از مزایای دنیای دیجیتال، به‌جمع میلیاردرهای خودساخته‌ی جهان راه یافت.

69
20 ساعت پیش
آخرین پوستر فصل سوم اسکویید گیم در بازی جدید
پوستر فصل آخر سریال اسکویید گیم منتشر شد

نتفلیکس آخرین پوستر سریال فوق‌العاده محبوب اسکویید گیم را به‌نمایش گذاشت.

38
2 روز پیش
زن جوانی در ساحل درحال تمرین مدیتیشن
مدیتیشن چیست؛ راهنمای جامع انواع مدیتیشن برای مبتدی ها

مدیتیشن استرس‌های روزانه را از بین می‌برد و آرامش درونی را به همراه می‌آورد. شما می‌توانید به‌راحتی نحوه انجام مدیتیشن را یاد بگیرید.

45
2 روز پیش
خرموش پشمی زیرآلپی  در دست پژوهشگر
گونه‌ای خرموش که فقط در موزه‌ها دیده شده بود، برای اولین‌بار در طبیعت مشاهده شد

پژوهشگر اهل جمهوری چک موفق شده است برای نخستین بار از خرموش پشمی زیرآلپی در زیستگاه طبیعی‌اش عکس بگیرد.

57
2 روز پیش
نمایی از موتور کولر آبی
برای حل ناترازی انرژی؛ فروش اقساطی موتورهای فوق‌کم‌مصرف کولر آغاز شد

صندوق نوآوری و شکوفایی و سازمان انرژی‌های تجدیدپذیر و بهره‌وری انرژی برق، طرح فروش اقساطی موتورهای فوق کم‌مصرف کولرهای آبی را آغاز کردند.

85
یک روز پیش
منوی اپلیکیشن‌های گلکسی A36
زمان‌بندی آپدیت One UI 7 سامسونگ اصلاح شد؛ لیست جدید را ببینید

به‌احتمال زیاد اکثر گوشی‌های سامسونگ تا ماه میلادی آینده به رابط کاربری One UI 7 مجهز خواهند شد.

421
2 روز پیش
طرح هوش مصنوعی از ایستگاه اتوبوس به شکل سفینه‌فضایی در محیط برفی
راز معماری سورئال شوروی: ایستگاه‌های اتوبوسی که از آینده آمده‌اند

در نظامی که به یکسان‌سازی معروف بود، این ایستگاه‌های اتوبوس کوچک و «بی‌اهمیت» چگونه به شاهکارهای هنری و تجلی مقاومت خاموش تبدیل شدند؟

38
یک روز پیش
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات