هوش مصنوعی گوگل حالا عملکرد بهتری در مکالمههای طبیعی دارد
هوش مصنوعی گوگل جمنای هماکنون باعث شده است که ارتباط با دستیار مجازی به تجربهای طبیعیتر از گذشته تبدیل شود. بااین حال، هیچ چیزی کامل نیست و همیشه جایی برای بهبود وجود دارد. حالا جمنای با دریافت چند بهروزرسانی جدید، سعی دارد تا کیفیت مکالمات خود را بیشتر ارتقاء دهد.
گوگل اعلام کرد که بهروزرسانی جدیدی برای Gemini 2.5 Flash Native Audio منتشر کرده که مخصوص ایجنتهای صوتی زنده است. در این آپدیت گوگل روی سه نقطه اصلی تمرکز کرده است:
- دقیقتر شدن فراخوانی عملکردها: قابلیت اطمینان هنگام فراخوانی عملکردهای خارجی بهبود یافته است. اکنون جمنای میتواند زمان دقیق جمعآوری اطلاعات واقعی را در طول مکالمه تشخیص دهد و بدون مختل کردن جریان مکالمه، آن اطلاعات را بهطور مؤثر در پاسخ صوتی خود بگنجاند.
- دنبالکردن بهتر دستورات: جمنای اکنون به ۹۰ درصد از دستورات توسعهدهندگان پایبند است که نسبت به ۸۴ درصد قبلی بهبود یافته است. به این ترتیب، میتواند دستورات پیچیدهتر را بهتر مدیریت کند و خروجیهای قابلاعتمادتر را ارائه دهد.
- مکالمات روانتر: Gemini 2.5 Flash Native Audio اکنون میتواند از نقاط مختلف مکالمه قبلی بهطور مؤثرتری متناظر با متن قبلی، اطلاعات را بازیابی و مکالمات پیوستهتری ایجاد کند.
جاش وودوارد معاون رئیس گوگل لبز، دو بهبود دیگر را نیز برای جمنای و AI Studio معرفی کرد. یکی از این بهبودها این است که از این پس اگر برای مدت طولانی هنگام صحبت با Gemini Live مکث کنید، حرفتان را وسط جمله قطع نخواهد کرد. بهبود دیگر اینکه شما میتوانید میکروفن خود را حین صحبت کردن Gemini Live بیصدا کنید تا صحبتهای آن را بهطور تصادفی قطع نکنید.
گوگل میگوید که بهروزرسانی جمنای با هدف بهبود توانایی مدل در مدیریت کارهای پیچیده، دنبالکردن دستورات کاربران و برگزاری مکالمات طبیعی منتشر شده است. این بهروزرسانی هماکنون بهطور گسترده برای Gemini Live ،Search Live ،Google AI Studio و Vertex AI درحال انتشار است. علاوهبر این اعلامیه، گوگل تغییرات جدیدی را برای اپلیکیشن Translate نیز معرفی کرده است.