D1-lg

سرویس متن به گفتار ابری گوگل در دسترس توسعه‌دهندگان قرار گرفت

دوشنبه 13 فروردین 1397 - 11:15
مطالعه 2 دقیقه
توسعه‌دهندگان از این پس می‌توانند از همان فناوری تبدیل متن به گفتاری که در سرویس‌های گوگل به‌کار رفته است، در اپلیکیشن‌های خود استفاده کنند.
تبلیغات
D4-mcid4

گوگل اخیرا در وبلاگ خود اعلام کرد که سرویس متن به گفتار ابری خود را در دسترس جامعه‌ی توسعه‌دهندگان قرار می‌دهد، این سرویس به توسعه‌دهندگان امکان می‌دهد تا با استفاده از الگوی ویونت (Wavenet) و زیرساخت شبکه‌ی عصبی غول جستجو، صدای طبیعی متن به گفتار را در اپلیکیشن‌های خود به‌کار بگیرند. فناوری ویونت همان فناوری به‌کار رفته در تبدیل متن به گفتار برخی از سرویس‌های محبوب گوگل از جمله گوگل اسیستنت، مپس و جستجو است. گوگل در وبلاگ خود اشاره کرد که جدیدترین سرویس آن می‌تواند در سامانه‌های پاسخ صوتی مراکز تماس به‌کار رود، امکان پاسخگویی را در اختیار دستگاه‌های اینترنت اشیا قرار دهد و به‌صورت خودکار محتوای متنی مقاله‌ها و کتاب‌ها را نیز به قالب‌های صوتی نظیر پادکست‌ها یا کتاب‌های صوتی تبدیل کند.

توسعه‌دهندگان می‌توانند از بین ۳۲ صدای مختلف از ۱۲ زبان از جمله انگلیسی، پرتغالی، ژاپنی، فرانسوی، اسپانیایی و سوئدی دست به انتخاب بزنند؛ با این حال، گوگل می‌گوید که در آینده‌ی نزدیک صداهای بیشتری را به این سرویس افزوده خواهد کرد. علاوه‌بر این، افراد می‌توانند حجم صدا، نرخ گفتار و کیفیت صداها را نیز تغییر دهند. همچنین توسعه‌دهنگان می‌توانند از برچسب‌های نشانه‌گذاری متن به گفتار (SSML) به‌منظور افزودن مکث، دستورالعمل‌های تلفظ و تاریخ به گفتار بهره بگیرند.

گوگل در پست وبلاگ خود جزئیات بیشتری درباره‌ی بهبودهای صورت‌گرفته در الگوی ویونت ارائه داد، این فناوری در ابتدا در سال ۲۰۱۶ عرضه شد و در آن زمان از یک شبکه‌ی عصبی کانولوشن که با بهره‌گیری از نمونه‌های گفتاری مختلفی آموزش داده شده بود، استفاده می‌کرد؛ با این حال، الگوی یادشده بلافاصله با محصولات گوگل ادغام نشد؛ زیرا هنوز برای استفاده‌ی تجاری از آمادگی لازم برخوردار نبود. دو سال پس از عرضه‌ی این فناوری، اکنون نسخه‌های به‌روزشده از الگوی ویونت امکان ساخت بسیار سریع‌تر صدا را فراهم می‌کنند. ویونت در سال ۲۰۱۶ در یک ثانیه تنها قادر به تولید ۰.۰۲ ثانیه صدا بود؛ در حالی که الگوی به‌روزشده می‌تواند در یک ثانیه، ۲۰ ثانیه صدا تولید کند. علاوه بر این، الگوی به‌روزشده در مقایسه با الگوی اولیه، وضوح و دقت بهتری ارائه می‌دهد که نتیجه‌ی آن تولید صدای باکیفیت‌تر و شبیه‌تر به صدای انسان است.

توسعه‌دهندگانی که از مزیت سرویس متن به گفتار ابری بهره خواهند گرفت، می‌توانند از بین صداهای بیسیک و ویونت دست به انتخاب بزنند و براساس تعداد کاراکترهایی که ماهانه برای ساخت صدا به این سرویس ارسال می‌کنند، ملزم به پرداخت هزینه خواهند شد. صداهای بیسیک به نحو قابل توجهی ارزان‌تر هستند؛ با این حال، صداهای ویونت صوت طبیعی‌تری ارائه خواهند داد.

مقاله رو دوست داشتی؟
نظرت چیه؟

داغ‌ترین مطالب روز
وضعیت اینترنت
گزارش ماه ژوئن اسپیدتست؛ میانه سرعت اینترنت ثابت و سیار افزایش پیدا کرد

طبق گزارش ژوئن ۲۰۲۵ اسپیدتست، میانه‌ی سرعت اینترنت ثابت و همراه افزایش یافته و رتبه‌ی ایران در جدول میانه‌ی سرعت اینترنت موبایل ۶ پله بهبود داشته ...

388
حدود 23 ساعت قبل
بهترین گوشی های پوکو در بازار ایران
بهترین گوشی پوکو در بازار ایران [تابستان ۱۴۰۴]

بهترین گوشی‌های پوکو کدام مدل‌ها هستند؟ در مقاله‌ی پیش‌ رو، بهترین مدل‌های پوکو از نظر دوربین، باتری و قدرت پردازشی معرفی می‌شوند.

139
حدود 2 ساعت قبل
نمای جلو پیکان وانت در جنگل
پیکان وانت فیس‌لیفت؛ تجسم آیند‌ه‌نگرانه AI از ماشین محبوب ایران‌خودرو

تصور کنید ایران‌خودرو سراغ مدل فیس‌لیفت خودرو پیکان می‌رفت؛ از هوش مصنوعی خواستیم تا چنین خودرویی را به تصویر بکشد.

53
حدود 19 ساعت قبل
آسمان خراش آینه ای لاین عربستان
آینده پرابهام پروژه لاین؛ عربستان به‌دنبال بازنگری در جاه‌طلبانه‌ترین طرح معماری قرن است

گزارش‌ها حاکی از آن است که کاهش قیمت نفت و فشار مالی، عربستان را به بازنگری در پروژه لاین وادار کرده است.

136
2 روز قبل
مرد جوان اسلحه به دست کنار خودرو مشکی در پس‌زمینه‌ی برج آزادی
اگر بازی مورد انتظار GTA 6 در تهران روایت می‌شد!

چه می‌شد اگر وقایع بازی GTA 6 در خیابان‌های تهران رقم می‌خورد؟ از هوش مصنوعی پرسیدیم.

152
حدود 19 ساعت قبل
بازسازی نئاندرتال زن
هوش مصنوعی فاش کرد: آمیزش میان اجداد ما و نئاندرتال‌ها بسیار زودتر از حد تصور قبل آغاز شد

در پژوهش جدیدی که به کمک هوش مصنوعی انجام شد، در طول ۲۵۰ هزار سال گذشته، سه موج عمده از آمیزش میان انسان‌ها و نئاندرتال‌ها شناسایی شده است.

146
1 روز قبل
دی جی آی Agras T100
پهپاد قدرتمند T100 رونمایی شد؛ مدرن و هیجان‌انگیز با توان حمل ۱۰۰ کیلوگرم بار

DJI با رونمایی از پهپادی بزرگ و تخصصی، بار دیگر نگاه‌ها را به قدرت فناوری‌های نوین در حوزه‌ی کشاورزی جلب کرده است.

19
2 روز قبل
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات