با این نرم‌افزار می‌توانید هر صدایی را شبیه‌سازی کنید

هوش مصنوعی

فناوری

چهارشنبه 29 بهمن 1404 - 19:40

مطالعه 2 دقیقه

امیر عبدالملکی

امواج صوتی روبه‌روی دهان یک شخص و لوگو میکروفون

نرم‌افزار جدید ویس‌باکس به شما امکان می‌دهد تا هر صدایی را تنها با چند ثانیه فایل صوتی به‌صورت امن شبیه‌سازی کنید.

تبلیغات

ابزار جدیدی با نام Voicebox امکان شبیه‌سازی صدا را تنها با چند ثانیه فایل صوتی و کاملاً به‌صورت آفلاین روی سیستم کاربر فراهم می‌کند.

برخلاف سرویس‌هایی مانند ElevenLabs، در ویس‌باکس نه نیازی به اشتراک پولی وجود دارد و نه اطلاعاتی به فضای ابری ارسال می‌شود؛ تمام پردازش‌ها به‌صورت آفلاین و روی دستگاه انجام خواهد شد و هیچ نمونه‌صدایی دستگاه را ترک نمی‌کند.

ویس‌باکس بر پایه‌ی مدل Qwen3-TTS توسعه یافته؛ مدل تبدیل متن به گفتار شرکت علی‌بابا که به‌عنوان یکی از پیشرفته‌ترین فناوری‌های متن‌باز متن‌به‌گفتار شناخته می‌شود.

کاربر می‌تواند تنها با بارگذاری چند ثانیه صدا، نمونه‌ای بسیار نزدیک به صدای اصلی تولید کند، متن دلخواه را در هر زبانی به گفتار تبدیل کند و حتی مکالمه‌هایی با چند صدای مختلف را در محیطی شبیه نرم‌افزارهای تدوین صوت مدیریت و ترکیب کند.

ویس‌باکس صرفاً یک رابط ساده‌ی TTS نیست، بلکه به‌عنوان یک استودیو کامل تولید صدا طراحی شده است. این نرم‌افزار از ویرایشگر تایم‌لاین چندترَکی برای ساخت پادکست یا دیالوگ‌های پیچیده بهره می‌برد، امکان ضبط صدای سیستم و تبدیل خودکارش به متن با استفاده از فناوری Whisper را فراهم می‌کند و با قابلیت کش‌کردن پرامپت‌های صوتی، بازتولید فوری صدا را امکان‌پذیر می‌کند.

مقاله‌های مرتبط

توسعه‌ی ویس‌باکس با فریم‌ورک Tauri و زبان Rust انجام شده، نه الکتروم. همین موضوع باعث کاهش چشمگیر حجم نرم‌افزار و ارائه‌ی عملکرد بومی و سریع‌تر شده است.

پروژه، کاملاً متن‌باز و تحت مجوز MIT منتشر شده و هم‌اکنون نسخه‌های macOS و ویندوز آن در دسترس است؛ نسخه‌ی لینوکس به‌زودی منتشر می‌شود.

مقاله رو دوست داشتی؟

نظرت چیه؟

امیر عبدالملکی

تبلیغات

نظرات