پخش از رسانه

تولید و ویرایش ویدیو با مکالمه؛ هوش مصنوعی جمنای آمنی فلش معرفی شد

چهارشنبه 10 تیر 1405
مطالعه 1 دقیقه
گوگل هوش مصنوعی ویدیوساز جمنای آمنی فلش را با تمرکز بر کاهش هزینه و سرعت بالا رونمایی کرد.
تبلیغات

گوگل از مدل Gemini Omni Flash رونمایی کرد؛ مدلی جدید برای تولید و ویرایش ویدئو که با تمرکز بر هزینه‌ی پایین و سرعت بالا توسعه یافته و از امروز از طریق Google AI Studio و Gemini API در اختیار توسعه‌دهندگان قرار گرفته است.

به گفته‌ی گوگل، جمنای آمنی فلش برای کارهای چندوجهی طراحی شده و می‌تواند با استفاده از دستورات متنی ساده، ویدئوها را تولید یا ویرایش کند. کاربران برای انجام تغییرات مختلف، از جمله اصلاح صحنه‌ها، تغییر سبک یا بازنویسی بخش‌هایی از ویدئو، تنها کافی است درخواست خود را با زبان طبیعی وارد کنند.

جمنای آمنی خانواده‌ای از مدل‌های چندرسانه‌ای گوگل است که قابلیت درک و تولید هم‌زمان متن، تصویر، صدا و ویدئو را در یک مدل واحد ارائه می‌دهد. گوگل این خانواده را با هدف ساده‌ترکردن ساخت برنامه‌های هوش مصنوعی معرفی کرده تا توسعه‌دهندگان بتوانند بدون نیاز به استفاده از چند مدل مجزا، وظایف مختلف محتوایی را انجام دهند.

نسخه‌ی فلش برای ارائه‌ی پاسخ‌های سریع‌تر و کاهش هزینه‌ی پردازش بهینه شده است. گوگل می‌گوید این مدل برای کاربردهایی مانند تولید محتوای ویدئویی، ساخت ابزارهای تعاملی و ویرایش هوشمند مناسب است و می‌تواند با تأخیر کم، خروجی باکیفیتی ارائه دهد.

معرفی Gemini Omni Flash در شرایطی انجام می‌شود که رقابت در حوزه‌ی تولید ویدئو با هوش مصنوعی به‌شدت افزایش یافته است. شرکت‌هایی مانند OpenAI و Runway و Pika و Luma در ماه‌های اخیر مدل‌های پیشرفته‌ای برای تولید و ویرایش ویدیو معرفی کرده‌اند و گوگل با گسترش خانواده‌ی جمنای آمنی تلاش می‌کند جایگاه خود را در این بازار حفظ کند.

نظرات