تولید و ویرایش ویدیو با مکالمه؛ هوش مصنوعی جمنای آمنی فلش معرفی شد
گوگل از مدل Gemini Omni Flash رونمایی کرد؛ مدلی جدید برای تولید و ویرایش ویدئو که با تمرکز بر هزینهی پایین و سرعت بالا توسعه یافته و از امروز از طریق Google AI Studio و Gemini API در اختیار توسعهدهندگان قرار گرفته است.
به گفتهی گوگل، جمنای آمنی فلش برای کارهای چندوجهی طراحی شده و میتواند با استفاده از دستورات متنی ساده، ویدئوها را تولید یا ویرایش کند. کاربران برای انجام تغییرات مختلف، از جمله اصلاح صحنهها، تغییر سبک یا بازنویسی بخشهایی از ویدئو، تنها کافی است درخواست خود را با زبان طبیعی وارد کنند.
جمنای آمنی خانوادهای از مدلهای چندرسانهای گوگل است که قابلیت درک و تولید همزمان متن، تصویر، صدا و ویدئو را در یک مدل واحد ارائه میدهد. گوگل این خانواده را با هدف سادهترکردن ساخت برنامههای هوش مصنوعی معرفی کرده تا توسعهدهندگان بتوانند بدون نیاز به استفاده از چند مدل مجزا، وظایف مختلف محتوایی را انجام دهند.
نسخهی فلش برای ارائهی پاسخهای سریعتر و کاهش هزینهی پردازش بهینه شده است. گوگل میگوید این مدل برای کاربردهایی مانند تولید محتوای ویدئویی، ساخت ابزارهای تعاملی و ویرایش هوشمند مناسب است و میتواند با تأخیر کم، خروجی باکیفیتی ارائه دهد.
معرفی Gemini Omni Flash در شرایطی انجام میشود که رقابت در حوزهی تولید ویدئو با هوش مصنوعی بهشدت افزایش یافته است. شرکتهایی مانند OpenAI و Runway و Pika و Luma در ماههای اخیر مدلهای پیشرفتهای برای تولید و ویرایش ویدیو معرفی کردهاند و گوگل با گسترش خانوادهی جمنای آمنی تلاش میکند جایگاه خود را در این بازار حفظ کند.