D1-lg

امکان ساخت ویدویوهای هوش مصنوعی با کارت‌های گرافیک اقتصادی ۶ گیگابایتی فراهم شد

یک‌شنبه 31 فروردین 1404 - 05:50
مطالعه 2 دقیقه
ویدیو تولید شده با مدل هوش مصنوعی FramePack
با فناوری هوش مصنوعی FramePack می‌توان حتی با کارت‌های گرافیک ۶ گیگابایتی، روی کامپیوتر شخصی و بدون‌نیاز به سرویس‌های ابری، ویدیو تولید کرد.
تبلیغات
D4-mcid4

لو‌مین ژانگ از گیت‌هاب با همکاری مانیش آگراوالا از دانشگاه استنفورد، فناوری جدیدی به‌نام FramePack معرفی کردند؛ معماری پیشرفته‌ی هوش مصنوعی که امکان ساخت ویدیوهای طولانی و باکیفیت را حتی با کارت‌های گرافیک اقتصادی مجهز به ۶ گیگابایت حافظه فراهم می‌کند.

FramePack نوعی معماری شبکه‌ی عصبی است که با استفاده از تکنیک‌های بهینه‌سازی چندمرحله‌ای، تولید ویدیوی مبتنی‌بر هوش مصنوعی را به‌شکل محلی (Local) ممکن می‌سازد. مدل ۱۳ میلیارد پارامتری توسعه‌یافته با این معماری می‌تواند فقط با ۶ گیگابایت VRAM، کلیپ ۶۰ ثانیه‌ای تولید کند؛ چیزی که قبلاً فقط با کارت‌های گرافیک پرچم‌دار ۱۲ گیگابایتی یا بیشتر امکان‌پذیر بود.

مکانیزم اصلی مدل‌های «دیفیوژن» به این صورت است که فریم‌های پر از نویز را پردازش می‌کنند و به‌تدریج به فریم‌هایی با نویز کمتر می‌رسند؛ اما مدل‌ها به حافظه‌ی گرافیکی زیادی نیاز دارند، زیرا طول زمینه‌ی زمانی (Temporal Context Length) با افزایش زمان ویدیو بیشتر می‌شود.

FramePack با فشرده‌سازی هوشمند فریم‌ها بر اساس میزان اهمیتشان، مشکل مدل‌های دیفیوژن را برطرف می‌کند و مصرف VRAM را به‌طرز چشمگیری کاهش می‌دهد. پژوهشگران می‌گویند هزینه‌ی محاسباتی این روش مشابه مدل‌های دیفیوژن تصویر است.

تکنیک‌های استفاده‌شده در FramePack همچنین از کاهش کیفیت تدریجی در ویدیوهای بلندتر، که به‌عنوان Drifting شناخته می‌شود، جلوگیری می‌کنند. این معماری برای اجرا به کارت گرافیک انویدیا سری RTX 30 ،40 یا 50 با پشتیبانی از فرمت‌های FP16 و BF16 نیاز دارد. هنوز اطلاعاتی درباره‌ی پشتیبانی از کارت‌های گرافیک ای‌ام‌دی یا اینتل منتشر نشده است.

خبر خوب اینکه اکثر کارت‌های گرافیک مدرن انویدیا با حداقل ۶ گیگابایت VRAM با معماری FramePack سازگاری دارند. در حالت بهینه، RTX 4090 می‌تواند ۰٫۶ فریم در هر ثانیه تولید کند و هر فریم بلافاصله پس از پردازش نمایش داده می‌شود.

اگرچه احتمالاً سرعت مدل FramePack روی ۳۰ فریم‌برثانیه محدود شده باشد، این معماری با کاهش وابستگی به سرویس‌های سنگین و گران‌قیمت ابری، گام بزرگی برای ساخت ویدیو با هوش مصنوعی برداشته است.

مقاله رو دوست داشتی؟
نظرت چیه؟
تبلیغات
D5-b3IranServer
داغ‌ترین مطالب روز
هواپیمای شرکت Condor در حال تیک‌آف
پروازی که قرار بود ۳ ساعت باشد، ۳۲ ساعت طول کشید و در نهایت به مقصد نرسید!

پرواز هواپیمای ایرباس A320 از زوریخ به جزیره‌ای در یونان ۳۲ ساعت طول کشید و در نهایت به مقصد نرسید.

37
2 روز قبل
 اسکرین‌ شات از استوری اینستاگرام
آیا اینستاگرام گرفتن اسکرین‌ شات از استوری را به کاربر اطلاع‌رسانی می‌کند؟

محدودیت‌های اینستاگرام درباره‌ی اسکرین‌شات، مخصوصاً در استوری و دایرکت، همیشه موضوعی حساس بوده است.

27
حدود 21 ساعت قبل
بهترین گوشی‌های سامسونگ در بازار ایران
بهترین گوشی های سامسونگ [خرداد ۱۴۰۴]

ارزان‌ترین گوشی سامسونگ و بهترین گوشی سامسونگ از نظر دوربین، پردازنده و باتری کدام است؟ با راهنمای خرید بهترین گوشی سامسونگ همراه زومیت باشید.

487
2 روز قبل
نمای سه‌چهارم جلو خودرو اکس‌پنگ G7
۱۰ هزار نفر برای خرید شاسی‌بلند جدید چینی صف کشیدند

استقبال کم‌سابقه‌ای از خودرو برقی جدید اکس‌پنگ صورت گرفت؛ ۱۰ هزار سفارش در کمتر از یک ساعت.

24
حدود 21 ساعت قبل
گلکسی S25 اولترا / Galaxy S25 Ultra در دست
هوش مصنوعی ۲۰۰ دلاری برای کاربران سامسونگ رایگان شد

سامسونگ هوش مصنوعی ۲۰۰ دلاری پرپلکسیتی را فعلاً به‌صورت رایگان در اختیار کاربرانش قرار می‌دهد.

39
1 روز قبل
پنل پشت و ماژول دوربین هواوی پیورا ۸۰ پرو
نوآوری به سبک هواوی؛ پرچمدار جدید چینی‌ها دست آیفون و گلکسی را از پشت بست

پرچمدار جدید هواوی با قابلیتی ویژه در زوم دوربین، بهترین گوشی‌های اپل و سامسونگ را به چالش می‌کشد.

37
2 روز قبل
سرباز ارتش آمریکا با عینک واقعیت مجازی
وقتی سربازان با کمک چشم پهپادها در میدان نبرد ناپدید می‌شوند

سیستم آموزشی جدید ارتش آمریکا با کمک پهپادها، به سربازان در مهارت مخفی‌شدن کمک می‌کند.

18
حدود 22 ساعت قبل
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات