این هوش مصنوعی در ۵ ثانیه عکس دوبعدی را سه‌بعدی می‌کند

شنبه ۲۰ آبان ۱۴۰۲ - ۱۵:۱۵
مطالعه 2 دقیقه
چت چی پی تی در تبلت Chat GPT
هوش مصنوعی روزبه‌روز پیشرفته‌تر می‌شود و این فناوری می‌تواند به ابزاری کاربردی برای تولیدکنندگان محتوا تبدیل شود.
تبلیغات

صنایع خلاقانه برای راضی‌ نگه‌ داشتن مخاطبان به جریان مدام محتوا نیاز دارند و این محتوا باید به‌نحوی ایجاد شود. وقتی صحبت از مدل‌های سه‌بعدی به‌میان آید، الگوریتم‌های هوش مصنوعی می‌توانند با کاهش زمان تولید، کمک بزرگی به تولیدکنندگان محتوا کنند.

محققان ادوبی و دانشگاه ملی استرالیا، با استفاده از مجموعه داده‌های بزرگ برای آموزش الگوریتم یادگیری ماشینی، فناوری جذابی را توسعه داده‌اند که عملکرد شگفت‌انگیزی در تولید مدل‌های سه‌بعدی دارد. محققان اولین مدل بازسازی بزرگ (LRM) را ایجاد کردند که می‌تواند شکل مدل سه‌بعدی را از روی تصویر دوبعدی پیش‌بینی کند و اینکار را فقط در مدت پنج ثانیه انجام می‌دهد.

محققان در مقاله‌ی خود توضیح می‌دهند نسل قبلی الگوریتم‌های ساخت مدل سه‌بعدی، براساس مجموعه داده‌های متمرکز بر تصویر در مقایس کوچک آموزش داده شده‌اند. اکنون مدل‌ LRM از معماری بسیار مقیاس‌پذیر و مبتنی‌بر ترانسفورماتور با بیش‌از ۵۰۰ میلیون پارامتر آموزش داده شده و از یک میلیون شکل سه‌بعدی موجود در داده‌های Objaverse و MVImgNet بهره می‌برد.

محققان می‌گویند مدل LRM می‌تواند بازسازی‌های سه‌بعدی با کیفیت را از عکس‌های مختلف ازجمله تصاویر دنیای واقعی تولید کند. علاوه‌بر این، مدل مذکور می‌تواند تصاویر عادی ساخته‌شده با سایر سرویس‌های هوش مصنوعی مثل DALL-E و میدجورنی را به‌عنوان مدل دوبعدی ورودی دریافت کند.

یوکان هانگ، نویسنده‌ی اصلی مقاله‌ی LRM می‌گوید این مدل پیشرفت مهمی در بازسازی سه‌بعدی از روی تصاویر ساده است. الگوریتم هوش مصنوعی می‌تواند هندسه‌ی دقیق را از ویدیو یا تصویر شکل موردنظر، ایجاد و بافت‌های پیچیده مثل دانه‌های چوب را روی آن‌ها حفظ کند.

ساخت مدل سه بعدی با مدل هوش مصنوعی LRM

طبق اعلام محققان، LRM می‌تواند در طیف گسترده‌ای از صنایع ازجمله طراحی، سرگرمی و بازی مورد استفاده قرار گیرد. طراحان می‌توانند مدل‌سازی سه‌بعدی را راحت‌تر بسازند و به‌میزان قابل توجهی در زمان خود برای ساخت مدل‌های مخصوص بازی‌های ویدیویی یا انیمیشن‌ها صرفه‌جویی کنند.

تولید محتوای سه‌بعدی در صنعتی که به‌سرعت در حال تحول است، به چالش مهمی تبدیل شده و شرکت‌های هوش مصنوعی سعی دارند هرچه زودتر، راهکارهای بالقوه‌ای مثل سرویس Stable 3D که Stability AI اخیراً معرفی کرد، ارائه دهند.

LRM این امکان را فراهم می‌کند کاربران عادی بتوانند مدل‌های سه‌بعدی بسیار دقیقی از عکس‌های گرفته‌شده با دوربین موجود روی گوشی هوشمند خود بسازند. اگرچه LRM هنوز با چالش‌هایی مثل بافت‌های تار مواجه است، اما دنیای پُر از فرصت‌های خلاقانه را روی افراد و کسب‌وکارها باز می‌کند.

تبلیغات
داغ‌ترین مطالب روز
تبلیغات
تبلیغات

نظرات