دوبله به کمک دیپ فیک؛ صنعت فیلم‌سازی در شرف دگرگونی شگرف

دوبله به کمک دیپ فیک؛ صنعت فیلم‌سازی در شرف دگرگونی شگرف

تکنولوژی جدید دیپ فیک مبتنی بر هوش مصنوعی، رابرت دنیرو را در حال صحبت به زبان آلمانی در فیلم راننده تاکسی نشان می‌دهد؛ طوری که حرکت لب‌ها با دیالوگ کاملا هماهنگ است. 

به کمک تکنولوژی جدید دیپ فیک، رابرت دنیرو جمله‌ی معروف خود را در فیلم راننده تاکسی (داری با من حرف می‌زنی؟) به زبان آلمانی و با حرکات واقع‌گرایانه‌ی لب و چهره ادا می‌کند. این نرم‌افزار مبتنی بر هوش مصنوعی لب‌ها و حالات چهره‌ی بازیگر را طوری دست‌کاری می‌کند تا به‌طور باورپذیری با فردی که همان جملات را به زبان دیگر ادا می‌کند، هماهنگ شوند. این تکنولوژی که می‌تواند صنعت فیلم‌سازی را دگرگون کند، هم می‌تواند تحسین‌برانگیز باشد و هم دردسرساز.

به گزارش Wired، تکنولوژی استفاده‌شده در این نرم‌افزار مرتبط با دیپ فیک است که در آن هوش مصنوعی چهره‌ی یک شخص را به‌اصطلاح بر چهره‌ی دیگری می‌چسباند. قرار است این تکنولوژی به کارگردانان این امکان را بدهد تا فیلم خود را به زبان‌های مختلف بسازند و آن را جایگزین دوبله‌های کنونی کنند که با حرکات لب بازیگران هماهنگ نیست. اما قدرت تغییر حالات چهره‌ی بازیگر به‌طور خودکار و به این آسانی، اگر به‌درستی مورد استفاده قرار گیرد، ممکن است جنجال‌آفرین شود. 

این تکنولوژی دوبله مبتنی بر هوش مصنوعی توسط شرکت بریتانیایی Flawless توسعه یافته که اسکات مان، کارگردان فیلم سرقت (Heist) با بازی دنیرو از هم‌بنیان‌گذاران آن است. مان در رابطه با انگیزه‌اش برای کار روی این پروژه می‌گوید از دیدن دوبله‌های بسیار بد و ضعیف فیلم‌هایش خسته شده بود.

دیپ فیک / Deepfake

به گفته‌ی مان، هنگام دوبله گاهی دیالوگ به‌طور قابل توجهی تغییر می‌کند تا بتواند با حرکات لب‌های بازیگر مطابقت بیشتری داشته باشد. این اتفاق برای او واقعا ناخوشایند بود چون «یک تغییر کوچک در یک کلمه یا اجرا می‌تواند تغییر بزرگی در شخصیت داستان و کل فیلم ایجاد کند.»

این‌گونه بود که مان پژوهش خود را درباره‌ی دیپ فیک شروع کرد تا اینکه به پروژه‌ی کریستین تئوبالت در آلمان برخورد که درباره‌ی دوبله به کمک هوش مصنوعی بود.

به کمک دیپ‌فیک تشخیص زبان اصلی فیلم غیرممکن می‌شود

این پروژه فرایند پیچیده‌تری از دیپ فیک‌های متداول دارد. در این پروژه، حالات چهره و حرکات بازیگر در یک صحنه‌ی خاص و همچنین ویدئوی فردی که همان جملات را به زبان دیگری ادا می‌کند، ثبت می‌شود. اطلاعات این دو سپس با هم ترکیب می‌شود تا مدل سه‌بعدی از چهره و سر بازیگر اما با حرکات لب دوبلور ساخته شود. سرانجام، نتیجه‌ی این فرایند به‌صورت دیجیتالی روی چهره‌ی بازیگر قرار داده می‌شود.  

شرکت Flawless برای این پروژه از مطالعه‌ی تئوبالت الهام گرفته است. مان می‌گوید این شرکت در حال گفت‌وگو با استودیوهای فیلم‌سازی برای ساخت نسخه‌ی خارجی چندین اثر سینمایی است. در دموهای دیگر شرکت Flawless جک نیکلسون و تام کروز را می‌بینیم که در حال ادای جملات معروف فیلم چند مرد خوب به زبان فرانسوی و تام هنکس در حال صحبت کردن به زبان اسپانیایی و ژاپنی در صحنه‌هایی از فیلم فارست گامپ است.

به گفته‌ی مان، به کمک این تکنولوژی مردم به‌زودی به تماشای فیلم‌هایی خواهند نشست که تشخیص زبان اصلی آن غیرممکن خواهد بود. البته مان اضافه کرد برخی از بازیگران از تماشای چهره‌ی دستکاری‌شده‌ی خود توسط هوش مصنوعی مضطرب و معذب شده‌اند. او می‌گوید واکنش افراد به این تکنولوژی یا ترس بوده است یا تحسین. 

ویرجینیا گاردنر، بازیگر زن جدیدترین فیلم مان که خودش را به لطف نرم‌افزار Flawless در حال صحبت کردن به زبان اسپانیایی دیده است، از این بابت نگرانی ندارد؛ اما معتقد است فیلم‌هایی که با هوش مصنوعی دست‌کاری شده‌اند، باید بینندگان را  کامل در جریان استفاده از این تکنولوژی بگذارند.

دست‌کاری ویدئو به کمک هوش مصنوعی موضوعی جنجالی و بحث‌برانگیز است که البته دلیل موجهی هم دارد. از این تکنولوژی برای ساخت ویدئوهایی به قصد آزار و اذیت افراد استفاده شده است. کارشناسان نگران هستند این ویدئوها ممکن است باعث گسترش اطلاعات نادرست شوند یا حتی مسیر انتخابات را عوض کنند.  

دست‌کاری چهره در صنعت فیلم‌سازی هم می‌تواند بحث‌برانگیز باشد. برخی از ستارگان مشهور سینما ممکن است به دست‌کاری چهره‌شان توسط هوش مصنوعی روی خوش نشان ندهند. 

به‌گفته‌یدانکن کرتبری-آیرلند، مشاور عمومی انجمن صنفی بازيگران، «این تکنولوژی می‌تواند مصارف کاملا قانونی و اخلاقی داشته باشد به شرط اینکه با رضایت تمام افراد حاضر در پروژه و جبران خسارت همراه باشد.»

به‌طور معمول ساخت دیپ فیک به ساعت‌ها پردازش الگوریتمی نیاز دارد؛ اما هائو لی، هنرمند جلوه‌های بصری و متخصص استفاده از هوش مصنوعی برای دست‌کاری چهره، در حال کار روی فیلمی است که در آن نرم‌افزار پیشرفته‌تر دیپ فیک به کارگردان اجازه می‌دهد در لحظه، فرایند تغییر حالت بازیگر را تماشا کند. 

به گفته‌ی لی، این موقعیت شبیه زمانی است که استفاده از گرافیک کامپیوتری واقع‌گرایانه در دهه‌ی ۲۰۰۰ به‌طور گسترده در دسترس عموم قرار گرفت. حالا به لطف هوش مصنوعی، «ناگهان همه می‌خواهند روی پروژه‌ای مرتبط کار کنند.»

***

نظر شما کاربر زومیت درباره‌ی تکنولوژی دوبله به کمک دیپ فیک چیست؟ آیا این روش تماشای فیلم‌های خارجی را لذت‌بخش‌تر می‌کند؟ یا دردسرهای مربوط به آن این پروژه را با شکست روبه‌رو خواهد کرد؟

منبع wired

از سراسر وب

  دیدگاه
کاراکتر باقی مانده

بیشتر بخوانید