دیپ فیک چه مزیت‌هایی دارد؟

دیپ فیک از فناوری‌های پر سروصدای ین روزها محسوب می‌شود و اخبار نگران‌کننده‌ی بسیاری در مورد آن منتشر می‌شود. آیا این فناوری مزیتی هم دارد؟

دیپ فیک را می‌توان یکی از مهم‌ترین موضوعات خبری دنیای امروز دانست. خطر فناوری مذکور روزبه‌روز بیشتر در رسانه‌ها دیده می‌شود و همه از سرعت بالای پیشرفت و در دسترس بودن آن واهمه دارند. پیچیدگی فناوری مذکور در کنار کاربردهای متنوع و بعضا خطرناک آن، دسته‌های متعدد مردم را نیز به رسانه‌ها بی‌اعتماد می‌کند. به‌هرحال اطلاع‌رسانی درباره‌ی خطرات یک فناوری جدید می‌‌تواند فوایدی را هم برای عموم جامعه به‌همراه داشته باشد.

امروز همه می‌‌دانیم که استفاده‌ی سوء از دیپ فیک، چالش‌هایی را برای جامعه به‌همراه خواهد داشت. به‌علاوه با افزایش آگاهی از زمینه‌های سوءاستفاده، پیشگیری از عواقب آن‌ها نیز آسان‌تر خواهد بود. البته درنهایت این فناوری توسعه یافته است و در دنیای آینده‌ی ما حضور جدی خواهد داشت. شاید با نگاهی عمیق‌تر بتوان کاربردهای مفیدی هم از آن استخراج کرد که به نفع همه‌ی جوامع هم باشند. در ادامه‌‌ی این مطلب زومیت، به بررسی همین قابلیت‌های مفید می‌پردازیم.

بحث و مناظره پیرامون فناوری دیپ فیک امروز به وضعیت پیچیده‌ای رسیده است. البته هنوز تعریف و بررسی واحدی از فناوری مذکور وجود ندارد. به‌هرحال با نگاهی اولیه می‌توان دیپ فیک را هرگونه تقلید، دست‌‌کاری یا ساخت صوت یا ویدئو نامید که به‌کمک یادگیری ماشین ممکن می‌شود. جابه‌جایی صورت، حرکت دادن مصنوعی بدن، کپی کردن صدای افراد و تولید اصوات و تصاویر کاملا جدید، همگی در دسته‌بندی دیپ فیک قرار می‌گیرند. البته با توجه به چنین تعریفی، نمی‌توان تغییر تصاویر ثابت در فتوشاپ را به‌عنوان دیپ فیک در نظر گرفت.

شیطان / دیپ فیک / Deep Fake

تولید و تغییر تصاویر، ابزاری در دست تولیدکننده‌های محتوا

داستان‌گویی از طریق تصاویر متحرک، فعالیتی بسیار گران‌قیمت محسوب می‌شود. استودیوهای هالیوودی امروزه میلیاردها دلار هزینه می‌کنند تا شخصیت‌های ساختگی را در فیلم‌های خود اضافه کنند. ابزارهایی که بازیگران بزرگ صنعت رسانه برای تولید محتوا استفاده می‌کنند، با وجود کاهش قیمت در دهه‌های اخیر هنوز برای بسیاری از تولیدکننده‌ها بسیار گران و غیرقابل دسترس هستند. همین ابزارها، استودیوهای بزرگ را قادر می‌سازند تا تصورات خود را به تولیداتی قابل قبول تبدیل کنند. دراین‌میان فناوری دیپ فیک فرایند تولید تصاویر متحرک را آسان‌تر می‌کند. درنهایت تولید‌کننده‌های کوچک‌تر هم می‌توانند با استفاده از دیپ فیک، به ظرفیتی نزدیک به استودیوهای غول‌پیکر هالیوودی دست پیدا کنند.

Synthesia یکی از شرکت‌های فعال در حوزه‌ی دیپ فیک است که محصولی تجاری توسعه می‌دهد. ابزار آن‌ها از فناوری دیپ فیک برای تغییر زبان ویدئو استفاده می‌کند. محصول آن‌ها، با متحرک‌سازی خودکار مجدد صورت، دوبله‌ی صدا و تصویر را ممکن می‌کند. دستاورد بزرگ این شرکت در ویدئویی رونمایی شد که دیوید بکام در آن به ۹ زبان زنده‌ی دنیا درباره‌ی مالاریا صحبت می‌کند.

علاوه‌بر نمونه‌ی بالا، می‌توان از ابزار سینتزیا برای افزایش توانمندی تولیدکننده‌های محتوا در سرتاسر جهان استفاده کرد. به‌عنوان مثال اگر هنرمندی بااستعداد، به زبان‌های بزرگ رایج در جهان صحبت نکند، دسترسی به چنین ابزاری حکم یک پیشرفت بزرگ را برای او خواهد داشت. با استفاده از دیپ فیک به چنین شکلی، می‌توان آثار هر هنرمندی را به زبان‌های متعدد بازتولید و پخش کرد.

با دیپ فیک ابزارهای تولید محتوای حرفه‌ای در دسترس عموم قرار می‌گیرد

غول نرم‌افزارهای گرافیکی جهان، ادوبی، نرم‌افزاری به‌نام Adobe VoCo دارد که اکنون در وضعیت تحقیق و نمونه‌های اولیه به سر می‌برد. این نرم‌افزار به تولیدکننده‌ها امکان می‌دهد که از متن، صوت تولید کرده و آن را با ابزارهایی شبیه به فتوشاپ ویرایش کنند. به‌عنوان نمونه‌ای از کاربرد نرم‌افزار، تولیدکننده می‌تواند فیلم کوتاه خود را با صدای گوینده‌های مشهور تولید کند.

تینگوی شو، بنیان‌گذار و مدیرعامل استارتاپ Humen است که ویدئوهای دیپ فیک با تمرکز روی حرکات موزون تولید می‌کند. او درباره‌ی هدف نهایی این فناوری می‌گوید:

در آینده‌ای که ما در نظر داریم، همه‌ می‌‌‌توانند محتوایی باکیفیت در سطح هالیوود تولید کنند.

یوتیوب و اینستاگرام، فاصله‌ی فرصت‌های توزیع و تولید محتوا بین شرکت‌های سرگرمی بزرگ و عکاسان حرفه‌ای را با آماتورهای بااستعداد کاهش دادند. به‌بیان دیگر امروز استعدادهایی که سرمایه‌های کمی برای تبلیغات دارند، فرصت‌های مناسبی برای رقابت با بازیگران بزرگ پیدا کرده‌اند. همین روند برای دیپ فیک هم وجود خواهد داشت. تولیدکننده‌های آماتور با استفاده از فناوری‌های موجود می‌توانند فاصله‌ی خود را با شرکت‌های ثروتمند بازار جلوه‌های بصری کاهش دهند.

کاربرد هنری دیپ فیک

آنچه که در بالا به‌عنوان فرصت‌های دیپ فیک مطرح شد، کاهش فاصله میان تولیدکننده‌ها با منابع متفاوت بود. دیپ فیک علاوه‌بر کاربردهای فوق می‌تواند به تولید نوعی جدید از هنر هم بینجامد؛ هنری که وابسته به تغییر محتوا یا دست‌کاری آن خواهد بود. فراموش نکنید که تقریبا تمامی انواع سرگرمی به تغییر، بازتاب، کپی و شکل‌های دیگر دست‌کاری واقعیت وابسته می‌شود.

دیپ فیک / deep fake

درحال‌حاضر انواع گوناگونی از کاربردهای جدید دیپ فیک در جهان هنر وجود دارد. البته چنین کاربردهایی طیف بسیار متنوعی را پوشش می‌دهند. از سوءاستفاده از چهره‌ی بازیگران و سیاست‌مداران تا تولید فیلم‌های سینمایی جدید با تغییر بازیگران اصلی، در این طیف (تقریبا) هنری قرار می‌گیرد.

پیش از آنکه دیپ فیک به فناوری بدنه‌ی جامعه بدل شود و به‌مرور جای خود را در دستان همه‌ی کاربران باز کند، تولید محتوا با دست‌کاری چهره‌ها امکان‌پذیر بود، اما برای همه اجرایی نمی‌شد. به‌هرحال روند موجود این تصور را ایجاد می‌کند که در آینده‌ی نزدیک شاهد تولید انواع آثار هنری صوتی و تصویری با بهره‌گیری از تغییر چهره‌ها و اصوات باشیم.

شرکت‌های Respeecher و Replica.AI از فعالان جدی تولید محتوای صوتی تقلیدی هستند. آن‌ها ابزارهای کاربردی برای تولید چنین محتوایی را در دستان کاربرانی قرار می‌دهند که آشنایی بالایی با فناوری ندارند. نمونه‌های اولیه از محصولات ساخته‌شده با استفاده از ابزارهای آن‌ها، نشان‌دهنده‌ی دسته‌ی جدیدی از محصولات سرگرمی و هنر است. محصولاتی که شاید آینده‌ی صنعت سرگرمی را شکل دهند.

احتمالا آینده‌ی صنعت سرگرمی با دیپ فیک رقم می‌خورد

یک باور تخصصی درباره‌ی آینده‌ی فرهنگ و هنر می‌گوید که کپی و ترکیب کردن آثار هنری، فرهنگ آینده را شکل می‌دهد. البته چنین دیدگاهی از سال‌ها قبل و دوران پابلو پیکاسو هم وجود داشت و بزرگانی همچون استیو جابز هم به آن اذعان داشتند. درواقع آن‌ها آینده‌ی هنر را نه در گرو آثار انحصاری، بلکه وابسته به ترکیب آثار هنرمندان و خلق محصولات جدید می‌دانند. به‌هرحال اگر آینده‌ی فرهنگ را با چنین تصویری در نظر بگیریم، دیپ فیک به‌عنوان ابزاری کاربردی برای شکل‌گیری آن شناخته می‌شود.

ساخت انسان‌های مجازی

توانایی تغییر چهره، صوت و حالت‌های احساسی، یکی از مهم‌ترین مراحل در ساخت انسان‌های مجازی خواهد بود؛ انسان‌هایی که احتمالا در آینده بخش مهمی از ارتباطات ما را شکل می‌دهند. ما امروز مراحل مهمی را در مسیر ساخت انسان‌های مجازی طی می‌کنیم. دستیارهای شخصی همچون الکسا،‌ کورتانا و سیری از سال‌ها پیش بخشی از تعامل ما با دنیا بوده‌اند. آن‌ها امروز سهم مناسبی را از لحاظ استفاده در میان کاربران به خود اختصاص داده‌اند و روزبه‌روز هم پیشرفته‌تر می‌شوند. به‌هرحال با وجود تمام پیشرفت‌هایی که در توسعه‌ی دستیارهای مجازی صورت گرفته است، امروز باز هم آن‌ها را تنها در حد رابط‌های کاربری متنوع می‌دانیم و هنوز به انسان مجازی مورد نظر تبدیل نشده‌اند.

دیپ فیک

لیل میکولا، اینفلوئنسر مجازی اینستاگرام

انسان‌های مجازی دستاورد مهم دیگری در حوزه‌ی تعاملات کاربر دنیای فناوری هستند که با روشی متفاوت از دستیارهای شخصی به سمت بدنه‌ی جامعه حرکت می‌کنند. مسیر آن‌ها از سمت اینفلوئنسرهای دیجیتال دنبال می‌شود؛ اینلفوئنسرهایی که در دسته‌ی انسان‌های مجازی قابل باور قرار می‌گیرند. آن‌ها نوعی از ارتباط را ایجاد می‌کنند که به رفتارهای انسانی عموم جامعه نزدیک‌تر است.

به‌عنوان نمونه‌ای از اینفلوئنسرهای دیجیتال می‌توان به Lil Miquela یا Astro در اینستاگرام اشاره کرد که ارتباطی طبیعی و نزدیک با کاربران دارند. البته پاسخ آن‌ها به کاربران و تعامل‌های مربوطه، توسط افراد دیگر و انسان‌های واقعی نوشته می‌شود؛ اما رویکردهای موجود نشان از آینده‌‌ای دارند که انسان‌های مجازی به پدیده‌ای رایج در شبکه‌های مجازی تبدیل شوند.

فاصله‌ی دستیارهای مجازی با اینلفوئنسرهای دیجیتال کم‌رنگ‌تر می‌شود

دیپ فیک می‌تواند فاصله‌ی میان دستیارهای مجازی و اینفلوئنسرهای دیجیتال را از بین ببرد. پیشرفت موجوداتی همچون الکسا یا لیل میکولا و تبدیل کردن آن‌ها به موجودی همچون سامانتا در فیم Her یا جوی در فیلم Blade runner 2049، نیازمند پیشرفت‌های بیشتر در شبیه‌سازی صوت و تصویر خواهد بود؛ پیشرفت در حوزه‌هایی همچون نشان دادن زبان بدن، صوت و احساسات که بیش از همیشه باید شبیه به انسان واقعی شود.

اگر تمامی ترکیب‌های منحصر‌به‌فرد حرکت، بازخورد صوتی و حالت چهره‌ی یک فرد را در طول زندگی بشماریم، به عددی در مقیاس میلیارد خواهیم رسید. درنتیجه برای واقعی‌تر کردن انسان‌های مجازی، نمی‌توان عملکرد آن‌ها را با رویکردهای سنتی کدنویسی طراحی کرد و باید روش‌هایی بسیار انعطاف‌پذیرتر به کار برد.

کورتانا

فناوری دیپ فیک میلیاردها نمونه از رفتارهای انسانی را دریافت و رفتارهایی بسیار شبیه به واقعیت را به‌عنوان خروجی ارائه می‌کند. با دیپ فیک می‌توان امکان و ظرفیت تعامل و درک طبیعی‌تر مکالمه را به دستیارهای هوشمند اضافه کرد. به‌همین‌ترتیب اینفلوئنسرهای مجازی هم توانایی تعامل تصویری واقعی‌تر و زنده را پیدا خواهند کرد. در آینده‌ی تحت سلطه‌ی دیپ فیک می‌توان زنده‌ شدن شخصیت‌هایی همچون میکی ماوس را متصور شد. تصاویر هولوگرام سه‌بعدی از کاراکترهای انیمیشنی و انسان‌های واقعی که توانایی صحبت با صدایی واقعی دارند، بخش دیگری از آینده‌ی مذکور خواهد بود.

خلاقیت را می‌توان محصولی از دل کپی کردن نامید. جزئیات بیشتر و پیشرفت در هنر هم از دل همین فرایند بیرون می‌آیند. چنین دستاوردهایی بسیار نزدیک به محصولات دیپ فیک هستند. فناور‌ی‌هایی که دسترسی به ابزارهای خلاقانه‌ی سرگرمی را برای همه ممکن کرده و تولید انواع جدیدی از محتوا را آسان می‌کنند. با توجه به همه‌ی این نکات، شاید بتوان کمی از ترس و نگرانی پیرامون دیپ فیک کاست و آینده‌ای روشن‌تر را متصور شد.  

منبع techcrunch

از سراسر وب

  دیدگاه
کاراکتر باقی مانده

بیشتر بخوانید