هوش مصنوعی سبک یک تصویر را به دیگری منتقل می‌کند

اپلیکیشن‌هایی مانند فیسبوک و پریزما می‌توانند سبک و ظاهر یک تصویر را به انتخاب کاربر دستخوش تغییر کنند؛ اما آیا می‌توان این سبک‌ها را از تصویری دیگر به دست آورد؟

یکی از تکنیک‌های رایج هوش مصنوعی که محبوبیت زیادی بین کاربران پیدا کرده است، «انتقال سبک» (Style Transfer)‌ نام دارد. این تکنیک که در اپ‌هایی مانند فیسبوک و پریزما استفاده می‌شود، با استفاده از شبکه‌های عصبی، ظاهر یک تصویر را تغییر می‌دهد و آن‌ها را به شکل یک نقاشی یا عکسی سیاه و سفید بازسازی می‌کند. هرچند این اپ‌ها، در انجام این‌گونه تغییرات «استایلیست» هستند تا اینکه «فوتورِئالیست» باشند؛ به عبارت دیگر به‌جای شبیه‌سازیِ واقعیت، به دنبال ایجاد فضایی فانتزی در تصاویر می‌روند. اما به‌تازگی یک گروه از پژوهشگران‌ِ شرکت ادوبی و دانشگاه کرنل سعی کرده‌اند به این تکنیک، توانایی شبیه‌سازی فضاهای واقعی اضافه کنند. آن‌ها الگوریتمِ انتقال سبک را به شکلی طراحی کرده‌اند که بتواند سبکِ یک تصویر را به دیگری منتقل کند. به این شرط که این تکنیک تنها سبک تصویر را دستخوش تغییر کند و جزئیات مهم آن را دست‌نخورده باقی بگذارد. نتایج به‌دست‌آمده از این تحقیق شگفت‌انگیز هستند.

در این پژوهش متدهای معمول و قدیمی انتقال سبک به کار رفته است که یک لایه‌ی دیگر از پردازش شبکه‌ی مصنوعی به آن‌ها اضافه شده؛ این لایه وظیفه‌ی محافظت از جزئیات تصویر اصلی را به عهده دارد.

neural network

یکی از پژوهشگران به نام کاویتا بالا، می‌گوید:

مردم اشتباهات یک انتقال سبک ساده را به‌راحتی می‌بخشند؛ اما زمانی که پای تصویر واقعی در میان باشد، انتظارات آن‌ها بسیار بیشتر خواهد شد. همین مسئله این چالش را برای ما جذاب‌تر کرد.

همان‌طور که اشاره شد، لایه‌ای جدید از شبکه‌های عصبی به این الگوریتم اضافه شده است که بر حاشیه‌‌های درون تصویر تمرکز دارد. مکان‌هایی مانند مرز بین درخت و دریاچه یا مرز یک ساختمان و آسمان. در حالی که انتقال سبک معمولی از کنار این حاشیه‌ها به‌سادگی رد می‌شود و آن‌ها را مدام جابجا می‌کند؛ این لایه باعث می‌شود این مرزها دست‌نخورده باقی بمانند و در نتیجه تصویر نهایی مشابه تصویر اولیه باشد.

هرچند این تکنیک محدودیت‌های خود را نیز دارد. این الگوریتم‌ها به نظر با ترکیب‌هایی مانند ساختمان بهتر عمل می‌کنند و اشتباهات آن در تصاویر چهره بیشتر مشخص است. همچنین در جابجایی سبک نمی‌توان از دو تصویر بسیار متفاوت استفاده کرد؛ زیرا کار جابجایی المان‌ها برای شبکه‌ی عصبی پیچیده‌تر خواهد شد. بالا توضیح می‌دهد:

اگر تصویر اصلی شما یک دریاچه است؛ برای بهترین تأثیر باید به دنبال تصویری بگردید که در آن آب وجود دارد. با این وجود ما به دنبال اعمال محدودیت نیستیم و می‌خواهیم طراحان، خود این جزئیات را امتحان کنند. 

neural network

سؤال اینجا است که چقدر زمان خواهد برد تا این تکنیک جدید به دست مردم عادی برسد. انتقال سبک نخستین نیز از یک تحقیقات ساده به اپ فیسبوک رسید و در عرض دو سال به صدها میلیون کاربر عرضه شد. همچنین با توجه به مشارکت ادوبی در این تحقیقات، باید انتظار داشت که آن‌ها به دنبال تجاری کردن این محصول باشند. 

تا آن زمان، دانشمندان به دنبال کاربردهای جدید برای انتقال سبک بر پایه‌ی تصویر خواهند بود. بالا می‌گوید:

تیم ما به دنبال گسترش مرزهای این تکنیک است. به عنوان مثال حضور این نوع از تغییر سبک در ویدیوها قابل پیش‌بینی است و احتمالا در آینده‌ی نزدیک ممکن خواهد شد.

کد الگوریتم یادشده از اینجا قابل دسترسی است.

منبع the verge

مقاله های مرتبط

  دیدگاه
کاراکتر باقی مانده