هوش مصنوعی سبک یک تصویر را به دیگری منتقل میکند
یکی از تکنیکهای رایج هوش مصنوعی که محبوبیت زیادی بین کاربران پیدا کرده است، «انتقال سبک» (Style Transfer) نام دارد. این تکنیک که در اپهایی مانند فیسبوک و پریزما استفاده میشود، با استفاده از شبکههای عصبی، ظاهر یک تصویر را تغییر میدهد و آنها را به شکل یک نقاشی یا عکسی سیاه و سفید بازسازی میکند. هرچند این اپها، در انجام اینگونه تغییرات «استایلیست» هستند تا اینکه «فوتورِئالیست» باشند؛ به عبارت دیگر بهجای شبیهسازیِ واقعیت، به دنبال ایجاد فضایی فانتزی در تصاویر میروند. اما بهتازگی یک گروه از پژوهشگرانِ شرکت ادوبی و دانشگاه کرنل سعی کردهاند به این تکنیک، توانایی شبیهسازی فضاهای واقعی اضافه کنند. آنها الگوریتمِ انتقال سبک را به شکلی طراحی کردهاند که بتواند سبکِ یک تصویر را به دیگری منتقل کند. به این شرط که این تکنیک تنها سبک تصویر را دستخوش تغییر کند و جزئیات مهم آن را دستنخورده باقی بگذارد. نتایج بهدستآمده از این تحقیق شگفتانگیز هستند.
در این پژوهش متدهای معمول و قدیمی انتقال سبک به کار رفته است که یک لایهی دیگر از پردازش شبکهی مصنوعی به آنها اضافه شده؛ این لایه وظیفهی محافظت از جزئیات تصویر اصلی را به عهده دارد.
یکی از پژوهشگران به نام کاویتا بالا، میگوید:
مردم اشتباهات یک انتقال سبک ساده را بهراحتی میبخشند؛ اما زمانی که پای تصویر واقعی در میان باشد، انتظارات آنها بسیار بیشتر خواهد شد. همین مسئله این چالش را برای ما جذابتر کرد.
همانطور که اشاره شد، لایهای جدید از شبکههای عصبی به این الگوریتم اضافه شده است که بر حاشیههای درون تصویر تمرکز دارد. مکانهایی مانند مرز بین درخت و دریاچه یا مرز یک ساختمان و آسمان. در حالی که انتقال سبک معمولی از کنار این حاشیهها بهسادگی رد میشود و آنها را مدام جابجا میکند؛ این لایه باعث میشود این مرزها دستنخورده باقی بمانند و در نتیجه تصویر نهایی مشابه تصویر اولیه باشد.
هرچند این تکنیک محدودیتهای خود را نیز دارد. این الگوریتمها به نظر با ترکیبهایی مانند ساختمان بهتر عمل میکنند و اشتباهات آن در تصاویر چهره بیشتر مشخص است. همچنین در جابجایی سبک نمیتوان از دو تصویر بسیار متفاوت استفاده کرد؛ زیرا کار جابجایی المانها برای شبکهی عصبی پیچیدهتر خواهد شد. بالا توضیح میدهد:
اگر تصویر اصلی شما یک دریاچه است؛ برای بهترین تأثیر باید به دنبال تصویری بگردید که در آن آب وجود دارد. با این وجود ما به دنبال اعمال محدودیت نیستیم و میخواهیم طراحان، خود این جزئیات را امتحان کنند.
سؤال اینجا است که چقدر زمان خواهد برد تا این تکنیک جدید به دست مردم عادی برسد. انتقال سبک نخستین نیز از یک تحقیقات ساده به اپ فیسبوک رسید و در عرض دو سال به صدها میلیون کاربر عرضه شد. همچنین با توجه به مشارکت ادوبی در این تحقیقات، باید انتظار داشت که آنها به دنبال تجاری کردن این محصول باشند.
تا آن زمان، دانشمندان به دنبال کاربردهای جدید برای انتقال سبک بر پایهی تصویر خواهند بود. بالا میگوید:
تیم ما به دنبال گسترش مرزهای این تکنیک است. به عنوان مثال حضور این نوع از تغییر سبک در ویدیوها قابل پیشبینی است و احتمالا در آیندهی نزدیک ممکن خواهد شد.
کد الگوریتم یادشده از اینجا قابل دسترسی است.