بهترین ابزارهای تولید تصویر هوش مصنوعی در سال ۲۰۲۳

شنبه ۲۳ اردیبهشت ۱۴۰۲ - ۲۳:۰۰
مطالعه 9 دقیقه
تصاویر ساخته شده با هوش مصنوعی
سال گذشته، سال پررونقی برای مولدهای تصویر هوش مصنوعی بود. در این مقاله به معرفی چند مورد از کاربردی‌ترین و معروف‌ترین نمونه‌های این ابزارها می‌پردازیم
تبلیغات

از پاپ فرانسیسی که جلیقه به تن دارد تا تیزرهای فیلم تأثیر گرفته از وس اندرسون، تصاویر ساخته شده با هوش مصنوعی این روزها به موضوع داغی در فضای مجازی تبدیل شده‌اند. چندان عجیب نیست که ابزارهای مدرن هوش مصنوعی برنده‌ی جایزه‌های معتبر عکاسی شوند. صرف‌نظر از اینکه مولدهای تصویر هوش مصنوعی را دوست داشته باشید یا از آن‌ها متنفر باشید، این ابزارها در سال گذشته به محبوبیت بالایی رسیدند و گویا قصد توقف هم ندارند.

در آغاز سال ۲۰۲۲، ابزارهای تبدیل متن به تصویر هوش مصنوعی به‌ندرت در دسترس عموم افراد قرار داشتند اما با فراهم شدن امکان دسترسی به نسخه‌ی بتای DALL-E در جولای ۲۰۲۲ و همچنین انتشار استیبل دیفیوژن درست یک ماه پس از آن، ناگهان مجموعه‌ی وسیعی از مولدهای تصویر هوش مصنوعی در دسترس همه قرار گرفتند. اگر نسبت به انتخاب مولد تصویر هوش مصنوعی در سال ۲۰۲۳ کمی گیج شده‌اید، در این مقاله سعی کردیم بهترین و محبوب‌ترین مولدهای تصویر این روزها و قابلیت‌های آن‌ها را معرفی کنیم تا بر اساس سلیقه، گزینه‌ی محبوبتان را انتخاب کنید.

DALL-E 2

تصویر تولید شده با dall-e
تصویر تولیدشده در DALL-E 2

DALL-E اولین مولد تصویر هوش مصنوعی بود که در سال ۲۰۲۱ بر سر زبان‌ها افتاد. جدیدترین نسخه‌ی این مولد با عنوان DALL-E2 دارای سطح و قابلیت‌های درک زبانی بالاتر و همچنین کیفیت تصویر بهتری نسبت به نسخه‌ی قبلی است. این ابزار همچنین می‌تواند تصاویر موجود را ویرایش کند و امکان‌ جایگذاری یا اضافه کردن اشیای کاملا جدید را می‌دهد.

OpenAI شرکت بنیان‌گذار چت جی‌پی‌تی، DALL-E را ساخته است. این شرکت از مدل زبانی عظیم GPT-3 به عنوان اساس کار خود استفاده کرده است که نشان می‌دهد این مولد تصویر چگونه دستورها را درک می‌کند. استفاده از DALL-E ساده است. تنها به یک حساب OpenAI نیاز دارید و پس از ورود به حساب کاربری می‌توانید دستور متنی را وارد کرده و دکمه‌ی Generate را برای ساخت تصویر فشار دهید.

متأسفانه DALL-E دیگر به صورت رایگان در دسترس کاربران قرار ندارد. اعتبار رایگان این سرویس در آوریل ۲۰۲۳ به پایان رسید و حالا کاربرها باید برای خود اعتبار خریداری کنند. به ازای ۱۵ دلار می‌توان ۱۱۵ اعتبار خریداری کرد که برای هر بار استفاده برابر است با ۱۳ سنت. با این‌حال هنوز می‌توانید از DALL-E به صورت رایگان از طریق چت بینگ مایکروسافت استفاده کنید.

میدجورنی

برد پیت در جنگل
خروجی عبارت «برد پیت در جنگل» در میدجورنی

با اینکه میدجورنی اولین مولد تصویر هوش مصنوعی نبود، خیلی زود به انتخاب اول خیلی از افراد تبدیل شد. یکی از دلایل اصلی این محبوبیت، نسخه‌ی V5 میدجورنی است که توانست از بسیاری از رقبای خود سبقت بگیرد. در بعضی نمونه‌ها، نتایج به نظر بسیار واقع‌گرایانه می‌رسند گرچه اشتباهاتی هم دارند.

برخلاف دیگر سرویس‌ها نمی‌توان از طریق وب‌سایت یا اپلیکیشن به میدجورنی دسترسی پیدا کنید. بلکه نیاز به دیسکورد دارید. دیسکورد اپلیکیشن چتی است که جوامع گیمینگ از آن استفاده می‌کنند. برای شروع کار با میدجورنی نیاز به حساب دیسکورد دارید.

اعضای جدید دارای محدودیت ساخت ۲۵ تصویر رایگان هستند. ارزان‌ترین اشتراک این سرویس ماهانه ده دلار است. با اینکه می‌توانید از دستورهای ساده‌ی میدجورنی هم برای ساخت تصاویر زیبا استفاده کنید، قدرت واقعی این سرویس در پارامترهای آن است. برای مثال می‌توانید نسبت تصویر 16:9 را با استفاده از پارامتر –ar تعریف کنید یا می‌توانید تصاویر به سبک انیمه را با پارامتر –niji بسازید. راهنمای کامل کار با میدجورنی را می‌توانید در زومیت بخوانید.

استیبل دیفیوژن

برد پیت در جنگل و همستر در حال خوردن پیتزا در ساحل
خروجی عبارت‌های «برد پیت در جنگل» و «همستر در حال پیتزا خوردن در ساحل» در استیبل دیفیوژن

برخلاف دیگر مولدهای تصویر هوش مصنوعی، استیبل دیفیوژن (Stable Diffusion) کاملا متن‌باز و رایگان است. اگر کامپیوتر قدرتمندی با کارت گرافیک اختصاصی داشته باشید می‌توانید مدل خود را دانلود و اجرا کنید. به علاوه، این سرویس به صورت آفلاین هم کار می‌کند. با این‌حال همه نمی‌توانند پیش‌نیازهای سخت‌افزاری آن را فراهم کنند.

می‌توانید از استیبل دیفیوژن برای ساخت تصاویر در مرورگر وب خود استفاده کنید. با کلیک روی وب‌سایت StableDiffusionOnline و تایپ دستور به خروجی دلخواهتان می‌رسید. برای کار با استیبل دیفیوژن نیازی به حساب کاربری ندارید اما نتایجتان برای بقیه قابل ذخیره‌سازی و قابل نمایش است. برای افزایش حریم خصوصی می‌توانید مدل را روی کامپیوتر شخصی‌تان اجرا کنید. پلتفرم استیبل دیفیوژن امکان مرور دستورها و نتایج قبلی را هم می‌دهد.

DreamStudio

تصاویر ساخته‌شده در Dream Studio
تصاویر ساخته‌شده در Dream Studio

با اینکه استیبل دیفیوژن سرویس رایگانی است اما امکانات کاملی ندارد. برای مثال نمی‌توانید اندازه‌ی تصویر را تغییر دهید یا آن را پس از تولید ویرایش کنید؛ اما خوشبختانه، Stability AI سازنده‌ی استیبل دیفیوژن راه‌حل این مشکل را به شکل DreamStudio ارائه داده است.

با باز کردن DreamStudio می‌توانید اپلیکیشنی جذاب با تعداد زیادی دکمه را مشاهده کنید. با این اپلیکیشن می‌توانید چند تصویر را به‌صورت یک جا بسازید، نسبت تصویر را تغییر دهید، عناصر مشخص را در اثر هنری خود تغییر دهید. همچنین DreamStudio دارای سبک‌های مختلفی مثل فتورئالیسم تا اریگامی و طرح‌های مشابه کتاب‌های کمیک است.

علاوه بر این می‌توانید اشیا را در تصاویر هوش مصنوعی خود با استفاده از تب edit اضافه یا حذف کنید. برای مثال از ابزار eraser یا پاک‌کن می‌توانید برای حذف بخش‌هایی از تصویر استفاده کنید. سپس دستور را برای پر کردن فضاهای خالی تایپ کنید. متأسفانه برای استفاده از دریم‌ استودیو باید هزینه بپردازید؛ اما هنگام ثبت نام، ۲۵ اعتبار رایگان یا ۱۲۵ بار تولید تصویر خواهید داشت. با پرداخت حداقل ۱۰ دلار می‌توانید ۵۰۰۰ تصویر بسازید.

Bing Image Creator

تصویر ساخته‌شده با Bing Image Creator
تصویر ساخته‌شده در Bing Image Creator

موتور جستجوی بینگ مایکروسافت پس از انتشار چت جی‌پی تی به قابلیت جدید چت قدرتمندی مجهز شد. Bing Image Creator ابزار تولید تصویری تحت پشتیبانی DALL-E است. با استفاده از دستورها و فرمان‌ها می‌توانید آثار هنری دیجیتالی تولید کنید. این مولد تصویر رایگان است با این‌حال برای دسترسی به آن نیاز به حساب کاربری مایکروسافت دارید. در حال حاضر این مولد فقط از دستورها و متن‌های انگلیسی پشتیبانی می‌کند.

از آنجا که مایکروسافت همکاری نزدیکی با OpenAI شرکت سازنده‌ی چت‌ جی‌پی‌تی دارد، عجیب نیست که Image Creator بینگ از DALL-E استفاده می‌کند. به این ترتیب می‌توانید روی پلتفرم بینگ بدون نیاز به پرداخت هزینه از DALL-E استفاده کنید.

بینگ ایمیج کریتیور دارای مجموعه ابزار متنوعی نیست. با این حال برای استفاده‌ی شخصی می‌تواند سرگرم‌کننده باشد. تمام تصاویر این مولد با نسبت مربعی ۱: ۱ و ۱۰۲۴ در ۱۰۲۴ پیکسل تولید می‌شوند. رابط کاربری آسان است و همچنین می‌توانید تصاویر تولیدشده را بدون واترمارک ذخیره کنید. این ابزار رایگان است.

Craiyon

تصاویر ساخته‌شده با craiyon
تصاویر ساخته‌شده با Criayon

مولد تصویر کرایون با اینکه در ابتدا DALL-E مینی نامیده شده بود، ربطی به شرکت OpenAI یا DALL-E2 ندارد. بلکه یکی از جایگزین‌های متن‌باز آن است. با این‌حال نام DALL-E2 mini بیشتر با این مولد تصویر سازگار است زیرا تقریبا تمام کارهای DALL-E2 را انجام می‌دهد.

برخلاف DALL-E2 خروجی‌های کرایون کیفیت کمتری دارند؛ اما مزیت این مولد تصویر چیست؟ با کرایون می‌توانید به صورت نامحدود تصویرسازی کنید و تا رسیدن به نتایج دقیق و دلخواه تصاویر را تغییر دهید. تفاوت کلیدی دیگر کرایون با DALL-E این است که به هیچ عنوان سانسور نمی‌شود و هر دستوری را می‌توان در آن وارد کرد. همچنین می‌توانید بر اساس سبکی خاص تصویرسازی کنید. علاوه بر این، رابط کاربری وب‌سایت بسیار ساده است و کاربران تازه‌کار می‌توانند به‌راحتی و به‌صورت رایگان از آن استفاده کنند.

ArtBreeder

تصاویر ساخته‌شده در Art Breeder
تصاویر ساخته‌شده در Art Breeder

یکی از شناخته‌شده‌ترین اسم‌ها در میان مولدهای تصویر هوش مصنوعی، آرت بریدر است. هدف اصلی این ابزار در واقع ارتقای کیفیت تصویر است و با استفاده از آن می‌توانید انواع متنوعی از تصاویر را از طریق یادگیری ماشین تولید کنید.

آرت‌بریدر از ترکیب تصاویر برای ساخت یک تصویر واحد استفاده می‌کند به این شیوه می‌توانید تصاویر کاملا منحصر‌به‌فرد و جدیدی را با استفاده از تصاویر موجود در گالری خود بسازید. رابط کاربری آرت بریدر ساده است و افراد تازه‌کار به راحتی می‌توانند از آن استفاده کنند. استفاده از آرت بریدر برای تعداد محدود عکس رایگان است با این حال برای استفاده از امکانات نامحدود باید هزینه پرداخت کنید.

Picsart

آواتارهای پیکس‌آرت
آواتارهای ساخته‌شده با پیکس‌آرت

پیکس‌آرت شاید یکی از در دسترس‌ترین مولدهای متن به تصویر موبایل باشد زیرا اپلیکیشن آن بسیار محبوب است و قابلیت هوش مصنوعی هم در پایان سال ۲۰۲۲ به آن اضافه شد. این سیستم مبتنی بر کد متن باز استیبل دیفیوژن است اما شرکت سازنده‌ی پیکس‌آرت می‌گوید کارهای زیادی را برای ارتقای این اپلیکیشن و تولید نتایج باکیفیت‌تر انجام داده است.

آنچه پیکس‌آرت را از دیگر گزینه‌ها متمایز می‌کند، قرار گرفتن آن در یک اپلیکیشن ویرایش تصویر است. درواقع هرچیزی که ساخته می‌شود را می‌توان بلافاصله با مجموعه‌ی غنی از ابزارها ویرایش کرد. مولد تصویر هوش مصنوعی پیکس‌آرت روزانه برای تولید بیش از یک میلیون تصویر به کار می‌رود. شرکت سازنده‌ی این اپلیکیشن همچنین قابلیت‌هایی مثل جایگذاری اشیا در تصاویر، ساخت پس‌زمینه‌های جدید، ساخت آواتارهای هوش مصنوعی بر اساس تصاویر افراد را به این پلتفرم اضافه کرده است. مولد تصویر پیکس‌‌آرت همچنین می‌تواند اسکچ‌ها و طرح‌های اولیه‌ی خام را به آثار کامل‌شده‌ی هنری تبدیل کند. مولد تصویر پایه‌ی پیکس‌آرت رایگان است اما برای دسترسی به امکانات بیشتر باید هزینه پرداخت کنید.

Nightcafe AI

ابزار هوش مصنوعی Night Cafe

Nightcafe Studio امکان تولید تصاویر به سبک‌های مختلف و جلوه‌های متفاوت را می‌دهد که از سبک کیهانی تا رنگ روغن و بسیاری از موارد دیگر را دربرمی‌گیرد. نام این اپلیکیشن برگرفته از نقاشی «کافه شب» اثری از ونسان ونگوگ، نقاش پرآوازه‌ی هلندی است. این پلتفرم از روش VQGAN+CLIP برای تولید هنر هوش مصنوعی استفاده می‌کند. هنگان ثبت نام در NightCafe، پنج اعتبار رایگان دریافت می‌کنید. هر روز هنگام نیمه شب، پنج اعتبار دیگر دریافت می‌کنید. برای خرید اعتبارهای بیشتر باید هزینه بپردازید.

Fotor

وب‌سایت Fotor
وب‌سایت فوتور

فوتور، ویرایشگر تصویر آنلاین با میلیون‌ها کاربر در سراسر جهان، به تازگی مولد تصویر هوش مصنوعی خود را منتشر کرده است. استفاده از این مولد تصویر بسیار راحت است و به راحتی می‌توانید با تایپ دستورهای متنی، تنها در چند ثانیه تصویرسازی کنید. با این ابزار می‌توانید تصاویر واقع‌گرایانه، سه‌بعدی، کاراکترهای انیمه، نقاشی، پس‌زمینه و به‌طورکلی انواع هنر دیجیتال را خلق کنید. می‌توانید به‌صورت رایگان از این مولد تصویر استفاده کنید.

جمع‌بندی

از سال گذشته تعداد مولدهای تصویر با امکانات متعدد رو به افزایش هستند. برخی از این ابزارها مثل میدجورنی و DALL-E به دلیل ارائه‌ی قابلیت‌ها و امکانات متنوع و همچنین تولید تصاویر با کیفیت به محبوبیت بالایی رسیده‌اند. برخی دیگر مثل Bing Image Creator و Craiyon هنوز جای پیشرفت زیادی دارند با این‌حال می‌توانند تا حدی نیازهای کاربران را برطرف کنند.

سوالات متداول زومیت

  • محبوب‌ترین مولد تصویر هوش مصنوعی کدام است؟

    DALL-E و میدجورنی محبوب‌ترین مولدهای تصویر هوش مصنوعی هستند که تصاویر باکیفیتی را تولید می‌کنند.

  • آیا مولدهای تصویر هوش مصنوعی قابلیت ویرایش تصویر دارند؟

    بسیاری از مولدهای تصویر هوش مصنوعی از قابلیتی برای دستکاری و ویرایش تصاویر و حذف و اضافه کردن اشیا برخوردار هستند.

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات