• خانه
  • ⬅️
  • تکنولوژی
  • ⬅️
  • 10 مولد هنر هوش مصنوعی خارق العاده که می توانند عجیب ترین رویاهای شما را زنده کنند

10 مولد هنر هوش مصنوعی خارق العاده که می توانند عجیب ترین رویاهای شما را زنده کنند

تولیدکننده‌های هنر هوش مصنوعی در عرض چند ماه از تازگی به یک محصول جدید و حتی یک کالا تبدیل شده‌اند، با خدمات متعددی که نوید توانایی ایجاد فوراً هنر هوش مصنوعی را با استفاده از پیام‌های متنی به زبان طبیعی می‌دهند. بهترین خدمات هنری هوش مصنوعی تصاویر فوق‌العاده و ابزارهای...

Article

10 مولد هنر هوش مصنوعی خارق العاده که می توانند عجیب ترین رویاهای شما را زنده کنند

تولیدکننده‌های هنر هوش مصنوعی در عرض چند ماه از تازگی به یک محصول جدید و حتی یک کالا تبدیل شده‌اند، با خدمات متعددی که نوید توانایی ایجاد فوراً هنر هوش مصنوعی را با استفاده از پیام‌های متنی به زبان طبیعی می‌دهند. بهترین خدمات هنری هوش مصنوعی تصاویر فوق‌العاده و ابزارهای برتر را به صورت رایگان یا با قیمت پایین ارائه می‌دهند.

چرا از هنر هوش مصنوعی استفاده کنیم؟ بسیاری از ما می‌توانیم از یک نقاشی، عکس یا طراحی عالی قدردانی کنیم، بدون اینکه خودمان بتوانیم آن را بکشیم. همچنین ممکن است بتوانیم آنچه را که می‌خواهیم ببینیم توصیف کنیم، و هنر هوش مصنوعی اینجاست. به جای جستجوی یک قطعه هنری که با آن توضیحات مطابقت داشته باشد، این سرویس در واقع آن را تولید می کند، با آنچه که از صحنه های تصویر شده در پایگاه داده تصویر خود می داند مطابقت می دهد و آنها را با صحنه و سبکی که شما مشخص می کنید مقایسه می کند.

با این حال، تمام این پیچیدگی به منابع محاسباتی فشرده نیاز دارد. خدمات هنری هوش مصنوعی به دو طریق این کار را انجام می دهند: یا محدود کردن تصاویر تولید شده (اعم از تعداد تصاویر یا وضوح آنها) یا گرفتن “اعتبار” یا پول واقعی برای فعال کردن اشتراک های بیشتر. ما آن را در نظر می گیریم.

در نهایت، نمی‌توانیم مفاهیم حقوقی و اخلاقی هنر هوش مصنوعی را نادیده بگیریم. هنر هوش مصنوعی مولد بر روی تعداد زیادی از تصاویر آموزش داده شد – برخی عمومی، برخی احتمالا خصوصی – و سرویس‌ها از آن به عنوان “بذر” برای تصویری که تولید می‌کنند استفاده می‌کنند. همه سرویس‌های هوش مصنوعی درباره منبع تصاویرشان شفاف نیستند. شرکت‌هایی مانند Getty Images احساس می‌کنند که این غیرقانونی است، و اقدام کرده اند. با این حال، اصالت واقعی هنر هوش مصنوعی مورد بحث است، و طرفداران هوش مصنوعی خاطرنشان می‌کنند که حتی هنرمندان انسانی نیز معمولاً تحت تأثیر قرار گرفتن در معرض هنرهای موجود، چه عمومی و چه خصوصی، آموزش دیده‌اند یا تحت تأثیر قرار می‌گیرند. فقط بدانید که احتمالاً بدون شواهدی مبنی بر اینکه خودتان آن را تغییر داده اید تا آن را به یک اثر اصلی تبدیل کنید، «مالک» یک اثر هنری هوش مصنوعی نخواهید بود.

گیج شده اید؟ در پایان این داستان درباره نحوه شروع کار با هنر هوش مصنوعی و برخی از ویژگی‌های اصطلاحات هنری هوش مصنوعی که ممکن است دوست داشته باشید بدانید (مانند نقاشی درونی) بیشتر صحبت خواهیم کرد.

بهترین مولدهای هنر هوش مصنوعی

میدان سفر

هزینه: آزمایشی رایگان (در حالت انتظار) / 10 دلار / 30 دلار / 60 دلار در ماهتصاویر: 25 درخواست برای رایگان آزمایشی، سپس متفاوت استمجوز تصویر: استفاده غیرتجاری برای آزمایش رایگان، در غیر این صورت استفاده تجاری به جز برای مشاغل بزرگ مجاز استNSFW/ افراد مشهور: خیر/بله

تا کنون، Midjourney می ایستد به عنوان رهبر بی نظیر هنر هوش مصنوعی از زمان راه اندازی آن در سال گذشته – اگرچه شکوه و عظمت تصاویر آن به طور طعنه آمیزی با بی نظمی مطلق رابط کاربری آن در تضاد است. Midjourney v5 (نسخه کنونی تا زمان انتشار) نوعی از تصاویر فوق واقعی و جعلی را ارائه می دهد (پاپ با ژاکت پفی، مثلا) که داستان های خبری را تولید می کند. اکنون می‌توان «واقعیت» را به‌طور مصنوعی تولید کرد.

رابط کاربری Midjourney’s UI در واقع روی Discord است، جایی که کاربران می‌توانند پیام‌های عمومی را وارد کنند و تصاویری را که دیگران تولید می‌کنند ببینند. ما روی یک اسکرین شات گرفته شده از Discord زوم کرده‌ایم که نتیجه واقعی واقعی عکس را نشان می‌دهد.

Midjourney از Discord به عنوان رابط خود استفاده می کند زیرا استارت آپ نمی خواست در هیچ زیرساختی سرمایه گذاری کند. شما باید برای آن برنامه ثبت نام کنید، سپس وارد یکی از کانال های Discord «جدید» شوید و از دستور /imagine استفاده کنید تا از سرویس درخواست شما را درخواست کند. هنر هوش مصنوعی (در اینجا راهنمای شروع با Discord وجود دارد شما به آن نیاز دارید.) Midjourney حداقل 10 دلار در ماه برای طرح اولیه خود، با سطوح اضافی 30 دلار در ماه و 60 دلار در ماه هزینه دریافت می کند. Midjourney یک آزمایش رایگان را به حالت تعلیق درآورد راه‌هایی برای خرید زمان بیشتر، استفاده از حالت آرام‌تر و غیره وجود دارد.

هر فرمان چهار تصویر تولید می‌کند که هر یک از آنها را می‌توان برای “تغییر” و همچنین افزایش مقیاس انتخاب کرد. Inpainting نیز امکان پذیر است. برای دانلود می توانید تصویر را در Discord یا مرورگر باز کنید. Midjourney می‌گوید که می‌توانید از تصاویر تولید شده آن «تقریباً به هر شکلی که می‌خواهید» استفاده کنید، که شامل مالکیت آن تصاویر، مشروط به شرایط خدمات آن می‌شود.

هر یک از همانطور که در اینجا نشان داده شده است، می توانید چهار تصویر Midjourney را ارتقا دهید یا می توانید تغییراتی در آنها بخواهید.

اجازه دهید تکرار کنیم: تصاویر Midjourney باشکوه هستند، و از آنجایی که عمومی هستند، می‌توانید مشاهده کنید که کاربران دیگر تصاویر را در زمان واقعی تولید می‌کنند و همچنین گالری تصاویر تاریخی را مرور می‌کنند. جادوی Midjourney این است که چگونه به طور معمول یک تصویر خوب ارائه می دهد. اما استفاده از آن بسیار شبیه نسخه خط فرمان فتوشاپ است: تنها ترفندهای موجود وجود دارد و اصلاً واضح نیستند.

چت مایکروسافت بینگ (حالت خلاق)

هزینه: رایگان با حساب مایکروسافتتصاویر: ظاهرا نامحدودمجوز تصویر: نامشخصNSFW/Celebs: خیر/برخی

به طور معمول، Bing Image Creator به عنوان سهم تصویر هوش مصنوعی مایکروسافت. طراح مایکروسافت مجهز به هوش مصنوعی نیز عالی اما به طرز عجیبی، ما بینگ چت ( به طور خاص، حالت خلاق آن) به عنوان یک تولید کننده برتر هنر هوش مصنوعی به یک دلیل خاص: تکرارها.

هر سه سرویس هنری هوش مصنوعی مایکروسافت اساساً رایگان و ظاهراً نامحدود هستند، مشروط بر اینکه حساب مایکروسافت داشته باشید و بتوانید از لیست انتظار Bing Chat و Image Creator عبور کنید. (Image Creator دارای یک سیستم “تقویت” عجیب است که ممکن است در اینجا وجود داشته باشد یا نباشد، اما به نظر نمی رسد که مایکروسافت محدودیتی برای تعداد تصاویری که می توانید ایجاد کنید، تعیین کند، که یک نقطه فروش بزرگ است.) ادعا نمی کنید که مالک هیچ یک از تصاویری که تولید می کند، هستید، اما نمی گوید که شما هم مالک آنها هستید.

شما می‌توانید در چت Bing برای هنر هوش مصنوعی درخواست کنید، اما تصاویر در Bing Image Creator ذخیره می‌شوند.

در غیر این صورت، تنها کاری که باید انجام دهید این است که به چت بینگ بروید و یک اعلان مانند “مرا یک… بکشید” و سپس توضیحی درباره تصویر وارد کنید. سپس بینگ چند لحظه وقت می‌گذارد و چهار تصویر 1024×1024 ایجاد می‌کند که می‌توانید برای مشاهده واضح‌تر و دانلود آنها روی آنها کلیک کنید. بینگ افراد مشهوری مانند بیل گیتس یا دونالد ترامپ را نمی کشد، اما ظاهراً براد پیت خوب است.

مایکروسافت از یک نسخه آموزش دیده از مدل DALL-E 2 استفاده می کند، و نتایج به طور ذهنی فقط یک قدم پایین تر از Midjourney هستند. به نظر می‌رسد بینگ چت اجازه نقاشی داخلی را نمی‌دهد، شما می‌توانید کاری را انجام دهید که سایر تولیدکنندگان هنر هوش مصنوعی انجام نمی‌دهند: تکرار تدریجی در یک صحنه. منظور ما این است که می‌توانیم از آن بخواهیم: «یک سبد میوه بکشید» و سپس در دستور بعدی، از آن بخواهیم جزئیات صحنه را تنظیم کند. (این صحنه را ویرایش نمی کند، اما فقط یک تصویر دیگر را دانلود کنید.)

به نظر می‌رسد آنچه Bing Chat خودش انجام نمی‌دهد، تصاویر آرشیو است. باید فوراً (هه) آنها را دانلود کنید یا از Bing Image Creator دیدن کنید، جایی که آنها را پنهان خواهید کرد.

هوش مصنوعی زمین بازی

هزینه: رایگان / 15 دلار در ماه.تصاویر: 1000 در روز (رایگان) / 2000 در روز (پرداخت) مجوز تصویر: شما مالک آنها هستید، حتی برای استفاده تجاریNSFW/Celebs: خیر/بله

اگرچه مایکروسافت بینگ چت احتمالاً از نظر سادگی مطلق برنده می شود، Playground AI احتمالا ارزان‌ترین، ساده‌ترین و در عین حال جامع‌ترین راه برای نمونه‌برداری از هنر هوش مصنوعی برای خودتان است. با چیزی بیش از یک حساب Google، می توانید برای Playground و 1000 تصویر رایگان آن در روز ثبت نام کنید. (برخی جزئیات کیفیت و اندازه پس از 50 تصویر روزانه محدود می شود.)

Playground AI یک رابط کاربری بسیار زیبا برای تولید هنر هوش مصنوعی ارائه می‌کند، اما ویژگی‌های ویرایش هوش مصنوعی آن ممکن است نیاز به تغییراتی داشته باشد. با این حال، یکی از نقاط قوت آن، نقاشی پیشی است که در واژه نامه پایان این داستان توضیح می دهیم.

رابط کاربری Playground بسیار خوب طراحی شده است، با اطلاعات سریع و سبک ها در ریل سمت چپ، با اندازه، وزن، و سایر تغییرات در سمت راست قابل تنظیم است. تصاویر تولید شده به خوبی Bing یا Midjourney نیستند، اما در این صورت یک گام بسیار کوچک به سمت پایین است. در مورد تنها محدودیت مدل های موجود است: فقط Stable Diffusion 1.5 و 2.1 که برای بسیاری از افراد کافی است. (دسترسی به DALL-E 2 10 دلار در ماه هزینه اضافی دارد.) اگر این مورد شماست، می‌توانید با تصاویر افراد مشهور بازی کنید، اما تصاویر NSFW غیرممکن است.

جایی که Playground می‌درخشد، در ویرایش است. مانند بینگ، می‌توانید تصاویر ایجاد شده را از طریق اعلان‌های اضافی ویرایش کنید، خواه همه چیز باشد یا فقط یک قسمت (inpainting). Playground این را Canvas می نامد، یک ویژگی بتا که نیاز به کمی کار دارد – انتقال از ایجاد به ویرایش (از طریق اعلان) به ویرایش (از طریق نقاشی درون و بیرون) خشن تر از آن چیزی است که باید باشد. در غیر این صورت، این سرویس واقعاً ارائه می دهد.

برخی نمونه از تصاویری که با هوش مصنوعی Playground ایجاد کردم.مارک هاچمن / IDG

Adobe Firefly

هزینه: TBDتصاویر: نامحدود، حداقل در نسخه بتامجوز تصویر : استفاده غیرتجاری فقط در مرحله بتاNSFW/Celebs: خیر/خیر

Adobe یک بازیگر اصلی در طراحی خلاقانه است، بنابراین منطقی است که همه ابزارهای آن تا حدی از هوش مصنوعی استفاده کنند. Adobe Firefly نشان دهنده اولین گام های عمومی Adobe در این جهت است. در حال حاضر در نسخه بتا، Firefly بر اساس تصاویر بدون حق نسخه برداری یا دارای مجوز آشکار ساخته شده است، یا تصاویری که خود متعلق به خود است. شاید به همین دلیل، تصاویر Firefly به نظر می رسد حرفه ای – یک چرخه خود تکمیل کننده، شاید، با توجه به اینکه احتمالاً تصاویر زیادی را دیده اید که در اصل از ابزارهای Adobe و سهام Adobe ایجاد شده اند.

در حال حاضر، ما نمی دانیم که Adobe در نهایت برای Firefly چه چیزی را شارژ خواهد کرد یا اینکه آیا یک محصول مستقل خواهد بود. ما انتظار داریم که موتور Firefly حداقل در Photoshop و سایر ابزارهای Adobe قرار بگیرد. نسخه بتا در حال حاضر مقدار نامحدودی از هنر تولیدی متن به تصویر و همچنین جلوه‌های متنی یا بافت‌های تولید شده توسط هوش مصنوعی را ارائه می‌دهد که از طریق یک اعلان روی متن اعمال می‌شوند. Adobe همچنین می‌گوید که در حال «کاوش» در نقاشی درونی، نقاشی بیرونی، تبدیل مدل‌های سه‌بعدی به تصاویر، مدل‌های هوش مصنوعی شخصی‌شده، طرح به تصویر، و موارد دیگر است.

مدل Adobe به اندازه برخی دیگر از نظر خلاقیت آزاد به نظر نمی رسد، اما با ظاهر نرم و حرفه ای خود آن را جبران می کند. هر فرمان چهار تصویر تولید می‌کند که می‌توانید با تنظیمات سبکی که به راحتی تجزیه می‌شوند، از نوع محتوا (عکس، گرافیک، هنری) تا سبک‌ها (کاغذ لایه‌ای، خز، نئون، چاقوی پالت) تا رنگ، تن و نور تنظیم کنید. تنظیم فرمت تصویر، تصویر را نیز تغییر می دهد. فقط هر چیزی NSFW یا افراد مشهور داخل آن را فراموش کنید.

به نظر می‌رسد Adobe Firefly با تصاویری که تا حدودی با دنیای واقعی و تصاویر موجود در آن ارتباط دارند، بهترین عملکرد را دارد. اتصالات عجیب و غریب (“مگسی که دور سر یک پادشاه وزوز می کند”) تنها یک بخش از صحنه را به تصویر می کشد. حرفه ای ها Firefly را دوست خواهند داشت، که بدون شک در پشت اشتراک گران قیمت Creative Cloud قفل خواهد شد.

انتشار پایدار

هزینه: رایگانتصاویر: نامحدودمجوز تصویر: نامشخصNSFW/Celebs: بله/بله

برخلاف سرویس‌های هنری هوش مصنوعی مبتنی بر ابر، یکی از نکات کلیدی Stable Diffusion این است که به صورت محلی، روی رایانه شخصی شما اجرا می‌شود – نه روی سرور! اگر می‌خواهید ده‌ها تصویر از جن‌های بیکینی‌پوشی که در حوضچه‌های ژله‌ای در Midjourney می‌چرخند خلق کنید، جهان می‌تواند آن را ببیند. در غیر این صورت، اگر یک لپ تاپ بازی قدرتمند یا دسکتاپ دارید، می توانید Stable Diffusion را دانلود کنید. کد و انواع مدل های تصویری و داده های آموزشی و رفتن به شهر در حریم شخصی کامپیوتر شما. و همه اینها رایگان است، مشروط بر اینکه زمان دانلود یک مدل نرم افزار چند گیگابایتی، منابع سخت افزاری برای اجرای آن، و صبر برای تنظیم همه آن را داشته باشید.

Stable Diffusion می تواند کمی شبیه به اجرای لینوکس باشد. میراث آن خط فرمان است، و فقط تعداد زیادی کد در دسترس عموم در GitHub و غیره وجود دارد که می‌توانید با آن بازی کنید، اگر این مورد شماست. با این حال، پیاده‌سازی‌های Stable Diffusion مبتنی بر رابط کاربری رایج‌تر می‌شوند و به نظر می‌رسد محبوب‌ترین آنها در حال حاضر AUTOMATIC1111.

به طور طبیعی، هر چه سخت‌افزار قدرتمندتر باشد، بهتر است – اما فقط CPU یا حتی GPU شما مهم نیست. در عوض، به نظر می رسد جزء کلیدی VRAM موجود در GPU شما باشد. مدل‌ها و کلیدها و گزینه‌های دیگری برای تغییر دادن Stable Diffusion به نفع CPU یا GPU‌های سطح پایین‌تر شما وجود دارد، اما ساده‌ترین راه برای اجرای Stable Diffusion با یک رایانه شخصی قدرتمند است.

Stable Horde (Artbot)

هزینه: رایگانتصاویر: نامحدود، گرچه منوط به صف استمجوز تصویر : نامشخصNSFW/Celebs: بله/بله

پس چه اتفاقی می‌افتد اگر نداشته باشید رایانه‌ای به اندازه کافی قدرتمند برای اجرای Stable Diffusion؟ Stable Horde یک پاسخ است. مانند SETI@Home قدیمی (اکنون منسوخ شده)، تنها کاری که انجام می دهید ارسال پیام خود به مجموعه ای از رایانه های شخصی متصل است که دارای Stable Diffusion هستند. چند رابط front-end وجود دارد، اما ما به Artbot .

برخلاف ریشه‌های Stable Diffusion، Artbot از رابط کاربری گرافیکی استفاده می‌کند که تا حدودی قابل پیمایش است: دستور در بالا و به دنبال آن تعداد زیادی گزینه و مدل موجود. آنچه Artbot ارائه می‌دهد، راهنمایی‌های ابزار مفیدی است که توضیح می‌دهد این گزینه‌ها چه کاری انجام می‌دهند: چگونه وزن دادن به درخواست بر روی آن تأثیر می‌گذارد، پیام‌های منفی و موارد دیگر. یک لیست بسیار مفید از مدل های مختلف وجود دارد که می توانید به عنوان چارچوبی برای درخواست خود استفاده کنید و به شما نشان می دهد که چگونه بر سبک خروجی تأثیر می گذارند. پیکربندی شگفت انگیز است.

یک یکی از بهترین چیزهایی که در مورد Stable Diffusion وجود دارد، مدل‌های هنری هوش مصنوعی آن است که اغلب ممکن است مورد توجه یا از دست دادن قرار بگیرند.

اما Stable Horde واقعاً رایگان نیست. این بر روی یک سیستم “شکر” کار می کند، جایی که شما باید با یک کلید API ثبت نام کنید – یک مانع برای کاربران ناآشنا. پس از آن، با تعادلی از تمجیدها شروع می‌کنید که با هر تصویری که ایجاد می‌کنید کم می‌شود. هرچه تصویر پیچیده تر باشد، تحسین بیشتری را مصرف می کند. هرچه قدردانی کمتر باشد، در صف با سایر کاربران قرار می گیرید. این همیشه یک مشکل نیست – با 30 یا بیشتر رایانه های شخصی که همه با هم کار می کنند تا تصاویر را ایجاد کنند، ممکن است متوجه شوید که تصویر شما بلافاصله تولید می شود. (تصاویر تا زمانی که کوکی های خود را پاک نکنید در کتابخانه ای در سایت ذخیره می شوند.)

شما می‌توانید با رتبه‌بندی تصاویر، آموزش مدلی که انسان‌ها (شما) ترجیح می‌دهند، تجلیل بخرید یا رایانه شخصی خود را به خود Horde متصل کنید. در حالی که می‌توانید با تولید مکرر تصاویر وارد «بدهی» شوید، اقدامات خاصی وجود دارد که نمی‌توانید بدون «موازنه» تمجید واقعی برای تأمین مالی آن انجام دهید.

مجموعه ای از تصاویری که با Artbot ایجاد کردم.Artbot

چرا از Artbot استفاده کنیم؟ تعداد زیاد مدل‌های هوش مصنوعی و تفاوت در سبک آن تصاویر. در غیر این صورت، تولید تصاویر از طریق Artbot می‌تواند کمی مشکل باشد، و شما ممکن است تعداد زیادی ستایش را صرف کاوش در همه گزینه‌ها کنید. از آنجایی که هیچ راه‌اندازی واقعی به جز کشف کلید API وجود ندارد، Stable Horde (Artbot) ارزش امتحان کردن را دارد.

نائب قهرمانان: DALL-E، Mage.Space، Getimg.ai و DreamStudio AI

چهار سرویس هنری هوش مصنوعی متمایز هستند اما در لیست ما قرار نمی گیرند: Dall-E، Mage.Space، DreamStudio، و Getimg.ai.

ما اخیراً درباره DALL-E نوشت، و برخی از نسل‌های هنری مانند عکس بسیار عالی هستند. فقط به نظر می رسد OpenAI در مورد آن خیلی جدی نیست، هر چند، و مدل قیمت گذاری (115 تصویر برای 15 دلار) منطقی نیست. تصاویر رایگان Bing Chat در DALL-E نیز آموزش داده شده است.

Mage.Space دارای شهرت یک فضای بسیار شبیه به NSFW، اما سایت اخیراً همه اینها را کنار گذاشته است. با این حال، آنچه را که از آن به عنوان تعداد مطلقاً نامحدودی از تصاویر یاد می شود، به صورت رایگان رها کرده است. (هزینه نسل‌های NSFW 4 دلار در ماه است، تا حدی به این دلیل که کارت‌های اعتباری می‌توانند نوعی شناسایی باشند.) این سایت دارای بیش از 40 مدل از نسل تنظیم‌شده بسیار زیبا است، اما این مدل‌ها برای طرح Pro 15 دلاری در ماه رزرو شده‌اند.

مجموعه ای از تصاویر ساخته شده با DALL-E.مارک هاچمن / IDG

Getimg.ai نیز ارائه می دهد عالی انواع مدل‌ها برای تولید تصاویر، ویرایش مبتنی بر سریع و حتی DreamBooth که به شما امکان می‌دهد یک مدل را روی عکس‌های خود آموزش دهید. Getimg.ai همچنین ControlNet را برای تولید تصویر به تصویر پیاده سازی می کند، الگوریتمی که به طور خاص ویژگی های تصویر اصلی (مانند ژست) را در تولید تصویر به تصویر حفظ می کند. محدودیت 100 تصویر رایگان در ماه بسیار کم به نظر می رسد، با این حال، هر چند با اشتراک 12 دلاری در ماه، 3000 تصویر در ماه، ارتقاء مقیاس و دسترسی به مدل های تصویربرداری برای شما به ارمغان می آورد.

من زمان زیادی را با DreamStudio AI (که امتیازاتی را برای ما فراهم کرد تا امتحان کنیم) اما در حال حاضر بسیار محدود به نظر می رسد (و هنوز بتا است؟). هزینه ثابت 10 دلاری اعتبار کافی برای 5000 تصویر را برای شما می‌خرد، اما تعداد انگشت شماری از مدل‌ها، بدون ویرایش، و تصاویری هستند که برجسته نیستند.

به دلایل مختلف، Deep Dream Generator، Starry.ai، NightCafe، و Craiyon را که به دریایی از تبلیغات تبدیل شده است، رد کردیم.

چگونه با هنر هوش مصنوعی شروع کنیم: اصول اولیه

اگر علاقه مند به آزمایش هنر هوش مصنوعی هستید، به یاد داشته باشید که سایت‌های زیادی وجود دارند که به شما امکان می‌دهند هنر هوش مصنوعی را به صورت رایگان امتحان کنید – و شما باید. به نظر می رسد یک حساب Google شرط پیش فرض باشد، با این حال، زیرا بسیاری از آنها حتی امکان انتخاب نام کاربری و رمز عبور را ندارند.

چند نسل هنر هوش مصنوعی در اولین تلاش عالی به نظر می رسند. کاری که سایت هایی مانند Midjourney انجام می دهند کمک به کاربران جدید است. فقط با یک توضیح بسیار ابتدایی می توانید به نتیجه عالی برسید.

اما، مانند هر سرگرمی دیگری، هنر هوش مصنوعی هم افراد خود را دارد. برخی از سایت‌ها به «مهندسی سریع» (و حتی آموزش‌هایی در مورد) اشاره می‌کنند، یا دستور متن شما را برای رسیدن به نتیجه تنظیم می‌کنند. آنچه سایت‌های دیگر به عنوان جایگزین ارائه می‌دهند، یک لیست بصری ساده از سبک‌ها و مدل‌هایی است که می‌توانید از بین آن‌ها انتخاب کنید – و انتخاب آن‌ها متن مناسب را به خود درخواست اضافه می‌کند. (درک تفاوت synthwave با سایبرپانک می تواند مفید باشد!) متأسفانه برخی این مدل های اضافی را پشت یک paywall قفل می کنند.

اگر به‌طور ناگهانی در مورد چیزی که باید بسازید دچار مشکل شدید، به تغییراتی در دنیای واقعی فکر کنید: اژدهایی که روی پل بروکلین نشسته است. سنتور ناز در انتهای بار. با انتخاب صحنه هایی به سبک هنرمندان یا عکاسان مورد علاقه خود لذت بیشتری خواهید برد. کلمات مهم هستند، همانطور که جمله بندی مهم است! گاهی اوقات ممکن است عبارتی مانند “هنگام اسکیت برد” به اشتباه تعبیر شود، اما “اسکیت برد سواری” ممکن است اینطور نباشد.

شما به سادگی می توانید یک درخواست مانند “مردی در کنار چادر نشسته” بنویسید و نتیجه را از یک سرویس هنری هوش مصنوعی دریافت خواهید کرد. اما برخی از مردم ترجیح می‌دهند خیلی خیلی خاص باشند.مارک هاچمن / IDG

شما اغلب می‌توانید همزمان بیش از یک تصویر ایجاد کنید، اگرچه اغلب از نظر اعتبار یا هر آنچه که سایت برای محدود کردن نسل‌ها استفاده می‌کند، برایتان هزینه در بر خواهد داشت. تصاویر بزرگتر اغلب به اعتبار بیشتری نیاز دارند، اما این میزان بسته به سرویس متفاوت است.

به این ترتیب به یک دستور فکر کنید: «عکس/کمیک/نقش چوبی سنجاب/مرلین مونرو/پری به سبک ون گوگ/انسل آدامز/سالوادور دالی»، که در آن یکی از هرکدام را انتخاب می‌کنید. سپس هر اصلاح‌کننده‌ای را که فکر می‌کنید اضافه کنید: آیا صحنه از طریق شاخه‌های درخت مشاهده می‌شود؟ با دوربین DSLR کانن با لنز بلند عکس گرفته اید؟ هوش مصنوعی می تواند بیش از آنچه فکر می کنید در خود جای دهد.

خب، تقریباً همه چیز. هنر هوش مصنوعی یک نقطه ضعف نیز دارد: دست و انگشتان. چرا؟ ما مطمئن نیستیم، اما این یک ضعف رایج است که تقریباً یک میم است! برخی از شرایط خدمات همچنین تصاویر NSFW را مجاز می‌کنند، در حالی که برخی دیگر اجازه نمی‌دهند – وقتی به همه چیزهای وحشتناکی که مردم می‌توانند تصور کنند فکر می‌کنید، این منطقی است. دیگران به اجازه دادن شباهت به افراد مشهور مانند روسای جمهور سابق اهمیتی نمی دهند.

درست مانند افرادی که در فتوشاپ یا لایت روم ماهر هستند برای ویرایش عکس به زمان نیاز دارند، شما هم می توانید. ممکن است برای به دست آوردن همه چیز به چند ده تلاش نیاز داشته باشید – و به همین دلیل است که ارزش دارد هنر هوش مصنوعی را در سایتی امتحان کنید که به شما اجازه می دهد چند اعلان را به قیمت ارزان انجام دهید تا ببینید آیا ارزشش را دارد یا خیر. چندین سایت را نیز امتحان کنید! ابزارهای ویرایش اضافی مانند inpainting و outpainting می‌توانند به رفع خطاها کمک کنند.

بله، inpainting. نمیدونی یعنی چی؟ خیلی از ما هم تا همین اواخر این کار را نکردیم. ما یک واژه نامه را در زیر قرار داده ایم تا تعاریف دیگری از هنر هوش مصنوعی ارائه کنیم تا به شما در شروع کار کمک کند.

Prompt: توضیح نوشتاری ساده (یا پیچیده!) که تصویر را توصیف می کند. This is affected by the prompt weight (see below).txt2img (text-to-image): This is basically what we think of in terms of AI art: input a text prompt, generate an image.Negative prompt: Anything you don’t want to see in the final image.img2img: (image to image): Instead of generating a scene from scratch, you can upload an image and use that as inspiration for the output image. Want to turn your dog into a king? Upload the dog’s photo, then apply the AI art generation to the scene.Model: AI uses different generative models (Stable Diffusion 1.5 or 2.1 are the most common, though there are many others like DALL-E 2 and Midjourney’s custom model) and each model will bring its own “look” to a scene. Experiment and see what works!Prompt weight: How closely the model and image adheres to the prompt. This is one variable you may want to tweak on the sites that allow it. Simply put, a strong prompt weight won’t allow for much creativity by the AI algorithm, while a weak weight will. Sampler: Nothing you probably need to worry about, though different samplers also affect the look of an image. Steps: How many iterations an AI art generator will take to construct an image, generally improving the output. While many services will allow you to adjust this, a general rule of thumb is that anything over 50 steps offers diminishing improvements. One user uploaded a visual comparison of how steps and samples affect the resulting image.Face fixing: Some sites offer the ability to “fix” faces using algorithms like GFPGAN, which can make portraits look more lifelike.ControlNet: A new algorithm, and not widely used. ControlNet is specifically designed for image-to-image generation, “locking” aspects of the original image so they can’t be changed. If you have an image of a black cat and want to change it to a calico, ControlNet could be used to preserve the original pose, simply changing the color.Upscaling: Default images are usually small, square, 1,024×1,024 images, though not always. Though upscaling often “costs” more in terms of time and computing resources, upscaling the image is one way to get a “big” image that you can use for other purposes besides just showing off to your friends on social media.Inpainting: This is a rather interesting form of image editing. Inpainting is basically like Photoshop plus AI: you can take an image and highlight a specific area, and then alter that area using AI. (You can also edit everything but the highlighted area, alternatively.) Imagine uploading a photo of your father, “inpainting” the area where his hair is, and then adding a crown or a clown’s wig with AI.Outpainting: This uses AI to expand the bounds of the scene. Imagine you just have a small photo, shot on a beach in Italy. You could use outpainting to “expand” the shot, adding more of the (AI-generated) beach, perhaps a few birds or a distant building. It’s not something you’d normally think of!

AI cut off the image to the left for some reason, leaving the image with half a face. Outpainting uses AI to extrapolate what the rest of the scene should look like.

AI art can be scary to a generation of artists who may now have to, perhaps unfairly, compete with machine-generated AI art. (Imagine what it’s like for a writer to test AI chatbots like ChatGPT, Bing, and Google Bard!)

However, we choose to look at AI art as its own, unique, creative outlet, encouraging you to think about and create your own pieces. After all, you can buy food at a restaurant, or follow a recipe and combine ingredients yourself. Each has its place. Encouraging more people to become part of the creative process is what AI art is all about.

متن کامل در pcworld

برچسب ها
0 0 رای ها
به این مطلب امتیاز بدید
اشتراک در
اطلاع از
0 دیدگاه
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
فهرست مطالب
more
مقالات بیشتر
Sponsored
مطالب حمایت شده
Comment
آخرین دیدگاه ها
More Similar post
مـــطالب مـشـــابه بیشتر...