۲- هوش مصنوعی

متن

  1. دسترسی به ابزارها و محدودیت‌های استفاده

در ابتدا، «نانو به نانای گوگل استودیو» برای دوستانی که خواهان دسترسی مستقیم بودند، ارسال شد. پس از نوشتن اولین پرامپت، تصویر مورد نظر گرفته و مقایسه شد. نکته‌ای بسیار مهم که همواره توسط کاربران مطرح می‌شود، مربوط به دسترسی به ابزارهای هوش مصنوعی است. با توجه به تحریم‌ها، برای دسترسی به این سایت‌ها باید از یک فیلترشکن یا ابزارهای مشابه مانند شکن استفاده شود.

  • موضوع حیاتی بعدی مربوط به محدودیت‌های استفاده رایگان و ایمیل است. استفاده رایگان از این ابزارها محدودیت دارد؛

برای مثال، در چت جی‌پی‌تی ممکن است بیش از تعداد مشخصی چت یا تصویر در ۲۴ ساعت نتوانید استفاده کنید. جمینای محدودیت کمتری دارد، اما پس از گذشت مدتی، کاربر را مسدود می‌کند. برای ادامه کار، می‌توانید صبر کنید تا سهمیه استفاده شما دوباره شارژ شود، یا اینکه با یک ایمیل دیگر وارد اکانت شوید تا تصاویر بیشتری بسازید. داشتن سه یا چهار ایمیل می‌تواند امکان خروجی گرفتن تصاویر بیشتری را فراهم کند.

برای ورود به این سایت‌ها، بهتر است از طریق مرورگر کروم و جیمیل شخصی خود (که متعلق به گوگل است) اقدام کنید. اگر ایمیل شما روی کروم لاگین باشد، روند ورود به سایت‌ها (مانند جمینای یا چت جی‌پی‌تی) سریع‌تر خواهد بود و از پر کردن مجدد فرم‌ها جلوگیری می‌شود.

  • اصول بنیادین پرامپت‌نویسی (Prompt Engineering)

در مبحث پرامپت‌نویسی، نکات مهمی وجود دارد که باید به آن‌ها توجه کرد. هرچند ساخت تصویر جذاب است، اما بدون در نظر گرفتن این اصول، کاربران در ادامه کار با مشکل مواجه می‌شوند. سختی کار زمانی پیش می‌آید که شما بخواهید یک رشته از عکس‌های مرتبط به هم و هدفمند را تولید کنید.

  • نوشتن پرامپت به آن سادگی که دیده می‌شود، نیست و نکات بسیار ریزی دارد که اغلب تجربی هستند.

به عنوان مثال، اگر پروژه شما نیازمند محیط قدیمی ایرانی (مانند بازار دوره صفویه) است. نوشتن صرفاً “بازار قدیمی” بسیار گسترده است و می‌تواند منجر به تصاویر بازارهای مصری، عربی یا اسلامی در دوره‌های مختلف شود. برای اینکه محیط مدنظر شما نزدیک‌تر به خواسته باشد، باید پرامپت را هوشمندانه بنویسید.

برای مثال، به جای اینکه مستقیماً به هوش مصنوعی بگویید “یک شهر ایرانی به من بده”، می‌توانید از توصیف‌هایی مانند “یک شهر خاورمیانه‌ای نسبتاً مدرن” استفاده کنید تا به نتیجه بهتری برسید. اگر دوره صفویه مدنظر است که در دوران اسلامی بوده است، می‌توانید در کنار “بازار صفویه” بنویسید “با دیزاین اسلامی”.

در مواجهه با چالش‌هایی که هوش مصنوعی درک دقیقی از یک کلمه کلی مانند “باستانی” ندارد، باید عناصر بصری آن دوره را توصیف کنید. مثلاً به جای “بازار باستانی”، باید توصیف کرد که بازاری با ستون‌های بزرگ سنگی، سقف‌های چوبی و طرح‌های باستانی مانند شیر یا پلنگ می‌خواهید. این توصیف دقیق به هوش مصنوعی کمک می‌کند تا تصویر مورد نظر را راحت‌تر تولید کند.

  • جزئیات فنی پرامپت
  • میزان جزئیات: هرچه جزئیات تصویر بیشتر باشد، دقت تصویرسازی بالاتر خواهد بود.
  • طول پرامپت: نباید بیش از حد طولانی باشد. نوشتن مطلبی بیشتر از حدود دو پاراگراف (یک نکته تجربی) ممکن است هوش مصنوعی تصویرساز را گیج کند.
  • ترجمه: اگر به زبان انگلیسی مسلط نیستید، می‌توانید پرامپت خود را در نرم‌افزارهای ترجمه یا خود چت جی‌پی‌تی و جمینای ترجمه کنید. اما باید توجه داشت که پرامپت انگلیسی از دقت بیشتری برخوردار است و فهم راحت‌تری برای هوش مصنوعی ایجاد می‌کند.
  • جریان کاری پیشرفته و حفظ کاراکتر
  • الف: پرامپت معکوس (Reverse Prompting) شما می‌توانید یک عکس را به هوش مصنوعی (مانند چت جی‌پی‌تی یا جمینای) بدهید و از آن بخواهید پرامپت آن تصویر را به شما ارائه دهد. مثلاً عکس تخت جمشید یا یک مسجد با دوره خاص را می‌دهید و پرامپت آن را می‌گیرید تا بتوانید آن را در نرم‌افزارهای تولید تصویر، به سبک دلخواه خود بازسازی کنید.
  • ب: حفظ کاراکتر در پروژه‌های بزرگ برای پروژه‌هایی که کاراکترها و محیط‌های تکراری دارند (مانند یک انیمیشن کوتاه)، برای جلوگیری از توصیف‌های مکرر، می‌توانید در یک چت جدید به چت جی‌پی‌تی یک بار توضیح جامع دهید. شما باید تعداد تصاویر، ویژگی‌های کامل کاراکترها (مانند پیرمرد، برادر بزرگ‌تر) و جزئیات محیط (مانند دوره سلجوقیه یا تم کودکانه) را مشخص کنید. سپس از او بخواهید که تمام پلان‌های بعدی را بر این اصول پیش ببرد. با این روش، هوش مصنوعی اطلاعات کاراکتر را در حافظه آن چت نگه می‌دارد و سرعت کار شما بسیار افزایش می‌یابد.
  • ج: نانو به نانای گوگل «نانو به نانای گوگل» یک هوش مصنوعی بسیار کاربردی (هم تصویری و هم متنی) است که در حفظ کاراکتر به سایر ابزارها کمک می‌کند. این ابزار می‌تواند زوایای مختلف یک کاراکتر را (مانند نیم‌رخ یا پشت) بازطراحی کند. اگرچه Midjourney و سایر ابزارها هنوز به این کیفیت نرسیده‌اند، نانو به نانا در این زمینه بسیار کار راه انداز است و به‌خصوص در ساخت موشن کاربرد فراوان دارد.
  • آرت استایل (Art Style)

آرت استایل مهم‌ترین بخش هنری کار است و شکل گرافیک، انیمیشن، پوستر و محتوای تولیدی شما را مشخص می‌کند. آرت استایل به سبک‌های مختلف هنری و آثار هنرمندان گوناگون (مانند عکاسی، نقاشی کودکانه، سه‌بعدی یا رئال) اشاره دارد.

  • انتخاب آرت استایل مناسب: شما باید آرت استایلی را انتخاب کنید که مناسب موضوع کار شما باشد. به عنوان مثال، برای کار کودک نباید از آرت استایل‌های پرجزئیات واقع‌گرا یا تم‌های دارک استفاده شود. برای کارهای جدی، محیط‌های رئال‌تر مناسب هستند.
  • نحوه استفاده از آرت استایل: برای اعمال یک آرت استایل خاص، کافی است در انتهای پرامپت توصیفی خود اضافه کنید: “با گرافیک کامیک بوک” یا “با آرت استایل 3D”. اگر نام آرت استایل را نمی‌دانید، می‌توانید اسم انیمیشن مورد علاقه خود را (مانند «انیمیشن آپ») ذکر کنید و از هوش مصنوعی بخواهید با آن آرت استایل خروجی دهد. سایت‌هایی مانند میدلایبرری (Midlibrary) نیز برای مشاهده و انتخاب آرت استایل‌های مختلف در دسترس هستند.
  • آرت استایل‌ها زیرمجموعه سبک‌های هنری کلی مانند رئالیسم، دادائیسم، کوبیسم و سوررئالیسم قرار می‌گیرند و هر هنرمند یا انیمیشنی می‌تواند آرت استایل منحصر به فرد خود را داشته باشد. خلاقیت در این بخش، کیفیت کار نهایی شما را به شدت افزایش می‌دهد.
  • Midjourney و قابلیت‌های پیشرفته

Midjourney یکی از بهترین ابزارها برای تصویرسازی حرفه‌ای و پروژه‌های بزرگ است.

  • الف: خرید اکانت: از آنجا که خرید مستقیم دشوار است، سایت‌های واسطی (مانند ایرانی کارت) وجود دارند که این خدمات را ارائه می‌دهند. اما باید توجه داشت که این سایت‌ها ممکن است با یک کارت اعتباری چندین اکانت بخرند. اگر یکی از آن اکانت‌ها قوانین را نقض کند، اکانت شما نیز ممکن است بسته شود؛ به همین دلیل، خرید اکانت‌های بیشتر از یک ماه توصیه نمی‌شود.
  • ب: امکانات ویژه Midjourney Midjourney امکانات پیشرفته‌ای برای افزایش دقت پرامپت دارد:
  • استایل رفرنس (Style Reference): علاوه بر توصیف متنی آرت استایل، می‌توانید یک عکس نمونه را آپلود کنید تا هوش مصنوعی درک قوی‌تری از سبک مورد نظر شما پیدا کند.
  • ایمیج پرامپت (Image Prompt): می‌توانید عکس مورد نظر را مستقیماً قرار دهید تا Midjourney از آن به عنوان پرامپت استفاده کرده و پرامپت متنی شما را تقویت کند.
  • آمنی رفرنس (Omni Reference): این ابزار برای حفظ کاراکتر در محیط‌های مختلف استفاده می‌شود. عکس کاراکتر طراحی شده آپلود می‌شود و با دادن پرامپت محیط جدید، هوش مصنوعی کاراکتر اصلی را در آن محیط جدید قرار می‌دهد.
  • ج: تنظیمات و شخصی‌سازی: در تنظیمات Midjourney، می‌توان سرعت جنریت (فست، ریلکس، توربو)، سایز تصویر و همچنین میزان خلاقیت تصویر (پارامترهای ویردنس و وریشن) را تنظیم کرد. همچنین، قابلیت «پرسونالایز آرت استایل» وجود دارد که با انتخاب ۲۰۰ عکس، سلیقه کاربر را تشخیص می‌دهد و تصویرسازی را هوشمندانه‌تر و مناسب‌تر می‌سازد.
  •  ابزارهای جایگزین و لزوم استفاده از فتوشاپ
  • ابزارهای رایگان: برای کارهای تکی، پوستر و پروژه‌های فضای مجازی، استفاده از جمینای، لئوناردو و نانو به نانا توصیه می‌شود. چت جی‌پی‌تی برای پروژه‌های طولانی مانند انیمیشن مناسب نیست، زیرا نمی‌تواند آرت استایل را در پلان‌های مختلف حفظ کند.
  • ساخت ویدیو: برای ساخت ویدیو ابزارهایی مانند ران‌وی و کیلینگ وجود دارند که مطرح هستند، اما رایگان نیستند.
  • فتوشاپ: با وجود پیشرفت هوش مصنوعی، در نهایت ممکن است برای اصلاح ایرادات جزئی تصاویر جنریت شده (مانند جزئیات چهره یا دست) نیاز به استفاده از فتوشاپ باشد. اصلاحات کوچک در فتوشاپ سرعت بیشتری نسبت به تلاش برای جنریت‌های مکرر در هوش مصنوعی دارند. آموزش‌های مقدماتی فتوشاپ به صورت رایگان در دسترس است.
  • نکات حقوقی و محدودیت‌های محتوایی

قوانین هوش مصنوعی ایجاب می‌کند که تصاویر خشونت‌آمیز، اختلاف‌آمیز، یا محتوای شامل خون و پرچم مستقیم کشورها جنریت نشود؛ در غیر این صورت، اکانت کاربر ممکن است بلاک شود. برای دور زدن محدودیت پرچم، می‌توان به جای درخواست مستقیم، پرچم را با توصیف رنگ‌ها و شکل آن بیان کرد.

  • موضوع کار عملی نهایی

موضوع کار نهایی که به عنوان تمرین و به منزله پذیرش یک سفارش اعلام شده است، «ایران قوی و پیشتاز در حوزه علم و فناوری» است. از دانشجویان خواسته شده است تا با توجه به نکات آموزشی، پستر یا تصویری با این موضوع بسازند و ارسال کنند.

به بالا بروید