کلیپ
پادکست
متن
- دسترسی به ابزارها و محدودیتهای استفاده
در ابتدا، «نانو به نانای گوگل استودیو» برای دوستانی که خواهان دسترسی مستقیم بودند، ارسال شد. پس از نوشتن اولین پرامپت، تصویر مورد نظر گرفته و مقایسه شد. نکتهای بسیار مهم که همواره توسط کاربران مطرح میشود، مربوط به دسترسی به ابزارهای هوش مصنوعی است. با توجه به تحریمها، برای دسترسی به این سایتها باید از یک فیلترشکن یا ابزارهای مشابه مانند شکن استفاده شود.
- موضوع حیاتی بعدی مربوط به محدودیتهای استفاده رایگان و ایمیل است. استفاده رایگان از این ابزارها محدودیت دارد؛
برای مثال، در چت جیپیتی ممکن است بیش از تعداد مشخصی چت یا تصویر در ۲۴ ساعت نتوانید استفاده کنید. جمینای محدودیت کمتری دارد، اما پس از گذشت مدتی، کاربر را مسدود میکند. برای ادامه کار، میتوانید صبر کنید تا سهمیه استفاده شما دوباره شارژ شود، یا اینکه با یک ایمیل دیگر وارد اکانت شوید تا تصاویر بیشتری بسازید. داشتن سه یا چهار ایمیل میتواند امکان خروجی گرفتن تصاویر بیشتری را فراهم کند.
برای ورود به این سایتها، بهتر است از طریق مرورگر کروم و جیمیل شخصی خود (که متعلق به گوگل است) اقدام کنید. اگر ایمیل شما روی کروم لاگین باشد، روند ورود به سایتها (مانند جمینای یا چت جیپیتی) سریعتر خواهد بود و از پر کردن مجدد فرمها جلوگیری میشود.
- اصول بنیادین پرامپتنویسی (Prompt Engineering)
در مبحث پرامپتنویسی، نکات مهمی وجود دارد که باید به آنها توجه کرد. هرچند ساخت تصویر جذاب است، اما بدون در نظر گرفتن این اصول، کاربران در ادامه کار با مشکل مواجه میشوند. سختی کار زمانی پیش میآید که شما بخواهید یک رشته از عکسهای مرتبط به هم و هدفمند را تولید کنید.
- نوشتن پرامپت به آن سادگی که دیده میشود، نیست و نکات بسیار ریزی دارد که اغلب تجربی هستند.
به عنوان مثال، اگر پروژه شما نیازمند محیط قدیمی ایرانی (مانند بازار دوره صفویه) است. نوشتن صرفاً “بازار قدیمی” بسیار گسترده است و میتواند منجر به تصاویر بازارهای مصری، عربی یا اسلامی در دورههای مختلف شود. برای اینکه محیط مدنظر شما نزدیکتر به خواسته باشد، باید پرامپت را هوشمندانه بنویسید.
برای مثال، به جای اینکه مستقیماً به هوش مصنوعی بگویید “یک شهر ایرانی به من بده”، میتوانید از توصیفهایی مانند “یک شهر خاورمیانهای نسبتاً مدرن” استفاده کنید تا به نتیجه بهتری برسید. اگر دوره صفویه مدنظر است که در دوران اسلامی بوده است، میتوانید در کنار “بازار صفویه” بنویسید “با دیزاین اسلامی”.
در مواجهه با چالشهایی که هوش مصنوعی درک دقیقی از یک کلمه کلی مانند “باستانی” ندارد، باید عناصر بصری آن دوره را توصیف کنید. مثلاً به جای “بازار باستانی”، باید توصیف کرد که بازاری با ستونهای بزرگ سنگی، سقفهای چوبی و طرحهای باستانی مانند شیر یا پلنگ میخواهید. این توصیف دقیق به هوش مصنوعی کمک میکند تا تصویر مورد نظر را راحتتر تولید کند.
- جزئیات فنی پرامپت
- میزان جزئیات: هرچه جزئیات تصویر بیشتر باشد، دقت تصویرسازی بالاتر خواهد بود.
- طول پرامپت: نباید بیش از حد طولانی باشد. نوشتن مطلبی بیشتر از حدود دو پاراگراف (یک نکته تجربی) ممکن است هوش مصنوعی تصویرساز را گیج کند.
- ترجمه: اگر به زبان انگلیسی مسلط نیستید، میتوانید پرامپت خود را در نرمافزارهای ترجمه یا خود چت جیپیتی و جمینای ترجمه کنید. اما باید توجه داشت که پرامپت انگلیسی از دقت بیشتری برخوردار است و فهم راحتتری برای هوش مصنوعی ایجاد میکند.
- جریان کاری پیشرفته و حفظ کاراکتر
- الف: پرامپت معکوس (Reverse Prompting) شما میتوانید یک عکس را به هوش مصنوعی (مانند چت جیپیتی یا جمینای) بدهید و از آن بخواهید پرامپت آن تصویر را به شما ارائه دهد. مثلاً عکس تخت جمشید یا یک مسجد با دوره خاص را میدهید و پرامپت آن را میگیرید تا بتوانید آن را در نرمافزارهای تولید تصویر، به سبک دلخواه خود بازسازی کنید.
- ب: حفظ کاراکتر در پروژههای بزرگ برای پروژههایی که کاراکترها و محیطهای تکراری دارند (مانند یک انیمیشن کوتاه)، برای جلوگیری از توصیفهای مکرر، میتوانید در یک چت جدید به چت جیپیتی یک بار توضیح جامع دهید. شما باید تعداد تصاویر، ویژگیهای کامل کاراکترها (مانند پیرمرد، برادر بزرگتر) و جزئیات محیط (مانند دوره سلجوقیه یا تم کودکانه) را مشخص کنید. سپس از او بخواهید که تمام پلانهای بعدی را بر این اصول پیش ببرد. با این روش، هوش مصنوعی اطلاعات کاراکتر را در حافظه آن چت نگه میدارد و سرعت کار شما بسیار افزایش مییابد.
- ج: نانو به نانای گوگل «نانو به نانای گوگل» یک هوش مصنوعی بسیار کاربردی (هم تصویری و هم متنی) است که در حفظ کاراکتر به سایر ابزارها کمک میکند. این ابزار میتواند زوایای مختلف یک کاراکتر را (مانند نیمرخ یا پشت) بازطراحی کند. اگرچه Midjourney و سایر ابزارها هنوز به این کیفیت نرسیدهاند، نانو به نانا در این زمینه بسیار کار راه انداز است و بهخصوص در ساخت موشن کاربرد فراوان دارد.
- آرت استایل (Art Style)
آرت استایل مهمترین بخش هنری کار است و شکل گرافیک، انیمیشن، پوستر و محتوای تولیدی شما را مشخص میکند. آرت استایل به سبکهای مختلف هنری و آثار هنرمندان گوناگون (مانند عکاسی، نقاشی کودکانه، سهبعدی یا رئال) اشاره دارد.
- انتخاب آرت استایل مناسب: شما باید آرت استایلی را انتخاب کنید که مناسب موضوع کار شما باشد. به عنوان مثال، برای کار کودک نباید از آرت استایلهای پرجزئیات واقعگرا یا تمهای دارک استفاده شود. برای کارهای جدی، محیطهای رئالتر مناسب هستند.
- نحوه استفاده از آرت استایل: برای اعمال یک آرت استایل خاص، کافی است در انتهای پرامپت توصیفی خود اضافه کنید: “با گرافیک کامیک بوک” یا “با آرت استایل 3D”. اگر نام آرت استایل را نمیدانید، میتوانید اسم انیمیشن مورد علاقه خود را (مانند «انیمیشن آپ») ذکر کنید و از هوش مصنوعی بخواهید با آن آرت استایل خروجی دهد. سایتهایی مانند میدلایبرری (Midlibrary) نیز برای مشاهده و انتخاب آرت استایلهای مختلف در دسترس هستند.
- آرت استایلها زیرمجموعه سبکهای هنری کلی مانند رئالیسم، دادائیسم، کوبیسم و سوررئالیسم قرار میگیرند و هر هنرمند یا انیمیشنی میتواند آرت استایل منحصر به فرد خود را داشته باشد. خلاقیت در این بخش، کیفیت کار نهایی شما را به شدت افزایش میدهد.
- Midjourney و قابلیتهای پیشرفته
Midjourney یکی از بهترین ابزارها برای تصویرسازی حرفهای و پروژههای بزرگ است.
- الف: خرید اکانت: از آنجا که خرید مستقیم دشوار است، سایتهای واسطی (مانند ایرانی کارت) وجود دارند که این خدمات را ارائه میدهند. اما باید توجه داشت که این سایتها ممکن است با یک کارت اعتباری چندین اکانت بخرند. اگر یکی از آن اکانتها قوانین را نقض کند، اکانت شما نیز ممکن است بسته شود؛ به همین دلیل، خرید اکانتهای بیشتر از یک ماه توصیه نمیشود.
- ب: امکانات ویژه Midjourney Midjourney امکانات پیشرفتهای برای افزایش دقت پرامپت دارد:
- استایل رفرنس (Style Reference): علاوه بر توصیف متنی آرت استایل، میتوانید یک عکس نمونه را آپلود کنید تا هوش مصنوعی درک قویتری از سبک مورد نظر شما پیدا کند.
- ایمیج پرامپت (Image Prompt): میتوانید عکس مورد نظر را مستقیماً قرار دهید تا Midjourney از آن به عنوان پرامپت استفاده کرده و پرامپت متنی شما را تقویت کند.
- آمنی رفرنس (Omni Reference): این ابزار برای حفظ کاراکتر در محیطهای مختلف استفاده میشود. عکس کاراکتر طراحی شده آپلود میشود و با دادن پرامپت محیط جدید، هوش مصنوعی کاراکتر اصلی را در آن محیط جدید قرار میدهد.
- ج: تنظیمات و شخصیسازی: در تنظیمات Midjourney، میتوان سرعت جنریت (فست، ریلکس، توربو)، سایز تصویر و همچنین میزان خلاقیت تصویر (پارامترهای ویردنس و وریشن) را تنظیم کرد. همچنین، قابلیت «پرسونالایز آرت استایل» وجود دارد که با انتخاب ۲۰۰ عکس، سلیقه کاربر را تشخیص میدهد و تصویرسازی را هوشمندانهتر و مناسبتر میسازد.
- ابزارهای جایگزین و لزوم استفاده از فتوشاپ
- ابزارهای رایگان: برای کارهای تکی، پوستر و پروژههای فضای مجازی، استفاده از جمینای، لئوناردو و نانو به نانا توصیه میشود. چت جیپیتی برای پروژههای طولانی مانند انیمیشن مناسب نیست، زیرا نمیتواند آرت استایل را در پلانهای مختلف حفظ کند.
- ساخت ویدیو: برای ساخت ویدیو ابزارهایی مانند رانوی و کیلینگ وجود دارند که مطرح هستند، اما رایگان نیستند.
- فتوشاپ: با وجود پیشرفت هوش مصنوعی، در نهایت ممکن است برای اصلاح ایرادات جزئی تصاویر جنریت شده (مانند جزئیات چهره یا دست) نیاز به استفاده از فتوشاپ باشد. اصلاحات کوچک در فتوشاپ سرعت بیشتری نسبت به تلاش برای جنریتهای مکرر در هوش مصنوعی دارند. آموزشهای مقدماتی فتوشاپ به صورت رایگان در دسترس است.
- نکات حقوقی و محدودیتهای محتوایی
قوانین هوش مصنوعی ایجاب میکند که تصاویر خشونتآمیز، اختلافآمیز، یا محتوای شامل خون و پرچم مستقیم کشورها جنریت نشود؛ در غیر این صورت، اکانت کاربر ممکن است بلاک شود. برای دور زدن محدودیت پرچم، میتوان به جای درخواست مستقیم، پرچم را با توصیف رنگها و شکل آن بیان کرد.
- موضوع کار عملی نهایی
موضوع کار نهایی که به عنوان تمرین و به منزله پذیرش یک سفارش اعلام شده است، «ایران قوی و پیشتاز در حوزه علم و فناوری» است. از دانشجویان خواسته شده است تا با توجه به نکات آموزشی، پستر یا تصویری با این موضوع بسازند و ارسال کنند.