برو به محتوای اصلی

مدل‌های تصویر

AI-School از کاتالوگ مرکزی مدل‌ها برای مدل‌های تبدیل متن به تصویر استفاده می‌کند. اینکه کدام مدل‌ها قابل مشاهده هستند به تنظیمات ارائه‌دهنده محیط بستگی دارد.

کاتالوگ فعلی

عرضه‌کنندهاقتصادیبا کیفیت بالا
OpenAIGPT Image 1 miniGPT Image 2
GoogleNano BananaNano Banana 2
Black Forest LabsFLUX.2 FlexFLUX.2 Pro Preview

Nano Banana نامی است که AI-School برای مدل‌های Gemini Flash Image استفاده می‌کند. مدل‌های تصویری اروپایی از طریق Black Forest Labs ارائه می‌شوند.

برای چه کاری کدام مدل را انتخاب کنید؟

مدلمناسب برای
GPT Image 1 miniتصاویر مفهومی سریع، طرح‌ها، آزمایش و تکرار با هزینه کمتر.
GPT Image 2تصاویر نهایی مرتب‌تر، متن واضح‌تر در تصاویر و کنترل بیشتر بر پایان‌بندی.
Nano Bananaتصاویر سریع و مقرون‌به‌صرفه، تنوع زیاد و ویرایش‌های ساده.
Nano Banana 2تولید تصویر روان و ویرایش تعاملی تصویر با Google.
FLUX.2 Flexتولید تصویر اروپایی انعطاف‌پذیر با کنترل، ویرایش و کیفیت خوب.
FLUX.2 Pro Previewتولید تصویر اروپایی با کیفیت بالا برای تصاویر واقع‌گرا و سبک سازگار.

گزینه‌های فرمت مرکزی

AI-School به کاربران چهار گزینه فرمت عمومی نشان می‌دهد:

گزینهمعنی
AutomatischAI-School مناسب‌ترین تنظیم را برای مدل انتخاب می‌کند.
Vierkantیک تصویر مربعی.
Liggendیک تصویر گسترده، برای مثال برای ارائه‌ها.
Staandیک تصویر عمودی، برای پوسترها.

در کاتالوگ مرکزی مدل‌ها مشخص شده است که این گزینه‌ها برای هر عرضه‌کننده به چه صورت به ترجمه به تنظیم فنی مناسب تبدیل می‌شوند. بنابراین کاربر نیاز ندارد بداند که ارائه‌دهنده با 16:9، 1536x1024، عرض/ارتفاع یا مقدار دیگری کار می‌کند.

ویرایش و تصاویر الهام

مدل‌های تصویر مدرن می‌توانند از تصاویر به عنوان ورودی استفاده کنند. AI-School بین این دو تمایز قائل می‌شود:

  • تصاویر الهام: تصاویر مرجع که به سبک، رنگ، ترکیب یا موضوع جهت می‌دهند.
  • تصاویر ویرایش: تصویر منبعی که مدل باید ویرایش کند.

در حالت ویرایش کاربر هیچ نسبت ابعادی تعیین نمی‌کند. AI-School ابعاد یا تنظیمات فرمتی دستی ارائه نمی‌کند تا مدل بتواند ابعاد و نسبت تصویر منبع را حفظ کند.

بهبود Prompt

در تولید تصویر مستقیم، AI-School می‌تواند یک گام اضافی هوش مصنوعی برای بهبود prompt و تنظیمات خودکار انجام دهد. این گام به prompt فعلی، تنظیمات و تاریخچه چت اخیر نگاه می‌کند. تنظیمات صریح انتخاب‌شده همچنان ساته‌اند؛ تنظیمات خودکار یا خالی می‌تواند تکمیل شود.