مایکروسافت به‌تازگی مدل جدید تولید تصویر خود با نام MAI-Image-1 را معرفی کرده است؛ نخستین مدل تولید تصویر کاملاً داخلی شرکت که اکنون در رتبه‌بندی سایت مستقل LMArena در کنار برترین مدل‌های جهان مانند Gemini’s Imagen و ChatGPT قرار گرفته است.

برای کسانی که با LMArena آشنا نیستند، این پلتفرم مانند جدول بیلبورد برای موسیقی است، با این تفاوت که به‌جای آهنگ‌ها، کیفیت مدل‌های تولید تصویر هوش مصنوعی را رتبه‌بندی می‌کند. شرکت‌ها و پروژه‌های متن‌باز مدل‌های خود را ارسال می‌کنند و کاربران واقعی از طریق مقایسه‌ی دو تصویر در کنار هم رأی می‌دهند که کدام بهتر است. مدلی که رأی بیشتری بگیرد، در رتبه‌بندی بالا می‌رود.

مایکروسافت اعلام کرده MAI-Image-1 در نخستین حضور خود در میان ۱۰ مدل برتر جهان قرار گرفته است؛ یعنی در آزمایش‌های مقایسه‌ای کور، عملکردی بهتر از بسیاری از رقبا داشته و حالا یکی از بهترین مولدهای تصویر بر اساس بازخورد عمومی محسوب می‌شود.

چگونه از MAI-Image-1 استفاده کنیم

شروع کار بسیار ساده است و به هیچ اشتراکی نیاز ندارد، تنها با ورود به حساب کاربری مایکروسافت می‌توانید تصاویر خود را دنبال کنید.

  • وارد com/images/create شوید (یا در اپلیکیشن Copilot به بخش Image Creator بروید).
  • متن موردنظر خود (prompt) را وارد کنید.
  • روی Create کلیک کنید و چند ثانیه صبر کنید تا ۳ یا ۴ نسخه متفاوت تولید شود.
  • تصویر دلخواه را دانلود یا ویرایش کنید.

این مدل همچنین در ابزارهای Microsoft Designer و PowerPoint ادغام شده است تا بتوانید از طریق فرمان‌های زبانی ساده، تصاویر مناسب برای ارائه‌ها، شبکه‌های اجتماعی یا تخته بوردهای مفهومی ایجاد کنید.

ویژگی‌های کلیدی MAI-Image-1

مایکروسافت می‌گوید در توسعه‌ی این مدل، انتخاب داده‌ها و ارزیابی کیفی با تمرکز بر کاربردهای واقعی در اولویت بوده است:

واقع‌گرایی بصری: بهبود نورپردازی، بازتاب‌ها و مناظر طبیعی.

سرعت و کیفیت: چرخه‌ی تولید سریع‌تر از مدل‌های بزرگ‌تر و کندتر.

آموزش خلاقانه: استفاده از بازخورد متخصصان صنایع خلاق به‌جای صرفاً داده‌های عمومی.

کاربران می‌توانند از این ابزار برای نمونه‌سازی ایده‌ها، طراحی‌های گرافیکی و خلق محتوای بصری استفاده کنند. پس از انتخاب بهترین تصویر، امکان ویرایش آن در نرم‌افزارهایی مانند Photoshop، Figma یا Illustrator نیز وجود دارد.

پنج دستور برای امتحان در MAI-Image-1

۱. سازه‌ها

پرامپت:

«یک تصویر فوتو رئالیستی از خط افق شهری آینده‌نگر در غروب، با ساختمان‌های شیشه‌ای و خودروهای پرنده بر فراز شهر، در سبک سینمایی و زاویه‌ی دید باز ایجاد کن.»

این دستور میزان خلاقیت و توانایی مدل در ایجاد جزئیات نوری و عناصر تخیلی را می‌سنجد و نتایج MAI-Image-1 در این زمینه در حد بهترین مدل‌های بازار است.

۲. آثار آشپزی

پرامپت:

«تصویر نزدیک از یک غذای گیاهی لوکس روی بشقاب سرامیکی مشکی، با نور طبیعی از کنار، پس‌زمینه مینیمال و وضوح بالا تولید کن.»

نتیجه: زاویه‌ها و چیدمان‌های مختلف غذا به شکل طبیعی و دقیق نمایش داده شدند.

۳. تصاویر بازاریابی

پرامپت:

«تصویری با کنتراست بالا برای کمپین تبلیغاتی یک استارتاپ فناوری بساز: چهار نفر از تیم متنوع در حال طوفان فکری دور یک نمایشگر هولوگرافیک با نورپردازی نئون.»

تصویر اولیه کمی تاریک بود، اما با تغییر جزئی در پرامپت، می‌توان وضوح و روشنایی بیشتری به دست آورد.

۴. حیوانات و طبیعت

پرامپت:

«صحنه‌ای آرام از حیات وحش تصویر کن: یک روباه قرمز در حال عبور از جنگلی مه‌آلود در سپیده‌دم، با نور طلایی ساعت جادویی، بافت موی بسیار دقیق و عمق میدان کم.»

تصویر حاصل به‌قدری طبیعی است که تشخیص واقع‌گرایی آن دشوار است، عملکردی در حد ChatGPT و Midjourney.

۵. طراحی استوری‌بورد

Prompt:

«یک استوری بورد سه‌قسمتی بساز که تحول فرایند ویرایش را از دفترچه‌های کاغذی به لپ‌تاپ و سپس دستیار هوش مصنوعی هولوگرافیک نشان دهد؛ در سبک شرکتی تمیز و مدرن.»

نتیجه‌ی نهایی نقطه‌ی شروع خوبی دارد و با ترکیب MAI-Image-1 با ابزارهایی مانند Mixboard می‌توان خروجی را به محصولی حرفه‌ای‌تر تبدیل کرد.

چشم‌انداز MAI-Image-1

مدل جدید مایکروسافت گامی مهم در حوزه‌ی هوش مصنوعی تصویری است؛ سریع، در دسترس و سازگار با نیازهای واقعی طراحان. هرچند هنوز نمی‌توان گفت از رقبایی مانند Nano Banana برتر است، اما نتایج اولیه بسیار امیدوارکننده‌اند. اگر با هوش مصنوعی محتوا تولید می‌کنید، MAI-Image-1 می‌تواند ابزار ارزشمندی در جعبه‌ابزار شما باشد.

منبع tomsguide

source

توسط wikiche.com