موضوعات داغ:

آدرس فروشگاه:
Lipak.com

 
لیپک » اخبار تکنولوژی » مایکروسافت مدل GPT-Image-1.5 اوپن‌ای‌آی را منتشر کرد!

مایکروسافت مدل GPT-Image-1.5 اوپن‌ای‌آی را منتشر کرد!

انتشار مدل تصویری جدید مایکروسافت.
مدل GPT-Image-1.5 اوپن‌ای‌آی

مایکروسافت به‌طور رسمی مدل جدید تولید و ویرایش تصویر اوپن‌ای‌آی با نام GPT-Image-1.5 را برای همه کاربران در پلتفرم Microsoft Foundry (که پیش‌تر با نام Azure AI Foundry شناخته می‌شد) در دسترس قرار داد. این مدل که قوی‌ترین ابزار تولید تصویر اوپن‌ای‌آی تا امروز محسوب می‌شود، از 20 دسامبر 2025 به‌صورت عمومی قابل استفاده است و نیازی به لیست انتظار ندارد.

GPT-Image-1.5 در مقایسه با مدل قبلی (GPT-Image-1) سه پیشرفت اصلی دارد:

  • کیفیت و وفاداری بصری به‌مراتب بالاتر (به‌ویژه در حفظ چهره، نورپردازی و جزئیات پیچیده).
  • هم‌خوانی بسیار دقیق‌تر با دستورات متنی (Prompt Following).
  • سرعت تولید تا 4 برابر سریع‌تر.

مایکروسافت اعلام کرد این مدل در بنچمارک‌های داخلی توانسته امتیاز 91.2 درصد در تولید تصویر از متن و 96.9 درصد در ساخت دیاگرام و فلوچارت کسب کند؛ عددی که آن را از رقبایی مانند Qwen Image، Flux و حتی Midjourney v6.1 جلوتر قرار می‌دهد.

همچنین یکی از قابلیت‌های کلیدی جدید، ویرایش هوشمند تصاویر است. کاربران می‌توانند فقط با انتخاب یک ناحیه و نوشتن دستور متنی، بخش‌های دلخواه عکس را تغییر دهند، در حالی که مدل به‌طور خودکار چهره‌ها، لوگوهای برند، ترکیب‌بندی و پالت رنگی را حفظ می‌کند. این ویژگی به‌خصوص برای خرده‌فروشی آنلاین، آژانس‌های تبلیغاتی و طراحان UI/UX بسیار کاربردی است.

قیمت‌گذاری مدل نیز بسیار رقابتی اعلام شده:

  • ورودی تصویر: 8 دلار به ازای هر یک میلیون توکن.
  • خروجی تصویر: 32 دلار به ازای هر یک میلیون توکن.

که نسبت به GPT-Image-1 کاهش قابل توجهی داشته و آن را برای استفاده‌های تجاری حجیم مقرون‌به‌صرفه می‌کند.

دسترسی به مدل از طریق دو مسیر ممکن است:

  • مستقیماً در ai.azure.com.
  • از طریق API در Microsoft Foundry با تمام امکانات امنیتی سازمانی (شبکه ایزوله، Azure Policy، Sentinel و Purview).

مایکروسافت تأکید کرده که تمام تصاویر تولیدشده با این مدل با فیلترهای ایمنی محتوایی پیشرفته و watermark نامرئی همراه هستند تا از سوءاستفاده جلوگیری شود.

این حرکت در حالی صورت می‌گیرد که رقابت در حوزه مدل‌های تولید تصویر مولتی‌مودال به اوج خود رسیده است. گوگل چندی پیش Imagen 3 و جمینی تصویرسازی را تقویت کرد و متا نیز Llama Vision را معرفی کرده بود. اما انتشار عمومی و بدون محدودیت GPT-Image-1.5 توسط مایکروسافت می‌تواند تعادل بازار را به نفع اکوسیستم Azure-OpenAI تغییر دهد.

کارشناسان معتقدند این مدل به‌سرعت به ابزار پیش‌فرض بسیاری از شرکت‌های بزرگ برای تولید کاتالوگ محصولات، محتوای شبکه‌های اجتماعی و حتی طراحی پروتوتایپ تبدیل خواهد شد. در حال حاضر بیش از 18 هزار سازمان در سراسر جهان از پلتفرم Foundry استفاده می‌کنند و انتظار می‌رود تا پایان سال 2026 این رقم دو برابر شود.

مایکروسافت اعلام کرده در هفته‌های آینده نمونه‌کدهای آماده (SDK) برای پایتون، Node.js و .NET را منتشر خواهد کرد تا ادغام آن در برنامه‌های موجود آسان‌تر شود.

منبع: techcommunity.microsoft.com

Telegram
WhatsApp
LinkedIn

نظر شما مهمه؛ بگید و بپرسید

شماره تماس شما منتشر نمی‌شود و فقط برای اطلاع‌رسانی از پاسخ به نظر شما، قرعه‌کشی دیدگاه‌های کاربران و خبرنامه تازه‌های تکنولوژی ثبت خواهد شد.