مایکروسافت بهطور رسمی مدل جدید تولید و ویرایش تصویر اوپنایآی با نام GPT-Image-1.5 را برای همه کاربران در پلتفرم Microsoft Foundry (که پیشتر با نام Azure AI Foundry شناخته میشد) در دسترس قرار داد. این مدل که قویترین ابزار تولید تصویر اوپنایآی تا امروز محسوب میشود، از 20 دسامبر 2025 بهصورت عمومی قابل استفاده است و نیازی به لیست انتظار ندارد.
GPT-Image-1.5 در مقایسه با مدل قبلی (GPT-Image-1) سه پیشرفت اصلی دارد:
- کیفیت و وفاداری بصری بهمراتب بالاتر (بهویژه در حفظ چهره، نورپردازی و جزئیات پیچیده).
- همخوانی بسیار دقیقتر با دستورات متنی (Prompt Following).
- سرعت تولید تا 4 برابر سریعتر.
مایکروسافت اعلام کرد این مدل در بنچمارکهای داخلی توانسته امتیاز 91.2 درصد در تولید تصویر از متن و 96.9 درصد در ساخت دیاگرام و فلوچارت کسب کند؛ عددی که آن را از رقبایی مانند Qwen Image، Flux و حتی Midjourney v6.1 جلوتر قرار میدهد.
همچنین یکی از قابلیتهای کلیدی جدید، ویرایش هوشمند تصاویر است. کاربران میتوانند فقط با انتخاب یک ناحیه و نوشتن دستور متنی، بخشهای دلخواه عکس را تغییر دهند، در حالی که مدل بهطور خودکار چهرهها، لوگوهای برند، ترکیببندی و پالت رنگی را حفظ میکند. این ویژگی بهخصوص برای خردهفروشی آنلاین، آژانسهای تبلیغاتی و طراحان UI/UX بسیار کاربردی است.
قیمتگذاری مدل نیز بسیار رقابتی اعلام شده:
- ورودی تصویر: 8 دلار به ازای هر یک میلیون توکن.
- خروجی تصویر: 32 دلار به ازای هر یک میلیون توکن.
که نسبت به GPT-Image-1 کاهش قابل توجهی داشته و آن را برای استفادههای تجاری حجیم مقرونبهصرفه میکند.
دسترسی به مدل از طریق دو مسیر ممکن است:
- مستقیماً در ai.azure.com.
- از طریق API در Microsoft Foundry با تمام امکانات امنیتی سازمانی (شبکه ایزوله، Azure Policy، Sentinel و Purview).
مایکروسافت تأکید کرده که تمام تصاویر تولیدشده با این مدل با فیلترهای ایمنی محتوایی پیشرفته و watermark نامرئی همراه هستند تا از سوءاستفاده جلوگیری شود.
این حرکت در حالی صورت میگیرد که رقابت در حوزه مدلهای تولید تصویر مولتیمودال به اوج خود رسیده است. گوگل چندی پیش Imagen 3 و جمینی تصویرسازی را تقویت کرد و متا نیز Llama Vision را معرفی کرده بود. اما انتشار عمومی و بدون محدودیت GPT-Image-1.5 توسط مایکروسافت میتواند تعادل بازار را به نفع اکوسیستم Azure-OpenAI تغییر دهد.
کارشناسان معتقدند این مدل بهسرعت به ابزار پیشفرض بسیاری از شرکتهای بزرگ برای تولید کاتالوگ محصولات، محتوای شبکههای اجتماعی و حتی طراحی پروتوتایپ تبدیل خواهد شد. در حال حاضر بیش از 18 هزار سازمان در سراسر جهان از پلتفرم Foundry استفاده میکنند و انتظار میرود تا پایان سال 2026 این رقم دو برابر شود.
مایکروسافت اعلام کرده در هفتههای آینده نمونهکدهای آماده (SDK) برای پایتون، Node.js و .NET را منتشر خواهد کرد تا ادغام آن در برنامههای موجود آسانتر شود.












