تیم Qwen شرکت علیبابا، در پایان سال پربار 2025، مدل منبعباز جدید تولید تصویر Qwen-Image-2512 را منتشر کرد که مستقیماً با مدل اختصاصی گوگل یعنی Nano Banana Pro (معروف به Gemini 3 Pro Image) رقابت میکند. این مدل که تحت لایسنس Apache 2.0 منتشر شده، عملکردی برابر با مدلهای بسته ارائه میدهد و امکان استفاده رایگان، تجاری، سفارشیسازی و خودمیزبانی را فراهم میکند. طبق گزارشها، در تستهای کور انسانی در پلتفرم AI Arena علیبابا، به عنوان قویترین مدل منبعباز رتبهبندی شده و با سیستمهای بسته رقابت نزدیک دارد. این اولین بار است که یک مدل منبعباز در تولید تصاویر حرفهای مانند اینفوگرافیکهای پرمتن، اسلایدها و ویژوالهای سازمانی بدون خطای املایی، به سطح مدلهای گوگل میرسد.
گوگل با Nano Banana Pro استاندارد جدیدی تعریف کرد: تولید تصاویر حرفهای با زبان طبیعی، بدون خطای متن و تمرکز بر کاربردهای سازمانی مانند بازاریابی، مستندسازی و طراحی. اما این مدل بسته است و وابسته به اکوسیستم گوگل (مانند Vertex AI و Workspace)، با قیمتگذاری مبتنی بر استفاده. Qwen-Image-2512 رویکرد متفاوتی دارد: عملکرد برابر + منبعباز بودن که برای شرکتها کنترل هزینه، حاکمیت داده و سفارشیسازی (مانند زبانهای محلی یا سبکهای خاص) را فراهم میکند.
ویژگیهای کلیدی Qwen-Image-2512
- واقعگرایی انسانی و همخوانی محیطی: کاهش چشمگیر “ظاهر AI” با رندر دقیق ویژگیهای صورت، سن، بافت پوست، وضعیت بدن و زمینههای پسزمینه، ایدهآل برای تصاویر مصنوعی در آموزش، شبیهسازی و ارتباطات.
- وفاداری بافت طبیعی: جزئیات دقیقتر در منظره، آب، خز حیوانات و مواد با گرادیانهای نرمتر برای کاربردهای تجارت الکترونیک، آموزش و ویژوالیزیشن.
- رندر متن ساختاریافته و چیدمان: دقت بالا در متن جاسازیشده (انگلیسی و چینی)، برای اسلایدها، پوسترها، اینفوگرافیکها و ترکیبهای متن-تصویر؛ جایی که مدلهای منبعباز قبلی ضعیف بودند.
مدل در Hugging Face، ModelScope و GitHub با وزنهای کامل موجود است و دموهای آنلاین برای تست فوری دارد. همچنین برای شرکتها، API از Alibaba Cloud با قیمت 0.075 دلار به ازای هر تصویر ارائه میشود.
مقایسه با Nano Banana Pro گوگل
Nano Banana Pro در تولید ویژوالهای پرمتن و چندزبانه عالی است، اما بسته بودن آن محدودیتهایی مانند وابستگی به کلود گوگل و عدم سفارشیسازی ایجاد میکند. Qwen-Image-2512 در واقعگرایی، بافت و متن رقابت میکند، اما با منبعباز بودن، برای تیمهای مستقل یا صنایع حساس به داده (مانند مقررات) مناسبتر است. در بنچمارک AI Arena، Qwen-Image-2512 رتبه برتر منبعباز را دارد و نزدیک به مدلهای بسته عمل میکند.
این انتشار نشاندهنده تغییر بازار است: منبعباز دیگر یک نسل عقب نیست، بلکه در قابلیتهای کلیدی سازمانی (وفاداری متن، کنترل چیدمان، واقعگرایی) با بستهها برابر شده و آزادی بیشتری ارائه میدهد.
علیبابا سال 2025 را با انتشارهای قدرتمند منبعباز به پایان رساند و Qwen-Image-2512 گامی بزرگ برای دموکراتیزه کردن تولید تصویر AI است. دسترسی رایگان و تجاری، آن را برای توسعهدهندگان، استارتآپها و شرکتها جذاب میکند.
منبع: venturebeat.com












