|

اختبار عميق لفشل GPT-Image-2 في الخلفية الشفافة: 4 بدائل و3 أسباب جذرية

أثناء مساعدتنا للعملاء في استكشاف متطلبات توليد الصور مؤخرًا، لاحظنا ظاهرة تستحق المشاركة: GPT-Image-2 لم يعد قادراً على توليد صور PNG بخلفية شفافة حقيقية. سواء كتبت في الموجه (Prompt) "يجب أن تكون الخلفية شفافة"، أو مررت معامل background: "transparent" مباشرة عبر واجهة برمجة التطبيقات (API)، فإن الجيل الأحدث من GPT-Image-2 سيعيد لك صورة بخلفية ملونة، أو سيظهر خطأً برمجياً. هذا يمثل تراجعاً واضحاً في القدرات مقارنة بالجيل السابق sora_image / gpt-4o-image، مما وضع فرق العمل التي تعتمد على قص صور المنتجات (SKU)، أو صناعة ملصقات التواصل الاجتماعي، أو رسومات العروض التقديمية في موقف صعب.

والأكثر إثارة للدهشة هو أن نموذج جوجل الرائد Nano Banana Pro (المبني على Gemini 3 Pro Image) الذي أُطلق في نهاية 2025، لا يدعم أيضاً توليد الخلفيات الشفافة، حتى الجيل السابق Nano Banana 2 كان يعاني من نفس القيود. بعبارة أخرى، قام أهم نموذجين أساسيين لتوليد الصور في الصناعة حالياً بإلغاء هذه الميزة التي تبدو أساسية. لقد أجرينا في APIYI (apiyi.com) سلسلة كاملة من اختبارات الانحدار، وقمنا بتنظيم النتائج والأسباب الجذرية والبدائل في هذا المقال لتسهيل اتخاذ القرار للفرق التي تعمل على دمج هذه التقنيات في منتجاتها.

gpt-image-2-transparent-background-not-supported-ar 图示

تجربة إعادة إنتاج فشل GPT-Image-2 في توليد الخلفية الشفافة

لفهم هذا الاختلاف في القدرات، الطريقة المباشرة هي تجربته بنفسك. لقد استخدمنا بوابة APIYI لاستدعاء ثلاثة إصدارات: gpt-image-2، وgpt-image-1.5، وgpt-image-2-all، مع توحيد الموجه ليكون "a cute orange cat sticker, transparent background"، وضبط معامل background صراحةً على transparent. كانت النتائج متسقة للغاية: سلسلة gpt-image-2 إما تعيد خطأ 4xx، أو تولد صورة بخلفية ملونة أو خلفية بنمط المربعات (التي تشير للشفافية)، بينما قام gpt-image-1.5 القديم بإعادة صورة PNG شفافة حقيقية مع قناة ألفا (alpha channel).

# اختبار قدرة الخلفية الشفافة لـ 3 إصدارات عبر بوابة APIYI
from openai import OpenAI

client = OpenAI(
    api_key="your-apiyi-key",
    base_url="https://api.apiyi.com/v1"
)

# ❌ gpt-image-2 لا يدعم transparent، وسيتم رفضه من قبل طبقة البوابة
client.images.generate(
    model="gpt-image-2",
    prompt="a cute orange cat sticker",
    background="transparent",
    output_format="png"
)

# ✅ gpt-image-1.5 لا يزال يدعم توليد الخلفية الشفافة أصلياً
client.images.generate(
    model="gpt-image-1.5",
    prompt="a cute orange cat sticker",
    background="transparent",
    output_format="png"
)

🎯 نصيحة للبدء السريع: إذا كنت ترغب فقط في تشغيل سير العمل الحالي، فإن أقل الحلول تكلفة هو إعادة حقل النموذج إلى gpt-image-1.5 وتوجيه base_url إلى APIYI (apiyi.com)، دون تغيير أي معاملات أخرى، وستستعيد القدرة على توليد الصور الشفافة في غضون 5 دقائق.

لقد قمنا أيضاً بإعادة إنتاج حالات إدراج عبارات مثل "background must be transparent" أو "isolated on transparent canvas" أو "PNG with alpha channel" في الموجه. كان أداء GPT-Image-2 عنيداً جداً: فإما يعطي خلفية بيضاء، أو يولد صورة بخلفية ملونة تحتوي على "ملصق" المربعات الرمادية والبيضاء، وهو ما يعني أنه رسم "العلامة المرئية للشفافية" بدلاً من جعلها شفافة فعلياً. هذا يتطابق تماماً مع نمط الفشل في Nano Banana Pro، وهو خلل في مستوى مواءمة الدلالات (Semantic Alignment) للنموذج، وليس بسبب عدم دقة كتابة الموجه.

طريقة التفعيل أداء GPT-Image-2 أداء gpt-image-1.5 التصرف الموصى به
معامل background="transparent" رفض API / خلفية ملونة PNG شفاف حقيقي استبدل النموذج
الموجه "transparent background" خلفية بيضاء أو نمط مربعات PNG شفاف حقيقي لا تعتمد على النص
الموجه "isolated subject on white" خلفية رمادية فاتحة خلفية بيضاء استخدمه مع المعاملات
المخرج output_format=webp لا يزال ملوناً webp شفاف حقيقي webp لا يؤثر على القدرة
واجهة Edit + قناع ألفا غير فعال شفافية جزئية متاح فقط في 1.5

هناك 3 أسباب جوهرية وراء إزالة ميزة الخلفية الشفافة في GPT-Image-2:

أولاً، المقايضات على مستوى البنية. ذكرت OpenAI بوضوح في الوثائق الرسمية لـ GPT-Image-2 أن "gpt-image-2 لا يدعم حالياً الخلفيات الشفافة". لم يتم الإفصاح عن الأسباب، لكن التقديرات السائدة في القطاع تشير إلى ارتباط ذلك بترقيته نحو هدف تدريبي يركز على "اتساق المشهد" بشكل أقوى؛ حيث يتم تدريب النموذج على إكمال مشهد واقعي بدلاً من "قص الصور"، مما يعني غياب إشارات قناة ألفا (alpha channel) في المستوى الأساسي. هذا قرار تصميمي على مستوى المنتج، وليس خطأً برمجياً (bug).

ثانياً، التحقق الإلزامي في بوابة API. بعد فحص استجابات نقاط النهاية الرسمية لـ OpenAI، وجدنا أن قيم المعامل background في GPT-Image-2 تقتصر فقط على auto و opaque؛ حيث تمت إزالة transparent تماماً من مساحة المعاملات. هذا يعني أن أي منصة وسيطة (بما في ذلك بوابة APIYI) سترفض هذا الطلب في مرحلة الإرسال، ولن يصل الطلب أبداً إلى مرحلة استنتاج النموذج. لذا، فإن الاعتقاد بأن "استخدام منصة طرف ثالث سيسمح بتجاوز هذا القيد" هو مجرد وهم، فجميع القنوات التي تدعي الوصول للنموذج (مثل gpt-image-2-all أو gpt-image-2-vip) تستخدم نفس النموذج الخلفي.

ثالثاً، سياسات الأمان وتصفية حقوق النشر. تُستخدم الصور ذات الخلفية الشفافة غالباً في عمليات التركيب الثانوي، والتي غالباً ما تتضمن صوراً شخصية أو شعارات علامات تجارية. في العامين الماضيين، قامت OpenAI بتشديد صلاحيات إخراج "المواد القابلة للتركيب الثانوي"، ويأتي إيقاف ميزة الخلفية الشفافة كجزء من توجهها نحو تطبيق خطوط إنتاج أكثر صرامة لمراجعة المحتوى.

🎯 نصيحة لفهم البنية: في بوابة موحدة مثل APIYI (apiyi.com)، نقوم بالتحقق من مساحات المعاملات لـ GPT-Image-2 و GPT-Image-1.5 بشكل منفصل، ونقدم اقتراحات تلقائية للرجوع إلى إصدار أقدم عند مواجهة طلب transparent، وذلك لتجنب الحالات التي يفشل فيها الطلب دون معرفة السبب.

gpt-image-2-transparent-background-not-supported-ar 图示

مقارنة قدرات الخلفية الشفافة بين GPT-Image-2 و Nano Banana Pro

يسألنا الكثير من العملاء: "هل يكفي التبديل إلى Google Nano Banana 2 أو Nano Banana Pro؟" والإجابة قاسية للغاية، وهي: لا، هذا لا يحل المشكلة. بل إن نمط الفشل في Nano Banana Pro أكثر "إزعاجاً" من GPT-Image-2؛ فهو يولد صورة تبدو في ظاهرها "ذات خلفية شفافة"، ولكن عند التدقيق، ستجد أن نمط المربعات (الذي يرمز للشفافية) هو في الواقع بكسلات ملونة مرسومة داخل الصورة نفسها، وكأن النموذج "رسم" نمط الشفافية الخاص ببرنامج فوتوشوب كجزء من الصورة.

التفسير السائد في المجتمع التقني حالياً هو: أن بيانات تدريب النموذج تحتوي على كميات هائلة من الصور التي تستخدم "المربعات" لتمثيل الشفافية (مثل صور Stock، لقطات شاشة فوتوشوب، ودروس التصميم)، مما جعل النموذج يربط خطأً بين "الشفافية = المربعات". وقد أكدت Google رسمياً في منتدى Gemini API أن سلسلة Nano Banana لن تدعم حالياً مخرجات الخلفية الشفافة بشكل أصلي، وتتطلب استخدام مزيج من Gemini 3 Flash مع تنفيذ الأكواد البرمجية كحل بديل.

النموذج تاريخ الإصدار دعم الخلفية الشفافة الأداء عند الفشل سيناريوهات الاستخدام
GPT-Image-2 أوائل 2026 ❌ لا يدعم خلفية ملونة / خطأ صور واقعية، ملصقات
GPT-Image-2-all أوائل 2026 ❌ لا يدعم مطابق للرسمي مكافئ لـ GPT-Image-2
GPT-Image-1.5 منتصف 2025 ✅ دعم أصلي / ملصقات، صور تجارة إلكترونية
sora_image / gpt-4o-image مارس 2025 ✅ يدعم / توافق مع سير العمل القديم
Nano Banana 2 أواخر 2025 ❌ لا يدعم نمط مربعات رمادي وأبيض إبداع ثانوي، أسلوب فني
Nano Banana Pro أواخر 2025 ❌ لا يدعم نمط مربعات رمادي وأبيض تحرير عالي الدقة
Stable Diffusion + LoRA تحديث مستمر ✅ دعم غير مباشر يحتاج معالجة لاحقة إنتاج ضخم ذاتي الاستضافة

🎯 نصيحة اختيار النموذج: إذا كان هدفك هو "عزل العنصر الأساسي فقط"، فإن الخيار الأكثر فعالية من حيث التكلفة في عام 2026 هو استخدام GPT-Image-1.5 أو sora_image مباشرة، أو استخدام Nano Banana Pro ثم إجراء عملية إزالة للخلفية. يمكنك الوصول إلى هذين المسارين عبر APIYI (apiyi.com) باستخدام نظام موحد للمصادقة والفواتير، مما يجنبك عناء إدارة مفاتيح API متعددة.

gpt-image-2-transparent-background-not-supported-ar 图示

4 بدائل للحصول على خلفية شفافة في GPT-Image-2

على الرغم من أن GPT-Image-2 يرفض توليد صور بخلفية شفافة، إلا أن هناك أربعة مسارات تقنية ناضجة لتحقيق ذلك، يتميز كل منها بمنحنى تكلفة وجودة مختلف، ويمكنك الدمج بينها بمرونة حسب احتياجات مشروعك.

الطريقة الأولى هي الرجوع إلى إصدار أقدم (sora_image / gpt-image-1.5). هذا هو الحل الأقل تعقيداً؛ حيث لا تحتاج لتعديل كود الاستدعاء في العميل، فقط قم بتغيير حقل model من gpt-image-2 إلى gpt-image-1.5 أو sora_image لاستعادة ميزة قنوات ألفا (alpha channel) فوراً. العيب هو أن الواقعية وقدرة معالجة النصوص الطويلة ستكون أضعف قليلاً مقارنة بـ GPT-Image-2، لكنها كافية تماماً لملصقات الويب، الشعارات، وصور المنتجات التجارية.

الطريقة الثانية هي توليد الصورة بـ GPT-Image-2 + معالجة لاحقة لإزالة الخلفية. يتم ذلك عبر توليد صورة بخلفية ملونة ذات جودة عالية باستخدام GPT-Image-2، ثم ربطها بنموذج إزالة خلفية (مثل 851-labs/background-remover، RemBG، أو BiRefNet) لاستخراج قناة ألفا. يحافظ هذا المسار على واقعية GPT-Image-2، لكنه يضيف تأخيراً زمنياً يتراوح بين 1-3 ثوانٍ، وتعتمد دقة الحواف المعقدة (مثل الشعر، الزجاج، أو الدخان) على كفاءة نموذج إزالة الخلفية المستخدم.

الطريقة الثالثة هي استخدام الشاشة الخضراء (Chroma Key). يمكنك إجبار النموذج في الموجه (Prompt) على توليد "خلفية خضراء صلبة ونقية، hex #00ff00"، ثم استخدام كود برمجي لاستبدال اللون عبر عتبة HSV. هذا الحل أسرع وأرخص من إزالة الخلفية العامة، لكن عيبه أنه قد "يأكل" البكسلات ذات اللون المشابه في العنصر الأساسي، لذا فهو غير مناسب للمواد التي تحتوي على اللون الأخضر في جوهرها.

الطريقة الرابعة هي طريقة طرح الخلفيتين. اطلب من GPT-Image-2 توليد صورتين بنفس البذرة (seed)، واحدة بخلفية بيضاء والأخرى بخلفية سوداء، ثم احسب فرق اللون لكل بكسل لاستنتاج قيمة ألفا. هذا هو الحل "الأكثر احترافية" الذي يحظى بنقاش واسع في مجتمع OpenAI، حيث يوفر أعلى استقرار في الجودة، لكن تكلفته هي ضعف رسوم التوليد.

البديل تعقيد التنفيذ تكلفة إضافية لكل صورة جودة الحواف سيناريو الاستخدام
العودة لـ GPT-Image-1.5 / sora_image 0 عالية الملصقات، صور المنتجات
GPT-Image-2 + نموذج إزالة خلفية ⭐⭐ +1 استدعاء للنموذج متوسطة-عالية صور الأشخاص الواقعية، المنتجات
طريقة الشاشة الخضراء (Chroma Key) ⭐⭐⭐ شبه معدومة متوسطة الشخصيات الكرتونية، الأشكال الهندسية
طريقة طرح الخلفيتين ⭐⭐⭐⭐ ضعف تكلفة التوليد عالية الزجاج، الشعر، الحواف المعقدة

🎯 نصيحة هندسية: في منصة APIYI (apiyi.com)، نقوم افتراضياً بتوجيه طلبات "الخلفية الشفافة" إلى gpt-image-1.5. إذا كان العميل يرغب في الحفاظ على واقعية GPT-Image-2، يمكننا دمج "التوليد + إزالة الخلفية" في استدعاء تسلسلي واحد عبر واجهة موحدة، مما يسهل عملية التطوير على جانب العميل.

إذا كان مشروعك حساساً تجاه جودة الحواف والتكلفة في آن واحد، يمكنك استخدام جدول المقارنة التالي لأدوات إزالة الخلفية كنقطة انطلاق:

أداة إزالة الخلفية دقة الحواف متوسط وقت المعالجة نمط النشر التوليفة الموصى بها
851-labs/background-remover عالية 1.5-2 ثانية API سحابي مع صور GPT-Image-2 الواقعية
RemBG (U2Net) متوسطة 0.5 ثانية استضافة ذاتية مع خلفيات ملونة، مهام مجمعة
BiRefNet عالية جداً 2-3 ثوانٍ استضافة ذاتية للشعر والحواف المعقدة
عتبة لون HSV متوسطة <0.1 ثانية بضعة أسطر Python مع الشاشة الخضراء

gpt-image-2-transparent-background-not-supported-ar 图示

الأسئلة الشائعة حول الخلفية الشفافة في GPT-Image-2

س1: لماذا تفشل دائمًا محاولات كتابة "يجب أن تكون الخلفية شفافة" في موجه GPT-Image-2؟

لأن النموذج لم يتم تدريبه على هدف "إخراج قناة ألفا" (alpha channel)، فهو قادر فقط على الرسم في مساحة RGB. عندما تفرض عليه وصف "خلفية شفافة" (transparent background)، فإنه سيرسم حرفيًا رمزًا بصريًا "يمثل الشفافية" – وهو نمط المربعات (الشطرنج) الذي نراه في برامج التصميم. هذا فشل نموذجي في مواءمة الدلالات (semantic alignment)، ولا علاقة له بمدى تفصيل الموجه.

س2: لماذا لا تعمل قنوات GPT-Image-2-all / GPT-Image-2-vip الرسمية المعكوسة؟

هذه القنوات في جوهرها تستدعي نفس نموذج OpenAI الخلفي، والفرق الوحيد هو أن الواجهة الأمامية تستخدم مجمعات حسابات أو وكيل (proxy). القدرات غير المدعومة على مستوى النموذج لا يمكن تعويضها مهما تم تغليفها في الواجهة الأمامية. إذا رأيت منصات خارجية تدعي أن "GPT-Image-2 يدعم الخلفية الشفافة"، فغالبًا ما يقومون بإجراء معالجة لاحقة لإزالة الخلفية في طبقة بوابة API، وليس لأن GPT-Image-2 يخرج شفافية أصلية.

س3: إذا كان مشروعي يحتاج فعليًا إلى خلفية شفافة، أي API يجب أن أختار؟

بناءً على اختباراتنا العملية في APIYI (apiyi.com)، نوصي بالآتي: للملصقات / الرموز التعبيرية / صور المنتجات التجارية استخدم GPT-Image-1.5، ولإزالة خلفية الصور الواقعية استخدم GPT-Image-2 مع نموذج متخصص في إزالة الخلفية، أما بالنسبة للمتطلبات المحلية المتوافقة مع التنظيمات فيمكن التفكير في استضافة نماذج Stable Diffusion ذاتيًا. هذه المسارات الثلاثة يمكن التبديل بينها في نفس البوابة، مما يسهل إجراء اختبارات AB.

س4: متى سيدعم GPT-Image-2 / Nano Banana Pro الخلفية الشفافة مجددًا؟

لم تعلن OpenAI أو Google عن جدول زمني لذلك. بالنظر إلى وتيرة التحديثات السابقة، عادة ما تقوم OpenAI بإضافة المعلمات المفقودة في الإصدارات الفرعية (مثل GPT-Image-2.1 أو 2.5)؛ بينما تميل سلسلة Nano Banana من Google إلى حل المشكلات عبر "مزيج" من Gemini 3 Flash + تنفيذ الأكواد، بدلاً من تعديل النموذج الأساسي.

س5: كيف يمكن لـ APIYI (apiyi.com) مساعدتي في هذا الأمر؟

لقد قمنا بثلاثة أشياء: ① التعرف تلقائيًا على طلبات transparent في طبقة البوابة واقتراح خيار بديل؛ ② ربط مسارات نماذج متعددة مثل GPT-Image-1.5 وGPT-Image-2 وNano Banana Pro؛ ③ توفير نظام موحد للفواتير والحصص والسجلات، مما يسهل على الفرق مقارنة التكاليف الحقيقية للحلول المختلفة دون الحاجة لصيانة مجموعات SDK متعددة.

3 خلاصات حول مشكلة الخلفية الشفافة في GPT-Image-2

أولاً، عدم دعم GPT-Image-2 للخلفية الشفافة هو استراتيجية منتج محددة، وليست مشكلة في كتابة الموجه أو طريقة الربط. أي سير عمل يحاول تكرار استخدام مصطلح "transparent" في الموجه يجب نقله في أقرب وقت إلى إصدار 1.5 أو إلى خط معالجة لاحقة، وإلا ستظل عالقًا في حلقة مفرغة من أنماط المربعات.

ثانياً، Nano Banana 2 / Pro لا تدعم أيضًا الخلفية الشفافة، وحاليًا يعتمد "الإخراج الشفاف الأصلي" في هذا المجال فقط على الجيل السابق GPT-Image-1.5، أو sora_image / gpt-4o-image، أو استضافة Stable Diffusion ذاتيًا. تعليق الآمال على وجود "مفتاح مخفي" ليس واقعيًا.

ثالثاً، أفضل ممارسة عمليًا هي تجريد النموذج خلف بوابة واحدة، والسماح لـ "طلب الخلفية الشفافة" بالتوجيه تلقائيًا داخل البوابة إلى النموذج القادر على التسليم. لقد جعلنا استراتيجية التوجيه هذه سلوكًا افتراضيًا، مما يوفر على الفرق وقت الوقوع في الأخطاء المتكررة، ويترك لهم التركيز على منطق العمل الحقيقي.

إذا كنت تعيد هيكلة سير عمل توليد الصور الخاص بك، نرحب بك في APIYI (apiyi.com) لإجراء اختبار تراجع مباشر: قم بتشغيل الموجه الحالي على كل من GPT-Image-2 وGPT-Image-1.5 في نفس الوقت، وخلال 10 دقائق ستحصل على جدول مقارنة يوضح "أي نموذج يجب استخدامه لأي مشهد"، ومن ثم تقرر ما إذا كنت ستخفض الإصدار مباشرة أو ستضيف معالجة لاحقة لإزالة الخلفية.

📌 المؤلف: فريق APIYI التقني — نتابع باستمرار تغييرات قدرات النماذج الرئيسية مثل OpenAI وGoogle وAnthropic، ونوفر للمطورين تجربة بوابة API موحدة ومتعددة النماذج. لمعرفة المزيد، تفضل بزيارة APIYI (apiyi.com).

موضوعات ذات صلة