|

إصلاح مشكلة إرجاع الصورة الأصلية في Nano Banana Pro: تشخيص 5 أسباب رئيسية + 8 حلول عملية للإصلاح

عند استخدام Nano Banana Pro API في عمليات تصيير (Rendering) المنازل، أو إدراج صور المنتجات، أو إنشاء مشاهد التجارة الإلكترونية، قد تواجه موقفاً محيراً: تقوم برفع صورتين مرجعيتين وتكتب الموجه (prompt) بوضوح، لكن النتيجة التي تحصل عليها تبدو وكأنها "نسخة طبق الأصل" من إحدى الصورتين المرجعيتين، دون أي تعديل وفقاً لتعليماتك. هذه الظاهرة أصبحت أكثر شيوعاً بعد إطلاق Gemini 3.1 Flash Image في فبراير 2026، وقد أكدت المناقشات في منتدى مطوري Google AI أن نموذج Pro يعاني من "عدم استقرار عالٍ" في سيناريوهات الصور المرجعية المتعددة.

تتناول هذه المقالة المشكلة بدءاً من آلية استدعاء النموذج (API Call)، مع تحليل حالة واقعية لـ "تصيير مخطط هيكلي معماري + صورة نهائية"، لنوضح بشكل منهجي أسباب حدوث مشكلة إعادة النموذج للصورة الأصلية، ونقدم 8 حلول عملية قابلة للتطبيق. جميع أمثلة الاستدعاء في المقال تعتمد على منصة APIYI (apiyi.com)، التي قامت بتحسين استقرار سلسلة نماذج Gemini 3 Pro Image، مما يجعلها مناسبة لاختبار الموجهات (prompts) المقترحة في المقال مباشرة.

أولاً: الظاهرة النموذجية لمشكلة إعادة الصورة الأصلية في Nano Banana Pro

لنلقِ نظرة على حالة واقعية: كان أحد المستخدمين يعمل على تصيير تصميم منزل، وقام برفع صورتين مرجعيتين؛ الصورة الأولى هي مخطط هيكلي لمبنى غير مكتمل (هيكل خرساني، 4.9 ميجابايت)، والصورة الثانية هي صورة نهائية للمبنى بعد اكتماله (واجهات زجاجية، مساحات خضراء، إضاءة غروب، 13.8 ميجابايت). كان الموجه (prompt) مكتوباً بالصينية المبسطة: "استخدم الصورة 2 لتصيير الصورة 1. الألوان: استخدم درجات ألوان باردة وراقية… الأسلوب: تصيير واقعي تجاري نموذجي…"، وكان الهدف هو استعارة أسلوب ومواد الصورة 2 لتصيير الهيكل في الصورة 1. النتيجة كانت أن النموذج أعاد صورة مطابقة تقريباً للصورة 2، بينما لم تظهر تفاصيل هيكل الصورة 1 في المخرجات على الإطلاق.

هذه ليست حالة فردية. في منتدى مطوري Google AI، أفاد مطورون بأن "النموذج يقوم بخفض دقة الصور المرجعية بشكل مفرط لدرجة أنه يعجز عن تمييز التفاصيل"، وأشاروا إلى أن المشكلة تفاقمت بشكل ملحوظ بعد إصدار Gemini 3.1 Flash Image. كما وثقت منصات الطرف الثالث مثل Replicate وAtlas Cloud وAI Free API حالات مشابهة لـ "إخراج الصورة المرجعية مباشرة"، وإن كانت ظروف التحفيز تختلف قليلاً.

1.1 تكرار الحدوث ونطاق التأثير

يوضح الجدول التالي الاحتمالية النسبية لحدوث ظاهرة عدم تعديل الصورة في Nano Banana Pro عبر سيناريوهات استخدام مختلفة، بناءً على ملاحظات المجتمع وعينات مراقبة المنصة.

سيناريو الاستخدام احتمالية الحدوث مستوى التأثير
تعديل صورة مرجعية واحدة منخفضة انحراف في تفاصيل فردية فقط
دمج صورتين (نقل الأسلوب) متوسطة إلى عالية المخرجات تشبه إحدى الصور الأصلية
دمج صور متعددة (أكثر من 3) عالية النموذج يميل للصورة الأخيرة
الاستدعاء في أوقات الذروة زيادة ملحوظة انخفاض جودة التفاصيل ككل
مشاهد حساسة (وجوه/علامات تجارية) عرضية رفض التعديل أو التراجع المباشر

🎯 نصيحة تشخيصية: إذا كنت تعمل في مجالات التجارة الإلكترونية، أو تصميم المنازل، أو صور المنتجات التي تعتمد على صور مرجعية متعددة، وظهرت مشكلة "إعادة الصورة الأصلية" بنسبة تزيد عن 10%، فعادةً ما لا يكون السبب واحداً، بل مزيجاً من الموجه (prompt)، والمعاملات (parameters)، والبنية التحتية. يُنصح باستخدام الواجهة الموحدة لمنصة APIYI (apiyi.com) لمقارنة مخرجات Nano Banana Pro وNano Banana 2 تحت نفس الموجه، مما يساعدك على تحديد ما إذا كانت المشكلة في مستوى النموذج أو في صياغة الموجه بسرعة.

2. Nano Banana Pro 返回原图的 5 大技术原因

nano-banana-pro-returns-original-image-troubleshooting-ar 图示

2.1 السبب الأول: ارتباك الموجه (Prompt) في الإشارة للمراجع يجعل النموذج ينسخ "الصورة 2" افتراضياً

السبب الأكثر شيوعاً لعودة Nano Banana Pro إلى الصورة الأصلية هو أن عبارات مثل "بالإشارة إلى الصورة 2" في الموجه (Prompt) تُفهم من قبل النموذج على أنها "أنتج نسخة مطابقة للصورة 2". يوصي دليل الموجهات الرسمي من Google DeepMind بوضوح: عند إدخال صور متعددة، استخدم تسميات دلالية (مثل "الهيكل السلكي" أو "المبنى المُصيّر") بدلاً من استخدام معرفات مكانية بحتة مثل "الصورة 2".

في اللغة الإنجليزية، قد تُفهم عبارة "استخدم الصورة 2 لتصيير الصورة 1" على أنها "تصيير الصورة 1 بأسلوب الصورة 2"، ولكن عند فك التشفير، يعطي النموذج الأولوية للإشارات البصرية الأكثر اكتمالاً، وهي الصورة 2 التي تمثل بالفعل عملاً نهائياً. عندما يصف الجزء الأخير من الموجه ألوان ومواد الصورة 2 بالتفصيل، يسهل على النموذج اعتبار الصورة 2 هي "المخرج المستهدف" بدلاً من اعتبارها مجرد مرجع للأسلوب.

2.2 السبب الثاني: غياب أفعال التعديل يدفع النموذج لمسار "إعادة الإنتاج"

تعتمد الآلية الأساسية لـ Gemini 2.5 و Gemini 3 Pro Image على تحويل الصور بناءً على فهم اللغة الطبيعية. إذا لم تظهر أفعال تعديل واضحة في الموجه (مثل transform، render، apply، replace، composite)، فإن النموذج يميل عند إدخال صور متعددة إلى اتباع مسار "إعادة البناء" (reconstruction)، أي إعادة بناء صورة مشابهة بناءً على الصورة المرجعية ذات الإشارة الأقوى، بدلاً من إجراء "تعديل" حقيقي.

قوالب الموجهات الرسمية الموصى بها من DataCamp ومدونة مطوري Google هي: Take the [element from image 1] and place it with/on the [element from image 2]، أو Using the provided image of [subject], please [add/remove/modify] [element]. كلاهما يستخدم أفعالاً واضحة لتحديد "ما هو الكائن المراد تعديله" و"ما هو مرجع الأسلوب"، وهو الجزء الذي غالباً ما يفتقر إليه الموجه باللغة العربية.

2.3 السبب الثالث: تعارض نسب العرض إلى الارتفاع للصور المتعددة، والصورة الأخيرة تهيمن على المخرجات

هناك قاعدة رسمية غير واضحة في سلسلة Nano Banana: عند إدخال صور متعددة، يعتمد النموذج افتراضياً نسبة العرض إلى الارتفاع الخاصة بآخر صورة مرجعية. تم توضيح هذه القاعدة في دروس DataCamp ومدونة مطوري Google، لكن غالباً ما يتم تجاهلها في التطوير الفعلي.

بالعودة إلى حالة المستخدم، الصورة 2 (صورة المبنى النهائي) هي صورة أفقية بنسبة 16:9، بينما الصورة 1 (المخطط الهيكلي) تقترب من نسبة 4:3 وحجمها أصغر. عندما يستخدم النموذج نسبة عرض الصورة 2، فإنه هندسياً يميل أكثر إلى عرض تكوين الصورة 2 بدلاً من إعادة التوليد بناءً على الصورة 1. غالباً ما تتداخل هذه الخطوة مع السبب الأول، مما يؤدي إلى نتيجة "إخراج الصورة 2 مباشرة".

2.4 السبب الرابع: تدهور البنية التحتية والتراجع الصامت في أوقات الذروة

منذ فبراير 2026، جعلت Google نموذج Nano Banana 2 هو الخيار الافتراضي في تطبيق Gemini، بينما تم نقل نموذج Pro إلى قائمة "النقاط الثلاث ← إعادة التوليد". وفي الوقت نفسه، ظهرت ظاهرة التراجع الصامت في واجهة برمجة التطبيقات (API) خلال أوقات الذروة؛ حيث أشارت منشورات في منتدى مطوري Google AI بتاريخ 18 مايو (قبل يوم من مؤتمر Google I/O) مباشرة إلى أن "جودة توليد الصور تنخفض فوراً قبل الإصدارات الكبرى".

يظهر هذا بوضوح في: استمرار النموذج في إرجاع رمز الحالة 200، ولكن قد ينتقل داخلياً إلى نموذج فرعي أصغر أو يتخطى بعض عمليات المعالجة اللاحقة، مما يؤدي إلى تشوه التفاصيل وانخفاض دقة اتباع الموجه. في هذه الحالة، حتى لو كان الموجه مكتوباً بشكل قياسي، فإن احتمال فشل تحويل الصورة إلى صورة في Nano Banana Pro يرتفع بشكل ملحوظ، وغالباً ما يظهر الفشل في صورة "العودة إلى الصورة الأصلية".

2.5 السبب الخامس: الصور المرجعية الكبيرة جداً تؤدي إلى أخذ عينات فرعية (Downsampling) قسري

أشار نفس المنشور في منتدى مطوري Google AI إلى أن: "النموذج يقوم بأخذ عينات فرعية من الصورة المرجعية بشكل مفرط، لدرجة أنه لا يستطيع التعرف على التفاصيل أو إعادة إنتاجها". عندما يقترب حجم الصورة المرجعية أو يتجاوز 13 ميجابايت، قد يقوم النموذج بإجراء تصغير كبير في مرحلة المعالجة الأولية الداخلية، مما يؤدي إلى ضغط معلومات الهيكل الرئيسية (مثل أعمدة المبنى، ملصقات المنتجات، تعبيرات الوجه) حتى تصبح غير واضحة.

إذا أصبحت تفاصيل الصورة 1 غير قابلة للتمييز بعد أخذ العينات الفرعية، سيعتمد النموذج بشكل طبيعي على الصورة المرجعية الأخرى الأكثر "وضوحاً" عند التركيب، مما يؤدي في النهاية إلى مخرجات تشبه نسخة من الصورة 2. وهذا هو السبب في تباين معدلات الفشل بشكل كبير عند استخدام نفس الموجه مع صور مرجعية بدقة مختلفة؛ حيث يظن العديد من المطورين أنه خطأ في الموجه، بينما في الواقع تكون الصورة المرجعية نفسها "غير واضحة" بالنسبة للنموذج.

ثالثاً: 8 حلول عملية لإصلاح مشكلة "التحرير حسب الصورة" في Nano Banana Pro

nano-banana-pro-returns-original-image-troubleshooting-ar 图示

إن الفكرة الجوهرية لإصلاح مشكلة عودة Nano Banana Pro إلى الصورة الأصلية هي: لا تعتمد على تخمين النموذج لنواياك، بل حدد بوضوح "ما هي الصورة الأساسية، وما هي الصورة المرجعية، وما هو التحويل المطلوب"، مع استخدام معاملات الاستدعاء (Parameters) كضمان إضافي. فيما يلي 8 نقاط إصلاح يمكن تطبيقها مباشرة، مقسمة إلى مستوى الموجه (Prompt) ومستوى المعاملات.

3.1 نقاط الإصلاح الخمس على مستوى الموجه (Prompt)

الرقم نقطة الإصلاح الصيغة الخاطئة الصيغة الموصى بها
1 إضافة فعل تحرير "参照图2渲染图1" "Transform image 1 using image 2 as reference"
2 استخدام دلالات بدلاً من الأرقام "图1、图2" "the wireframe / the finished rendering"
3 تحديد الأدوار بوضوح (بدون توضيح) "use the first as structure base, the second as style reference"
4 وصف الهدف بشكل إيجابي "不要变成图2" "preserve the original building outline from the first image"
5 دمج متطلبات المواد المحددة "采用清冷色调" "apply the cool-toned glass facade and warm interior glow from image 2 onto the structure from image 1"

💡 قالب الموجه: بالنسبة لمهام الصورتين مثل "الهيكل + النمط" في تصيير المباني، نوصي باستخدام هيكل القالب التالي: [Action verb] + [structural reference from image A] + [style/material reference from image B] + [explicit constraints]. على منصة APIYI (apiyi.com)، يمكنك تضمين هذا القالب كموجه نظام (system prompt) شائع، وإجراء اختبارات A/B بين Nano Banana Pro و Nano Banana 2، مما يقلل من تكاليف التكرار بشكل كبير.

3.2 نقاط الإصلاح الثلاث على مستوى معاملات الاستدعاء

الرقم نقطة الإصلاح التوضيح
6 التحكم في ترتيب الرفع ضع "الكائن المراد تحريره" في النهاية، ليستخدم النموذج نسبة العرض إلى الارتفاع الخاصة به
7 تقييد حجم الصورة المرجعية ضغط الصورة الواحدة إلى 2-5 ميجابايت لتجنب التحجيم السفلي العدواني
8 تحديد image_size بشكل صريح مثل 1024×1024 أو 1536×1024، لتقليل تعارض نسب العرض إلى الارتفاع

وتجدر الإشارة إلى أن Gemini 3 Pro Image في بعض الإصدارات تعاني بالفعل من تجاهل معامل imageSize (حسب الحالة 110458 في منتدى مطوري Google AI)، لذا يجب استخدام نقطتي الإصلاح 6 و 8 معاً لضمان تطابق نسبة العرض إلى الارتفاع النهائية مع التوقعات. إذا قمت بضبط image_size فقط دون تعديل ترتيب الرفع، فقد يتم استبدال نسبة العرض إلى الارتفاع بالصورة الأخيرة في بعض الإصدارات.

رابعاً: مثال كامل لاستدعاء واجهة برمجة تطبيقات (API) تحويل صورة إلى صورة لـ Nano Banana Pro

4.1 مثال خاطئ: طريقة كتابة تؤدي غالباً إلى إرجاع الصورة الأصلية بواسطة Nano Banana Pro

تُعيد الشيفرة البرمجية التالية إنتاج حالة الفشل في سيناريو المستخدم: تداخل في الإشارة إلى الموجه (prompt)، نقص في أفعال التعديل، عدم التحكم في نسبة العرض إلى الارتفاع، وعدم ضغط الصورة المرجعية.

import openai

client = openai.OpenAI(
    api_key="your-apiyi-key",
    base_url="https://api.apiyi.com/v1"
)

response = client.images.edit(
    model="gemini-3-pro-image-preview",
    image=[
        open("wireframe.jpg", "rb"),    # 4.9 ميجابايت
        open("rendered.jpg", "rb"),     # 13.8 ميجابايت، تم تحميلها في النهاية
    ],
    prompt="参照图2渲染图1。色彩: 采用清冷的高级色调。",
    size="auto",
    n=1,
)

في هذا النوع من الكتابة، وفي سيناريوهات الصور المتعددة، من المرجح جداً أن يعتبر النموذج rendered.jpg هو الإشارة الرئيسية، مما ينتج نسخة مطابقة للصورة الثانية. هناك ثلاثة مخاطر جوهرية: فهم عبارة "参照图2" (الرجوع للصورة 2) كأنها مخرجات مستهدفة، نقص أفعال التحويل (transform)، وضبط الحجم على auto مما يجعل نسبة العرض إلى الارتفاع خاضعة للصورة الأكبر حجماً.

4.2 مثال مُصحح: جعل Nano Banana Pro يقوم بالتعديل بناءً على الصورة فعلياً

import openai

client = openai.OpenAI(
    api_key="your-apiyi-key",
    base_url="https://api.apiyi.com/v1"
)

# استخدام الإنجليزية في الموجه يضمن دقة أكبر في فهم الأوامر
prompt = (
    "Transform the unfinished concrete wireframe structure in the first image "
    "into a fully rendered architectural visualization. "
    "Use the second image STRICTLY as a STYLE and MATERIAL reference: "
    "apply its cool-toned glass facade, warm interior glow, surrounding greenery "
    "and dusk lighting onto the structure from the first image. "
    "Preserve the building outline, floor count and balcony arrangement "
    "exactly as shown in the first image. "
    "Do NOT replace the geometry with the second image."
)

response = client.images.edit(
    model="gemini-3-pro-image-preview",
    image=[
        open("rendered_compressed.jpg", "rb"),   # مرجع النمط، مضغوط إلى ~3 ميجابايت
        open("wireframe_compressed.jpg", "rb"),  # الكائن المراد تعديله يوضع في النهاية
    ],
    prompt=prompt,
    size="1536x1024",
    n=1,
)

هناك أربعة تغييرات رئيسية هنا: استخدام الإنجليزية لتوضيح تقسيم الأدوار بوضوح مثل "تحويل A باستخدام B كمرجع"؛ تعديل ترتيب التحميل لجعل الـ wireframe (الكائن المراد تعديله) هو "الصورة الأخيرة" للتحكم في نسبة العرض إلى الارتفاع؛ تحديد الحجم (size) صراحةً لتجنب وراثة دقة الصورة المرجعية العالية في وضع auto؛ وضغط كلتا الصورتين المرجعيتين إلى أقل من 5 ميجابايت لتجنب التخفيض القسري للدقة.

🚀 نصيحة للبدء السريع: يمكن للمطورين الذين يرغبون في التحقق من نتائج الإصلاح، تجربة استدعاء Nano Banana Pro و Nano Banana 2 بنفس الموجه (prompt) مباشرةً على منصة APIYI (apiyi.com). المنصة توفر واجهة متوافقة مع OpenAI، مما يغنيك عن كتابة شيفرات مخصصة لكل نموذج، ويمكنك الحصول على نتائج مقارنة A/B في 5 دقائق.

خامساً: الأسئلة الشائعة حول تحويل صورة إلى صورة في Nano Banana Pro

س1: لماذا يعيد الموجه (prompt) المعدل الصورة الأصلية عند كتابته بالصينية، بينما يعمل بشكل طبيعي عند كتابته بالإنجليزية؟

سلسلة نماذج Gemini أكثر استقراراً في التحليل الدلالي للغة الإنجليزية. الأفعال الصينية والمراجع الرقمية (مثل "参照图X") قد تُفهم أثناء المعالجة اللغوية على أنها "أوامر للمخرجات المستهدفة". يُنصح بكتابة أوامر التعديل الرئيسية (مثل transform / preserve / apply) بالإنجليزية، ودمج الوصف بالصينية والإنجليزية، مما يحافظ على دقة التعبير الصيني ويتجنب سوء فهم الأفعال.

س2: هل يكفي ضغط الصور المرجعية إلى أقل من 2 ميجابايت لحل المشكلة؟

ضغط الصور يحل فقط السبب الخامس (تشوه خفض الدقة)، لكنه لا يحل تعارض الموجه مع نسبة العرض إلى الارتفاع. يُنصح بالعمل على ثلاثة مستويات: الضغط + إعادة صياغة الموجه + التحكم في ترتيب التحميل. إذا كان حجم العمل كبيراً، يمكنك إجراء معالجة مسبقة موحدة قبل الاستدعاء، بتحويل الصور المرجعية إلى صيغة jpg وضغطها إلى 2-5 ميجابايت.

س3: أيهما أنسب لتحرير الصور المتعددة: Nano Banana Pro أم Nano Banana 2؟

النموذج استقرار الصور المتعددة الحفاظ على التفاصيل السيناريو المناسب
Nano Banana Pro (Gemini 3 Pro Image) متوسط (تقلبات حديثة) عالٍ تعديل صورة واحدة بجودة عالية، صور العلامات التجارية
Nano Banana 2 (Gemini 3.1 Flash Image) أعلى متوسط (مظهر بلاستيكي طفيف) معالجة دفعات الصور، صور التجارة الإلكترونية

عملياً، إذا كانت متطلبات التفاصيل عالية جداً (مثل التصميم المعماري، صور المنتجات عالية الدقة)، يمكنك استخدام Nano Banana 2 للحصول على مخرجات مستقرة، ثم استخدام Nano Banana Pro لإجراء اللمسات النهائية. هذا الأسلوب "المسودة + التنقيح" يوازن بين الاستقرار والجودة.

س4: عند ظهور "الصورة الأصلية مباشرة"، هل إعادة المحاولة عدة مرات تحل المشكلة؟

إذا كان الأمر مجرد انخفاض مؤقت في أداء البنية التحتية خلال ساعات الذروة، فإن إعادة المحاولة 1-3 مرات قد تكون فعالة. أما إذا كانت المشكلة في الموجه أو المعاملات، فلن تجدي إعادة المحاولة 100 مرة نفعاً. طريقة الحكم بسيطة: إذا تكرر الفشل بنفس المعاملات في أوقات مختلفة، فالمشكلة في الموجه؛ أما إذا نجحت العملية في أوقات خارج الذروة، فهي مجرد انخفاض مؤقت.

س5: هل خطة الإصلاح هذه عامة لنماذج أخرى (مثل Flux Kontext أو Seedream)؟

أجزاء تعديل الموجه (التسمية الدلالية، أفعال التعديل، تقسيم الأدوار، الوصف الإيجابي) تنطبق على جميع نماذج تحويل صورة إلى صورة الرئيسية. لكن قاعدة "الصورة الأخيرة تتحكم في نسبة العرض إلى الارتفاع" هي قاعدة خاصة بسلسلة Nano Banana. إذا كان عملك يعتمد على نماذج متعددة، فإن الواجهة الموحدة لمنصة APIYI (apiyi.com) تتيح لك صيانة قالب موجه واحد وتكييفه مع النماذج المختلفة عبر المعاملات.

ملخص

إن عودة Nano Banana Pro إلى الصورة الأصلية هي في جوهرها نتاج لـ "مدخلات متعددة الصور + موجه غامض + تقلبات في البنية التحتية" ضمن السلوك الافتراضي للنموذج، وليست مجرد خطأ تقني (Bug). ومن خلال فهم تفضيل النموذج لـ "الصورة الأخيرة"، واعتماده على أفعال التحرير، واستراتيجية تقليل دقة الصورة المرجعية، يمكنك معالجة 90% من حالات الفشل باستخدام 80% من تعديلات الموجه.

بالنسبة للفرق التي تعمل في مجالات مثل تصميم العمارة، وصور المنتجات، وتوليد صور التجارة الإلكترونية التي تعتمد على صور مرجعية، نوصي بتحويل حلول الإصلاح الثمانية المذكورة أعلاه إلى قوالب موجهات ومعايير استدعاء، وتثبيتها في بيئة الإنتاج وفقًا لنوع العمل. على المدى الطويل، سيؤدي ذلك إلى تقليل تكاليف إعادة التشغيل ومعدلات العمل اليدوي بشكل كبير، مما يسمح بالاستفادة الحقيقية من قدرات الإخراج عالية الجودة لنموذج Nano Banana Pro في أعمالكم.


تم إعداد هذا المقال بواسطة فريق APIYI، مع التركيز على التطبيقات العملية لواجهات برمجة تطبيقات نماذج اللغة الكبيرة. للاطلاع على أحدث أمثلة استدعاء Nano Banana Pro وبيانات الاستقرار، يمكنكم زيارة موقع APIYI الرسمي apiyi.com.

موضوعات ذات صلة