في عالم توليد الصور بالذكاء الاصطناعي، لا يزال العديد من المبدعين يعتمدون على "صيغة الموجهات" الموروثة من أيام Stable Diffusion 1.5. إليك مثال على موجه (Prompt) نموذجي مبالغ فيه:
إضافة سلسلة تعتيم بيضاء إلى خزانة زجاجية، مساحة داخلية واقعية للغاية، جماليات إضاءة وظلال بمستوى احترافي، ضوء طبيعي يتسلل بلطف عبر نوافذ ممتدة من الأرض للسقف، تباين ناعم بين الضوء والظلام، طبقات إضاءة وظلال دقيقة، تأثير ضوء تيندال، تصيير فيزيائي واقعي للضوء والظل، إضاءة عالمية، ظلال ناعمة، تفاصيل دقيقة، دقة 8K فائقة، جودة سينمائية، قوام ملموس واقعي، أجواء مكانية نظيفة وشفافة، تصوير داخلي احترافي، تصوير بكاميرا Canon 5D Mark IV، فتحة عدسة f/1.8، ملمس واقعي، بدون تصيير مفرط، بساطة راقية، مريح ودافئ، تفاصيل غنية. دقة 8K عالية، واقعية سينمائية، أسلوب تصوير واقعي، واقعية فائقة، ملمس شفاف، تفاصيل كاملة ——
يحتوي هذا الموجه على 23 صفة، 8 مصطلحات تقنية، وتكرار للجودة 3 مرات. في بيئة SD قبل عام 2024، ربما كان لهذا الأسلوب تأثير معين، ولكن في عصر Nano Banana 2 و gpt-image-2 عام 2026، أصبحت هذه "الموجهات المبالغ فيها" ليست مجرد حشو زائد، بل إنها قد تخفض جودة الصورة الناتجة.
في هذا المقال، سننطلق من الفروقات الجوهرية في بيانات التدريب لنشرح لماذا تغيرت الأمور، وسنقدم 7 مبادئ فورية لـ "تنحيف" الموجهات، مما يتيح لك الحصول على صور أفضل باستخدام أوصاف أقصر وأكثر دقة.

1. لماذا لم تعد الموجهات (Prompts) المبالغ فيها فعالة في عصر Nano Banana 2
لفهم هذا التغيير، يجب أن نعود إلى التطور التاريخي لكيفية كتابة الموجهات.
1.1 الجذور التاريخية للموجهات المبالغ فيها: عصر وسوم Danbooru
كلمات مثل "8K" و"masterpiece" و"best quality" و"ultra realistic" كانت تُعتبر ذات يوم "كلمات سحرية"، وهناك سبب تقني محدد لذلك: هذه الكلمات هي وسوم (Tags) حقيقية من موقع الصور Danbooru.
احتوت بيانات تدريب نماذج Stable Diffusion 1.5 ومشتقاتها (مثل NovelAI وWaifu Diffusion) على عدد هائل من الصور المأخوذة من Danbooru، وكانت هذه الصور تُصنف من قبل المستخدمين عند رفعها بوسوم مثل masterpiece وbest quality. الارتباط الذي تعلمه النموذج هو:
كلمة "masterpiece" ⟷ نمط الصور التي تم تصنيفها كـ masterpiece في مجموعة التدريب
لذلك، كان تكديس الموجهات مثل (masterpiece:1.2), (best quality:1.2), 8k, ultra detailed فعالاً بالفعل في SD 1.5، لأنه كان يستدعي توزيع الصور التي "صنفها الجمهور كأعمال فنية" في مجموعة التدريب.
1.2 تغير نموذج التدريب: من الوسوم إلى اللغة الطبيعية
في الجيل الحالي من نماذج الصور الحديثة مثل Nano Banana 2 (gemini-3.1-flash-image-preview) وNano Banana Pro (gemini-3-pro-image-preview) وgpt-image-2 وStable Diffusion 3.5، تغير نموذج التدريب بشكل جذري:
| وجه المقارنة | عصر SD 1.5 | عصر Nano Banana 2 / gpt-image-2 |
|---|---|---|
| تصنيف بيانات التدريب | قائمة وسوم بأسلوب Danbooru | وصف طبيعي للصور (caption) |
| مشفر النصوص | حد 77 token لـ CLIP | نموذج لغوي كبير متعدد الوسائط (سياق بآلاف الـ tokens) |
| طريقة الفهم | مطابقة الوسوم | فهم دلالي + استنتاج |
| أفضل موجه | تكديس كلمات مفتاحية مفصولة بفواصل | وصف مشهدي سردي |
| وزن الكلمات المبالغ فيها | فعال، يستدعي توزيع الأنماط | تخفيف دلالي، وقد يكون سلبياً |
| الطول الموصى به | 30-80 token | جمل طبيعية من 50-500 كلمة |
تذكر Google بوضوح في دليل الموجهات الخاص بـ Nano Banana: "Nano Banana 2 يفهم الجمل الوصفية، وليس تكديس الكلمات المفتاحية المفصولة بفواصل."
كما تشير OpenAI في دليل Cookbook الرسمي لـ gpt-image-2 بوضوح إلى أن: "المواصفات التقنية الدقيقة للكاميرا قد يتم تفسيرها بشكل فضفاض" — فالمواصفات التقنية الدقيقة مثل "Canon 5D Mark IV, f/1.8" لا يقوم النموذج بمحاكاتها فيزيائياً، بل يعاملها فقط كتلميح تقريبي لنمط التكوين.
1.3 التأثيرات السلبية الثلاث للموجهات المبالغ فيها على النماذج الحديثة
إن نقل عادات عصر SD 1.5 إلى Nano Banana 2 سيؤدي فعلياً إلى المشكلات التالية:
التأثير السلبي 1: التخفيف الدلالي. يحتاج النموذج إلى العثور على الموضوع والحركة الحقيقيين وسط 20 صفة، مما يؤدي إلى تشتيت الانتباه.
التأثير السلبي 2: التعليمات المتضاربة. توجد صراعات أسلوبية دقيقة بين "واقعية فائقة" + "جماليات احترافية" + "بساطة راقية" + "سينمائية" + "تصوير فوتوغرافي حقيقي"، ويضطر النموذج للمفاضلة بين توزيعات متعددة، وغالباً ما تكون النتيجة عدم إتقان أي منها.
التأثير السلبي 3: هدر الوزن. يشير دليل الموجهات الرسمي لـ OpenAI إلى أن gpt-image-2 يعطي وزناً أعلى لأول 50 كلمة. إذا كانت الكلمات الخمسون الأولى كلها عبارة عن كلمات فارغة مثل "واقعية فائقة، احترافية، 8K"، فسيتم دفع الوصف الفعلي للموضوع إلى الخلف حيث يكون الوزن أقل.

2. تفكيك نموذج للموجهات المبالغ فيها: ما هي الإشارات وما هي الضوضاء؟
لنأخذ الموجه المبالغ فيه المكون من 115 كلمة الذي بدأنا به، ونقوم بتصنيفه بنداً بنداً:
2.1 كلمات الإشارة: الأوصاف التي يستفيد منها النموذج فعلياً
| الكلمة الأصلية | التصنيف | سبب الاحتفاظ بها |
|---|---|---|
| زجاج خزانة مع سلسلة تعتيم بيضاء | موضوع محدد + حركة | عناصر بصرية واضحة |
| مساحة داخلية | مشهد | تحديد مكاني ضروري |
| ضوء طبيعي عبر نافذة ممتدة من الأرض للسقف | وصف مصدر الضوء | تصميم إضاءة محدد |
| فتحة عدسة f/1.8 | تلميح للتكوين | يفهمها النموذج كـ "عمق مجال ضحل" |
الإجمالي: حوالي 4-5 كلمات إشارة حقيقية.
2.2 كلمات الضوضاء: الأوصاف الفارغة دلالياً أو المتكررة
| الكلمة الأصلية | نوع الضوضاء | المشكلة |
|---|---|---|
| واقعية للغاية | صفة غامضة | "غاية" لا يمكن قياسها |
| جماليات إضاءة احترافية | شعار تسويقي | لا توجد سمات بصرية مقابلة |
| تباين ناعم بين الضوء والظل | تكرار مع "ضوء طبيعي" | معلومات زائدة |
| طبقات ضوء وظل دقيقة | كما سبق | تكرار |
| تأثير ضوء تيندال | مصطلح احترافي يُساء استخدامه | صالح فقط في بيئات الغبار |
| تصيير فيزيائي واقعي للضوء | مصطلح تصيير ثلاثي الأبعاد | لا معنى له في مشاهد التصوير |
| إضاءة عالمية | مصطلح تصيير ثلاثي الأبعاد | كما سبق |
| ظلال ناعمة | تكرار مع "تباين ناعم" | تكرار |
| ملمس عالي التفاصيل | كلمة جودة | لا يوجد توزيع محدد للنموذج |
| دقة 8K فائقة | كلمة دقة | لا علاقة لها بمعايير API |
| جودة سينمائية | شعار | لا يوجد معنى قابل للتنفيذ |
| أنسجة واقعية | كلمة جودة عامة | لم يتم تحديد المادة |
| أجواء مساحة نظيفة وشفافة | تراكم صفات | لا توجد تعليمات محددة |
| تصوير داخلي احترافي | وسم أسلوب زائد | تكرار |
| كاميرا Canon 5D Mark IV | علامة تجارية للكاميرا | النموذج لا يحاكي الفيزياء |
| ملمس واقعي | تكرار | تكرار عدة مرات |
| بدون تصيير مفرط | تعليمات سلبية | يسهل على النموذج تجاهلها |
| بساطة راقية | كلمة تسويقية | لا توجد تعليمات بصرية |
| مريح ودافئ | كلمة عاطفية | غامضة |
| تفاصيل غنية | كلمة جودة | تكرار مع "تفاصيل عالية" |
| دقة 8K عالية | تكرار مرة أخرى | فائض شديد |
| واقعية سينمائية | تكرار مرة أخرى | فائض شديد |
| أسلوب تصوير واقعي | تكرار مرة أخرى | فائض شديد |
| واقعية فائقة | تكرار مرة أخرى | فائض شديد |
| ملمس شفاف | تكرار مرة أخرى | فائض شديد |
| تفاصيل كاملة | تكرار مرة أخرى | فائض شديد |
الإجمالي: حوالي 26 كلمة ضوضاء، بنسبة تقترب من 85%.
2.3 إعادة الكتابة: الاحتفاظ بالإشارات وحذف الضوضاء
بعد إزالة كل الضوضاء، يمكن تقليص هذا الموجه إلى أقل من 20% من طوله الأصلي، مع جعل المعنى أكثر وضوحاً:
مساحة داخلية حديثة، خزانة زجاجية أمام نافذة ممتدة من الأرض للسقف،
سلسلة تعتيم بيضاء معلقة على الخزانة، ضوء طبيعي يتسلل من النافذة،
يلقي بقعاً ضوئية ناعمة على الأرضية الخشبية. تصوير بعدسة 85 مم،
عمق مجال ضحل، انعكاسات الزجاج في المقدمة واضحة، والخلفية ضبابية قليلاً.
هذا الموجه المكون من 61 كلمة سيعطي نتائج على Nano Banana 2 أفضل بكثير من النسخة المبالغ فيها المكونة من 115 كلمة. السبب بسيط: كل كلمة لها تعليمات بصرية واضحة.
🎯 نصيحة للاختبار: نقترح عليك استخدام نفس مفتاح API على منصة APIYI (apiyi.com) لمقارنة الموجه المبالغ فيه بالموجه المختصر، عبر تشغيل 5 نتائج لكل منهما باستخدام
gemini-3-pro-image-previewلتلمس الفرق بنفسك. تدعم المنصة واجهات برمجية موحدة لنماذج رائدة مثل Nano Banana 2 و gpt-image-2، مما يسهل المقارنة الأفقية السريعة.
3. مبادئ تقليص الموجهات السبعة في عصر Nano Banana 2 و gpt-image-2
فيما يلي المبادئ السبعة التي تم التحقق منها عبر وثائق Google و OpenAI الرسمية والتجارب العملية، مرتبة حسب الأهمية.

3.1 المبدأ الأول: حذف جميع صفات الجودة
قائمة الكلمات التي يمكن حذفها بأمان:
8K/4K/عالي الدقةتحفة فنية/أفضل جودة/مستوى احترافيواقعية فائقة/واقعية مفرطةسينمائي(إلا إذا كنت تقصد أبعاد الفيلم حقاً)تفاصيل كاملة/عالي التفاصيلراقي/احترافي(بدون سياق محدد)
كانت هذه الكلمات بمثابة وسوم لجذب توزيعات بيانات التدريب في عصر SD 1.5، أما في Nano Banana 2 فهي مجرد ضوضاء دلالية. إذا كنت بحاجة فعلاً للتحكم في الدقة، فافعل ذلك عبر معاملات طلب API وليس عبر الموجه.
3.2 المبدأ الثاني: Nano Banana 2 يحتاج إلى حركات محددة لا مشاعر غامضة
❌ تكديس الكلمات العاطفية:
دافئ ومريح، هادئ وساكن، مليء بالحيوية، حالم وجميل، لحظات زمنية جميلة
✅ مشهد محدد:
نصف كوب من القهوة الساخنة على طاولة خشبية قديمة، بجانبه كتاب مفتوح،
الشمس تتسلل من النافذة لتلقي بقعاً ضوئية ناعمة على الصفحات.
يستنتج النموذج المشاعر طبيعياً من المشهد المحدد، ولا داعي لإخباره مباشرة بأن المشهد "دافئ".
3.3 المبدأ الثالث: حذف جميع مصطلحات التصيير ثلاثي الأبعاد (إلا إذا كنت تقوم بالتصيير فعلاً)
في مشاهد التصوير/الواقعية، تعد الكلمات التالية تلوثاً عبر النماذج—فهي تنتمي لمجال التصيير ثلاثي الأبعاد ولا تنتمي للغة التصوير الفوتوغرافي:
إضاءة عالمية/GIتتبع الأشعة/ray tracingتصيير فيزيائي واقعي للضوءSSS/تشتت تحت السطحمواد PBR
وضع هذه الكلمات في موجه بأسلوب تصوير فوتوغرافي يشبه إجبار النموذج على التذبذب بين توزيعين مختلفين، والنتيجة غالباً ما تكون صورة لا تشبه الصور الفوتوغرافية ولا تشبه التصيير.
3.4 المبدأ الرابع: معاملات الكاميرا للتكوين، لا للمحاكاة الفيزيائية
توصية OpenAI الرسمية: "قد يتم تفسير مواصفات الكاميرا التفصيلية بشكل فضفاض، لذا استخدمها بشكل أساسي للمظهر العام والتكوين بدلاً من المحاكاة الفيزيائية الدقيقة."
بمعنى آخر: إذا كتبت Canon 5D Mark IV, f/1.8 لن يقوم النموذج بمحاكاة خصائص مستشعر هذه الكاميرا أو معادلة عمق المجال لفتحة f/1.8. سيتعرف فقط على إشارتين: "صورة احترافية" + "عمق مجال ضحل".
بما أن الأمر كذلك، فإن كتابة نية التكوين مباشرة أكثر كفاءة:
❌ تكديس موديلات الكاميرا:
تصوير بكاميرا Canon 5D Mark IV، فتحة عدسة f/1.8، عدسة 50 مم، ISO 100، صيغة RAW
✅ التعبير عن نية التكوين:
عمق مجال ضحل، موضوع واضح وخلفية ضبابية، منظور بورتريه
تم تقليص عدد الكلمات من 32 إلى 18، وفهم النموذج للمقصود أصبح أدق.
3.5 المبدأ الخامس: ضع المعلومات الجوهرية في أول 50 كلمة لـ gpt-image-2
تشير OpenAI رسمياً إلى أن gpt-image-2 يعطي وزناً أكبر لـ أول 50 كلمة. هذا يعني أن بداية الموجه يجب أن تحتوي على "أهم المعلومات" — الموضوع، الحركة، المشهد — وليس "أكثر الزخارف بريقاً" — كلمات الجودة، الأسلوب، العلامة التجارية.
❌ عدم تطابق الأوزان (تقديم الكلمات البراقة):
دقة 8K فائقة، جودة سينمائية احترافية، تصوير احترافي بكاميرا Canon 5D Mark IV،
امرأة ترتدي فستاناً أبيض تقف على شاطئ البحر...
أول 50 كلمة كلها كلمات فارغة، والموضوع الحقيقي "امرأة، فستان أبيض، شاطئ البحر" تم دفعه لما بعد الكلمة الخمسين.
✅ تحسين الأوزان (تقديم الموضوع):
امرأة ترتدي فستاناً أبيض تقف على صخور شاطئ البحر، تنظر إلى الأفق،
الرياح تداعب شعرها الطويل، شمس الغروب الذهبية تضيء من الخلف، عمق مجال ضحل.
احتوت أول 50 كلمة على الموضوع، الحركة، المشهد، الإضاءة، والتكوين، وكل الإشارات المهمة أصبحت في منطقة الوزن العالي.
3.6 المبدأ السادس: Nano Banana 2 لا يحتاج لتكرار المترادفات
من السمات النموذجية للموجهات المبالغ فيها الخوف من عدم فهم النموذج، لذا يتم كتابة نفس المعنى 3 مرات:
واقعية فائقة، واقعية مفرطة، أسلوب تصوير واقعي، نابض بالحياة، ملمس واقعي
قدرة الفهم الدلالي لـ Nano Banana 2 تتجاوز بكثير SD 1.5، فهو يستخلص النية من وصف واحد. تكرار المترادفات يؤدي فقط إلى:
- تشتيت الانتباه
- استهلاك ميزانية الرموز (tokens)
- جعل الموجه يبدو غير احترافي
القاعدة: عبر عن المفهوم مرة واحدة فقط، باستخدام الكلمة الأكثر دقة.
3.7 المبدأ السابع: إعادة صياغة التعليمات السلبية إلى إيجابية
غالباً ما تحتوي الموجهات المبالغ فيها على تعليمات سلبية مثل "بدون تصيير مفرط، بدون طابع الذكاء الاصطناعي، بدون تشويه". تحذر توجيهات Google Gemini 3 الرسمية من ذلك:
"التعليمات السلبية الواسعة جداً قد تجعل النموذج يركز بشكل مفرط على تلك التعليمات ويفشل في تنفيذ المنطق الأساسي… استبدل السلبيات العامة بتوجيهات إيجابية صريحة."
ببساطة: بدلاً من إخبار النموذج "بما لا تريده"، أخبره "بما تريده".
| ❌ تعليمات سلبية | ✅ إعادة صياغة إيجابية |
|---|---|
| بدون تصيير مفرط | أسلوب واقعي طبيعي |
| بدون طابع الذكاء الاصطناعي | ملمس تصوير واقعي، مع الحفاظ على العيوب الطبيعية |
| بدون تشويه | نسب دقيقة، هيكل أصابع طبيعي |
| لا يوجد نص | صورة بصرية بحتة، بدون عناصر نصية |
| لا أريد كرتون | أسلوب تصوير واقعي |

4. Nano Banana 2 مقابل gpt-image-2: تجربة عملية في تقليص الموجهات (Prompt Slimming)
4.1 السيناريو الأول: تصوير المساحات الداخلية
النسخة المبالغ فيها (115 كلمة):
مساحة داخلية واقعية للغاية، جماليات إضاءة بمستوى احترافي، ضوء طبيعي يتسلل بنعومة عبر نوافذ ممتدة من الأرض للسقف، تباين ناعم بين الضوء والظل، طبقات إضاءة دقيقة، تأثير إضاءة تيندال، تجسيد فيزيائي واقعي للضوء، إضاءة عالمية، ظلال ناعمة، تفاصيل عالية الدقة، 8K فائق الوضوح، جودة سينمائية، أنسجة واقعية، أجواء مساحة نظيفة وشفافة، تصوير داخلي احترافي، تصوير بكاميرا Canon 5D Mark IV، فتحة عدسة f/1.8، ملمس واقعي، بدون معالجة مفرطة، بساطة راقية، مريح ودافئ، تفاصيل غنية.
النسخة المختصرة (58 كلمة):
غرفة معيشة بأسلوب بسيط (Minimalist)، نوافذ كبيرة ممتدة من الأرض للسقف، ضوء طبيعي مائل يتسلل للداخل، أريكة من الكتان الرمادي الفاتح، أرضية خشبية طبيعية، نبتة خضراء في زاوية الغرفة. عمق مجال ضحل، التركيز على الموضوع، خلفية ضبابية ناعمة.
أظهرت النتائج الفعلية للموجه المختصر على gemini-3-pro-image-preview تفوقاً في كافة المؤشرات:
| البعد | النسخة المبالغ فيها | النسخة المختصرة |
|---|---|---|
| عدد الـ Token | ~180 | ~65 |
| وضوح الموضوع | متوسط | عالٍ |
| طبيعية الإضاءة | متوسط (تبدو معالجة) | عالٍ |
| اتساق الأسلوب | منخفض (تضارب الأساليب) | عالٍ |
| استقرار المخرجات | منخفض | عالٍ |
4.2 السيناريو الثاني: تصوير البورتريه
النسخة المبالغ فيها:
واقعية فائقة، 8K عالي الدقة، تصوير بورتريه بمستوى احترافي، جودة سينمائية، تصوير بكاميرا Canon EOS R5، عدسة ثابتة 85mm f/1.2، إضاءة صندوق ناعم (Softbox)، إضاءة عالمية، ظلال ناعمة، ملمس بشرة واقعي، تفاصيل غنية، معالجة احترافية، مستوى غلاف مجلة، واقعية قصوى، تصوير حقيقي، شابة...
(تم دفع الموضوع الأساسي إلى ما بعد الكلمة الخمسين)
النسخة المختصرة:
شابة تبلغ من العمر 25 عاماً، شعر أسود مستقيم يصل للكتفين، عيون بنية داكنة، ترتدي سترة محبوكة باللون الأبيض الكريمي، تجلس جانبياً بجوار طاولة خشبية في مقهى، تمسك بيدها كوب لاتيه ساخن، تبتسم وتنظر خارج النافذة. ضوء النافذة يسقط بنعومة على وجهها من اليسار، عمق مجال ضحل، خلفية ضبابية لأضواء المقهى الدافئة.
في هذه النسخة، تتركز كافة الإشارات (الموضوع، الحركة، الإضاءة، التكوين) ضمن أول 50 كلمة.
4.3 السيناريو الثالث: صور المنتجات التجارية
النسخة المبالغ فيها:
تصوير منتج فائق الدقة 8K، جماليات تصميم صناعي احترافي، إضاءة مثالية، جودة سينمائية، واقعية قصوى، ملمس راقٍ، تصوير تجاري احترافي، تصوير بكاميرا Hasselblad متوسطة التنسيق، زجاجة عطر...
النسخة المختصرة:
زجاجة عطر زجاجية شفافة، جسم مربع، فوهة ذهبية، ملصق أسود يحمل اسم العلامة التجارية "AURA" بحروف ذهبية. خلفية بيضاء نقية غير ملحومة، إضاءة ناعمة من الأعلى، انعكاسات واضحة على الجوانب. تكوين مركزي للمنتج، يشغل 60% من مساحة الصورة.
لاحظ أن النسخة المختصرة استخدمت علامات الاقتباس حول "AURA"؛ وهي طريقة تفعيل خاصة بـ Nano Banana 2 لضمان دقة عالية في عرض النصوص، وهي أكثر فعالية بكثير من كتابة "مع شعار العلامة التجارية".
💡 نصيحة هندسية: في بيئات الإنتاج، يُنصح بنشر طبقة "وسيط تقليص الموجهات" عبر APIYI، باستخدام Gemini 3 Pro أو Claude 4 للتعرف تلقائياً على الكلمات المبالغ فيها وضغطها قبل إرسالها إلى نموذج الصور. هذا يحافظ على توافق واجهة الأعمال ويوحد جودة المخرجات لجميع الاستدعاءات.
5. الحدود التقنية لتقليص الموجهات في Nano Banana 2 و gpt-image-2
على الرغم من فعالية مبدأ التقليص، إلا أن له حدوداً. إليك الحالات الاستثنائية التي يجب مراعاتها.
5.1 متى يمكنك الاحتفاظ بـ "كلمات الأسلوب"؟
ليست كل الصفات ضوضاء. احتفظ بكلمات الأسلوب التي لها توزيع بصري محدد:
| ✅ كلمات أسلوب يُنصح بالاحتفاظ بها | السبب |
|---|---|
| أسلوب آرت ديكو (Art Deco) | له مفردات بصرية واضحة |
| أسلوب أنمي جيبلي | النموذج تعلم هذا التوزيع |
| ملمس فيلم الثمانينيات | يمكنه تفعيل أسلوب لوني محدد |
| جماليات Vaporwave | له تعريف بصري محدد |
| أسلوب التباين (Chiaroscuro) | تقنية فنية واضحة |
الفرق هو: هذه الكلمات تقابل مدارس فنية أو تقنيات محددة بصرياً، وليست مجرد تقييمات فارغة مثل "مستوى احترافي".
5.2 متى يجب أن تكون الموجهات مفصلة؟
تتطلب السيناريوهات التالية موجهات أطول، ولكن تذكر أن الطول لا يعني المبالغة:
- توليد الرسوم البيانية: يتطلب وصف موقع كل وحدة، محتوى النص، والألوان.
- اتساق الشخصيات المتعددة: يتطلب وصف تفاصيل مظهر كل شخصية.
- التكوين المعقد: تحديد ما يوجد في المقدمة/المنتصف/الخلفية.
- مواد العلامة التجارية: تتطلب دقة في موقع الشعار، محتوى النص، وتنسيق الألوان.
حتى في هذه الحالات، تظل التعليمات المحددة أفضل من تراكم الصفات.
5.3 مثال على استدعاء API: استخدام موجه مختصر مع Nano Banana 2
إليك نموذج كود مصغر لاستدعاء Nano Banana 2 عبر APIYI:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1"
)
prompt = """شابة تبلغ من العمر 25 عاماً، شعر أسود مستقيم يصل للكتفين، عيون بنية داكنة،
ترتدي سترة محبوكة باللون الأبيض الكريمي، تجلس جانبياً بجوار طاولة خشبية في مقهى،
تمسك بيدها كوب لاتيه ساخن، تبتسم وتنظر خارج النافذة.
ضوء النافذة يسقط بنعومة على وجهها من اليسار، عمق مجال ضحل،
خلفية ضبابية لأضواء المقهى الدافئة."""
response = client.chat.completions.create(
model="gemini-3-pro-image-preview",
messages=[{"role": "user", "content": prompt}]
)
استخدم base_url الموحد https://api.apiyi.com/v1 مع الاحتفاظ بمعرف النموذج كما هو في الواجهة الرسمية. الاتصال المباشر يضمن لك الحصول على الأداء الحقيقي للواجهة الرسمية؛ فالموجه المختصر فعال على API الرسمية كما هو فعال تماماً على APIYI.
5.4 مقارنة حساسية النماذج المختلفة للكلمات المبالغ فيها
| النموذج | نموذج التدريب | الحساسية للكلمات المبالغ فيها | الأسلوب الموصى به للموجه |
|---|---|---|---|
| Stable Diffusion 1.5 | وسوم Danbooru | منخفضة (مفيدة أحياناً) | تكديس الوسوم |
| Stable Diffusion XL | مختلط | متوسط | أسلوب مختلط |
| Stable Diffusion 3.5 | شرح باللغة الطبيعية | عالية | لغة طبيعية |
| DALL-E 3 | شرح GPT | عالية | وصف سردي |
| gpt-image-2 | نموذج لغة كبير متعدد الوسائط | عالية | سرد + تعليمات محددة |
| Nano Banana 2 | Gemini 3.1 Flash | عالية | سرد + عناصر المشهد الخمسة |
| Nano Banana Pro | Gemini 3 Pro | الأعلى | سرد موجز ودقيق |
الخلاصة: كلما كان النموذج أكثر حداثة، قل اعتماده على المبالغات اللفظية.
سادساً: الأسئلة الشائعة حول الموجهات (Prompts) في Nano Banana 2 و gpt-image-2
س1: الموجهات التي كنت أستخدمها في SD 1.5 لا تعطي نتائج جيدة مع Nano Banana 2، كيف يمكنني نقلها بسرعة؟
الطريقة الأبسط هي: تحويل جميع الوسوم المفصولة بفواصل إلى فقرة بلغة طبيعية، وحذف جميع كلمات الجودة (مثل 8K، masterpiece، best quality)، وتبسيط إعدادات الكاميرا إلى نوايا تكوين (مثلاً تحويل f/1.8 إلى "عمق مجال ضحل"). يمكنك من خلال APIYI (apiyi.com) استخدام نفس الكود لاستدعاء كل من SD و Nano Banana 2 للمقارنة والتحقق من عملية النقل.
س2: هل الاحتفاظ بكلمة "8K" لا فائدة منه حقاً؟
في Nano Banana 2، يتم تحديد الدقة عبر معاملات API (512/1K/2K/4K)، لذا فإن كلمة "8K" في الموجه لا ترفع الدقة الفعلية ولا يوجد لها توزيع تدريبي مقابل. يُنصح بحذفها تماماً وتحديد 2K أو 4K صراحةً في معاملات API.
س3: هل يجب كتابة العلامات التجارية للكاميرات مثل Canon 5D أو Hasselblad؟
يمكنك كتابتها أحياناً، ولكن بحدود. كتابة "Hasselblad" تجعل النموذج يميل إلى أسلوب تجاري/أزياء أكثر، وكتابة "GoPro" تجعله يميل إلى زاوية واسعة ديناميكية؛ هذا يعتبر إيحاءً بالأسلوب وليس محاكاة فيزيائية. اختر إيحاء كاميرا واحداً فقط لكل صورة، ولا تبالغ في التكديس.
س4: عند استخدام gpt-image-2 لتوليد صور منتجات، تكون النتائج ضعيفة عند كتابة "فاخر، راقٍ، حرفية فائقة"، ماذا أفعل؟
استبدل الصفات المجردة بتعليمات بصرية محددة. "فاخر" ← "خلفية بنسيج رخامي داكن، انعكاسات معدنية ذهبية"؛ "راقٍ" ← "تكوين بسيط، خلفية نقية، إضاءة علوية ناعمة"؛ "حرفية فائقة" ← "سطح خالٍ من العيوب، خطوط حواف واضحة، فواصل متساوية". من خلال ربط gpt-image-2 عبر APIYI (apiyi.com)، يمكنك اختبار الفروق في النتائج بسرعة لكل تعليمات محددة.
س5: تقليل حجم الموجه يوفر الرموز (Tokens)، لكن هل يؤثر ذلك على الاستقرار؟
على العكس تماماً، الاستقرار يتحسن. لأن كل كلمة في الموجه القصير تحمل تعليمات دلالية واضحة، مما يركز انتباه النموذج. أما الموجهات المبالغ فيها، وبسبب تكرار المترادفات وتضارب الأساليب، فإنها تضطر للموازنة في اتجاهات مختلفة في كل مرة توليد، مما يجعلها غير مستقرة.
س6: هل توجد أداة لتحويل الموجهات المبالغ فيها تلقائياً إلى نسخ مختصرة؟
يمكنك استخدام Gemini 3 Pro أو Claude 4 Sonnet لإنشاء "وكيل تنقيح الموجهات" (Prompt Refiner Agent)، مع ضبط موجه النظام على: "تعرّف على كلمات الجودة الفارغة دلالياً، والمترادفات المكررة، ومصطلحات العرض المتقاطعة واحذفها، مع الاحتفاظ بوصف دقيق للموضوع، والحركة، والمشهد، والإضاءة". يمكنك استدعاء هذه النماذج اللغوية عبر APIYI (apiyi.com) لإجراء معالجة أولية للموجهات بضغطة زر.
سابعاً: الخلاصة: توافق جديد حول الموجهات في عصر Nano Banana 2
بالعودة إلى الموجه المبالغ فيه المكون من 115 كلمة في بداية المقال، أصبحنا الآن نعلم أن مشكلته ليست في "التفصيل الزائد"، بل في استخدام الكلمات في غير محلها:
- المبالغة ≠ التفصيل: التفصيل الحقيقي يعني عناصر بصرية محددة، وليس تكديس صفات الجودة.
- Nano Banana 2 لا يكترث لـ 8K: الدقة تحددها معاملات API، وتكديس "8K، 4K، فائق الدقة" في الموجه لا معنى له.
- إعدادات الكاميرا إيحاء وليست محاكاة: كتابة "f/1.8" لن تحاكي خصائص f/1.8 البصرية فعلياً، كتابة "عمق مجال ضحل" أكثر كفاءة.
- تكرار المترادفات ضجيج: قل المفهوم مرة واحدة بالكلمة الأكثر دقة.
- حول التعليمات السلبية إلى إيجابية: استبدل "لا تفعل X" بـ "افعل Y".
- ضع الكلمات الخمسين الأولى للمهم: gpt-image-2 يعطي وزناً أكبر لبداية الموجه.
- احذف مصطلحات العرض ثلاثي الأبعاد: مشاهد التصوير الفوتوغرافي لا تحتاج إلى إضاءة شاملة أو تتبع أشعة.
دخل الرسم بالذكاء الاصطناعي في عام 2026 عصر "اللغة الطبيعية = الموجه". النماذج الحديثة مثل Nano Banana 2 و gpt-image-2 و Nano Banana Pro تكافئ وصف المشهد الواضح، وليس قائمة الصفات البراقة.
ننصحك بدءاً من اليوم، بإجراء "فحص تنحيف" لكل موجه تكتبه: احذف كل كلمة لا يؤثر حذفها على الفهم البصري. ما يتبقى هو الإشارة الحقيقية التي توجه النموذج. ومع قدرات الربط الموحدة التي يوفرها APIYI (apiyi.com) لنماذج مثل Nano Banana 2 و gpt-image-2، يمكنك إجراء اختبارات A/B بتكلفة منخفضة لمختلف الموجهات المختصرة، وبناء مكتبة أصول الموجهات الخاصة بك بسرعة.
عن المؤلف: فريق APIYI التقني، متخصص في تزويد المطورين بخدمات ربط API مستقرة وشفافة وشاملة لنماذج الذكاء الاصطناعي الكبيرة. قم بزيارة موقع APIYI (apiyi.com) للاطلاع على أحدث حلول الربط وأفضل ممارسات الموجهات لنماذج مثل Nano Banana 2 و gpt-image-2 و Gemini 3 Pro.
