طرح أحد المطورين في مجتمعنا مؤخراً سؤالاً محدداً: "هل يمكن لواجهة برمجة التطبيقات (API) الخاصة بـ gpt-image-2 توليد صور بنسب عرض إلى ارتفاع فائقة مثل 1:8 أو 8:1؟ أرغب في إنشاء لافتات (Banner) ممتدة، أو لوحات بانورامية، أو رسوم بيانية طولية". الإجابة المباشرة هي: لا يدعم gpt-image-2 أصلياً نسب 1:8 أو 8:1، حيث يصل الحد الأقصى للنسبة إلى 3:1 (أو 1:3). كما أن نموذج Nano Banana Pro (المعروف بـ Gemini 3 Pro Image)، الذي غالباً ما يُقارن به في السوق، لا يدعم ذلك أيضاً، حيث يقتصر عرضه على نسبة 21:9.

هذا لا يعني أنه لا توجد حلول. بالنسبة للاحتياجات الفعلية لنسب عرض إلى ارتفاع متطرفة (مثل اللافتات الإعلانية، شاشات العرض السينمائي العريضة، الرسوم البيانية الطويلة، أو صور الشخصيات الكاملة)، فإن النهج السائد هو "توليد نسبة تقريبية + معالجة لاحقة بالدمج". في هذه المقالة، قمنا بمراجعة الوثائق الرسمية لكلا النموذجين لتوضيح دعم الأبعاد، وقواعد البكسل، والحلول البديلة لمساعدتك على تجنب الأخطاء الشائعة.
5 اختلافات جوهرية في قدرات الأبعاد بين gpt-image-2 و Nano Banana Pro
لنضع النتائج بين يديك. الجدول التالي مستمد من مراجعة دقيقة للوثائق الرسمية لكل من OpenAI و Google DeepMind، وننصح بالرجوع إليه عند اختيار النموذج المناسب.
| البعد | gpt-image-2 | Nano Banana Pro |
|---|---|---|
| طريقة دعم النسبة | أي نسبة (مقيدة بالبكسل) | 10 قيم ثابتة |
| أقصى عرض | 3:1 (3840×1280) | 21:9 (حوالي 2.33:1) |
| أقصى طول | 1:3 (1280×3840) | 9:16 (0.5625:1) |
| دقة البكسل | مضاعفات 16 بكسل لكل جانب | تُحسب تلقائياً حسب الدقة |
| أقصى جانب واحد | 3840 بكسل | 4096 بكسل (عند دقة 4K) |
| هل يدعم 1:8 / 8:1 | ❌ لا يدعم | ❌ لا يدعم |
| حلول المعالجة اللاحقة | دمج / توسيع / قص | دمج / توسيع / قص |
هناك نقطتان أساسيتان لفهم هذا الجدول: أولاً، لا تدعم واجهات البرمجة الأصلية لكلا النموذجين نسبة 1:8 / 8:1، فلا يمكنك الحصول على صورة بانورامية فائقة الطول من خلال استدعاء واحد للـ API. ثانياً، يتمتع gpt-image-2 بقدرة أكبر على الوصول إلى "الأطراف"؛ حيث أن نسبة 3:1 أعرض من 21:9، ونسبة 1:3 أضيق من 9:16. إذا كانت احتياجاتك ضمن حدود 21:9، فكلا النموذجين مناسبان، أما إذا تجاوزت ذلك، فإن gpt-image-2 هو خيارك الوحيد.
🎯 نصيحة للاختيار: إذا كنت بحاجة فعلية إلى نسبة 1:8، فلا يمكن لأي منهما القيام بذلك مباشرة. الطريقة الأكثر عملية هي استخدام gpt-image-2 لتوليد أبعاد قصوى بنسبة 3:1 / 1:3، ثم إجراء معالجة لاحقة للتوسيع أو الدمج. يمكنك استخدام خدمة وكيل API عبر APIYI (apiyi.com) لاستدعاء gpt-image-2 و Nano Banana Pro باستخدام نفس مفتاح API، مما يتيح لك مقارنة أي منهما يناسب سيناريوهاتك المحددة بشكل أسرع.
شرح مفصل لآلية دعم الأبعاد في gpt-image-2
جعلت OpenAI "الأبعاد" في نموذج gpt-image-2 معاملًا مستمرًا قابلًا للتخصيص، بدلاً من الاعتماد على قيم ثابتة محددة مسبقًا. يمنح هذا المطورين مرونة كبيرة، ولكنه يفرض أيضًا مجموعة من القيود الصارمة التي يجب الالتزام بها.
قواعد الأبعاد الرسمية لـ gpt-image-2
تضع وثائق OpenAI ثلاثة مستويات من القيود الصارمة على معامل size في gpt-image-2:
| بُعد القيد | القاعدة |
|---|---|
| بكسل الضلع الواحد | يجب أن يكون من مضاعفات 16 |
| الحد الأقصى للضلع | 3840 بكسل (حوالي 4K) |
| إجمالي نطاق البكسل | 655,360 ~ 8,294,400 بكسل مربع |
| نسبة الضلع الطويل/القصير | ≤ 3:1 (أو ≥ 1:3) |
| النطاق التجريبي | تنخفض الاستقرارية بعد تجاوز 2560×1440 |
يجب استيفاء الشروط الأربعة معًا ليتم قبول الطلب. بعبارة أخرى، يمكنك ضبط size = "3840x1280" (نسبة 3:1، 4.91 مليون بكسل، تستوفي جميع القيود)، ولكن size = "4096x512" سيتم رفضه (لأنه يتجاوز طول الضلع 3840، ونسبة 8:1 تتجاوز الحد الأقصى المسموح به).
الأبعاد القياسية الثلاثة والأبعاد المخصصة في gpt-image-2
بالإضافة إلى الأبعاد المخصصة، يوفر gpt-image-2 ثلاثة "أحجام قياسية" كاختصارات:
1024x1024(نسبة 1:1، مربع)1536x1024(نسبة 3:2، أفقي)1024x1536(نسبة 2:3، عمودي)
هذه الأحجام الثلاثة لا تتطلب القلق بشأن القيود، وتتميز باستقرار الفوترة وأقصر وقت استنتاج. يُنصح باستخدام هذه الأحجام مباشرة لـ 95% من حركة مرور الإنتاج. لا يتم اللجوء للأحجام المخصصة إلا في حالات خاصة مثل الملصقات، اللافتات، أو اللوحات الطولية.
🎯 نصيحة للاستقرار: عند استدعاء gpt-image-2 عبر خدمة APIYI (apiyi.com)، يتم تمرير الحجم المخصص بالكامل إلى النموذج الأساسي، ويكون السلوك متطابقًا مع الاتصال المباشر بـ OpenAI. ومع ذلك، يُنصح بإعادة محاولة الطلبات التي تقع ضمن "النطاق التجريبي" (>2560×1440) في حال حدوث خطأ، لأن هذا النطاق قد يعيد أحيانًا صورًا ذات جودة غير طبيعية، وإعادة المحاولة مسبقًا ترفع من معدل نجاح النتائج.
لماذا لا يدعم gpt-image-2 نسبة 1:8؟
الحد الأقصى 3:1 هو قيد صارم حددته OpenAI أثناء مرحلة تدريب النموذج؛ حيث لم يتم تدريب النموذج على نسب أكثر تطرفًا، لذا فإن فرضه قسريًا سيؤدي إلى رفضه مباشرة من قبل الخادم. حتى لو حاولت استخدام size = "3840x480" (نسبة 8:1)، سيعيد الـ API خطأ 400: "aspect ratio must be at most 3:1". هذا يختلف عن "النموذج يدعمها ولكنها معطلة"، فالأمر يتعلق بعدم امتلاك هذه القدرة فعليًا.
من منظور تصميم النموذج، تمثل نسب العرض إلى الارتفاع المتطرفة تحديًا لجودة التوليد يفوق النسب العادية. نسبة 1:8 تعني أن النموذج يحتاج إلى الحفاظ على تناسق التكوين، ومركز الثقل البصري، وتنسيق النص في وقت واحد على لوحة مسطحة جدًا، وهو ما يتطلب بيانات تدريب متخصصة وخطط ترميز موضعية. اختارت OpenAI في gpt-image-2 استراتيجية "تحقيق أفضل جودة ضمن نطاق 3:1 أولاً"، وترك النسب الأكثر تطرفًا لنظام المعالجة اللاحقة.
🎯 نصيحة للحلول البديلة: إذا كنت بحاجة فعلية لنسبة 1:8، يُنصح باستخدام gpt-image-2 لتوليد صورة بنسبة 3:1 لتحديد الأساس، ثم استخدام واجهة تحرير الصور (image edit) عبر APIYI (apiyi.com) للتوسيع الأفقي، حيث يقوم النموذج بتمديد الصورة إلى الجانبين بناءً على المحتوى الموجود. هذا المسار "الأساس + التوسيع" أسهل في الحفاظ على الاتساق البصري مقارنة بدمج 8 أجزاء دفعة واحدة.
شرح مفصل لآلية دعم الأبعاد في Nano Banana Pro
اختارت Google DeepMind لنموذج Nano Banana Pro (المعروف تجاريًا باسم Gemini 3 Pro Image، ويُعرف في المجتمع بـ "Nano Banana 2") تصميمًا معاكسًا تمامًا؛ حيث تم تثبيت نسبة العرض إلى الارتفاع في 10 قيم محددة مسبقًا، مع إضافة ثلاث مستويات للدقة (1K / 2K / 4K). يحتاج المطور فقط إلى "اختيار نسبة + اختيار مستوى دقة"، دون الحاجة للقلق بشأن قيود البكسل.

نسب العرض إلى الارتفاع العشر المدعومة في Nano Banana Pro
الجدول أدناه هو قائمة كاملة وحصرية لنسب العرض إلى الارتفاع في Nano Banana Pro، وأي نسبة أخرى (مثل 5:3، 2:1) ستؤدي إلى خطأ أو العودة تلقائيًا إلى 1:1.
| النوع | النسبة | القيمة | الاستخدام النموذجي |
|---|---|---|---|
| مربع | 1:1 | 1.00 | صور الملف الشخصي، صور التواصل الاجتماعي |
| أفقي | 4:3 / 5:4 / 3:2 | 1.33 / 1.25 / 1.50 | الصور التقليدية، عروض PPT |
| أفقي (عريض) | 16:9 / 21:9 | 1.78 / 2.33 | أغلفة الفيديو، الشاشات العريضة |
| عمودي | 3:4 / 4:5 / 2:3 | 0.75 / 0.80 / 0.67 | الملصقات، تفاصيل المنتج |
| عمودي (طولي) | 9:16 | 0.56 | أغلفة الفيديوهات القصيرة |
أعرض نسبة هي 21:9 ≈ 2.33:1، وأطول نسبة هي 9:16 ≈ 0.56:1. بغض النظر عن كيفية تمرير معامل aspect_ratio، لن تخرج عن هذا النطاق. وهذا يعني أن النسب المتطرفة مثل 1:8 (=0.125) و 8:1 (=8.0) خارج نطاق الدعم تمامًا.
مستويات الدقة وحساب البكسل في Nano Banana Pro
يتم تحديد البكسل بواسطة معاملين معًا: aspect_ratio (يحدد الشكل) + resolution (يحدد الحجم). قاعدة الحساب بسيطة للغاية:
- الضلع القصير = القيمة الأساسية لـ resolution (1K=1024 / 2K=2048 / 4K=4096)
- الضلع الطويل = الضلع القصير × مضاعف النسبة
مثال: 21:9 + 4K = الضلع القصير 4096 × 9/21 ≈ 4096، والضلع الطويل وفقًا للنسبة حوالي 9557 بكسل. لكن النظام الفعلي يطبق تحكمًا في الحد الأقصى، حيث يخضع الحد الأقصى الحقيقي للضلع الطويل في فئة 4K لإجمالي البكسل ووقت التوليد، تستغرق عملية التوليد الفعلية لـ 21:9 + 4K حوالي 30 ثانية للصورة الواحدة، وهو أبطأ من 16:9 + 4K بأكثر من الضعف.
🎯 نصيحة للدقة: بالنسبة لـ 95% من طلبات الإنتاج اليومية، يكفي استخدام 2K، حيث تكون جودة الصورة ممتازة جدًا ووقت التوليد معقول. لا يتم اللجوء إلى 4K إلا في سيناريوهات المتطلبات الصارمة مثل معاينة الطباعة وملصقات العلامات التجارية. عند استدعاء نموذج nano-banana-pro عبر APIYI (apiyi.com)، تغطي المستويات الثلاثة للدقة جميع احتياجاتك، مع فوترة حسب الاستخدام، مما يسهل مقارنة النتائج.
مقارنة قدرات الأبعاد بين gpt-image-2 و Nano Banana Pro
وضعنا قدرات النموذجين في سيناريوهات احتياجات مختلفة لتسهيل اتخاذ القرار.

اتساع نطاق تغطية نسب العرض إلى الارتفاع
| نسبة العرض إلى الارتفاع القصوى | gpt-image-2 | Nano Banana Pro | ملاحظات |
|---|---|---|---|
| 1:1 (مربع) | ✅ 1024×1024 | ✅ 1:1 / أي دقة | كلاهما مستقر جداً |
| 16:9 (فيديو) | ✅ تخصيص أي بكسل | ✅ قائمة ثابتة | كلاهما مدعوم |
| 21:9 (شاشة عريضة سينمائية) | ✅ تخصيص أي بكسل | ✅ قائمة ثابتة (حد أقصى) | كلاهما مدعوم |
| 3:1 (لافتة إعلانية) | ✅ تخصيص (حد أقصى) | ❌ غير مدعوم | ميزة حصرية لـ gpt-image-2 |
| 1:3 (شاشة عمودية فائقة) | ✅ تخصيص (حد أقصى) | ❌ غير مدعوم | ميزة حصرية لـ gpt-image-2 |
| 4:1 / 1:4 وما فوق | ❌ يتجاوز حد 3:1 | ❌ يتجاوز حد 21:9 | كلاهما يحتاج معالجة لاحقة |
| 8:1 / 1:8 | ❌ غير مدعوم | ❌ غير مدعوم | كلاهما يحتاج دمج (拼接) |
مرونة البكسل
يعد gpt-image-2 نموذجاً "لأي بكسل" بالمعنى الحقيقي، طالما تم استيفاء ثلاثة قيود: مضاعفات 16 + نطاق إجمالي البكسلات + حد النسبة. أما Nano Banana Pro فهو يعتمد على "قائمة ثابتة"، بإجمالي 10 نسب × 3 مستويات دقة = 30 احتمالاً فقط.
هذا الاختلاف يحدد أن سير العمل المناسب لكل منهما مختلف تماماً. نموذج gpt-image-2 مناسب للسيناريوهات التي تتطلب تحكماً دقيقاً في البكسل، مثل توليد أبعاد 1920×1080 لتتطابق تماماً مع المواد الموجودة، أو توليد صور مجمعة وفقاً لشبكة التصميم (مثل 768، 1280). بينما Nano Banana Pro مناسب للسيناريوهات التي يكفي فيها "تحديد الاتجاه العام"، حيث لا يحتاج المطور لحساب البكسلات، بل يختار فقط من بين 10 نسب، ثم يحدد الدقة (1K/2K/4K)، ويترك الباقي للنظام.
| السيناريو | التوصية |
|---|---|
| الحاجة إلى تخصيص أي بكسل | gpt-image-2 |
| الحاجة إلى دقة 4K كبيرة | Nano Banana Pro (3 مستويات دقة تصل إلى 4K) |
| الحاجة إلى نسب 3:1 / 1:3 | فقط gpt-image-2 |
| الحاجة إلى نسب شائعة بين 21:9 و 9:16 | كلاهما مناسب |
🎯 استراتيجية هجينة: في الممارسة العملية، تقوم العديد من الفرق بدمج النموذجين معاً؛ حيث يتم استخدام Nano Banana Pro للنسب الشائعة (1:1، 16:9، 9:16) للحصول على صور كبيرة بدقة 4K، بينما يتم استخدام gpt-image-2 للتخصيص عند الحاجة إلى لافتات 3:1 أو شاشات عمودية 1:3. على منصة APIYI (apiyi.com)، يمتلك النموذجان نفس الحساب ونفس الرمز (Token)، ويتم محاسبتهما بناءً على حجم الاستدعاء، دون الحاجة لتبديل الحسابات.
حلول عملية للتعامل مع نسب العرض إلى الارتفاع المتطرفة 1:8 / 8:1
على الرغم من أن كلا النموذجين لا يدعمان نسب 1:8 أو 8:1 بشكل مباشر، إلا أنه يمكنك تحقيق نتائج مكافئة من خلال استراتيجيات الدمج. فيما يلي ثلاث طرق تم التحقق منها في بيئات الإنتاج، يمكنك اختيار ما يناسب سيناريو عملك منها.
الطريقة الأولى: التوليد المجزأ + الدمج الأفقي
تعد هذه الطريقة الأكثر موثوقية. قم بتقسيم الصورة البانورامية بنسبة 1:8 إلى 4 أجزاء بنسبة 1:2 أو 8 أجزاء بنسبة 1:1، ثم قم بتوليد كل جزء على حدة ودمجها باستخدام مكتبات مثل PIL أو sharp أو برنامج Photoshop. تكمن الصعوبة في ضمان انتقال سلس عند الحواف بين الأجزاء؛ لذا نوصي بإدراج موجه (prompt) متسق للأسلوب في كل جزء (مثل: "مدينة سايبربانك، ليلة ممطرة، أضواء نيون، إطار سينمائي") مع تثبيت قيمة الـ seed، مما يعزز الاتساق بشكل ملحوظ.
from openai import OpenAI
import base64
# استخدام خدمة وكيل API عبر APIYI
client = OpenAI(api_key="sk-xxx", base_url="https://api.apiyi.com/v1")
def gen_segment(prompt, idx):
resp = client.images.generate(
model="gpt-image-2",
prompt=f"{prompt}، الجزء {idx+1}، انتقال سلس مع الأجزاء السابقة واللاحقة، أسلوب متسق",
size="1024x1024",
quality="medium",
)
return base64.b64decode(resp.data[0].b64_json)
base = "أفق مدينة سايبربانك، ليلة ممطرة وأضواء نيون"
segments = [gen_segment(base, i) for i in range(8)]
# استخدام PIL للدمج الأفقي لـ 8 صور بحجم 1024×1024 → 8192×1024 (أي نسبة 8:1)
الطريقة الثانية: التوليد بنسبة 3:1 + التوسيع بالذكاء الاصطناعي
قم بتوليد صورة أساسية بحجم 3840×1280 (نسبة 3:1) باستخدام gpt-image-2، ثم استخدم واجهة image.edit الخاصة بـ OpenAI أو قدرات تحرير الصور في Nano Banana Pro لإجراء توسيع أفقي. كرر عملية التوسيع بمقدار الضعف مرتين للوصول إلى نسبة 8:1. توفر هذه الطريقة اتساقاً بصرياً أفضل من الدمج البسيط، لكنها تستهلك استدعاءً إضافياً للنموذج في كل عملية توسيع، مما يزيد من التكلفة والوقت.
الطريقة الثالثة: التوليد بنسبة 21:9 + القص اللاحق
هذه هي الطريقة الأبسط والأكثر مباشرة. قم بتوليد صورة بدقة 4K بنسبة 21:9 (حوالي 4096×1755) باستخدام Nano Banana Pro، ثم قم بقص الحواف العلوية والسفلية للوصول إلى نسبة 8:1 المطلوبة (4096×512). ستفقد بعض المعلومات الرأسية، لكنك ستحافظ على تكوين الصورة وتناسق الأسلوب. تناسب هذه الطريقة اللافتات والإعلانات والصور الزخرفية حيث لا يكون المحتوى الرأسي حرجاً.
🎯 نصيحة للدمج: في الواقع العملي، هذه الطرق ليست حصرية. نوصي باستخدام الطريقة الثالثة أولاً لإنشاء نموذج أولي (demo) والتحقق من الفكرة، ثم الترقية إلى الطريقة الثانية أو الأولى للحصول على نسخة احترافية. يمكنك استخدام جميع هذه الطرق عبر منصة APIYI (apiyi.com) باستخدام مفتاح API واحد، مما يغنيك عن التبديل بين الحسابات.
| الطريقة | المميزات | العيوب | السيناريو المناسب |
|---|---|---|---|
| التوليد المجزأ | أي نسبة ممكنة | احتمالية وجود عيوب عند الدمج | اللوحات البانورامية، الرسوم البيانية الطويلة |
| التوسيع بالذكاء الاصطناعي | أفضل اتساق بصري | تكلفة ووقت أعلى | ملصقات العلامات التجارية، معاينة الطباعة |
| القص اللاحق | الأسرع | فقدان جزء من المحتوى | اللافتات، الصور الزخرفية |
توصيات اختيار الأبعاد لمختلف سيناريوهات العمل
ربط السيناريو بالنموذج المناسب وحجم الصورة يسرع من عملية اتخاذ القرار.
| سيناريو العمل | النموذج الموصى به | الأبعاد الموصى بها | ملاحظات |
|---|---|---|---|
| صور التواصل الاجتماعي / الصور الشخصية | أي نموذج | 1:1 + 1K/2K | الأولوية للسرعة |
| غلاف فيديو / لافتة | Nano Banana Pro | 16:9 + 2K/4K | دقة 4K مناسبة للطباعة |
| غلاف فيديو قصير | Nano Banana Pro | 9:16 + 2K | مناسب للهواتف المحمولة |
| ملصق فيلم / صورة ترويجية | Nano Banana Pro | 21:9 + 4K | شاشة عريضة جداً |
| لافتة طويلة جداً / إنفوجرافيك | gpt-image-2 | 3:1 (3840×1280) | أقصى حجم مخصص |
| صورة رأسية طويلة / لوحة عمودية | gpt-image-2 | 1:3 (1280×3840) | أقصى حجم مخصص |
| بانوراما 1:8 / 8:1 | طريقة الدمج | دمج 8 صور 1:1 | تتطلب معالجة لاحقة |
| أي نسبة مخصصة | gpt-image-2 | مخصص | يجب أن يتوافق مع القيود |
🎯 أفضل الممارسات: قبل إطلاق العمل في بيئة الإنتاج، نوصي بإجراء اختبار A/B عبر منصة APIYI (apiyi.com): قم بتوليد 50 صورة لكل نموذج باستخدام الأبعاد الشائعة (1:1, 16:9, 9:16)، وقارن بين جودة الصورة والسرعة قبل تحديد النموذج الأساسي. مفتاح API واحد يغطي كلا النموذجين، مما يجعل تكلفة الاختبار منخفضة جداً ويجنبك أخطاء الاختيار بعد الإطلاق.
الأسئلة الشائعة (FAQ)
س1: ماذا يحدث إذا أرسلت size = "3840×480" (بنسبة 8:1) إلى gpt-image-2؟
ستعيد واجهة برمجة التطبيقات (API) خطأ 400 مباشرة، مشيرة إلى أن نسبة العرض إلى الارتفاع تتجاوز الحد الأقصى. نسبة 3:1 هي قيد صارم وضعه OpenAI في مرحلة تدريب النموذج، وليست معلمة قابلة للتعديل من جانب الخادم. حتى نسخة ChatGPT الويب الداخلية الخاصة بـ OpenAI لا يمكنها توليد صور بنسبة 1:8 أو 8:1، ويجب تحقيق ذلك من خلال الربط (拼接) بعد المعالجة.
س2: هل يمكن لـ Nano Banana Pro استقبال نسب مخصصة؟ مثل 5:3؟
لا. معلمة aspect_ratio في Nano Banana Pro تقبل فقط 10 قيم محددة (1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9). إرسال نسب أخرى سيؤدي إلى خطأ أو العودة إلى النسبة الافتراضية 1:1. إذا كنت بحاجة إلى نسبة 5:3 أو غيرها، يُنصح باستخدام أقرب نسبة متاحة (مثل 16:9) ثم قص الصورة لاحقاً.
س3: هل سلوك المعلمات متسق عند استدعاء النموذجين عبر خدمة وكيل APIYI (apiyi.com)؟
متسق تماماً. تقوم APIYI (apiyi.com) بتمرير معلمة size لنموذج gpt-image-2، ومعلمات aspect_ratio + resolution لنموذج Nano Banana Pro بالكامل دون أي تحويل، حيث يتطابق السلوك تماماً مع نقاط النهاية الرسمية لـ OpenAI وGoogle. يتم احتساب التكلفة وفقاً للأسعار الرسمية دون أي رسوم إضافية للخدمة.
س4: عند تخصيص أبعاد gpt-image-2، هل 1024×1024 و 1536×1024 هي "المستويات الثلاثة القياسية" أم تُعتبر تخصيصاً؟
تُصنف وثائق OpenAI هذه الأبعاد الثلاثة بوضوح على أنها "أحجام قياسية" (standard sizes)، وهي تستخدم مسارات محددة ومحسنة، مما يضمن أقصر وقت للاستدلال وأعلى استقرار. يمكن استخدام مجموعات بكسل أخرى ضمن القيود، لكن قد تظهر اختلافات طفيفة في السلوك (خاصة في الأبعاد المتطرفة القريبة من الحد الأقصى)، لذا نوصي باستخدام المستويات القياسية الثلاثة لـ 95% من حركة مرور الإنتاج.
س5: هل يمكن لمستوى 4K في Nano Banana Pro إنتاج حافة قصيرة بطول 4096 بكسل فعلاً؟
تنص الوثائق على أن "الحافة القصيرة تساوي القيمة الأساسية لـ resolution"، وفي مستوى 4K تكون الحافة القصيرة = 4096 بكسل. لكن الاختبارات العملية أظهرت أن طلبات 21:9 + 4K تؤدي إلى وقت توليد أطول (أكثر من 30 ثانية)، وأحياناً يحدث انخفاض إلى 2K ثم إعادة رفع الدقة (upsampling). إذا كانت لديك متطلبات عالية لنقاء الصورة، نوصي باستخدام مجموعة 16:9 أو 1:1 مع 4K لتجنب الجمع بين النسب المتطرفة والدقة المتطرفة.
س6: كيف يمكن ضمان عدم وجود "انقطاع" بين الأجزاء عند استخدام خطة الربط لصور بانورامية بنسبة 1:8؟
ثلاث نصائح: أولاً، استخدم موجه (prompt) طويل ومشترك لجميع الأجزاء مع وصف "ربط سلس، نمط متسق"؛ ثانياً، ثبّت معلمة seed (التي يدعمها gpt-image-2) لجعل النموذج يولد نمطاً مشابهاً تحت نفس الدلالات؛ ثالثاً، استخدم واجهة تحرير الصور لجعل الحافة اليمنى للجزء السابق مرجعاً (reference) للحافة اليسرى للجزء التالي، مما يفرض استمرارية المحتوى. الجمع بين هذه الطرق الثلاث يقلل من آثار الربط المرئية إلى أدنى حد ممكن.
س7: هل سيكون هناك نموذج يدعم نسبة 1:8 أصلياً في المستقبل؟
لا توجد معلومات عامة حتى الآن من الشركات الكبرى حول خطط تدريب أصلية لنسبة 1:8 / 8:1. النسب المتطرفة تشكل تحدياً كبيراً لقدرات تكوين النموذج، وتتطلب بيانات تدريب وتعديلات معمارية خاصة. على المدى القصير (خلال عام 2026)، نوصي بالاعتماد على حلول الربط بعد المعالجة. إذا كانت هناك تحديثات كبيرة، ستقوم APIYI (apiyi.com) بتحديثها فوراً في مركز المساعدة.
س8: هل يمكن رؤية سجلات الأخطاء المتعلقة بالأبعاد في لوحة تحكم APIYI؟
نعم. تحتفظ سجلات الطلبات في لوحة تحكم APIYI (apiyi.com) بمعلومات الخطأ الكاملة التي تعيدها الجهات الخارجية، بما في ذلك رسائل مثل "aspect ratio must be at most 3:1" أو "unsupported aspect_ratio". يمكن للمطورين رؤية سبب الرفض مباشرة في السجلات دون الحاجة إلى إعادة إنتاج الطلب، مما يقلل بشكل كبير من وقت تصحيح الأخطاء.
الخلاصة: اختر النموذج بناءً على نطاق النسبة ثم جودة الصورة
بالعودة إلى السؤال الجوهري في هذا المقال: واجهة برمجة تطبيقات gpt-image-2 لا تدعم 1:8 / 8:1، وأقصى حد لها هو 3:1 / 1:3؛ ونموذج Nano Banana Pro لا يدعم ذلك أيضاً، حيث يصل أقصى حد له إلى 21:9 / 9:16. إذا كان عملك يتطلب فعلاً نسبة متطرفة مثل 1:8، يرجى التخطيط مسبقاً لعملية الربط بعد المعالجة، ولا تعتمد على واجهة برمجة تطبيقات واحدة لإنجاز المهمة مباشرة.
ولكن ضمن نطاق النسب الشائعة التي تصل إلى 21:9، يتميز كل نموذج بمزاياه؛ حيث يوفر Nano Banana Pro تجربة بسيطة "اختر النسبة + اختر المستوى" مع دقة 4K أصلية، بينما يوفر gpt-image-2 مرونة في أي عدد من البكسلات وقدرة على التعامل مع النسب العرضية المتطرفة حتى 3:1. إن توجيه 90% من حركة المرور إلى النطاق المشترك بين النموذجين، وترك الـ 10% من الاحتياجات المتطرفة للمعالجة اللاحقة، هو النهج الهندسي الأكثر أماناً.
🎯 نصيحة نهائية: نوصي بالوصول إلى gpt-image-2 و Nano Banana Pro عبر منصة واحدة هي APIYI (apiyi.com)، باستخدام مفتاح API واحد وفاتورة واحدة. يمكنك التبديل بين النموذجين للنسب الشائعة، والاعتماد على تخصيص gpt-image-2 والربط للنسب المتطرفة، فهذا هو النهج الأكثر كفاءة للتعامل مع واجهات برمجة تطبيقات الصور في عام 2026.
— فريق APIYI التقني | نتابع باستمرار تطورات نماذج توليد الصور، للمزيد من المقارنات المتعمقة يرجى زيارة مركز المساعدة في APIYI (apiyi.com)
