ملاحظة من المؤلف: نقدم هنا تحليلاً عميقاً لسبب اعتماد واجهات برمجة تطبيقات (API) توليد الصور مثل Nano Banana Pro و Nano Banana 2 على مقياس RPM بدلاً من QPS كمعيار لتحديد معدل الاستخدام، وذلك انطلاقاً من طبيعة الاستدعاءات المتزامنة (Synchronous Blocking) في Gemini، لفهم الفرق في سيناريوهات استخدام كل منهما.
إذا كنت قد استخدمت واجهات برمجة تطبيقات لنماذج اللغة الكبيرة (LLM)، فربما اعتدت على مقياس QPS (عدد الاستعلامات في الثانية). ولكن عند الانتقال إلى واجهات برمجة تطبيقات توليد الصور مثل Nano Banana Pro و Nano Banana 2، ستجد أن الوثائق الرسمية تتحدث حصراً عن RPM (عدد الطلبات في الدقيقة) — لماذا لا تتحدث واجهات توليد الصور عن QPS؟ الأمر لا يتعلق بالتفضيلات في التسمية، بل لأن نمط الاستدعاء المتزامن المحظور (Synchronous Blocking) في توليد الصور يجعل مقياس QPS عديم الفائدة تقريباً في هذا السياق. ستوضح هذه المقالة الفرق بينهما من منظور تقني بحت.
القيمة الجوهرية: بعد قراءة هذا المقال، ستفهم الاختلاف الجوهري بين RPM و QPS في سيناريوهات API المختلفة، ولماذا جعل نمط الاستدعاء المتزامن في Gemini لمقاييس الصور من QPS مفهوماً غير منطقي.

النقاط الجوهرية حول الفرق بين RPM و QPS
لنجب على السؤال مباشرة: نستخدم RPM (طلبات في الدقيقة) بدلاً من QPS (استعلامات في الثانية) في واجهات برمجة تطبيقات (API) توليد الصور، لأن وقت حظر الاستدعاء المتزامن طويل جداً، مما يجعل مقياس QPS بلا معنى عملي.
| المفهوم | التعريف | سيناريو الاستخدام | هل يناسب API توليد الصور؟ |
|---|---|---|---|
| QPS | استعلامات في الثانية (Queries Per Second) | الخدمات عالية التردد ذات الاستجابة بالملي ثانية | لا يناسب |
| RPS | طلبات في الثانية (Requests Per Second) | يعادل QPS تقريباً | لا يناسب |
| RPM | طلبات في الدقيقة (Requests Per Minute) | الخدمات البطيئة ذات الاستجابة بالثواني أو الدقائق | يناسب |
| IPM | صور في الدقيقة (Images Per Minute) | مخصص لتوليد الصور | الأنسب |
| RPD | طلبات في اليوم (Requests Per Day) | إدارة الحصص (Quota) | يناسب |
لماذا يعتبر QPS في API توليد الصور مفهوماً غير دقيق؟
يكمن مفتاح فهم هذه المسألة في خاصية الاستدعاء المتزامن (Synchronous Call) لواجهة برمجة تطبيقات Gemini لتوليد الصور.
عندما تقوم باستدعاء Nano Banana 2 لتوليد صورة، فإن الـ API يعمل بنظام الحظر المتزامن (Synchronous Blocking)؛ أي بمجرد إرسال الطلب، يظل اتصال HTTP مفتوحاً، ويظل العميل في حالة انتظار حتى اكتمال توليد الصورة (ما بين 13 إلى 170 ثانية) قبل أن يتلقى الرد. طوال هذه الفترة، لا يقوم الاتصال بأي شيء سوى الانتظار.
للمقارنة:
- Claude API (نصوص): يتم إرجاع الرمز (Token) الأول خلال 50-200 مللي ثانية، مع نقل متدفق (Streaming)، مما يتيح الحصول على نتائج مفيدة في أقل من ثانية.
- Nano Banana 2 (صورة بدقة 1K): يستغرق 13 ثانية على الأقل للرد، مع بقاء الاتصال محظوراً طوال الوقت.
لذا، بالنسبة لـ API توليد الصور، فإن سؤال "كم عدد الطلبات التي يمكن معالجتها في الثانية" (QPS) لا أساس له من الصحة، لأن طلباً واحداً قد يستغرق أكثر من 13 ثانية. استخدام RPM هو وحدة القياس المنطقية الوحيدة.
🎯 تشبيه: QPS يشبه قياس عدد الوجبات التي يمكن لمطعم وجبات سريعة تقديمها في الثانية. أما RPM فيشبه قياس عدد الطاولات التي يمكن لمطعم فاخر خدمتها في الساعة. لن تستخدم "عدد الأطباق في الثانية" لقياس كفاءة مطعم فرنسي، لأن الطبق الواحد يتطلب 30 دقيقة للتحضير.
من خلال APIYI (apiyi.com)، يمكنك استدعاء Nano Banana 2 دون قيود رسمية على RPM، مما يتيح لك إرسال المزيد من الطلبات المتزامنة.
التفاصيل التقنية للاستدعاء المتزامن في Gemini API لتوليد الصور
هذا هو الأساس لفهم الفرق بين RPM و QPS.
عملية الحظر في الاستدعاء المتزامن لـ Nano Banana 2
العميل يرسل الطلب
│
▼
إنشاء اتصال TCP ──────────────────────────────────┐
│ │
▼ │
الخادم يستقبل الموجه (Prompt) │ الاتصال يظل مفتوحاً
│ │ العميل ينتظر في حالة حظر
▼ │
استنتاج نموذج الانتشار (13-170 ثانية) │
│ │
▼ │
ترميز الصورة إلى base64 │
│ │
▼ │
إرجاع الرد (يحتوي على بيانات الصورة) ──────────────┘
│
▼
العميل يستقبل الصورة
خلال هذه العملية، يتم شغل خيط المعالجة (Thread) أو العملية (Process) الخاصة بالعميل بالكامل. إذا كنت تستخدم استدعاءً متزامناً بخيط واحد، فستتمكن في الدقيقة الواحدة من إرسال 60 / وقت التوليد من الطلبات فقط. بالنسبة لصورة 1K التي تستغرق 13 ثانية، فإن QPS للخيط الواحد يبلغ حوالي 0.077 (أي 0.077 طلباً في الثانية)، وهو ما يعادل 4.6 RPM فقط.
وقت الحظر لـ Nano Banana 2 بدقة مختلفة
| الدقة | وقت التوليد النموذجي | الحد الأقصى لـ RPM (خيط واحد) | "QPS" للخيط الواحد |
|---|---|---|---|
| 0.5K | ~8 ثوانٍ | ~7.5 RPM | 0.125 |
| 1K | ~13 ثانية | ~4.6 RPM | 0.077 |
| 2K | ~30 ثانية | ~2 RPM | 0.033 |
| 4K | ~90-170 ثانية | ~0.4-0.7 RPM | 0.006-0.011 |
هل لاحظت ذلك؟ عند دقة 4K، يبلغ "QPS" للخيط الواحد 0.006 فقط؛ أي أنك تحتاج في المتوسط إلى 170 ثانية لإكمال طلب واحد. عند هذا المستوى، يصبح الحديث عن QPS بلا معنى، ويبقى RPM هو المقياس الفعال.
متى نستخدم RPM ومتى نستخدم QPS؟
السيناريوهات المناسبة لـ QPS
تكون QPS (الاستعلامات في الثانية) مؤشراً ذا معنى للسرعة فقط إذا كان: زمن استجابة الطلب الواحد أقل بكثير من ثانية واحدة.
| نوع الخدمة | زمن الاستجابة النموذجي | هل QPS مفيد؟ | السبب |
|---|---|---|---|
| CDN / التخزين المؤقت | 1-10 مللي ثانية | مفيد جداً | يمكن معالجة آلاف الطلبات في الثانية |
| استعلامات قاعدة البيانات | 5-50 مللي ثانية | مفيد | يمكن معالجة مئات الطلبات في الثانية |
| أول Token في نماذج اللغة | 50-200 مللي ثانية | مفيد | يمكن بدء 5-20 طلباً في الثانية |
| واجهة برمجة تطبيقات البحث | 100-500 مللي ثانية | مفيد | يمكن إتمام 2-10 طلبات في الثانية |
السيناريوهات المناسبة لـ RPM
تعتبر RPM (الطلبات في الدقيقة) مؤشراً أكثر منطقية للسرعة عندما: يكون زمن استجابة الطلب الواحد يتراوح بين ثوانٍ إلى دقائق.
| نوع الخدمة | زمن الاستجابة النموذجي | لماذا نستخدم RPM؟ | قيود Gemini الرسمية |
|---|---|---|---|
| توليد الصور | 8-170 ثانية | لا يمكن إكمال طلب واحد في ثانية | RPM + IPM |
| توليد الفيديو | 30-300 ثانية | الطلب الواحد يستغرق دقائق | RPM |
| معالجة البيانات الضخمة | دقائق | حجم المهمة أكبر من الثانية | RPM + RPD |
| تحويل الملفات | 5-60 ثانية | وقت المعالجة طويل للطلب الواحد | RPM |
قيود السرعة رباعية الأبعاد لواجهة توليد الصور في Gemini
صممت جوجل أربعة أبعاد لقيود السرعة لواجهة برمجة تطبيقات توليد الصور في Gemini، وسيتم تقييد سرعتك إذا تجاوزت أياً منها:
| البعد | المعنى | المستوى المجاني | المستوى 1 (مدفوع) |
|---|---|---|---|
| RPM | الطلبات في الدقيقة | 5-15 | 150-300 |
| TPM | عدد الـ Token في الدقيقة | محدود | مرتفع |
| RPD | الطلبات في اليوم | 20-100 | 1,000+ |
| IPM | عدد الصور في الدقيقة | محدود | مرتفع |
لاحظ أن IPM (الصور في الدقيقة) هو مؤشر مصمم خصيصاً لتوليد الصور. ونظراً لأن الطلب الواحد قد يولد صوراً متعددة، فإن العلاقة بين RPM و IPM ليست علاقة مباشرة (واحد لواحد).

كيفية تحسين الإنتاجية الفعلية لواجهة برمجة تطبيقات (API) توليد الصور
بعد فهم جوهر مفهوم RPM (الطلبات في الدقيقة)، يبرز السؤال التالي: كيف يمكننا تحقيق أقصى قدر من كفاءة توليد الصور ضمن حدود الـ RPM المتاحة؟
حساب تعدد الخيوط (Multi-threading) + سقف RPM
لنفترض أنك بحاجة إلى توليد 20 صورة بدقة 1K في الدقيقة:
RPM للخيط الواحد = 60 ثانية / 13 ثانية ≈ 4.6 صورة/دقيقة
عدد الخيوط المطلوبة = 20 / 4.6 ≈ 5 خيوط متزامنة
لكن يجب عليك أيضاً التأكد من أن إجمالي RPM للخيوط الخمسة المتزامنة (حوالي 23 RPM) لا يتجاوز حصة RPM الخاصة بحسابك. تبلغ الحصة في المستوى المجاني 5-15 RPM فقط، بينما تصل في المستوى المدفوع (Tier 1) إلى 150-300 RPM.
نصائح لتحسين تزامن واجهة برمجة تطبيقات توليد الصور
| استراتيجية التحسين | التأثير | سيناريوهات الاستخدام |
|---|---|---|
| تعدد الخيوط/الروتينات المتزامنة | تحسين خطي (مقيد بـ RPM) | سيناريوهات التوليد الفوري |
| Batch API غير المتزامن | لا يوجد حظر + خصم 50% | السيناريوهات الجماعية التي تتحمل التأخير |
| تقليل الدقة | تقليل وقت الصورة الواحدة → زيادة RPM | الصور المعاينة، الصور المصغرة |
| خدمة وكيل APIYI | تجاوز قيود RPM الرسمية | بيئات الإنتاج ذات التزامن العالي |
| إعدادات مهلة العميل | تجنب الانتظار غير المجدي | جميع السيناريوهات (ينصح بـ 300 ثانية لـ 1K، و600 ثانية لـ 4K) |
🎯 نصيحة عملية: إذا كنت بحاجة إلى توليد صور بتزامن عالٍ، فإن استخدام Nano Banana 2 عبر APIYI (apiyi.com) هو الحل الأسهل؛ فهو غير مقيد بحدود RPM الرسمية، ويتمتع بخصم 28%، مع سعر ثابت قدره 0.045 دولار فقط لدقة 4K.
الأسئلة الشائعة
س1: إذا أرسلت 10 طلبات باستخدام التزامن غير المتزامن، فكم يبلغ الـ RPM؟
يُحسب بـ 10. يُقاس الـ RPM بعدد الطلبات التي ترسلها خلال دقيقة واحدة، بغض النظر عما إذا كانت هذه الطلبات قد عادت بالاستجابة أم لا. حتى لو أرسلت 10 طلبات في وقت واحد باستخدام التزامن، فإن كل منها سيحظر لمدة 13 ثانية قبل أن يعود تباعاً، وتُحسب جميع هذه الطلبات العشرة ضمن نفس الدقيقة من الـ RPM. لذا، يمكن لتعدد الخيوط زيادة الإنتاجية، لكنه لا يمكنه تجاوز حصة الـ RPM.
س2: هل Gemini Batch API غير متزامن؟ وهل يمكنه تجاوز الـ RPM؟
نعم. يعمل Gemini Batch API بنمط غير متزامن؛ حيث ترسل مجموعة من الطلبات وتستلم معرف المهمة فوراً دون حظر العميل. تتم معالجة المهمة في الخلفية، ويتم إخطارك عند اكتمالها للحصول على النتائج. تمتلك Batch API حصة مستقلة (تُحسب بناءً على الرموز/Tokens)، ولا تستهلك حصة الـ RPM الفورية، كما أنها أرخص بنسبة 50%. العيب هو أنها لا تضمن الفورية، لذا فهي مناسبة للسيناريوهات الجماعية التي "لا تتطلب استجابة فورية".
س3: هل chatgpt-image-latest من OpenAI محظور أيضاً بشكل متزامن؟
نعم. يعد chatgpt-image-latest استدعاءً متزامناً أيضاً، ويبلغ وقت الاستجابة حوالي 44-60 ثانية. أبلغ مجتمع المطورين عن تكرار مشاكل المهلة (Timeout) في gpt-image-1، لذا يُنصح بضبط مهلة لا تقل عن 300 ثانية. لذلك، تستخدم واجهة برمجة تطبيقات الصور من OpenAI أيضاً الـ RPM كمؤشر لتقييد المعدل، والمنطق هو نفسه كما في Gemini؛ نظراً لأن وقت الاستجابة للحظر المتزامن طويل جداً، فإن قياس QPS لا معنى له.
س4: كيف تتجاوز APIYI قيود الـ RPM الرسمية؟
تحقق APIYI ذلك من خلال آلية تدوير مجمعات الحسابات المتعددة؛ حيث تحتفظ المنصة بعدة حسابات Gemini API، ويتم توزيع طلبات العميل تلقائياً على حسابات مختلفة، حيث يمتلك كل حساب حصة RPM خاصة به. بالنسبة للمطور، يعادل هذا زيادة كبيرة في الـ RPM دون الحاجة إلى إدارة مفاتيح API متعددة بنفسه. بالإضافة إلى ذلك، يمكنك الاستمتاع بخصم 28% وميزة السعر الثابت 0.045 دولار لدقة 4K.

ملخص
السبب الرئيسي لاعتماد Nano Banana لواجهة برمجة تطبيقات (API) توليد الصور على معدل الطلبات في الدقيقة (RPM) بدلاً من الطلبات في الثانية (QPS):
- الحظر المتزامن يحدد وحدة القياس: استدعاء واجهة برمجة تطبيقات توليد الصور في Gemini هو استدعاء متزامن، حيث يحظر الطلب الواحد لمدة تتراوح بين 13 إلى 170 ثانية، مما يعني أنه لا يمكن إكمال طلب واحد حتى في الثانية الواحدة. لذا، فإن مؤشر QPS (الطلبات في الثانية) لا معنى له هنا، ويصبح RPM (الطلبات في الدقيقة) هو المقياس المنطقي.
- RPM مناسب للخدمات البطيئة، وQPS للخدمات السريعة: معيار بسيط للتقييم—إذا كان زمن الاستجابة الفردي أقل من ثانية واحدة استخدم QPS، وإذا كان أكثر من ثانية واحدة استخدم RPM. خدمات توليد الصور، الفيديو، وتحويل الملفات تندرج جميعها تحت سيناريوهات RPM.
- زيادة الإنتاجية تعتمد على التزامن + الحصة: يمكن للتزامن متعدد الخيوط (Multi-threading) تحسين الإنتاجية بشكل خطي، ولكنه مقيد بحصة RPM. من خلال استخدام ميزة تدوير حسابات متعددة في APIYI، يمكنك تجاوز حد RPM للحساب الواحد.
نوصي باستخدام Nano Banana 2 عبر APIYI (apiyi.com)؛ حيث لا يخضع لقيود RPM الرسمية، مع خصم 28% على الأسعار، وسعر ثابت قدره 0.045 دولار لدقة 4K.
📚 المراجع
-
حدود معدل Gemini API: وثائق حدود المعدل الرسمية.
- الرابط:
ai.google.dev/gemini-api/docs/rate-limits - الوصف: تتضمن شرحاً كاملاً لقيود الأبعاد الأربعة: RPM، TPM، RPD، وIPM.
- الرابط:
-
مقارنة Nano Banana Pro بين واجهة برمجة التطبيقات المتزامنة وغير المتزامنة: الفروق التقنية بين نمطي الاستدعاء.
- الرابط:
help.apiyi.com/en/nano-banana-pro-sync-async-api-comparison-en.html - الوصف: تتضمن أوقات الحظر، إعدادات المهلة، وحسابات الإنتاجية.
- الرابط:
-
حدود معدل OpenAI: وثائق حدود المعدل الخاصة بـ OpenAI (نظام RPM).
- الرابط:
developers.openai.com/api/docs/guides/rate-limits - الوصف: مقارنة بين فلسفة تصميم حدود المعدل في Gemini وOpenAI.
- الرابط:
-
مركز وثائق APIYI: الوصول إلى واجهة برمجة تطبيقات توليد الصور مع تجاوز قيود RPM.
- الرابط:
docs.apiyi.com - الوصف: الوصول عالي التزامن لـ Nano Banana 2 والأسعار المخفضة.
- الرابط:
المؤلف: الفريق التقني لـ APIYI
النقاش التقني: نرحب بمناقشاتكم في قسم التعليقات، ولمزيد من المعلومات يمكنكم زيارة مركز وثائق APIYI على docs.apiyi.com.
