|

تحليل عميق لخدمة الإنتاجية المخصصة (PT) من جوجل: 6 فروقات جوهرية بين Vertex AI و AI Studio (2026)

عندما يستفسر مستخدمو الشركات عن حلول الوصول إلى نماذج Google مثل Gemini وNano Banana Pro، يبرز مصطلح "Provisioned Throughput (PT)" كأحد أكثر المصطلحات تداولاً وإثارة للالتباس. تشمل المفاهيم الخاطئة الشائعة: "هل PT هو النسخة المخصصة للشركات من AI Studio؟"، "هل PT هو شراء أولوية لاستدعاءات Gemini API؟"، "هل تنخفض تكلفة الوحدة بعد شراء PT؟".

إجابات هذه الأسئلة ليست بديهية تماماً. يستعرض هذا المقال، استناداً إلى أحدث وثائق Google Cloud Vertex AI الرسمية باللغة الإنجليزية، مفهوم PT بشكل شامل: فهو ينتمي إلى نظام Vertex AI وليس AI Studio، ووحدة قياسه هي GSU (Generative AI Scale Unit)، وهو لا يخفض سعر الوحدة ولكنه يضمن أولوية الإنتاجية، بينما تسمى آلية الدفع حسب الاستخدام المقابلة له DSQ (Dynamic Shared Quota).

إن فهم هذه المفاهيم لن يساعدك فقط في تقييم ما إذا كان يجب على شركتك شراء PT، بل سيساعدك أيضاً في الاختيار العقلاني بين مسارات الوصول الثلاثة: بناء حل Google الخاص بك، أو الاشتراك في PT، أو الوصول عبر منصة التجميع APIYI (apiyi.com).

google-provisioned-throughput-pt-explained-vertex-vs-aistudio-2026-ar 图示

ما هو Google Provisioned Throughput (PT)

Provisioned Throughput (PT) هو اشتراك في حجز الإنتاجية بتكلفة ثابتة وفترة زمنية محددة، توفره منصة Vertex AI من Google Cloud لنماذج الذكاء الاصطناعي التوليدي. منطقها الأساسي هو: تلتزم الشركة بشراء كمية معينة من قدرة المعالجة مسبقاً، وتقوم Google بحجز موارد حوسبة مخصصة لك، مقابل ضمان اليقين والأولوية في استدعاءات الإنتاجية.

التعريف الرسمي لـ PT والخصائص الرئيسية

وفقاً للوثائق الرسمية لـ Google Cloud:

Provisioned Throughput هو اشتراك بتكلفة ثابتة وفترة زمنية محددة متاح بعدة مدد زمنية، يحجز الإنتاجية لنماذج الذكاء الاصطناعي التوليدي المدعومة على Vertex AI.

تحليل الكلمات الرئيسية الثلاث في هذه العبارة:

  1. تكلفة ثابتة (Fixed-cost): لا علاقة لها بحجم الاستدعاء الفعلي، بل تُدفع مسبقاً بناءً على الالتزام.
  2. فترة زمنية محددة (Fixed-term): يمكن الاختيار من بين: أسبوع واحد / شهر واحد / 3 أشهر / سنة واحدة.
  3. حجز الإنتاجية (Reserves throughput): لا يعني حجز "قوة الحوسبة" (Hardware)، بل حجز "قدرة معالجة الرموز (Tokens) في الثانية".

ما الذي لا يمثله PT: توضيح ثلاث مفاهيم خاطئة

المفهوم الخاطئ الشائع توضيح الحقيقة
"PT = نسخة الشركات من AI Studio" ❌ PT موجود فقط في Vertex AI، ولا علاقة مباشرة له بـ AI Studio
"سعر الوحدة ينخفض بعد شراء PT" ❌ PT لا يخفض سعر الوحدة، بل يوفر فقط ضمان الإنتاجية والأولوية
"يمكن إلغاء PT في أي وقت" ❌ لا يمكن الإلغاء خلال فترة العقد، يمكن فقط إضافة GSU
"PT يمنحك GPU مخصصاً" ❌ PT يحجز وحدات الإنتاجية (GSU)، وليس عتاداً مخصصاً
"PT ينطبق على جميع نماذج Google" ❌ مدعوم فقط لبعض النماذج، يجب مراجعة قائمة النماذج المدعومة

💡 نصيحة للمشاهد الشائعة: إذا كان هدفك الأساسي هو "خفض سعر الوحدة" وليس "ضمان الإنتاجية"، فإن PT ليس الخيار المناسب لك. في هذه الحالة، غالباً ما يكون الوصول عبر حلول الشركات من APIYI (apiyi.com) لنماذج سلسلة Gemini (بما في ذلك Nano Banana Pro) خياراً أكثر اقتصادية، حيث يمكن أن تصل التكلفة إلى 37% من السعر الرسمي، مع دعم الدفع بالعملة المحلية وفواتير ضريبة القيمة المضافة.

شرح مفصل لوحدة القياس GSU (وحدة توسيع الذكاء الاصطناعي التوليدي)

لفهم الـ PT (الإنتاجية المخصصة)، يجب أولاً فهم وحدة قياسها: GSU.

التعريف الرسمي لـ GSU

تُعد GSU وحدة سعة تمرير بيانات مجردة، حيث تظل التكلفة والسعة ثابتة بين جميع نماذج جوجل التي تدعم PT، لكن تختلف كفاءة استهلاك النماذج للـ GSU. بمعنى آخر:

  • سعر 1 GSU ثابت في جميع النماذج.
  • سعة 1 GSU (عدد الرموز/tokens الممررة في الثانية) ثابتة أيضاً في جميع النماذج.
  • لكن حجم استدعاء النموذج الفعلي الذي يمكن لـ 1 GSU دعمه يختلف من نموذج لآخر.

أمثلة على العلاقة بين GSU والنماذج

يوضح الجدول التالي علاقة تقديرية (يُرجى الاعتماد على البيانات الرسمية الأحدث من جوجل):

النموذج سعة التمرير لـ 1 GSU ملاحظات
Gemini 2.5 Flash-Lite مرتفعة نموذج خفيف، وحدة GSU الواحدة تدعم طلبات أكثر
Gemini 2.5 Flash متوسطة نموذج متوازن، الخيار المفضل للمؤسسات
Gemini 2.5 Pro منخفضة نموذج رائد، يستهلك GSU أكثر
Gemini 3 Pro الأدنى النموذج الرائد الجديد، استهلاك عالٍ لكل طلب
Gemini 3 Pro Image يحسب حسب أبعاد الصورة استهلاك صورة 4K أعلى بكثير من 1K

هذا يعني أنه إذا كانت شركتك تستخدم نماذج متعددة، فيجب عليك شراء التزام GSU لكل نموذج على حدة، وليس مشاركتها في مجمع (Pool) واحد.

كيفية تقدير كمية الـ GSU المطلوبة

تقدم جوجل حاسبة GSU رسمية، ولكن يمكن تبسيط فكرة التقدير كالتالي:

GSU المطلوبة = (ذروة QPS × متوسط الرموز لكل طلب) / (سعة التمرير لـ 1 GSU)

خطوات التقدير الفعلية للشركات:

  1. قياس ذروة الطلبات في الثانية (QPS) التاريخية.
  2. قياس متوسط الرموز (tokens) المستهلكة لكل طلب (المدخلات + المخرجات).
  3. التحقق من سعة التمرير لكل GSU للنموذج المستهدف.
  4. التقريب لأعلى، مع ترك هامش 20-30% للتعامل مع الزيادات المفاجئة.

الحد الأدنى للشراء وتدرج الـ GSU

عادةً ما يكون لطلب الـ PT حد أدنى من وحدات GSU (تختلف حسب النموذج والمنطقة). بعد توقيع العقد، يمكن للشركة:

  • إضافة GSU: زيادة الالتزام في أي وقت مع نمو الأعمال.
  • تقليل GSU: لا يمكن تقليل الكمية خلال فترة الالتزام الحالية.
  • ⚠️ تعديل عند التجديد: إعادة تقييم الحجم قبل نهاية فترة الالتزام.

Vertex AI مقابل AI Studio: توضيح ملكية الـ PT

هذه هي النقطة التي يخلط فيها معظم العملاء. تمتلك جوجل خطين مستقلين من منتجات الذكاء الاصطناعي التوليدي:

google-provisioned-throughput-pt-explained-vertex-vs-aistudio-2026-ar 图示

Vertex AI: منصة سحابية بمستوى الشركات

  • التبعية: Google Cloud Platform (GCP).
  • الجمهور المستهدف: الشركات، فرق التطوير الكبيرة، العملاء المهتمون بالامتثال والخصوصية.
  • الفوترة: حساب موحد عبر GCP، يدعم الدفع حسب الاستخدام، والالتزامات، والطلبات المجمعة.
  • لوحة التحكم: console.cloud.google.com → قائمة Vertex AI.
  • مسار API: *-aiplatform.googleapis.com.
  • دعم PT: ✅ نعم.
  • النشر الجغرافي: ✅ يدعم مناطق متعددة عالمياً.

AI Studio: بوابة Gemini للمطورين والأفراد

  • التبعية: Google AI for Developers (مستقل عن GCP).
  • الجمهور المستهدف: المطورون الأفراد، التجارب السريعة، صناع المحتوى.
  • الفوترة: حساب Google Pay شخصي، دفع حسب الاستخدام.
  • لوحة التحكم: aistudio.google.com.
  • مسار API: generativelanguage.googleapis.com.
  • دعم PT: ❌ لا.
  • النشر الجغرافي: ❌ مجمع عالمي موحد.

الاختلافات في كود ربط API

AI Studio (Gemini Developer API):

from google import genai
client = genai.Client(api_key="AIzaSy-xxx")  # مفتاح خاص بـ AI Studio
resp = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents="قطة برتقالية"
)

Vertex AI:

from google import genai
client = genai.Client(
    vertexai=True,
    project="your-gcp-project",  # معرف مشروع GCP
    location="us-central1"       # المنطقة
)
# المصادقة تتم عبر gcloud ADC / Service Account، لا حاجة لمفتاح API

لاحظ أن أسماء النماذج، طرق المصادقة، وتبعيات الفوترة تختلف بين الاثنين. إذا بدأت باستخدام مفتاح API الخاص بـ AI Studio، فلا يمكنك بأي حال من الأحوال شراء PT؛ يجب تفعيل Vertex AI تحت مشروع GCP واستخدام Service Account للمصادقة.

🎯 نصيحة للربط: إذا كنت لا ترغب في عناء فهم الحدود الفاصلة بين AI Studio و Vertex AI، أو تعقيدات حسابات الخدمة (Service Accounts) وتوجيه المسارات الإقليمية، يمكنك الربط مباشرة عبر APIYI (apiyi.com). نوفر وصولاً موحداً لمجموعة نماذج Gemini بالكامل باستخدام base_url و api_key متوافقين مع معايير OpenAI، ونتولى نحن التعامل مع نظام الحسابات والتوجيه برمجياً.

شرح مفصل لآلية الدفع حسب الاستخدام DSQ (Dynamic Shared Quota)

تُعد DSQ نمط الدفع الافتراضي حسب الاستخدام في Vertex AI، وهي الطريقة التي يعتمد عليها الغالبية العظمى من المستخدمين. فهمك لآلية DSQ هو المفتاح لاستيعاب القيمة الحقيقية لأولوية الإنتاجية المخصصة (PT).

الآلية الجوهرية لـ DSQ

مع DSQ، لا توجد حدود حصص محددة مسبقًا لاستخدامك. بدلاً من ذلك، توفر DSQ وصولاً إلى مجموعة كبيرة ومشتركة من الموارد، يتم تخصيصها ديناميكيًا بناءً على توفر الموارد في الوقت الفعلي والطلب اللحظي من جميع عملاء هذا النموذج.

نقاط رئيسية:

  • لا توجد حصص مسبقة: لا حاجة لتقديم طلب زيادة الحصة (QIR).
  • مجموعة موارد مشتركة: جميع عملاء الدفع حسب الاستخدام يتشاركون في نفس المجمع الكبير.
  • تخصيص ديناميكي: إعادة تقسيم الموارد بناءً على الطلب العالمي في الوقت الفعلي.
  • تقلبات في معدل النقل: في أوقات الذروة، قد ينخفض معدل النقل المتاح لكل مستخدم.

العلاقة بين أولوية DSQ و PT

توضح Google بشكل صريح:

يتم إعطاء الأولوية لعملاء الإنتاجية المخصصة (PT) وخدمتهم قبل طلبات الدفع حسب الاستخدام (On-demand).

هذه هي القيمة الجوهرية لـ PT: تتم معالجة الطلبات في طابور جدولة Google بأولوية أعلى. ويتجلى ذلك في:

  • طلبات PT ← تدخل في طابور مخصص عالي الأولوية، مما يضمن استجابة مستقرة.
  • طلبات DSQ ← تدخل في مجمع الموارد المشترك، حيث قد تواجه قيودًا في السرعة أو انتظارًا في أوقات الذروة.

سيناريوهات القيود النموذجية لـ DSQ

الشركات التي لا تشتري PT قد تواجه صعوبات في السيناريوهات التالية:

  1. ذروة عروض التجارة الإلكترونية: يتم الضغط على المجمع المشترك العالمي، مما يؤدي إلى تضاعف زمن الاستجابة (P99).
  2. توليد الصور في البث المباشر: تتطلب استجابة فورية، ولا يمكن تحمل تقلبات DSQ.
  3. الأعمال العابرة للحدود: استدعاءات من مناطق متعددة في وقت واحد، مع تفاوت كبير في سعة DSQ بين المناطق.
  4. الأسبوع الأول من إطلاق نموذج جديد: لم يتم فتح الحصص الرسمية من Google بالكامل، مما يجعل DSQ تحت ضغط كبير.

لكن تجدر الإشارة إلى: بالنسبة للشركات الصغيرة والمتوسطة التي يقل حجم استدعاءاتها عن 50 ألف طلب شهريًا أو 50 ألف صورة شهريًا، فإن استقرار DSQ كافٍ تمامًا، وشراء PT قد يعتبر استثمارًا زائدًا.

خيارات فترة الالتزام بـ PT وعملية الشراء

صُممت فترات الالتزام بـ PT لتغطية سيناريوهات متنوعة، بدءًا من التجربة وحتى العقود طويلة الأجل:

مقارنة بين فترات الالتزام الأربع

فترة الالتزام السيناريو النموذجي نسبة التكلفة الإجمالية المرونة
أسبوع واحد فعاليات قصيرة المدى / اختبار الذروة الأساس × 1 الأعلى
شهر واحد تخطيط الأعمال المستقر شهريًا ~الأساس × 0.95 متوسطة
3 أشهر التزام ربع سنوي للأعمال ~الأساس × 0.88 منخفضة
سنة واحدة عقد طويل الأجل + تثبيت الميزانية ~الأساس × 0.75 الأقل

يجب التحقق من الأسعار المحددة بعد تسجيل الدخول إلى وحدة تحكم GCP، حيث تختلف الأسعار باختلاف المناطق والنماذج.

خطوات شراء PT

google-provisioned-throughput-pt-explained-vertex-vs-aistudio-2026-ar 图示

الخطوات القياسية للشركات لشراء PT:

  1. حساب الاحتياجات: استخدم حاسبة GSU الرسمية من Google لتقدير السعة المطلوبة.
  2. إنشاء مشروع GCP: تفعيل Vertex AI API، وتكوين حساب الخدمة (Service Account).
  3. بدء الشراء: تقديم الطلب عبر GCP Console → Vertex AI → Provisioned Throughput.
  4. اختيار المعلمات: النموذج، المنطقة، عدد GSU، وفترة الالتزام.
  5. الموافقة المالية: الدفع ببطاقة ائتمان بالدولار أو عبر التحويل البنكي للشركات (ACH).
  6. التفعيل: عادة ما يتم التفعيل خلال 1-5 أيام عمل.
  7. تكوين API: إضافة معامل provisioned_throughput_id في الكود للتبديل إلى قناة PT.

مثال على استخدام API لـ PT

بعد تفعيل PT، يجب تحديد ذلك صراحة في كود الاستدعاء:

from google import genai
from google.genai import types

client = genai.Client(
    vertexai=True,
    project="your-gcp-project",
    location="us-central1"
)

resp = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents="قطة برتقالية",
    config=types.GenerateContentConfig(
        # تحديد معرف اشتراك PT، ليتم توجيه الطلب عبر القناة ذات الأولوية
        labels={"dedicated-capacity": "your-pt-subscription-id"}
    )
)

إذا لم يتم تحديد هذا المعامل، فسيستمر الطلب عبر قناة DSQ حتى لو كان هناك اشتراك PT نشط في الحساب.

مقارنة بين نماذج الفوترة الثلاثة لـ Vertex AI: PT مقابل DSQ مقابل Batch

توفر منصة Vertex AI ثلاثة نماذج للفوترة في وقت واحد، ويعد فهم الحدود الفاصلة بينها أمراً حاسماً لاتخاذ القرارات المؤسسية:

البعد Provisioned Throughput (PT) Dynamic Shared Quota (DSQ) Batch API
نموذج الفوترة دفع مسبق ثابت الدفع حسب الاستخدام الدفع حسب الاستخدام
سعر الوحدة نفس سعر الدفع حسب الاستخدام السعر الرسمي خصم 50%
الأولوية الأعلى (مخصصة) مجمع مشترك الأدنى (نافذة 24 ساعة)
الالتزام أسبوعي/شهري/فصلي/سنوي لا يوجد لا يوجد
التأخير (Latency) مستقر (منخفض) متذبذب غير متزامن (24 ساعة)
سيناريوهات الاستخدام تطبيقات الوقت الفعلي عالية التزامن الاستخدام اليومي العام المهام الضخمة غير المتصلة
عتبة البدء تبدأ من آلاف الدولارات تبدأ مجاناً تبدأ مجاناً

استراتيجية الدمج: PT + DSQ + Batch

تعتمد الشركات الناضجة عادةً على بنية فوترة هجينة:

  • PT لضمان الأعمال الأساسية في الوقت الفعلي: مثل توليد الصور في البث المباشر وتفاعل المستخدمين.
  • DSQ لتغطية حركة المرور اليومية: تمر معظم الطلبات غير الحرجة عبر نظام الدفع حسب الاستخدام.
  • Batch لمعالجة المهام الضخمة ليلاً: مثل إنشاء التقارير وتصنيف البيانات.

نصيحة للبنية الهجينة: إذا كان فريقك صغيراً ولا ترغب في بناء بنية معقدة متعددة القنوات، نوصي بالاتصال الموحد عبر APIYI (apiyi.com). لقد قمنا بتنفيذ توجيه ذكي في الخلفية: تمر الطلبات العاجلة عبر قناة VIP، وتمر المهام المجمعة عبر قناة Batch، وتمر الطلبات اليومية عبر القناة القياسية. كل هذا شفاف للمستخدم، حيث يمكنك الاستفادة من مزايا الاستراتيجية الهجينة باستخدام مفتاح API واحد فقط.

تقييم مفصل لسيناريوهات استخدام PT

أربع فئات من الشركات التي تستفيد حقاً من شراء PT

google-provisioned-throughput-pt-explained-vertex-vs-aistudio-2026-ar 图示

السيناريو الأول: أعمال الوقت الفعلي عالية التزامن
في حملات التجارة الإلكترونية الكبرى، ومنصات الفيديو القصيرة، وتفاعلات البث المباشر، حيث يتطلب الأمر ذروة تزامن > 50 طلباً/ثانية، قد يؤدي DSQ إلى تقييد السرعة، لذا يجب الاعتماد على PT للضمان.

السيناريو الثاني: مؤشرات P99 الصارمة للتأخير
تتطلب اتفاقية مستوى الخدمة (SLA) لتفاعل المستخدم أن يكون تأخير الحزمة الأولى P99 < 10 ثوانٍ، مثل أدوات الرسم بالذكاء الاصطناعي في الوقت الفعلي. عادةً ما يكون P99 لـ DSQ بين 15-30 ثانية، وهو ما لا يلبي المتطلبات.

السيناريو الثالث: تجاوز عتبة الاستهلاك الشهري
عندما يتجاوز الاستهلاك الشهري 50,000 دولار، يتم تخفيف تكلفة الالتزام الثابت لـ PT من خلال وفورات الحجم، ويمكن أن تصبح تكلفة الوحدة أقل من DSQ، وفي هذه الحالة يكون شراء PT أكثر توفيراً واستقراراً.

السيناريو الرابع: العزل التنظيمي الصارم
تتطلب قطاعات مثل التمويل والرعاية الصحية مجمعات موارد حصرية وإقرارات امتثال، ويوفر PT التزاماً واضحاً بعزل الإنتاجية.

خمس فئات من السيناريوهات غير المناسبة لـ PT

  1. حجم الاستخدام الشهري < 50 ألف طلب: التكلفة الثابتة لـ PT لا يتم توزيعها بشكل كافٍ، لذا فإن الدفع حسب الاستخدام أكثر جدوى.
  2. تقلبات كبيرة في حجم الأعمال: قد يؤدي الالتزام المسبق إلى هدر كبير في الموارد غير المستخدمة.
  3. الحاجة فقط لخفض سعر الوحدة: PT لا يخفض سعر الوحدة، بل يجب اختيار قنوات التجميع للتفاوض على الأسعار.
  4. الاستخدام المختلط لنماذج متعددة: كل نموذج يتطلب التزام GSU مستقلاً، مما يجعل التشغيل معقداً.
  5. الفرق الصغيرة: تفتقر إلى القدرات المالية والتشغيلية للالتزام بعقود طويلة الأمد بالدولار.

إذا كنت تندرج ضمن الفئات غير المناسبة لـ PT، يمكنك الحصول على سعر مؤسسي بخصم 37% عند الاتصال بجميع نماذج Gemini عبر APIYI (apiyi.com)، مع إمكانية إضافة مكافآت شحن تصل إلى 20%، مما يجعل سعر الوحدة الفعلي يصل إلى حوالي 32% من السعر الرسمي لـ Google — لتحصل على استقرار مقبول بـ سعر أقل.

الأسئلة الشائعة (FAQ)

س1: لقد قمت بالفعل بالتطوير باستخدام مفتاح API الخاص بـ Gemini في AI Studio، هل يمكنني شراء PT؟

لا. يُعد كل من AI Studio (Gemini Developer API) و Vertex AI نظامين منفصلين تماماً، وخدمة PT تابعة حصرياً لـ Vertex AI. لاستخدام PT، يجب عليك: ① إنشاء مشروع على GCP وتفعيل Vertex AI؛ ② الانتقال إلى طريقة المصادقة عبر حساب الخدمة (Service Account) في Vertex AI؛ ③ إعادة كتابة جزء من كود استدعاء النموذج. إذا كنت ترغب في تجنب هذه العملية، يمكنك استخدام APIYI (apiyi.com) للاتصال بـ Gemini مباشرة عبر base_url متوافق مع OpenAI، دون الحاجة للقلق بشأن نظام الحسابات الأساسي.

س2: هل سيكون سعر الوحدة بعد شراء PT أرخص من الدفع حسب الاستخدام؟

سعر الوحدة ثابت، ولكن عند توزيع التكلفة على "كل مليون توكن"، قد تكون التكلفة الإجمالية أقل عند الاستخدام واسع النطاق. الآلية هي: يتم محاسبة PT بناءً على التزام شهري ثابت، وإذا استفدت بالكامل من سعة GSU، فإن سعر الوحدة الفعلي يكون حوالي 80-95% من سعر DSQ؛ أما إذا لم تستفد منها بالكامل، فستكون التكلفة أعلى. لا تكمن قيمة PT في توفير المال فحسب، بل في ضمان معدل النقل (Throughput)، استقرار زمن الاستجابة، وأولوية أعلى.

س3: هل يمكن إلغاء أو تقليل عدد وحدات GSU في منتصف المدة؟

لا. بمجرد التعاقد، لا يمكن إلغاء أو تقليل عدد وحدات GSU خلال فترة الالتزام الحالية. يمكنك فقط اختيار التجديد أو عدمه عند انتهاء الدورة. التغيير الوحيد المسموح به هو إضافة وحدات GSU (عند توسع الأعمال). هذه هي أكبر نقطة مخاطرة في PT، حيث يجب أن يستند الالتزام المدفوع مسبقاً إلى تقديرات متحفظة للاستخدام.

س4: هل يدعم Gemini 3 Pro Image (Nano Banana Pro) خدمة PT؟

اعتباراً من أبريل 2026، ووفقاً لقائمة الدعم الرسمية من Google، فإن سلسلة نماذج Gemini 3 Pro (بما في ذلك gemini-3-pro-image-preview) تدعم الآن Provisioned Throughput. ولكن تجدر الإشارة إلى أن استهلاك GSU لنماذج الصور يتم حسابه بناءً على أبعاد الصورة والتوكنز، حيث أن استهلاك GSU لطلب صورة بدقة 4K أعلى بكثير من صورة بدقة 1K. يرجى الرجوع إلى البيانات الرسمية من Google لمعرفة معاملات الاستهلاك الدقيقة. للمقارنة السريعة للتكاليف، يمكنك التواصل مع فريق المبيعات في APIYI (apiyi.com) للحصول على جدول مقارنة أسعار حلول الشركات.

س5: ليس لدي حساب GCP ولا بطاقة ائتمان دولية، هل يمكنني الاستفادة من قناة ذات أولوية مشابهة لـ PT؟

نعم. توفر حلول الشركات من APIYI (apiyi.com) قناة ذات أولوية مشابهة من خلال تجميع حسابات متعددة + طابور انتظار VIP خاص، حيث يمكنك التفعيل باستخدام كيان تجاري محلي والدفع بالعملة المحلية. زمن الاستجابة (P99) في القناة المخصصة للشركات يعادل القناة الرسمية من Google، وهو كافٍ للعملاء الذين يستهلكون أقل من 50 ألف صورة شهرياً، بتكلفة لا تتجاوز 32-37% من سعر الدفع حسب الاستخدام الرسمي.

س6: هل يمكن استخدام PT و Google Batch API معاً؟

نعم. تعمل Batch API عبر قناة غير متزامنة مستقلة، ولا تتعارض مع PT أو DSQ. تعتمد البنية التحتية الناضجة على الجمع بين الثلاثة: الطلبات الحيوية الفورية تمر عبر PT، الطلبات اليومية عبر DSQ، والمهام الضخمة الليلية عبر Batch (التي تتمتع بخصم 50%). هذا "الدمج بين القنوات الثلاث" يعظم كفاءة التكلفة الإجمالية.

الخلاصة

بالعودة إلى السؤال الجوهري في هذا المقال—ما هي خدمة Provisioned Throughput (PT) من Google؟ وإلى أي نظام تنتمي؟

الإجابة المختصرة هي: PT هي اشتراك لحجز معدل النقل على مستوى الشركات ضمن Google Cloud Vertex AI (GCP)، وتُقاس بوحدات GSU (Generative AI Scale Unit)، وتتوفر لفترات التزام مدتها أسبوع / شهر / 3 أشهر / سنة. خلال فترة الالتزام، لا ينخفض سعر الوحدة ولكن يتم توفير أولوية في الجدولة ومعدل نقل مستقر. وهي لا علاقة لها بـ AI Studio (generativelanguage.googleapis.com)، وتشكل مع آلية الدفع حسب الاستخدام DSQ (Dynamic Shared Quota) هيكلاً ثنائياً يجمع بين "الأولوية مقابل المشاركة".

بالنسبة للغالبية العظمى من الشركات الصغيرة والمتوسطة والمطورين الأفراد وصناع المحتوى، تعتبر عتبة الدخول وشروط الالتزام في PT مرتفعة للغاية. المسار الأكثر عملية هو الوصول إلى سلسلة نماذج Gemini عبر منصات تجميع مثل APIYI (apiyi.com)، للاستمتاع بقناة مستقرة على مستوى الشركات بسعر أقل (خصم 63%)، مع تجنب تعقيدات الحسابات العابرة للحدود، المدفوعات الدولية، ومتطلبات الامتثال باللغة الإنجليزية.

فقط عندما يصل حجم أعمالك فعلياً إلى واحدة من عتبات PT الأربع (حجم طلبات متزامن عالٍ، زمن استجابة P99 منخفض، استهلاك شهري > 50 ألف دولار، أو متطلبات تنظيمية صارمة)، يكون استثمار الوقت في دراسة وشراء PT خياراً منطقياً.

📌 توقيع المؤلف: تم إعداد هذا المحتوى بواسطة فريق حلول الشركات في APIYI (apiyi.com)، بناءً على الوثائق الرسمية لـ Google Cloud Vertex AI وسياسات الشركات المحدثة في أبريل 2026. إذا كنت بحاجة إلى تقييم سريع لمعرفة ما إذا كانت أعمالك مناسبة لـ PT أم للوصول عبر منصات التجميع، نرحب بتواصلك معنا عبر بوابة المبيعات على موقعنا الإلكتروني للحصول على تحليل فردي.

موضوعات ذات صلة