|

Nano Banana 2 ضبط response_modalities=IMAGE للعودة للصور فقط، كم يمكن توفير الرموز؟ تحليل عملي للفوترة


title: "تحليل عميق: كيف يوفر ضبط response_modalities على ['Image'] في Nano Banana 2 التكاليف؟"
description: "تحليل مفصل لاستهلاك الرموز المميزة (Tokens) عند ضبط response_modalities على ['Image'] فقط في Nano Banana 2، مع تفكيك قواعد حساب تكاليف رموز الصور والنص والتفكير، وتقديم استراتيجية التكوين الأمثل للتوفير."
date: 2024-06-10
categories: ["تحليل تقني", "نماذج اللغة الكبيرة", "توليد الصور"]
tags: ["Nano Banana 2", "APIYI", "توليد الصور", "تحسين التكلفة", "رموز مميزة"]
author: "محلل تقني"

nano-banana-2-response-modalities-image-only-token-cost-guide-ar 图示

عند استدعاء Nano Banana 2 لتوليد الصور، يمكن ضبط معامل response_modalities بطريقتين: ["Text", "Image"] (الوضع الافتراضي) و ["Image"] (الصور فقط). السؤال الطبيعي الذي يطرح نفسه هو: ما مقدار الرموز المميزة (Tokens) والتكاليف التي يمكن توفيرها عند ضبطه على إرجاع الصور فقط؟

القيمة الأساسية: بعد قراءة هذا المقال، ستكون قد فهمت تمامًا قواعد حساب التكاليف للأنواع الثلاثة من رموز الإخراج في Nano Banana 2 (الصور/النص/التفكير)، وستعرف بالضبط مقدار التوفير الذي يجلبه response_modalities=["Image"]، بالإضافة إلى استراتيجيات التوفير الفعالة حقًا.

قواعد تسعير الأنواع الثلاثة لـ Token الإخراج في Nano Banana 2

لا يعتمد تسعير إخراج Nano Banana 2 على "سعر واحد" بسيط، بل يتم تقسيمه إلى ثلاثة أنواع من الـ Tokens يتم تسعيرها بشكل مستقل:

نوع الـ Token سعر الوحدة الشرح هل يمكن إزالته عبر المعلمات؟
Token إخراج الصورة $60.00 / مليون Token الـ Tokens المستهلكة في توليد الصورة، تشكل أكثر من 95%+ من التكلفة الإجمالية ❌ لا (المخرجات الأساسية)
Token إخراج النص $3.00 / مليون Token الوصف النصي أو الشرح المصاحب للصورة ✅ نعم، يمكن إزالته عن طريق تعيين ["Image"]
Token التفكير (Thinking) $3.00 / مليون Token المستهلكة في عملية الاستدلال الداخلية للنموذج ❌ يتم توليدها دائمًا، لا يمكن إيقافها
Token الإدخال $0.50 / مليون Token نص الموجه (prompt) الخاص بك والصورة المرجعية ⚠️ يمكن تحسين طول الموجه

Token الصورة في Nano Banana 2 هو الجزء الأكبر من التكلفة بشكل مطلق

الرقم الحاسم: سعر وحدة Token إخراج الصورة هو $60 لكل مليون، بينما سعر وحدة Token النص والتفكير هو $3 لكل مليون فقط — Token الصورة أغلى بـ 20 ضعفًا.

الدقة Token إخراج الصورة تكلفة الصورة نسبة التكلفة من إجمالي الإخراج
512 بكسل ~747 ~$0.045 ~95%
1K (الافتراضي) ~1,120 ~$0.067 ~96%
2K ~1,680 ~$0.101 ~97%
4K ~2,520 ~$0.151 ~97%

🔑 الاستنتاج الأساسي: تشكل Token الصورة 95-97% من تكلفة الإخراج الإجمالية. بينما تشكل Token النص والتفكير معًا 3-5% فقط. لذلك، حتى إذا أزلت إخراج النص تمامًا، فإن التوفير في التكاليف سيكون محدودًا جدًا.


مقارنة الـ Tokens بين إعدادي response_modalities

nano-banana-2-response-modalities-image-only-token-cost-guide-ar 图示

الإعداد ["Text", "Image"] — الوضع الافتراضي

بشكل افتراضي، يُرجع Nano Banana 2 صورة + وصف نصي. سيقوم النموذج أولاً بـ "التفكير" (Thinking)، ثم يُخرج وصفًا نصيًا وصورة.

from google import genai
from google.genai import types

client = genai.Client(api_key="YOUR_API_KEY")

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="توليد قطة ترتدي بدلة فضاء",
    config=types.GenerateContentConfig(
        response_modalities=["Text", "Image"],  # الافتراضي: نص+صورة
    )
)

محتوى الإخراج: وصف نصي (مثل "هذه قطة برتقالية ترتدي بدلة فضاء…") + صورة واحدة

تكوين استهلاك الـ Tokens (بدقة 1K كمثال):

  • Token التفكير: ~200-800 (يختلف حسب تعقيد الموجه)
  • Token إخراج النص: ~50-200
  • Token إخراج الصورة: ~1,120

الإعداد ["Image"] — وضع الصورة فقط

يتم تعيينه لإرجاع الصور فقط، دون وصف نصي.

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="توليد قطة ترتدي بدلة فضاء",
    config=types.GenerateContentConfig(
        response_modalities=["Image"],  # صورة فقط، لا يُرجع نصًا
    )
)

محتوى الإخراج: صورة واحدة فقط، بدون وصف نصي

تكوين استهلاك الـ Tokens (بدقة 1K كمثال):

  • Token التفكير: ~200-800 (ما زال يتم توليده، وما زال يُحتسب)
  • Token إخراج النص: 0 (تمت إزالته ✅)
  • Token إخراج الصورة: ~1,120 (ثابت)

مقارنة التكلفة بين وضعي Nano Banana 2

عنصر المقارنة ["Text", "Image"] الافتراضي ["Image"] صورة فقط الفرق
Token الصورة (~1,120) $0.0672 $0.0672 0 (ثابت)
Token التفكير (~500) $0.0015 $0.0015 0 (ثابت)
Token النص (~100) $0.0003 $0 توفير $0.0003
التكلفة الإجمالية للصورة الواحدة (1K) ~$0.069 ~$0.069 توفير ~0.4%

⚠️ الخلاصة: response_modalities=["Image"] يؤدي بالفعل إلى توفير Token إخراج النص، ولكن نظرًا لأن سعر وحدة Token النص هو $3 لكل مليون فقط وعددها قليل جدًا (حوالي 50-200 Token)، فإن التوفير الفعلي لكل صورة هو حوالي $0.0001-$0.0006 فقط، وهو مبلغ يمكن تجاهله تقريبًا.


لماذا لا يمكن الاستغناء عن رموز التفكير في Nano Banana 2؟

هذه هي النقطة الأكثر إهمالًا في تسعير Nano Banana 2: رموز التفكير تُنتَج دائمًا، وتُحتسَب دائمًا، سواء كنت ترى عملية التفكير أم لا.

توضح الوثائق الرسمية من Google بوضوح:

يتم احتساب رسوم رموز التفكير بغض النظر عن ضبط includeThoughts على true أو false، لأن عملية التفكير تحدث دائمًا بشكل افتراضي.

هذا يعني:

  • includeThoughts=True: يمكنك رؤية عملية التفكير، تُحتسَب الرسوم
  • includeThoughts=False: لا يمكنك رؤية عملية التفكير، تُحتسَب الرسوم أيضًا
  • معدل احتساب رسوم رموز التفكير: 3 دولارات لكل مليون رمز (مثل ناتج النص)

يدعم Nano Banana 2 مستويين للتفكير:

مستوى التفكير طريقة الضبط استهلاك رموز التفكير جودة الصورة السيناريو الموصى به
minimal الافتراضي ~200-500 كافية لمعظم السيناريوهات توليد الصور اليومي
high thinking_level="high" ~500-2000 أفضل في السيناريوهات المعقدة شخصيات متعددة/تكوين دقيق

💡 نصيحة للتحسين: إذا لم تكن بحاجة إلى جودة فائقة للصور، حافظ على مستوى التفكير الافتراضي minimal. مستوى high يزيد مئات إلى آلاف رموز التفكير، ورغم أن سعر الوحدة منخفض (3 دولارات لكل مليون رمز)، إلا أنه يمثل تكلفة في سيناريوهات الدُفعات.


استراتيجيات التوفير الفعالة حقًا في Nano Banana 2

بما أن response_modalities=["Image"] لا توفر الكثير، ما هي الاستراتيجيات الفعالة حقًا؟

nano-banana-2-response-modalities-image-only-token-cost-guide-ar 图示

استراتيجية التوفير نسبة التوفير الإجراء المحدد التوصية
اختيار الدقة المناسبة حتى 70% 4K→512px تنخفض التكلفة من 0.151 دولار إلى 0.045 دولار ⭐⭐⭐⭐⭐
استخدام APIYI حسب الاستخدام حتى 70% 0.045 دولار/صورة (بما في ذلك 4K)، لا تفرق بين الدقة ⭐⭐⭐⭐⭐
استخدام APIYI حسب الحجم حتى 63% دقة منخفضة فقط 0.018 دولار/صورة (512px) ⭐⭐⭐⭐⭐
Google Batch API 50% معالجة دُفعية غير متزامنة، رموز الصور بنصف السعر ⭐⭐⭐⭐
التفكير الأدنى (minimal) 2-5% الحفاظ على مستوى التفكير الافتراضي ⭐⭐⭐
response_modalities=["Image"] ~0.4% إزالة ناتج النص

مقارنة أسعار Nano Banana 2 للدقات المختلفة عبر المنصات

الدقة Google الرسمي APIYI حسب الاستخدام APIYI حسب الحجم أقصى توفير
512px 0.045 دولار 0.045 دولار 0.018 دولار 60%
1K 0.067 دولار 0.045 دولار 0.025 دولار 63%
2K 0.101 دولار 0.045 دولار 0.03 دولار 70%
4K 0.151 دولار 0.045 دولار 0.045 دولار 70%

🎯 أفضل الممارسات: إذا كان عملك يسمح باستخدام 1K بدلاً من 4K، فستوفر 55% مباشرة. وبالاقتران مع التسعير حسب الحجم من APIYI apiyi.com، تصبح دقة 1K فقط 0.025 دولار/صورة، مما يوفر 83% مقارنة بـ 0.151 دولار للدقة 4K الرسمية. توفر المنصة أيضًا أداة اختبار مجانية لتوليد الصور AI 图片大师: imagen.apiyi.com، مما يتيح لك التحقق من تأثيرات الدقات المختلفة بسرعة دون كتابة كود.


الإعداد الأمثل لاستدعاء Nano Banana 2 عبر APIYI

بناءً على التحليل السابق، إليك الإعداد الأمثل الموصى به:

import requests
import base64

API_KEY = "your-apiyi-api-key"
ENDPOINT = "https://api.apiyi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent"

headers = {
    "Content-Type": "application/json",
    "x-goog-api-key": API_KEY
}

payload = {
    "contents": [{"parts": [{"text": "قطة ترتدي بدلة فضاء، بأسلوب الفن الرقمي"}]}],
    "generationConfig": {
        "responseModalities": ["IMAGE"],  # صور فقط، لتوفير وحدات النص (Token)
        "imageConfig": {
            "aspectRatio": "1:1",
            "imageSize": "1K"  # اختر الدقة حسب الحاجة، هذا هو مفتاح التوفير
        }
    }
}

response = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120)
result = response.json()

image_data = result["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
with open("output.png", "wb") as f:
    f.write(base64.b64decode(image_data))

توصية: عند استدعاء Nano Banana 2 عبر APIYI على apiyi.com، يكون التسعير حسب الاستخدام 0.045 دولار لكل صورة بغض النظر عن الدقة، والتسعير حسب الحجم يبدأ من 0.018 دولار لكل صورة. يدعم الاستدعاء بالتنسيق الأصلي من Google، مما يجعل عملية النقل خالية من التكلفة.


الأسئلة الشائعة

س1: هل سيتم توليد وحدات التفكير (Thinking Token) عند تعيين response_modalities=[“Image”]؟

نعم. عملية التفكير (Thinking) في Nano Banana 2 مفعلة بشكل افتراضي ولا يمكن إيقافها. سواء عيّنت response_modalities إلى ["Image"] أو ["Text", "Image"]، أو حتى إذا عيّنت includeThoughts إلى true أو false، سيتم توليد وحدات التفكير (Token) وفرض تكلفتها. الخبر الجيد هو أن وحدات التفكير (Token) تُحسب بمعدل النص البالغ 3 دولارات لكل مليون وحدة، وهو أقل بكثير من معدل وحدات الصور البالغ 60 دولارًا لكل مليون وحدة.

س2: إذن ما فائدة تعيين [“Image”]؟

قيمتها الرئيسية في نقطتين: أولاً، تقليل حجم البيانات المنقولة عبر الشبكة، حيث أن عدم إرجاع محتوى نصي يعني تحليل استجابة أسرع. ثانيًا، تبسيط منطق الكود، فلا حاجة لمعالجة إضافية للجزء النصي. على الرغم من أن التوفير في التكلفة أقل من 1%، إلا أنه في السيناريوهات التي تتطلب إخراج صور خالصة (مثل إنتاج المواد الدفعية)، فإن الحصول على الصورة مباشرة يكون أكثر ملاءمة.

س3: أيهما أكثر توفيرًا عند استخدام APIYI، التسعير حسب الاستخدام أم حسب الحجم؟

يعتمد ذلك على الدقة التي تستخدمها بشكل متكرر. التسعير حسب الاستخدام (0.045 دولار لكل صورة) لا يميز بين الدقات، وهو مناسب للسيناريوهات التي تنتج صورًا كبيرة الحجم (2K/4K) بشكل متكرر. التسعير حسب الحجم يحسب التكلفة بشكل مرن بناءً على استهلاك الوحدات (Token)، حيث تبلغ تكلفة الصورة منخفضة الدقة (512 بكسل) حوالي 0.018 دولار فقط، وهو مناسب لسيناريوهات إنتاج الصور منخفضة الدقة بشكل دفعي. يمكنك استخدام كلا نمطي التسعير بمجرد التسجيل عبر APIYI على apiyi.com.


الخلاصة

التحليل الأساسي لتكاليف response_modalities في Nano Banana 2:

  1. رموز الصور هي التكلفة الرئيسية المطلقة: سعر $60 لكل مليون رمز يشكل 95-97% من إجمالي تكاليف الإخراج، بينما تشكل رموز النص والتفكير معًا 3-5% فقط.
  2. تعيين ["Image"] لا يوفر الكثير: يلغي فقط رموز إخراج النص، مما يوفر حوالي $0.0003 لكل صورة (أقل من 0.5%).
  3. لا يمكن إلغاء رموز التفكير: يتم توليدها دائمًا وتحسب تكلفتها، بمعدل $3 لكل مليون رمز، بغض النظر عن إعداد response_modalities.
  4. التوفير الحقيقي يعتمد على الدقة والمنصة: اختيار الدقة المناسب يمكن أن يوفر 70%، واستخدام APIYI يمكن أن يوفر 63% إضافية.

نوصي باستدعاء Nano Banana 2 عبر APIYI على apiyi.com، بسعر $0.045 لكل صورة (بما في ذلك 4K) مع عدم وجود قيود على الدقة، أو انخفاض السعر إلى $0.018 لكل صورة عند الدفع حسب الحجم. المنصة لا تضع قيودًا على الطلبات المتزامنة، وتدعم استدعاءات بتنسيق Google الأصلي، وتأتي مع أداة مجانية لتوليد الصور: imagen.apiyi.com.


📚 المراجع

  1. صفحة تسعير Google Gemini API: جدول الأسعار الرسمي لرموز Nano Banana 2

    • الرابط: ai.google.dev/gemini-api/docs/pricing
    • الشرح: عرض أحدث أسعار رموز الصور/النص/التفكير
  2. وثائق توليد الصور من Google AI: شرح معامل response_modalities

    • الرابط: ai.google.dev/gemini-api/docs/image-generation
    • الشرح: توضح الوثائق الرسمية طرق تكوين الوضعين ["Image"] و ["Text","Image"]
  3. وثائق عد الرموز من Google AI: فهم تكوين الرموز والفوترة

    • الرابط: ai.google.dev/gemini-api/docs/tokens
    • الشرح: فهم العلاقة بين عدد رموز إخراج الصور والدقة
  4. وثائق APIYI الخاصة بـ Nano Banana 2: تفاصيل وضعي الفوترة (لكل استدعاء/حسب الحجم)

    • الرابط: docs.apiyi.com/en/api-capabilities/nano-banana-2-image
    • الشرح: شرح خطط الفوترة وطرق الاستدعاء على منصة APIYI

المؤلف: فريق APIYI التقني
النقاش التقني: نرحب بالنقاش في قسم التعليقات، للمزيد من المصاطب تفضل بزيارة مركز وثائق APIYI على docs.apiyi.com

موضوعات ذات صلة