|

Nano Banana 2 configuration response_modalities=IMAGE, combien de tokens peut-on économiser en ne renvoyant que des images ? Analyse de facturation basée sur des tests réels.

Note de l'auteur : Analyse approfondie des différences de consommation de tokens lorsque Nano Banana 2 est configuré avec response_modalities sur IMAGE (retourne uniquement l'image). Décortication des règles de facturation pour les trois types de tokens (image/texte/réflexion) et proposition de la configuration optimale pour économiser.

Analyse des coûts des tokens Nano Banana 2 Répartition des coûts pour une image 1K – Mode Image uniquement Répartition des coûts (1K) 96% Image Coût principal Tokens Image 96% (Coût principal) Tokens Réflexion 3% (Peut être réduit) Tokens Texte 1% (Négligeable) Comparaison des modes Mode par défaut Tokens Image (96%) 3% Tokens Réflexion Tokens Texte (1%) Coût total : ~Nano Banana 2 — Détail de la tarification des trois types de tokens de sortie tokens Mode Image uniquement Tokens Image (96%) 3% Tokens Réflexion Tokens Texte (0%) Économie : ~response_modalities=[« Image »] permet d’économiser combien d’argent ?% Conclusion L’économie réelle est minime. L’astuce pour économiser est de réduire la résolution. apiyi.com | Analyse des coûts des tokens Nano Banana 2

Lors de l'appel à Nano Banana 2 pour générer une image, le paramètre response_modalities peut être configuré de deux manières : ["Text", "Image"] (par défaut) et ["Image"] (image uniquement). Une question naturelle se pose : En configurant pour ne retourner que l'image, combien de tokens et d'argent peut-on économiser ?

Valeur clé : Après avoir lu cet article, vous comprendrez parfaitement les règles de facturation des trois types de tokens de sortie de Nano Banana 2 (image/texte/réflexion), vous saurez exactement combien d'argent response_modalities=["Image"] permet d'économiser, et vous découvrirez les stratégies d'économie réellement efficaces.


Règles de facturation des trois types de tokens de sortie de Nano Banana 2

La facturation des sorties de Nano Banana 2 n'est pas un simple "prix unique", mais est divisée en trois types de tokens facturés indépendamment :

Type de token Prix unitaire Description Peut-il être éliminé par paramètre ?
Token de sortie d'image 60,00 $ / M de tokens Tokens consommés pour générer l'image, représentant 95 %+ du coût total ❌ Non (production principale)
Token de sortie de texte 3,00 $ / M de tokens Description/texte accompagnant l'image ✅ Oui, en définissant ["Image"]
Token de réflexion (Thinking) 3,00 $ / M de tokens Consommés pendant le processus de raisonnement interne du modèle ❌ Toujours générés, impossible à désactiver
Token d'entrée 0,50 $ / M de tokens Votre invite de texte et image de référence ⚠️ Optimisable en réduisant la longueur de l'invite

Les tokens d'image de Nano Banana 2 représentent l'écrasante majorité du coût

Chiffre clé : le prix unitaire des tokens de sortie d'image est de 60 $/M, tandis que celui des tokens de texte et de réflexion n'est que de 3 $/M — les tokens d'image sont 20 fois plus chers.

Résolution Tokens de sortie d'image Coût de l'image Proportion du coût total de sortie
512px ~747 ~0,045 $ ~95 %
1K (par défaut) ~1 120 ~0,067 $ ~96 %
2K ~1 680 ~0,101 $ ~97 %
4K ~2 520 ~0,151 $ ~97 %

🔑 Conclusion principale : Les tokens d'image représentent 95 à 97 % du coût total des sorties. Les tokens de texte et de réflexion combinés ne représentent que 3 à 5 %. Même en éliminant complètement la sortie texte, les économies sont donc très limitées.


Comparaison des tokens pour les deux configurations de response_modalities

nano-banana-2-response-modalities-image-only-token-cost-guide-fr 图示

Configuration ["Text", "Image"] — Mode par défaut

Par défaut, Nano Banana 2 renvoie une image + une description textuelle. Le modèle va d'abord "réfléchir" (Thinking), puis produire une description textuelle et une image.

from google import genai
from google.genai import types

client = genai.Client(api_key="YOUR_API_KEY")

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="Générez un chat en combinaison spatiale",
    config=types.GenerateContentConfig(
        response_modalities=["Text", "Image"],  # Par défaut : texte + image
    )
)

Contenu de sortie : Une description textuelle (par exemple, "C'est un chat roux en combinaison spatiale…") + 1 image

Composition de la consommation de tokens (exemple pour une résolution 1K) :

  • Tokens de réflexion : ~200-800 (varie selon la complexité de l'invite)
  • Tokens de sortie de texte : ~50-200
  • Tokens de sortie d'image : ~1 120

Configuration ["Image"] — Mode image uniquement

Configure le modèle pour ne renvoyer que l'image, sans description textuelle.

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="Générez un chat en combinaison spatiale",
    config=types.GenerateContentConfig(
        response_modalities=["Image"],  # Image uniquement, pas de texte
    )
)

Contenu de sortie : Seulement 1 image, pas de description textuelle

Composition de la consommation de tokens (exemple pour une résolution 1K) :

  • Tokens de réflexion : ~200-800 (toujours générés, toujours facturés)
  • Tokens de sortie de texte : 0 (éliminés ✅)
  • Tokens de sortie d'image : ~1 120 (inchangé)

Comparaison des coûts des deux modes de Nano Banana 2

Point de comparaison ["Text", "Image"] par défaut ["Image"] image uniquement Différence
Tokens d'image (~1 120) 0,0672 $ 0,0672 $ 0 (inchangé)
Tokens de réflexion (~500) 0,0015 $ 0,0015 $ 0 (inchangé)
Tokens de texte (~100) 0,0003 $ 0 $ Économie de 0,0003 $
Coût total par image (1K) ~0,069 $ ~0,069 $ Économie de ~0,4 %

⚠️ Conclusion : response_modalities=["Image"] permet effectivement d'économiser les tokens de sortie de texte, mais comme leur prix unitaire n'est que de 3 $/M et qu'ils sont peu nombreux (environ 50-200), l'économie réelle par image n'est que d'environ 0,0001 $ à 0,0006 $, ce qui est presque négligeable.


Pourquoi les Thinking Token de Nano Banana 2 ne peuvent-ils pas être supprimés ?

C'est le point le plus facilement négligé dans la tarification de Nano Banana 2 : Les Thinking Token sont toujours générés et toujours facturés, que vous visualisiez ou non le processus de réflexion.

La documentation officielle de Google le précise clairement :

Les Thinking Token sont facturés que le paramètre includeThoughts soit défini sur true ou false, car le processus de réflexion se produit toujours par défaut.

Cela signifie que :

  • includeThoughts=True : Vous voyez le processus de réflexion, facturé
  • includeThoughts=False : Vous ne voyez pas le processus de réflexion, toujours facturé
  • Taux de facturation des Thinking Token : 3$/M (identique à la sortie texte)

Nano Banana 2 prend en charge deux niveaux de réflexion (Thinking) :

Niveau de réflexion Méthode de configuration Consommation de Thinking Token Qualité d'image Scénario recommandé
minimal Par défaut ~200-500 Suffisante pour la plupart des scénarios Génération d'images quotidienne
high thinking_level="high" ~500-2000 Meilleure pour les scénarios complexes Multi-personnages / Composition précise

💡 Conseil d'optimisation : Si vous n'avez pas besoin d'une qualité d'image extrême, conservez le niveau de réflexion par défaut minimal. Le niveau high ajoutera des centaines à des milliers de Thinking Token supplémentaires. Bien que le prix unitaire soit bas (3$/M), cela représente un coût supplémentaire dans des scénarios de traitement par lots.


Stratégies réellement efficaces pour économiser avec Nano Banana 2

Puisque response_modalities=["Image"] ne permet pas de faire de grosses économies, quelles stratégies sont réellement efficaces ?

nano-banana-2-response-modalities-image-only-token-cost-guide-fr 图示

Stratégie d'économie Taux d'économie Action concrète Recommandation
Choisir une résolution adaptée Jusqu'à 70% 4K→512px : coût passe de 0.151$ à 0.045$ ⭐⭐⭐⭐⭐
Utiliser APIYI en paiement par requête Jusqu'à 70% 0.045$/image (inclut 4K), pas de distinction de résolution ⭐⭐⭐⭐⭐
Utiliser APIYI en paiement par volume Jusqu'à 63% Basse résolution seulement 0.018$/image (512px) ⭐⭐⭐⭐⭐
Google Batch API 50% Traitement par lots hors ligne, Token image à moitié prix ⭐⭐⭐⭐
Thinking minimal 2-5% Conserver le niveau de réflexion par défaut ⭐⭐⭐
response_modalities=["Image"] ~0.4% Supprimer la sortie texte

Comparaison des prix de Nano Banana 2 par résolution sur différentes plateformes

Résolution Google Officiel APIYI par requête APIYI par volume Économie maximale
512px 0.045$ 0.045$ 0.018$ 60%
1K 0.067$ 0.045$ 0.025$ 63%
2K 0.101$ 0.045$ 0.03$ 70%
4K 0.151$ 0.045$ 0.045$ 70%

🎯 Meilleure pratique : Si votre activité permet d'utiliser 1K au lieu de 4K, vous économisez directement 55%. En combinant cela avec le paiement par volume d'APIYI sur apiyi.com, la résolution 1K ne coûte que 0.025$/image, soit 83% d'économie par rapport au prix officiel de 0.151$ pour du 4K. La plateforme propose également un outil de test de génération d'images gratuit AI 图片大师: imagen.apiyi.com, permettant de valider rapidement l'effet de différentes résolutions sans écrire de code.

Configuration optimale pour appeler Nano Banana 2 via APIYI

En synthétisant l'analyse précédente, voici la configuration optimale recommandée :

import requests
import base64

API_KEY = "your-apiyi-api-key"
ENDPOINT = "https://api.apiyi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent"

headers = {
    "Content-Type": "application/json",
    "x-goog-api-key": API_KEY
}

payload = {
    "contents": [{"parts": [{"text": "Un chat en combinaison spatiale, style art numérique"}]}],
    "generationConfig": {
        "responseModalities": ["IMAGE"],  # Image uniquement, économise les tokens texte
        "imageConfig": {
            "aspectRatio": "1:1",
            "imageSize": "1K"  # Choisissez la résolution selon vos besoins, c'est la clé pour économiser
        }
    }
}

response = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120)
result = response.json()

image_data = result["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
with open("output.png", "wb") as f:
    f.write(base64.b64decode(image_data))

Recommandation : En appelant Nano Banana 2 via APIYI sur apiyi.com, la facturation à l'usage est de $0.045/image, quelle que soit la résolution. La facturation au volume démarre à $0.018/image. Compatible avec le format natif Google, migration sans coût.


Questions fréquentes

Q1 : Les tokens de réflexion sont-ils toujours générés si on définit response_modalities=[« Image »] ?

Oui. Le processus de réflexion (Thinking) de Nano Banana 2 est activé par défaut et ne peut pas être désactivé. Que vous définissiez response_modalities sur ["Image"] ou ["Text", "Image"], et que includeThoughts soit true ou false, les tokens de réflexion seront toujours générés et facturés. La bonne nouvelle est que ces tokens sont facturés au tarif texte de $3/M, bien inférieur au tarif image de $60/M.

Q2 : Quel est alors l’intérêt de définir [« Image »] ?

Il y a deux avantages principaux : premièrement, réduire le volume de données transmises (pas de contenu texte retourné signifie un parsing de la réponse plus rapide) ; deuxièmement, simplifier la logique du code (pas besoin de traiter une partie texte supplémentaire). L'économie sur les coûts est inférieure à 1%, mais dans les scénarios nécessitant une sortie purement image (comme la production de masse de ressources), obtenir directement l'image est plus pratique.

Q3 : Quelle est la méthode de facturation la plus avantageuse avec APIYI : à l’usage ou au volume ?

Cela dépend de votre résolution habituelle. La facturation à l'usage à $0.045/image (toutes résolutions confondues) convient aux scénarios produisant fréquemment des images en 2K/4K. La facturation au volume, basée sur la consommation de tokens, est flexible : les basses résolutions (512px) coûtent seulement $0.018/image, idéal pour la production en masse d'images basse résolution. Inscrivez-vous sur APIYI (apiyi.com) pour utiliser les deux modes de facturation.


Résumé

Points clés de l'analyse de facturation du paramètre response_modalities pour Nano Banana 2 :

  1. Les tokens d'image dominent largement : Le prix de $60/M pour les tokens d'image représente 95 à 97 % du coût total de sortie. Les tokens de texte et de raisonnement combinés ne représentent que 3 à 5 %.
  2. Définir ["Image"] n'économise pas beaucoup : Cela élimine uniquement les tokens de sortie de texte, économisant environ $0.0003 par image (moins de 0.5 %).
  3. Les tokens de raisonnement sont inévitables : Ils sont toujours générés et facturés, à un taux de $3/M, indépendamment du paramètre response_modalities.
  4. Les vraies économies viennent de la résolution et de la plateforme : Choisir une résolution appropriée peut économiser jusqu'à 70 %. Utiliser APIYI permet d'économiser 63 % supplémentaires.

Nous recommandons d'utiliser APIYI (apiyi.com) pour invoquer Nano Banana 2. Le tarif par requête est de $0.045/image (4K, résolution illimitée incluse), et le tarif à l'usage peut descendre jusqu'à $0.018/image. La plateforme n'a pas de limite de concurrence, prend en charge l'appel au format natif Google et inclut un outil de génération d'images gratuit : imagen.apiyi.com.


📚 Références

  1. Page de tarification de l'API Google Gemini : Tableau officiel des prix des tokens pour Nano Banana 2

    • Lien : ai.google.dev/gemini-api/docs/pricing
    • Description : Consultez les derniers prix pour les trois types de tokens (image, texte, raisonnement).
  2. Documentation Google AI sur la génération d'images : Explication du paramètre response_modalities

    • Lien : ai.google.dev/gemini-api/docs/image-generation
    • Description : Documentation officielle expliquant comment configurer les modes ["Image"] et ["Text","Image"].
  3. Documentation Google AI sur le comptage des tokens : Comprendre la composition et la facturation des tokens

    • Lien : ai.google.dev/gemini-api/docs/tokens
    • Description : Comprendre la relation entre le nombre de tokens de sortie d'image et la résolution.
  4. Documentation APIYI pour Nano Banana 2 : Détails sur les deux modes de facturation (par requête et à l'usage)

    • Lien : docs.apiyi.com/en/api-capabilities/nano-banana-2-image
    • Description : Explication des plans tarifaires et des méthodes d'appel sur la plateforme APIYI.

Auteur : Équipe technique APIYI
Échanges techniques : Bienvenue dans les commentaires pour discuter. Plus de ressources sont disponibles dans le centre de documentation APIYI : docs.apiyi.com.

Publications similaires