Note de l'auteur : Analyse approfondie des différences de consommation de tokens lorsque Nano Banana 2 est configuré avec response_modalities sur IMAGE (retourne uniquement l'image). Décortication des règles de facturation pour les trois types de tokens (image/texte/réflexion) et proposition de la configuration optimale pour économiser.
Lors de l'appel à Nano Banana 2 pour générer une image, le paramètre response_modalities peut être configuré de deux manières : ["Text", "Image"] (par défaut) et ["Image"] (image uniquement). Une question naturelle se pose : En configurant pour ne retourner que l'image, combien de tokens et d'argent peut-on économiser ?
Valeur clé : Après avoir lu cet article, vous comprendrez parfaitement les règles de facturation des trois types de tokens de sortie de Nano Banana 2 (image/texte/réflexion), vous saurez exactement combien d'argent response_modalities=["Image"] permet d'économiser, et vous découvrirez les stratégies d'économie réellement efficaces.
Règles de facturation des trois types de tokens de sortie de Nano Banana 2
La facturation des sorties de Nano Banana 2 n'est pas un simple "prix unique", mais est divisée en trois types de tokens facturés indépendamment :
| Type de token | Prix unitaire | Description | Peut-il être éliminé par paramètre ? |
|---|---|---|---|
| Token de sortie d'image | 60,00 $ / M de tokens | Tokens consommés pour générer l'image, représentant 95 %+ du coût total | ❌ Non (production principale) |
| Token de sortie de texte | 3,00 $ / M de tokens | Description/texte accompagnant l'image | ✅ Oui, en définissant ["Image"] |
| Token de réflexion (Thinking) | 3,00 $ / M de tokens | Consommés pendant le processus de raisonnement interne du modèle | ❌ Toujours générés, impossible à désactiver |
| Token d'entrée | 0,50 $ / M de tokens | Votre invite de texte et image de référence | ⚠️ Optimisable en réduisant la longueur de l'invite |
Les tokens d'image de Nano Banana 2 représentent l'écrasante majorité du coût
Chiffre clé : le prix unitaire des tokens de sortie d'image est de 60 $/M, tandis que celui des tokens de texte et de réflexion n'est que de 3 $/M — les tokens d'image sont 20 fois plus chers.
| Résolution | Tokens de sortie d'image | Coût de l'image | Proportion du coût total de sortie |
|---|---|---|---|
| 512px | ~747 | ~0,045 $ | ~95 % |
| 1K (par défaut) | ~1 120 | ~0,067 $ | ~96 % |
| 2K | ~1 680 | ~0,101 $ | ~97 % |
| 4K | ~2 520 | ~0,151 $ | ~97 % |
🔑 Conclusion principale : Les tokens d'image représentent 95 à 97 % du coût total des sorties. Les tokens de texte et de réflexion combinés ne représentent que 3 à 5 %. Même en éliminant complètement la sortie texte, les économies sont donc très limitées.
Comparaison des tokens pour les deux configurations de response_modalities

Configuration ["Text", "Image"] — Mode par défaut
Par défaut, Nano Banana 2 renvoie une image + une description textuelle. Le modèle va d'abord "réfléchir" (Thinking), puis produire une description textuelle et une image.
from google import genai
from google.genai import types
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-3.1-flash-image-preview",
contents="Générez un chat en combinaison spatiale",
config=types.GenerateContentConfig(
response_modalities=["Text", "Image"], # Par défaut : texte + image
)
)
Contenu de sortie : Une description textuelle (par exemple, "C'est un chat roux en combinaison spatiale…") + 1 image
Composition de la consommation de tokens (exemple pour une résolution 1K) :
- Tokens de réflexion : ~200-800 (varie selon la complexité de l'invite)
- Tokens de sortie de texte : ~50-200
- Tokens de sortie d'image : ~1 120
Configuration ["Image"] — Mode image uniquement
Configure le modèle pour ne renvoyer que l'image, sans description textuelle.
response = client.models.generate_content(
model="gemini-3.1-flash-image-preview",
contents="Générez un chat en combinaison spatiale",
config=types.GenerateContentConfig(
response_modalities=["Image"], # Image uniquement, pas de texte
)
)
Contenu de sortie : Seulement 1 image, pas de description textuelle
Composition de la consommation de tokens (exemple pour une résolution 1K) :
- Tokens de réflexion : ~200-800 (toujours générés, toujours facturés)
- Tokens de sortie de texte : 0 (éliminés ✅)
- Tokens de sortie d'image : ~1 120 (inchangé)
Comparaison des coûts des deux modes de Nano Banana 2
| Point de comparaison | ["Text", "Image"] par défaut | ["Image"] image uniquement | Différence |
|---|---|---|---|
| Tokens d'image (~1 120) | 0,0672 $ | 0,0672 $ | 0 (inchangé) |
| Tokens de réflexion (~500) | 0,0015 $ | 0,0015 $ | 0 (inchangé) |
| Tokens de texte (~100) | 0,0003 $ | 0 $ | Économie de 0,0003 $ |
| Coût total par image (1K) | ~0,069 $ | ~0,069 $ | Économie de ~0,4 % |
⚠️ Conclusion :
response_modalities=["Image"]permet effectivement d'économiser les tokens de sortie de texte, mais comme leur prix unitaire n'est que de 3 $/M et qu'ils sont peu nombreux (environ 50-200), l'économie réelle par image n'est que d'environ 0,0001 $ à 0,0006 $, ce qui est presque négligeable.
Pourquoi les Thinking Token de Nano Banana 2 ne peuvent-ils pas être supprimés ?
C'est le point le plus facilement négligé dans la tarification de Nano Banana 2 : Les Thinking Token sont toujours générés et toujours facturés, que vous visualisiez ou non le processus de réflexion.
La documentation officielle de Google le précise clairement :
Les Thinking Token sont facturés que le paramètre
includeThoughtssoit défini surtrueoufalse, car le processus de réflexion se produit toujours par défaut.
Cela signifie que :
includeThoughts=True: Vous voyez le processus de réflexion, facturéincludeThoughts=False: Vous ne voyez pas le processus de réflexion, toujours facturé- Taux de facturation des Thinking Token : 3$/M (identique à la sortie texte)
Nano Banana 2 prend en charge deux niveaux de réflexion (Thinking) :
| Niveau de réflexion | Méthode de configuration | Consommation de Thinking Token | Qualité d'image | Scénario recommandé |
|---|---|---|---|---|
| minimal | Par défaut | ~200-500 | Suffisante pour la plupart des scénarios | Génération d'images quotidienne |
| high | thinking_level="high" |
~500-2000 | Meilleure pour les scénarios complexes | Multi-personnages / Composition précise |
💡 Conseil d'optimisation : Si vous n'avez pas besoin d'une qualité d'image extrême, conservez le niveau de réflexion par défaut
minimal. Le niveauhighajoutera des centaines à des milliers de Thinking Token supplémentaires. Bien que le prix unitaire soit bas (3$/M), cela représente un coût supplémentaire dans des scénarios de traitement par lots.
Stratégies réellement efficaces pour économiser avec Nano Banana 2
Puisque response_modalities=["Image"] ne permet pas de faire de grosses économies, quelles stratégies sont réellement efficaces ?

| Stratégie d'économie | Taux d'économie | Action concrète | Recommandation |
|---|---|---|---|
| Choisir une résolution adaptée | Jusqu'à 70% | 4K→512px : coût passe de 0.151$ à 0.045$ | ⭐⭐⭐⭐⭐ |
| Utiliser APIYI en paiement par requête | Jusqu'à 70% | 0.045$/image (inclut 4K), pas de distinction de résolution | ⭐⭐⭐⭐⭐ |
| Utiliser APIYI en paiement par volume | Jusqu'à 63% | Basse résolution seulement 0.018$/image (512px) | ⭐⭐⭐⭐⭐ |
| Google Batch API | 50% | Traitement par lots hors ligne, Token image à moitié prix | ⭐⭐⭐⭐ |
| Thinking minimal | 2-5% | Conserver le niveau de réflexion par défaut | ⭐⭐⭐ |
| response_modalities=["Image"] | ~0.4% | Supprimer la sortie texte | ⭐ |
Comparaison des prix de Nano Banana 2 par résolution sur différentes plateformes
| Résolution | Google Officiel | APIYI par requête | APIYI par volume | Économie maximale |
|---|---|---|---|---|
| 512px | 0.045$ | 0.045$ | 0.018$ | 60% |
| 1K | 0.067$ | 0.045$ | 0.025$ | 63% |
| 2K | 0.101$ | 0.045$ | 0.03$ | 70% |
| 4K | 0.151$ | 0.045$ | 0.045$ | 70% |
🎯 Meilleure pratique : Si votre activité permet d'utiliser 1K au lieu de 4K, vous économisez directement 55%. En combinant cela avec le paiement par volume d'APIYI sur apiyi.com, la résolution 1K ne coûte que 0.025$/image, soit 83% d'économie par rapport au prix officiel de 0.151$ pour du 4K. La plateforme propose également un outil de test de génération d'images gratuit AI 图片大师: imagen.apiyi.com, permettant de valider rapidement l'effet de différentes résolutions sans écrire de code.
Configuration optimale pour appeler Nano Banana 2 via APIYI
En synthétisant l'analyse précédente, voici la configuration optimale recommandée :
import requests
import base64
API_KEY = "your-apiyi-api-key"
ENDPOINT = "https://api.apiyi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent"
headers = {
"Content-Type": "application/json",
"x-goog-api-key": API_KEY
}
payload = {
"contents": [{"parts": [{"text": "Un chat en combinaison spatiale, style art numérique"}]}],
"generationConfig": {
"responseModalities": ["IMAGE"], # Image uniquement, économise les tokens texte
"imageConfig": {
"aspectRatio": "1:1",
"imageSize": "1K" # Choisissez la résolution selon vos besoins, c'est la clé pour économiser
}
}
}
response = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120)
result = response.json()
image_data = result["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
with open("output.png", "wb") as f:
f.write(base64.b64decode(image_data))
Recommandation : En appelant Nano Banana 2 via APIYI sur apiyi.com, la facturation à l'usage est de $0.045/image, quelle que soit la résolution. La facturation au volume démarre à $0.018/image. Compatible avec le format natif Google, migration sans coût.
Questions fréquentes
Q1 : Les tokens de réflexion sont-ils toujours générés si on définit response_modalities=[« Image »] ?
Oui. Le processus de réflexion (Thinking) de Nano Banana 2 est activé par défaut et ne peut pas être désactivé. Que vous définissiez response_modalities sur ["Image"] ou ["Text", "Image"], et que includeThoughts soit true ou false, les tokens de réflexion seront toujours générés et facturés. La bonne nouvelle est que ces tokens sont facturés au tarif texte de $3/M, bien inférieur au tarif image de $60/M.
Q2 : Quel est alors l’intérêt de définir [« Image »] ?
Il y a deux avantages principaux : premièrement, réduire le volume de données transmises (pas de contenu texte retourné signifie un parsing de la réponse plus rapide) ; deuxièmement, simplifier la logique du code (pas besoin de traiter une partie texte supplémentaire). L'économie sur les coûts est inférieure à 1%, mais dans les scénarios nécessitant une sortie purement image (comme la production de masse de ressources), obtenir directement l'image est plus pratique.
Q3 : Quelle est la méthode de facturation la plus avantageuse avec APIYI : à l’usage ou au volume ?
Cela dépend de votre résolution habituelle. La facturation à l'usage à $0.045/image (toutes résolutions confondues) convient aux scénarios produisant fréquemment des images en 2K/4K. La facturation au volume, basée sur la consommation de tokens, est flexible : les basses résolutions (512px) coûtent seulement $0.018/image, idéal pour la production en masse d'images basse résolution. Inscrivez-vous sur APIYI (apiyi.com) pour utiliser les deux modes de facturation.
Résumé
Points clés de l'analyse de facturation du paramètre response_modalities pour Nano Banana 2 :
- Les tokens d'image dominent largement : Le prix de $60/M pour les tokens d'image représente 95 à 97 % du coût total de sortie. Les tokens de texte et de raisonnement combinés ne représentent que 3 à 5 %.
- Définir
["Image"]n'économise pas beaucoup : Cela élimine uniquement les tokens de sortie de texte, économisant environ $0.0003 par image (moins de 0.5 %). - Les tokens de raisonnement sont inévitables : Ils sont toujours générés et facturés, à un taux de $3/M, indépendamment du paramètre
response_modalities. - Les vraies économies viennent de la résolution et de la plateforme : Choisir une résolution appropriée peut économiser jusqu'à 70 %. Utiliser APIYI permet d'économiser 63 % supplémentaires.
Nous recommandons d'utiliser APIYI (apiyi.com) pour invoquer Nano Banana 2. Le tarif par requête est de $0.045/image (4K, résolution illimitée incluse), et le tarif à l'usage peut descendre jusqu'à $0.018/image. La plateforme n'a pas de limite de concurrence, prend en charge l'appel au format natif Google et inclut un outil de génération d'images gratuit : imagen.apiyi.com.
📚 Références
-
Page de tarification de l'API Google Gemini : Tableau officiel des prix des tokens pour Nano Banana 2
- Lien :
ai.google.dev/gemini-api/docs/pricing - Description : Consultez les derniers prix pour les trois types de tokens (image, texte, raisonnement).
- Lien :
-
Documentation Google AI sur la génération d'images : Explication du paramètre
response_modalities- Lien :
ai.google.dev/gemini-api/docs/image-generation - Description : Documentation officielle expliquant comment configurer les modes
["Image"]et["Text","Image"].
- Lien :
-
Documentation Google AI sur le comptage des tokens : Comprendre la composition et la facturation des tokens
- Lien :
ai.google.dev/gemini-api/docs/tokens - Description : Comprendre la relation entre le nombre de tokens de sortie d'image et la résolution.
- Lien :
-
Documentation APIYI pour Nano Banana 2 : Détails sur les deux modes de facturation (par requête et à l'usage)
- Lien :
docs.apiyi.com/en/api-capabilities/nano-banana-2-image - Description : Explication des plans tarifaires et des méthodes d'appel sur la plateforme APIYI.
- Lien :
Auteur : Équipe technique APIYI
Échanges techniques : Bienvenue dans les commentaires pour discuter. Plus de ressources sont disponibles dans le centre de documentation APIYI : docs.apiyi.com.
