title: "Nano Banana 2 の response_modalities を IMAGE のみに設定した場合の Token 消費分析:画像・テキスト・思考トークンの課金ルールと最適な節約設定"
description: "Nano Banana 2 で response_modalities を ['Image'] のみに設定した場合のトークン消費量を深掘り。画像、テキスト、思考トークンの課金ルールを分解し、最も費用対効果の高い設定を提案します。"
date: "2024-07-15"
tags: ["Nano Banana 2", "画像生成", "Token節約", "API最適化", "マルチモーダル"]
Nano Banana 2 で画像を生成する際、response_modalities パラメータには ["Text", "Image"](デフォルト)と ["Image"](画像のみ)の2つの設定方法があります。当然の疑問として、画像のみを返すように設定すると、どれだけトークンと費用を節約できるのでしょうか?
本記事の核心的な価値:この記事を読み終えると、Nano Banana 2 の3種類の出力トークン(画像/テキスト/思考)の課金ルールを完全に理解し、response_modalities=["Image"] が実際にどれだけ節約になるのか、そして本当に効果的な節約戦略が明確になります。
Nano Banana 2 の3種類の出力トークン課金ルール
Nano Banana 2 の出力課金は、単純な「1つの価格」ではなく、以下の3種類のトークンに分けて独立して価格設定されています:
| トークンタイプ | 課金単価 | 説明 | パラメータで削除可能か |
|---|---|---|---|
| 画像出力トークン | $60.00 / M トークン | 画像生成で消費されるトークン。総費用の95%以上を占める | ❌ 不可(コアアウトプット) |
| テキスト出力トークン | $3.00 / M トークン | 画像に付随するテキスト説明/キャプション | ✅ ["Image"] 設定で削除可能 |
| 思考トークン (Thinking) | $3.00 / M トークン | モデル内部の推論プロセスで消費される | ❌ 常に発生、無効化不可 |
| 入力トークン | $0.50 / M トークン | プロンプトテキストと参照画像 | ⚠️ プロンプト長を最適化可能 |
Nano Banana 2 画像トークンが費用の大部分を占める
重要な数字:画像出力トークンの単価は $60/M ですが、テキストと思考トークンの単価はわずか $3/M です。つまり、画像トークンは20倍も高価です。
| 解像度 | 画像出力トークン | 画像費用 | 総出力費用に占める割合 |
|---|---|---|---|
| 512px | ~747 | ~$0.045 | ~95% |
| 1K (デフォルト) | ~1,120 | ~$0.067 | ~96% |
| 2K | ~1,680 | ~$0.101 | ~97% |
| 4K | ~2,520 | ~$0.151 | ~97% |
🔑 核心的な結論:画像トークンは総出力費用の 95-97% を占めます。テキストと思考トークンを合わせてもわずか 3-5% です。したがって、テキスト出力を完全に削除しても、節約できる費用は非常に限られています。
response_modalities 2つの設定のトークン比較

設定 ["Text", "Image"] — デフォルトモード
デフォルトでは、Nano Banana 2 は画像 + テキスト説明を返します。モデルはまず「思考」(Thinking)し、その後テキスト説明と画像を出力します。
from google import genai
from google.genai import types
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-3.1-flash-image-preview",
contents="宇宙服を着た猫を生成",
config=types.GenerateContentConfig(
response_modalities=["Text", "Image"], # デフォルト:テキスト+画像
)
)
出力内容:テキスト説明(例:「これは宇宙服を着たオレンジ猫です……」)+ 画像1枚
トークン消費構成(1K解像度の場合):
- 思考トークン:~200-800(プロンプトの複雑さによる)
- テキスト出力トークン:~50-200
- 画像出力トークン:~1,120
設定 ["Image"] — 画像のみモード
テキスト説明を返さず、画像のみを返すように設定します。
response = client.models.generate_content(
model="gemini-3.1-flash-image-preview",
contents="宇宙服を着た猫を生成",
config=types.GenerateContentConfig(
response_modalities=["Image"], # 画像のみ、テキストは返さない
)
)
出力内容:画像1枚のみ、テキスト説明なし
トークン消費構成(1K解像度の場合):
- 思考トークン:~200-800(依然として発生、課金対象)
- テキスト出力トークン:0(削除済み ✅)
- 画像出力トークン:~1,120(変化なし)
Nano Banana 2 2つのモードの費用比較
| 比較項目 | ["Text", "Image"] デフォルト | ["Image"] 画像のみ | 差異 |
|---|---|---|---|
| 画像トークン (~1,120) | $0.0672 | $0.0672 | 0(変化なし) |
| 思考トークン (~500) | $0.0015 | $0.0015 | 0(変化なし) |
| テキストトークン (~100) | $0.0003 | $0 | $0.0003 節約 |
| 1枚あたり総費用 (1K) | ~$0.069 | ~$0.069 | ~0.4% 節約 |
⚠️ 結論:
response_modalities=["Image"]は確かにテキスト出力トークンを削除できますが、テキストトークンの単価はわずか $3/M で、数も少ない(約 50-200 個)ため、実際には1枚あたり約 $0.0001-$0.0006 しか節約できず、ほとんど無視できるレベルです。
Nano Banana 2 で Thinking Token を省けない理由
Nano Banana 2 の課金で最も見落とされがちな点はこれです:思考トークンは、思考プロセスを表示するかどうかに関わらず、常に生成され、常に課金されます。
Google の公式ドキュメントには明確に記載されています:
includeThoughtsがtrueに設定されているかfalseに設定されているかに関わらず、思考トークンは課金されます。なぜなら、思考プロセスはデフォルトで常に発生するためです。
つまり:
includeThoughts=True:思考プロセスを確認できますが、課金されますincludeThoughts=False:思考プロセスは見えませんが、それでも課金されます- 思考トークンの課金レート:$3/M(テキスト出力と同じ)
Nano Banana 2 は 2 つの Thinking レベルをサポートしています:
| Thinking レベル | 設定方法 | 思考トークン消費量 | 画像品質 | 推奨シナリオ |
|---|---|---|---|---|
| minimal | デフォルト | ~200-500 | ほとんどの場面で十分 | 日常的な画像生成 |
| high | thinking_level="high" |
~500-2000 | 複雑な場面でより良い | 複数キャラクター/精密な構図 |
💡 最適化の提案:最高の画質が必要でない場合は、デフォルトの
minimal思考レベルを維持してください。highレベルは数百から数千の思考トークンを追加します。単価は高くありませんが($3/M)、バッチ処理のシナリオではコストになります。
Nano Banana 2 で本当に効果的なコスト削減策
response_modalities=["Image"] ではあまり節約できないなら、どの戦略が本当に効果的なのでしょうか?

| コスト削減戦略 | 節約率 | 具体的な操作 | 推奨度 |
|---|---|---|---|
| 適切な解像度を選択 | 最大 70% | 4K→512px で費用が $0.151 から $0.045 に削減 | ⭐⭐⭐⭐⭐ |
| APIYI 従量課金を利用 | 最大 70% | $0.045/枚(4K 含む)、解像度を区別しない | ⭐⭐⭐⭐⭐ |
| APIYI 従量課金を利用 | 最大 63% | 低解像度はわずか $0.018/枚 (512px) | ⭐⭐⭐⭐⭐ |
| Google Batch API | 50% | オフライン一括処理、画像トークン半額 | ⭐⭐⭐⭐ |
| Thinking minimal | 2-5% | デフォルトの思考レベルを維持 | ⭐⭐⭐ |
| response_modalities=["Image"] | ~0.4% | テキスト出力を削除 | ⭐ |
Nano Banana 2 の異なる解像度における各プラットフォームの価格比較
| 解像度 | Google 公式 | APIYI 従量課金 | APIYI 従量課金 | 最大節約率 |
|---|---|---|---|---|
| 512px | $0.045 | $0.045 | $0.018 | 60% |
| 1K | $0.067 | $0.045 | $0.025 | 63% |
| 2K | $0.101 | $0.045 | $0.03 | 70% |
| 4K | $0.151 | $0.045 | $0.045 | 70% |
🎯 ベストプラクティス:あなたのビジネスが 4K ではなく 1K を使用できる場合、直接 55% 節約できます。さらに APIYI apiyi.com の従量課金を組み合わせると、1K 解像度はわずか $0.025/枚となり、公式の 4K の $0.151 に比べて 83% 節約できます。プラットフォームは無料の画像生成テストツール AI 画像マスター: imagen.apiyi.com も提供しており、コードを書かずに異なる解像度の効果を迅速に検証できます。
Nano Banana 2 を APIYI で呼び出す最適な設定
上記の分析を総合すると、以下が推奨される最適な設定です:
import requests
import base64
API_KEY = "your-apiyi-api-key"
ENDPOINT = "https://api.apiyi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent"
headers = {
"Content-Type": "application/json",
"x-goog-api-key": API_KEY
}
payload = {
"contents": [{"parts": [{"text": "宇宙服を着た猫、デジタルアートスタイル"}]}],
"generationConfig": {
"responseModalities": ["IMAGE"], # 画像のみ、テキスト Token を節約
"imageConfig": {
"aspectRatio": "1:1",
"imageSize": "1K" # 必要に応じて解像度を選択、これが節約の鍵
}
}
}
response = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120)
result = response.json()
image_data = result["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
with open("output.png", "wb") as f:
f.write(base64.b64decode(image_data))
推奨事項:APIYI apiyi.com を通じて Nano Banana 2 を呼び出す場合、従量課金は解像度に関わらず $0.045/枚、従量課金は最低 $0.018/枚です。Google ネイティブ形式での呼び出しをサポートし、移行コストはゼロです。
よくある質問
Q1: response_modalities=[“Image”] を設定しても、思考 Token は発生しますか?
はい、発生します。Nano Banana 2 の思考プロセス(Thinking)はデフォルトで有効化されており、無効にすることはできません。response_modalities を ["Image"] または ["Text", "Image"] のどちらに設定しても、また includeThoughts を true または false のどちらに設定しても、思考 Token は発生し、課金対象となります。良いニュースは、思考 Token はテキスト料金の $3/M で課金されるため、画像 Token の $60/M よりもはるかに安価だということです。
Q2: では [“Image”] を設定する意味は何ですか?
主に2つの価値があります:1つ目はネットワーク転送量の削減です。テキストコンテンツを返さないことで、より高速な応答解析が可能になります。2つ目はコードロジックの簡素化です。テキスト部分を追加で処理する必要がなくなります。費用面での節約は1%未満ですが、純粋な画像出力が必要なシナリオ(素材のバッチ生成など)では、直接画像を取得できる方が便利です。
Q3: APIYI の従量課金と従量課金、どちらがお得ですか?
お使いの解像度によります。従量課金は解像度に関わらず $0.045/枚なので、2K/4K の大サイズ画像を頻繁に出力するシナリオに適しています。従量課金は Token 消費量に応じて柔軟に価格が決まり、低解像度(512px)ではわずか $0.018/枚です。低解像度画像をバッチで出力するシナリオに適しています。APIYI apiyi.com で登録すれば、両方の課金モードを使用できます。
まとめ
Nano Banana 2 の response_modalities に関する課金分析の核心ポイント:
- 画像トークンが費用の大半を占める:$60/M の単価が総出力費用の 95-97% を占め、テキストと思考トークンを合わせてもわずか 3-5% です。
["Image"]を設定しても大幅な節約にはならない:テキスト出力トークンを削除するだけでは、画像 1 枚あたり約 $0.0003 の節約(0.5% 未満)にしかなりません。- 思考トークンは削除できない:
response_modalitiesの設定に関わらず、常に生成され課金対象となります($3/M の料率)。 - 本当の節約は解像度とプラットフォーム選びで実現:適切な解像度を選ぶことで 70% 節約可能、APIYI を利用することでさらに 63% 節約できます。
Nano Banana 2 の呼び出しには、APIYI apiyi.com の利用をお勧めします。従量課金で 4K 解像度無制限の画像が 1 枚あたり $0.045、大量利用時は 1 枚あたり $0.018 まで低価格です。プラットフォームは同時実行数に制限がなく、Google ネイティブ形式での呼び出しをサポートし、無料の画像生成ツール imagen.apiyi.com も付帯しています。
📚 参考資料
-
Google Gemini API 料金ページ: Nano Banana 2 の公式トークン価格表
- リンク:
ai.google.dev/gemini-api/docs/pricing - 説明: 画像/テキスト/思考の 3 種類のトークンの最新価格を確認できます。
- リンク:
-
Google AI 画像生成ドキュメント:
response_modalitiesパラメータの説明- リンク:
ai.google.dev/gemini-api/docs/image-generation - 説明:
["Image"]と["Text","Image"]の 2 つのモードの設定方法についての公式ドキュメントです。
- リンク:
-
Google AI トークンカウントドキュメント: トークンの構成と課金についての理解
- リンク:
ai.google.dev/gemini-api/docs/tokens - 説明: 画像出力トークン数と解像度の関係について学べます。
- リンク:
-
APIYI Nano Banana 2 ドキュメント: 従量課金/定額課金の 2 つの料金モデルの詳細
- リンク:
docs.apiyi.com/en/api-capabilities/nano-banana-2-image - 説明: APIYI プラットフォームの料金プランと呼び出し方法について説明しています。
- リンク:
著者: APIYI 技術チーム
技術交流: コメント欄での議論を歓迎します。詳細な資料は APIYI docs.apiyi.com ドキュメントセンターでご覧いただけます。
