|

Nano Banana 2 で response_modalities=IMAGE を設定し画像のみを返すと、どれだけトークンを節約できるか?実測による課金分析


title: "Nano Banana 2 の response_modalities を IMAGE のみに設定した場合の Token 消費分析:画像・テキスト・思考トークンの課金ルールと最適な節約設定"
description: "Nano Banana 2 で response_modalities を ['Image'] のみに設定した場合のトークン消費量を深掘り。画像、テキスト、思考トークンの課金ルールを分解し、最も費用対効果の高い設定を提案します。"
date: "2024-07-15"
tags: ["Nano Banana 2", "画像生成", "Token節約", "API最適化", "マルチモーダル"]

Nano Banana 2 で画像を生成する際、response_modalities パラメータには ["Text", "Image"](デフォルト)と ["Image"](画像のみ)の2つの設定方法があります。当然の疑問として、画像のみを返すように設定すると、どれだけトークンと費用を節約できるのでしょうか?

本記事の核心的な価値:この記事を読み終えると、Nano Banana 2 の3種類の出力トークン(画像/テキスト/思考)の課金ルールを完全に理解し、response_modalities=["Image"] が実際にどれだけ節約になるのか、そして本当に効果的な節約戦略が明確になります。


Nano Banana 2 の3種類の出力トークン課金ルール

Nano Banana 2 の出力課金は、単純な「1つの価格」ではなく、以下の3種類のトークンに分けて独立して価格設定されています:

トークンタイプ 課金単価 説明 パラメータで削除可能か
画像出力トークン $60.00 / M トークン 画像生成で消費されるトークン。総費用の95%以上を占める ❌ 不可(コアアウトプット)
テキスト出力トークン $3.00 / M トークン 画像に付随するテキスト説明/キャプション ["Image"] 設定で削除可能
思考トークン (Thinking) $3.00 / M トークン モデル内部の推論プロセスで消費される ❌ 常に発生、無効化不可
入力トークン $0.50 / M トークン プロンプトテキストと参照画像 ⚠️ プロンプト長を最適化可能

Nano Banana 2 画像トークンが費用の大部分を占める

重要な数字:画像出力トークンの単価は $60/M ですが、テキストと思考トークンの単価はわずか $3/M です。つまり、画像トークンは20倍も高価です。

解像度 画像出力トークン 画像費用 総出力費用に占める割合
512px ~747 ~$0.045 ~95%
1K (デフォルト) ~1,120 ~$0.067 ~96%
2K ~1,680 ~$0.101 ~97%
4K ~2,520 ~$0.151 ~97%

🔑 核心的な結論:画像トークンは総出力費用の 95-97% を占めます。テキストと思考トークンを合わせてもわずか 3-5% です。したがって、テキスト出力を完全に削除しても、節約できる費用は非常に限られています。


response_modalities 2つの設定のトークン比較

nano-banana-2-response-modalities-image-only-token-cost-guide-ja 图示

設定 ["Text", "Image"] — デフォルトモード

デフォルトでは、Nano Banana 2 は画像 + テキスト説明を返します。モデルはまず「思考」(Thinking)し、その後テキスト説明と画像を出力します。

from google import genai
from google.genai import types

client = genai.Client(api_key="YOUR_API_KEY")

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="宇宙服を着た猫を生成",
    config=types.GenerateContentConfig(
        response_modalities=["Text", "Image"],  # デフォルト:テキスト+画像
    )
)

出力内容:テキスト説明(例:「これは宇宙服を着たオレンジ猫です……」)+ 画像1枚

トークン消費構成(1K解像度の場合):

  • 思考トークン:~200-800(プロンプトの複雑さによる)
  • テキスト出力トークン:~50-200
  • 画像出力トークン:~1,120

設定 ["Image"] — 画像のみモード

テキスト説明を返さず、画像のみを返すように設定します。

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="宇宙服を着た猫を生成",
    config=types.GenerateContentConfig(
        response_modalities=["Image"],  # 画像のみ、テキストは返さない
    )
)

出力内容:画像1枚のみ、テキスト説明なし

トークン消費構成(1K解像度の場合):

  • 思考トークン:~200-800(依然として発生、課金対象
  • テキスト出力トークン:0(削除済み ✅)
  • 画像出力トークン:~1,120(変化なし)

Nano Banana 2 2つのモードの費用比較

比較項目 ["Text", "Image"] デフォルト ["Image"] 画像のみ 差異
画像トークン (~1,120) $0.0672 $0.0672 0(変化なし)
思考トークン (~500) $0.0015 $0.0015 0(変化なし)
テキストトークン (~100) $0.0003 $0 $0.0003 節約
1枚あたり総費用 (1K) ~$0.069 ~$0.069 ~0.4% 節約

⚠️ 結論response_modalities=["Image"] は確かにテキスト出力トークンを削除できますが、テキストトークンの単価はわずか $3/M で、数も少ない(約 50-200 個)ため、実際には1枚あたり約 $0.0001-$0.0006 しか節約できず、ほとんど無視できるレベルです。

Nano Banana 2 で Thinking Token を省けない理由

Nano Banana 2 の課金で最も見落とされがちな点はこれです:思考トークンは、思考プロセスを表示するかどうかに関わらず、常に生成され、常に課金されます。

Google の公式ドキュメントには明確に記載されています:

includeThoughtstrue に設定されているか false に設定されているかに関わらず、思考トークンは課金されます。なぜなら、思考プロセスはデフォルトで常に発生するためです。

つまり:

  • includeThoughts=True:思考プロセスを確認できますが、課金されます
  • includeThoughts=False:思考プロセスは見えませんが、それでも課金されます
  • 思考トークンの課金レート:$3/M(テキスト出力と同じ)

Nano Banana 2 は 2 つの Thinking レベルをサポートしています:

Thinking レベル 設定方法 思考トークン消費量 画像品質 推奨シナリオ
minimal デフォルト ~200-500 ほとんどの場面で十分 日常的な画像生成
high thinking_level="high" ~500-2000 複雑な場面でより良い 複数キャラクター/精密な構図

💡 最適化の提案:最高の画質が必要でない場合は、デフォルトの minimal 思考レベルを維持してください。high レベルは数百から数千の思考トークンを追加します。単価は高くありませんが($3/M)、バッチ処理のシナリオではコストになります。


Nano Banana 2 で本当に効果的なコスト削減策

response_modalities=["Image"] ではあまり節約できないなら、どの戦略が本当に効果的なのでしょうか?

nano-banana-2-response-modalities-image-only-token-cost-guide-ja 图示

コスト削減戦略 節約率 具体的な操作 推奨度
適切な解像度を選択 最大 70% 4K→512px で費用が $0.151 から $0.045 に削減 ⭐⭐⭐⭐⭐
APIYI 従量課金を利用 最大 70% $0.045/枚(4K 含む)、解像度を区別しない ⭐⭐⭐⭐⭐
APIYI 従量課金を利用 最大 63% 低解像度はわずか $0.018/枚 (512px) ⭐⭐⭐⭐⭐
Google Batch API 50% オフライン一括処理、画像トークン半額 ⭐⭐⭐⭐
Thinking minimal 2-5% デフォルトの思考レベルを維持 ⭐⭐⭐
response_modalities=["Image"] ~0.4% テキスト出力を削除

Nano Banana 2 の異なる解像度における各プラットフォームの価格比較

解像度 Google 公式 APIYI 従量課金 APIYI 従量課金 最大節約率
512px $0.045 $0.045 $0.018 60%
1K $0.067 $0.045 $0.025 63%
2K $0.101 $0.045 $0.03 70%
4K $0.151 $0.045 $0.045 70%

🎯 ベストプラクティス:あなたのビジネスが 4K ではなく 1K を使用できる場合、直接 55% 節約できます。さらに APIYI apiyi.com の従量課金を組み合わせると、1K 解像度はわずか $0.025/枚となり、公式の 4K の $0.151 に比べて 83% 節約できます。プラットフォームは無料の画像生成テストツール AI 画像マスター: imagen.apiyi.com も提供しており、コードを書かずに異なる解像度の効果を迅速に検証できます。

Nano Banana 2 を APIYI で呼び出す最適な設定

上記の分析を総合すると、以下が推奨される最適な設定です:

import requests
import base64

API_KEY = "your-apiyi-api-key"
ENDPOINT = "https://api.apiyi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent"

headers = {
    "Content-Type": "application/json",
    "x-goog-api-key": API_KEY
}

payload = {
    "contents": [{"parts": [{"text": "宇宙服を着た猫、デジタルアートスタイル"}]}],
    "generationConfig": {
        "responseModalities": ["IMAGE"],  # 画像のみ、テキスト Token を節約
        "imageConfig": {
            "aspectRatio": "1:1",
            "imageSize": "1K"  # 必要に応じて解像度を選択、これが節約の鍵
        }
    }
}

response = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120)
result = response.json()

image_data = result["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
with open("output.png", "wb") as f:
    f.write(base64.b64decode(image_data))

推奨事項:APIYI apiyi.com を通じて Nano Banana 2 を呼び出す場合、従量課金は解像度に関わらず $0.045/枚、従量課金は最低 $0.018/枚です。Google ネイティブ形式での呼び出しをサポートし、移行コストはゼロです。


よくある質問

Q1: response_modalities=[“Image”] を設定しても、思考 Token は発生しますか?

はい、発生します。Nano Banana 2 の思考プロセス(Thinking)はデフォルトで有効化されており、無効にすることはできません。response_modalities["Image"] または ["Text", "Image"] のどちらに設定しても、また includeThoughtstrue または false のどちらに設定しても、思考 Token は発生し、課金対象となります。良いニュースは、思考 Token はテキスト料金の $3/M で課金されるため、画像 Token の $60/M よりもはるかに安価だということです。

Q2: では [“Image”] を設定する意味は何ですか?

主に2つの価値があります:1つ目はネットワーク転送量の削減です。テキストコンテンツを返さないことで、より高速な応答解析が可能になります。2つ目はコードロジックの簡素化です。テキスト部分を追加で処理する必要がなくなります。費用面での節約は1%未満ですが、純粋な画像出力が必要なシナリオ(素材のバッチ生成など)では、直接画像を取得できる方が便利です。

Q3: APIYI の従量課金と従量課金、どちらがお得ですか?

お使いの解像度によります。従量課金は解像度に関わらず $0.045/枚なので、2K/4K の大サイズ画像を頻繁に出力するシナリオに適しています。従量課金は Token 消費量に応じて柔軟に価格が決まり、低解像度(512px)ではわずか $0.018/枚です。低解像度画像をバッチで出力するシナリオに適しています。APIYI apiyi.com で登録すれば、両方の課金モードを使用できます。


まとめ

Nano Banana 2 の response_modalities に関する課金分析の核心ポイント:

  1. 画像トークンが費用の大半を占める:$60/M の単価が総出力費用の 95-97% を占め、テキストと思考トークンを合わせてもわずか 3-5% です。
  2. ["Image"] を設定しても大幅な節約にはならない:テキスト出力トークンを削除するだけでは、画像 1 枚あたり約 $0.0003 の節約(0.5% 未満)にしかなりません。
  3. 思考トークンは削除できないresponse_modalities の設定に関わらず、常に生成され課金対象となります($3/M の料率)。
  4. 本当の節約は解像度とプラットフォーム選びで実現:適切な解像度を選ぶことで 70% 節約可能、APIYI を利用することでさらに 63% 節約できます。

Nano Banana 2 の呼び出しには、APIYI apiyi.com の利用をお勧めします。従量課金で 4K 解像度無制限の画像が 1 枚あたり $0.045、大量利用時は 1 枚あたり $0.018 まで低価格です。プラットフォームは同時実行数に制限がなく、Google ネイティブ形式での呼び出しをサポートし、無料の画像生成ツール imagen.apiyi.com も付帯しています。


📚 参考資料

  1. Google Gemini API 料金ページ: Nano Banana 2 の公式トークン価格表

    • リンク: ai.google.dev/gemini-api/docs/pricing
    • 説明: 画像/テキスト/思考の 3 種類のトークンの最新価格を確認できます。
  2. Google AI 画像生成ドキュメント: response_modalities パラメータの説明

    • リンク: ai.google.dev/gemini-api/docs/image-generation
    • 説明: ["Image"]["Text","Image"] の 2 つのモードの設定方法についての公式ドキュメントです。
  3. Google AI トークンカウントドキュメント: トークンの構成と課金についての理解

    • リンク: ai.google.dev/gemini-api/docs/tokens
    • 説明: 画像出力トークン数と解像度の関係について学べます。
  4. APIYI Nano Banana 2 ドキュメント: 従量課金/定額課金の 2 つの料金モデルの詳細

    • リンク: docs.apiyi.com/en/api-capabilities/nano-banana-2-image
    • 説明: APIYI プラットフォームの料金プランと呼び出し方法について説明しています。

著者: APIYI 技術チーム
技術交流: コメント欄での議論を歓迎します。詳細な資料は APIYI docs.apiyi.com ドキュメントセンターでご覧いただけます。

類似投稿