作者注:深度分析 Nano Banana 2 設置 response_modalities 爲 IMAGE 僅返回圖片時的 Token 消耗差異,拆解圖像/文本/思考三類 Token 的計費規則,給出最優省錢配置方案

調用 Nano Banana 2 生圖時,response_modalities 參數有兩種設置方式:["Text", "Image"](默認)和 ["Image"](僅圖片)。一個自然的問題是:設置爲僅返回圖片,能省多少 Token 和費用?
核心價值:讀完本文,你將徹底理解 Nano Banana 2 的三類輸出 Token(圖像/文本/思考)的計費規則,明確 response_modalities=["Image"] 到底能省多少錢,以及真正有效的省錢策略。
Nano Banana 2 的三類輸出 Token 計費規則
Nano Banana 2 的輸出計費並不是簡單的「一個價格」,而是分成三類獨立計價的 Token:
| Token 類型 | 計費單價 | 說明 | 能否通過參數消除 |
|---|---|---|---|
| 圖像輸出 Token | $60.00 / M Tokens | 生成圖片消耗的 Token,佔總費用 95%+ | ❌ 不能(核心產出) |
| 文本輸出 Token | $3.00 / M Tokens | 圖片附帶的文字描述/說明 | ✅ 設 ["Image"] 可消除 |
| 思考 Token (Thinking) | $3.00 / M Tokens | 模型內部推理過程消耗 | ❌ 始終產生,無法關閉 |
| 輸入 Token | $0.50 / M Tokens | 你的 prompt 文本和參考圖 | ⚠️ 可優化 prompt 長度 |
Nano Banana 2 圖像 Token 是費用絕對大頭
關鍵數字:圖像輸出 Token 的單價是 $60/M,而文本和思考 Token 的單價僅 $3/M——圖像 Token 貴 20 倍。
| 分辨率 | 圖像輸出 Token | 圖像費用 | 佔總輸出費用比例 |
|---|---|---|---|
| 512px | ~747 | ~$0.045 | ~95% |
| 1K (默認) | ~1,120 | ~$0.067 | ~96% |
| 2K | ~1,680 | ~$0.101 | ~97% |
| 4K | ~2,520 | ~$0.151 | ~97% |
🔑 核心結論:圖像 Token 佔總輸出費用的 95-97%。文本和思考 Token 加起來只佔 3-5%。所以即使完全去掉文本輸出,省下的費用也非常有限。
response_modalities 兩種設置的 Token 對比

設置 ["Text", "Image"] — 默認模式
默認情況下,Nano Banana 2 返回圖片 + 文字說明。模型會先「思考」(Thinking),然後輸出一段文字描述和圖片。
from google import genai
from google.genai import types
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-3.1-flash-image-preview",
contents="生成一隻穿宇航服的貓咪",
config=types.GenerateContentConfig(
response_modalities=["Text", "Image"], # 默認:文本+圖片
)
)
輸出內容:一段文字描述(如「這是一隻穿着宇航服的橘貓……」)+ 1 張圖片
Token 消耗構成(以 1K 分辨率爲例):
- 思考 Token:~200-800(因 prompt 複雜度而異)
- 文本輸出 Token:~50-200
- 圖像輸出 Token:~1,120
設置 ["Image"] — 僅圖片模式
設置爲僅返回圖片,不返回文字描述。
response = client.models.generate_content(
model="gemini-3.1-flash-image-preview",
contents="生成一隻穿宇航服的貓咪",
config=types.GenerateContentConfig(
response_modalities=["Image"], # 僅圖片,不返回文本
)
)
輸出內容:僅 1 張圖片,無文字描述
Token 消耗構成(以 1K 分辨率爲例):
- 思考 Token:~200-800(仍然產生,仍然計費)
- 文本輸出 Token:0(被消除 ✅)
- 圖像輸出 Token:~1,120(不變)
Nano Banana 2 兩種模式的費用對比
| 對比項 | ["Text", "Image"] 默認 | ["Image"] 僅圖片 | 差異 |
|---|---|---|---|
| 圖像 Token (~1,120) | $0.0672 | $0.0672 | 0(不變) |
| 思考 Token (~500) | $0.0015 | $0.0015 | 0(不變) |
| 文本 Token (~100) | $0.0003 | $0 | 省 $0.0003 |
| 單張總費用 (1K) | ~$0.069 | ~$0.069 | 省 ~0.4% |
⚠️ 結論:
response_modalities=["Image"]確實能省掉文本輸出 Token,但由於文本 Token 單價僅 $3/M 且數量很少(約 50-200 個),實際每張圖只省約 $0.0001-$0.0006,幾乎可以忽略。
Nano Banana 2 爲什麼 Thinking Token 無法省掉?
這是 Nano Banana 2 計費中最容易被忽略的一點:思考 Token 始終產生,且始終計費,無論你是否查看思考過程。
Google 官方文檔明確說明:
Thinking tokens are billed regardless of whether
includeThoughtsis set totrueorfalse, as the thinking process always happens by default.
也就是說:
includeThoughts=True:你能看到思考過程,計費includeThoughts=False:你看不到思考過程,仍然計費- 思考 Token 的計費費率:$3/M(與文本輸出相同)
Nano Banana 2 支持兩個 Thinking 級別:
| Thinking 級別 | 設置方式 | 思考 Token 消耗 | 圖像質量 | 推薦場景 |
|---|---|---|---|---|
| minimal | 默認 | ~200-500 | 足夠大多數場景 | 日常生圖 |
| high | thinking_level="high" |
~500-2000 | 複雜場景更好 | 多角色/精確構圖 |
💡 優化建議:如果不需要極致畫質,保持默認的
minimal思考級別。high級別會增加數百到上千個思考 Token,雖然單價不高($3/M),但在批量場景下也是一筆開銷。
Nano Banana 2 真正有效的省錢策略
既然 response_modalities=["Image"] 省不了多少錢,哪些策略才真正有效?

| 省錢策略 | 節省比例 | 具體操作 | 推薦度 |
|---|---|---|---|
| 選擇合適分辨率 | 最高 70% | 4K→512px 費用從 $0.151 降到 $0.045 | ⭐⭐⭐⭐⭐ |
| 使用 API易 按次計費 | 最高 70% | $0.045/張(含 4K),不區分分辨率 | ⭐⭐⭐⭐⭐ |
| 使用 API易 按量計費 | 最高 63% | 低分辨率僅 $0.018/張 (512px) | ⭐⭐⭐⭐⭐ |
| Google Batch API | 50% | 離線批量處理,圖像 Token 半價 | ⭐⭐⭐⭐ |
| Thinking minimal | 2-5% | 保持默認思考級別 | ⭐⭐⭐ |
| response_modalities=["Image"] | ~0.4% | 去掉文本輸出 | ⭐ |
Nano Banana 2 不同分辨率在各平臺的價格對比
| 分辨率 | Google 官方 | API易 按次 | API易 按量 | 最大節省 |
|---|---|---|---|---|
| 512px | $0.045 | $0.045 | $0.018 | 60% |
| 1K | $0.067 | $0.045 | $0.025 | 63% |
| 2K | $0.101 | $0.045 | $0.03 | 70% |
| 4K | $0.151 | $0.045 | $0.045 | 70% |
🎯 最佳實踐:如果你的業務允許用 1K 而不是 4K,直接省 55%。再配合 API易 apiyi.com 的按量計費,1K 分辨率僅 $0.025/張,比官方 4K 的 $0.151 省了 83%。平臺還提供免費出圖測試工具 AI 圖片大師: imagen.apiyi.com ,無需寫代碼即可快速驗證不同分辨率的效果。
Nano Banana 2 通過 API易 調用的最優配置
綜合以上分析,以下是推薦的最優配置:
import requests
import base64
API_KEY = "your-apiyi-api-key"
ENDPOINT = "https://api.apiyi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent"
headers = {
"Content-Type": "application/json",
"x-goog-api-key": API_KEY
}
payload = {
"contents": [{"parts": [{"text": "一隻穿宇航服的貓咪,數字藝術風格"}]}],
"generationConfig": {
"responseModalities": ["IMAGE"], # 僅圖片,省掉文本 Token
"imageConfig": {
"aspectRatio": "1:1",
"imageSize": "1K" # 按需選分辨率,這纔是省錢關鍵
}
}
}
response = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120)
result = response.json()
image_data = result["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
with open("output.png", "wb") as f:
f.write(base64.b64decode(image_data))
建議:通過 API易 apiyi.com 調用 Nano Banana 2,按次計費 $0.045/張不區分分辨率,按量計費最低 $0.018/張。支持 Google 原生格式調用,遷移零成本。
常見問題
Q1: response_modalities=[“Image”] 設置後思考 Token 還會產生嗎?
會。Nano Banana 2 的思考過程(Thinking)是默認啓用且無法關閉的。無論你設置 response_modalities 爲 ["Image"] 還是 ["Text", "Image"],也無論 includeThoughts 設爲 true 還是 false,思考 Token 都會產生並計費。好消息是思考 Token 按文本費率 $3/M 計費,遠低於圖像 Token 的 $60/M。
Q2: 那設置 [“Image”] 還有什麼意義?
主要有兩點價值:一是減少網絡傳輸量,不返回文本內容意味着更快的響應解析;二是簡化代碼邏輯,不需要額外處理文本部分。費用上的節省雖然不到 1%,但在需要純圖片輸出的場景(如批量生產素材),直接拿到圖片更方便。
Q3: 使用 API易 按次計費和按量計費哪個更划算?
取決於你的常用分辨率。按次計費 $0.045/張不區分分辨率,適合經常出 2K/4K 大圖的場景。按量計費按 Token 消耗靈活計價,低分辨率(512px)僅 $0.018/張,適合批量出低分辨率圖的場景。通過 API易 apiyi.com 註冊即可使用兩種計費模式。
總結
Nano Banana 2 的 response_modalities 計費分析核心要點:
- 圖像 Token 是絕對大頭:$60/M 的單價佔總輸出費用 95-97%,文本和思考 Token 加起來僅佔 3-5%
- 設 ["Image"] 省不了多少:僅消除文本輸出 Token,每張圖省約 $0.0003(不到 0.5%)
- 思考 Token 無法消除:始終產生且計費,$3/M 費率,與 response_modalities 設置無關
- 真正省錢靠分辨率和平臺:選合適分辨率可省 70%,使用 API易可再省 63%
推薦通過 API易 apiyi.com 調用 Nano Banana 2,按次 $0.045/張含 4K 不限分辨率,按量計費低至 $0.018/張。平臺不限併發,支持 Google 原生格式調用,附帶免費出圖工具: imagen.apiyi.com 。
📚 參考資料
-
Google Gemini API 定價頁: Nano Banana 2 官方 Token 價格表
- 鏈接:
ai.google.dev/gemini-api/docs/pricing - 說明: 查看圖像/文本/思考三類 Token 的最新定價
- 鏈接:
-
Google AI 圖像生成文檔: response_modalities 參數說明
- 鏈接:
ai.google.dev/gemini-api/docs/image-generation - 說明: 官方文檔說明 ["Image"] 和 ["Text","Image"] 兩種模式的配置方式
- 鏈接:
-
Google AI Token 計數文檔: 理解 Token 構成和計費
- 鏈接:
ai.google.dev/gemini-api/docs/tokens - 說明: 瞭解圖像輸出 Token 數量與分辨率的關係
- 鏈接:
-
API易 Nano Banana 2 文檔: 按次/按量兩種計費模式詳情
- 鏈接:
docs.apiyi.com/en/api-capabilities/nano-banana-2-image - 說明: API易平臺的計費方案和調用方式說明
- 鏈接:
作者: APIYI 技術團隊
技術交流: 歡迎在評論區討論,更多資料可訪問 API易 docs.apiyi.com 文檔中心
