Gemini 3.1 Pro 思考等級怎麼設? 3 級控制 + Deep Think Mini 完整配置教程

Gemini 3.1 Pro Preview 新增了 medium 思考等級，這是與前代 Gemini 3 Pro 最大的區別之一。現在你可以在 low、medium、high 三個等級間精確控制模型的推理深度，而 high 模式更是激活了 Deep Think Mini 能力。

核心價值: 讀完本文，你將掌握 thinkingLevel 參數的完整配置方法，學會在質量、速度和成本之間找到最優平衡。

Gemini 3.1 Pro 思考等級完整支持矩陣

先看全局: 不同 Gemini 模型支持的思考等級不同。

思考等級	Gemini 3.1 Pro	Gemini 3 Pro	Gemini 3 Flash	說明
minimal	❌ 不支持	❌ 不支持	✅ 支持	接近關閉思考，僅 Flash 支持
low	✅ 支持	✅ 支持	✅ 支持	快速響應，最低成本
medium	✅ 新增支持	❌ 不支持	✅ 支持	平衡推理，3.1 Pro 的核心升級
high	✅ 支持（默認）	✅ 支持（默認）	✅ 支持（默認）	最深推理，激活 Deep Think Mini

關鍵變化: 3 Pro → 3.1 Pro 的思考等級升級

對比	Gemini 3 Pro	Gemini 3.1 Pro
可用等級	low， high （僅 2 級）	low， medium， high （3 級）
默認等級	high	high
high 模式含義	深度推理	Deep Think Mini （更強）
能否關閉思考	不能	不能

核心理解: Gemini 3 Pro 的 high 推理深度 ≈ Gemini 3.1 Pro 的 medium。而 3.1 Pro 的 high 是全新的 Deep Think Mini，推理深度遠超上代。

🎯 遷移建議: 如果你之前用 Gemini 3 Pro 的 high 模式，切換到 3.1 Pro 後建議先用 medium （保持類似的質量和成本），只在需要深度推理時開啓 high。API易 apiyi.com 同時支持所有 Gemini 模型和思考等級。

Gemini 3.1 Pro 思考等級 API 設置方法

通過 API易調用（OpenAI 兼容格式）

import openai

client = openai.OpenAI（
    api_key="YOUR_API_KEY"，
    base_url="https://api.apiyi.com/v1"  # API易 統一接口
）

# LOW 模式: 快速響應
response_low = client.chat.completions.create（
    model="gemini-3.1-pro-preview"，
    messages=[{"role": "user"， "content": "把這段英文翻譯成中文: Hello World"}]，
    extra_body={
        "thinking": {"type": "enabled"， "budget_tokens": 1024}
    }
）

# MEDIUM 模式: 平衡推理 （新增！）
response_med = client.chat.completions.create（
    model="gemini-3.1-pro-preview"，
    messages=[{"role": "user"， "content": "審查這段代碼有沒有內存泄漏風險"}]，
    extra_body={
        "thinking": {"type": "enabled"， "budget_tokens": 8192}
    }
）

# HIGH 模式: Deep Think Mini
response_high = client.chat.completions.create（
    model="gemini-3.1-pro-preview"，
    messages=[{"role": "user"， "content": "證明: 對所有正整數n， n^3-n能被6整除"}]，
    extra_body={
        "thinking": {"type": "enabled"， "budget_tokens": 32768}
    }
）

通過 Google SDK 原生調用

from google import genai
from google.genai import types

client = genai.Client（）

# 使用 thinkingLevel 參數
response = client.models.generate_content（
    model="gemini-3.1-pro-preview"，
    contents="你的提示詞"，
    config=types.GenerateContentConfig（
        thinking_config=types.ThinkingConfig（
            thinking_level="MEDIUM"  # "LOW" / "MEDIUM" / "HIGH"
        ）
    ），
）

# 查看思考 token 消耗
print（f"思考 token: {response.usage_metadata.thoughts_token_count}"）
print（f"輸出 token: {response.usage_metadata.candidates_token_count}"）

REST API 調用

POST https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent

{
  "contents": [{"parts": [{"text": "你的提示詞"}]}]，
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "MEDIUM"
    }
  }
}

⚠️ 重要提醒: thinkingLevel 和 thinkingBudget 不能同時使用，否則會返回 400 錯誤。Gemini 3+ 模型推薦使用 thinkingLevel，Gemini 2.5 模型使用 thinkingBudget。

3 個思考等級的 Gemini 3.1 Pro 詳細對比

LOW: 最快最便宜

維度	詳情
推理深度	最少的思考 token，仍優於不思考的模型
響應速度	秒級（最快）
成本	最低（思考 token 少 → 輸出 token 少 → 費用低）
適用場景	自動補全、分類、結構化數據提取、簡單翻譯、摘要
不適合	複雜推理、數學證明、多步調試

MEDIUM: 平衡首選（新增）

維度	詳情
推理深度	中等思考 token，≈ 舊版 3.0 Pro 的 high 水平
響應速度	中等延遲
成本	中等
適用場景	代碼審查、文檔分析、日常編碼、標準 API 調用、問答
不適合	IMO 級數學、極複雜的多步推理

HIGH: Deep Think Mini （默認）

維度	詳情
推理深度	最大化推理，激活 Deep Think Mini 能力
響應速度	可能需要數分鐘（IMO 題 ~8 分鐘）
成本	最高（大量思考 token 按輸出價格計費）
適用場景	複雜調試、算法設計、數學證明、研究任務、Agent 工作流
特殊能力	思考簽名（thought signatures）保持跨 API 調用的推理連續性

Gemini 3.1 Pro 思考 Token 計費規則

理解計費是選擇思考等級的關鍵。

核心計費原則

計費項	說明
思考 token 是否計費	是，按輸出 token 同等價格計費
輸出 token 價格	$12.00 / 1M tokens （包含思考 token）
計費基準	按完整內部推理鏈計費，不僅是摘要
思考摘要	API 僅返回思考摘要，但按完整思考 token 數計費

谷歌官方說明:

"Thinking models generate full thoughts to improve the quality of the final response， and then output summaries to provide insight into the thought process. Pricing is based on the full thought tokens the model needs to generate to create a summary， despite only the summary being output from the API."

三個等級的成本估算

等級	估算思考 token	以 1000 次調用計	月成本趨勢
LOW	~500-2K / 次	$6-24	最低
MEDIUM	~2K-8K / 次	$24-96	中等
HIGH	~8K-32K+ / 次	$96-384+	較高，複雜任務更多

💰 成本優化: 不是每個請求都需要 HIGH。將 80% 的日常任務設爲 LOW 或 MEDIUM，僅 20% 的複雜任務用 HIGH，可以將 API 支出降低 50-70%。通過 API易 apiyi.com 平臺可以靈活配置。

任務類型與 Gemini 3.1 Pro 思考等級匹配指南

詳細場景推薦

任務類型	推薦等級	理由	延遲預期
簡單翻譯	LOW	不需要推理	<5 秒
文本分類	LOW	模式匹配任務	<5 秒
摘要提取	LOW	信息壓縮，非推理	<10 秒
自動補全	LOW	延遲敏感	<3 秒
代碼審查	MEDIUM	需要適度分析	10-30 秒
文檔問答	MEDIUM	理解 + 回答	10-30 秒
日常編碼	MEDIUM	常規代碼生成	15-40 秒
Bug 分析	MEDIUM	中等複雜度推理	20-40 秒
複雜調試	HIGH	多步推理鏈	1-5 分鐘
數學證明	HIGH	Deep Think Mini	3-8 分鐘
算法設計	HIGH	深度推理	2-5 分鐘
研究分析	HIGH	多維度深度分析	2-5 分鐘
Agent 工作流	HIGH	思考簽名保持連續	視任務而定

動態等級選擇: 最佳實踐代碼

import openai

client = openai.OpenAI（
    api_key="YOUR_API_KEY"，
    base_url="https://api.apiyi.com/v1"  # API易 統一接口
）

# 根據任務類型自動選擇思考等級
THINKING_CONFIG = {
    "simple":  {"type": "enabled"， "budget_tokens": 1024}，   # LOW
    "medium":  {"type": "enabled"， "budget_tokens": 8192}，   # MEDIUM
    "complex": {"type": "enabled"， "budget_tokens": 32768}，  # HIGH
}

def smart_think（prompt， complexity="medium"）:
    """根據任務複雜度自動設置思考等級"""
    return client.chat.completions.create（
        model="gemini-3.1-pro-preview"，
        messages=[{"role": "user"， "content": prompt}]，
        extra_body={"thinking": THINKING_CONFIG[complexity]}
    ）

# 簡單翻譯 → LOW
resp1 = smart_think（"翻譯: Good morning"， "simple"）

# 代碼審查 → MEDIUM
resp2 = smart_think（"審查這段代碼的安全性: ..."， "medium"）

# 數學證明 → HIGH （Deep Think Mini）
resp3 = smart_think（"證明黎曼猜想的某個特殊情況"， "complex"）

Gemini 3.1 Pro vs 3 Pro: 思考等級演進對照

Deep Think Mini 到底強在哪

Gemini 3.1 Pro 的 HIGH 模式激活的 Deep Think Mini 是這次升級的最大亮點。

Deep Think Mini 是什麼

Deep Think Mini 不是一個獨立模型，而是 Gemini 3.1 Pro 在 HIGH 思考等級下的特殊推理模式。谷歌將其描述爲「Gemini Deep Think 的迷你版本」— Deep Think 是谷歌的專用重型推理模型（ARC-AGI-2 得分 84.6%）。

Deep Think Mini 的實測表現

測試項	Deep Think Mini （3.1 Pro HIGH）	Gemini 3 Pro HIGH	提升幅度
ARC-AGI-2	77.1%	31.1%	+148%
IMO 數學題	~8 分鐘解出	無法解出	從不能到能
複雜規劃任務	基準提升 40-60%	對比 Gemini 2.5 Pro	顯著提升

思考簽名（Thought Signatures）

Deep Think Mini 引入了一項獨特技術: 思考簽名（thought signatures）。這是加密的、防篡改的中間推理狀態表示。

在 Agent 工作流中，模型的推理往往跨越多個 API 調用。思考簽名可以將前一次調用的推理上下文傳遞給下一次調用，保持推理連續性。這對多步驟 Agent 任務尤爲重要。

什麼任務值得用 Deep Think Mini

值得用 HIGH （Deep Think Mini）	不值得用 HIGH
數學競賽級推理	簡單四則運算
複雜 Bug 跨文件調試	語法錯誤修復
算法設計和優化	CRUD 代碼生成
學術論文方法論分析	文章摘要
多步驟 Agent 長任務	單輪問答
安全漏洞深度分析	格式轉換

💡 實用建議: Deep Think Mini 的強大是有代價的 — 延遲和成本都很高。建議只在真正需要「深度思考」的任務上使用 HIGH，日常任務用 MEDIUM 足矣。通過 API易 apiyi.com 可以在每個請求級別靈活切換。

thinkingLevel vs thinkingBudget: 別混淆

谷歌有兩個控制思考的參數，適用於不同模型系列:

參數	適用模型	值類型	說明
thinkingLevel	Gemini 3+ （3 Flash， 3 Pro， 3.1 Pro）	枚舉: MINIMAL/LOW/MEDIUM/HIGH	推薦用於 Gemini 3 系列
thinkingBudget	Gemini 2.5 （Pro， Flash， Flash Lite）	整數: 0-32768	適用於 2.5 系列

⚠️ 兩個參數不能同時使用！ 同時傳入會返回 400 錯誤。

場景	正確做法	錯誤做法
調用 Gemini 3.1 Pro	用 `thinkingLevel: "MEDIUM"`	用 `thinkingBudget: 8192`
調用 Gemini 2.5 Pro	用 `thinkingBudget: 8192`	用 `thinkingLevel: "MEDIUM"`
兩個參數都傳	—	400 錯誤 ❌

🎯 簡單記憶: Gemini 3 系列 → thinkingLevel （字符串等級），Gemini 2.5 系列 → thinkingBudget （數字 token 數）。API易 apiyi.com 支持兩種參數格式。

常見問題

Q1: 默認不設置 thinkingLevel 是什麼等級？

默認是 HIGH。這意味着如果你不主動設置，每次調用都會使用 Deep Think Mini 的全部推理能力，消耗最多的思考 token。建議根據任務實際需要設置合適的等級以節省成本。通過 API易 apiyi.com 可以在請求級別靈活控制。

Q2: 思考 token 怎麼計費？很貴嗎？

思考 token 按輸出 token 同等價格計費（$12.00 / 1M tokens）。HIGH 模式下一個複雜請求可能消耗 3 萬+ 思考 token，費用約 $0.36。而 LOW 模式同樣的請求可能只消耗 1000 思考 token，費用約 $0.012。差距可達 30 倍。

Q3: 3.1 Pro 的 MEDIUM 就是 3.0 Pro 的 HIGH 嗎？

基本等價。谷歌的描述是 3.1 Pro 的 MEDIUM 提供「平衡的思維，適合處理大多數任務」，這和 3.0 Pro 的 HIGH 的定位一致。如果你從 3.0 Pro 遷移到 3.1 Pro，把 HIGH 改成 MEDIUM 可以保持相似的質量和成本。通過 API易 apiyi.com 可以同時調用兩個版本做對比。

Q4: 能關閉思考功能嗎？

Gemini 3.1 Pro 不能完全關閉思考。最低只能設爲 LOW，仍會進行基礎推理。如果需要完全無思考的響應，可以考慮 Gemini 3 Flash 的 MINIMAL 模式。

Gemini 3.1 Pro 思考等級常見誤區

誤區	事實
「HIGH 等級回答質量最好，應該一直用」	HIGH 在簡單任務上的質量和 MEDIUM 接近，但成本高 5-10 倍
「LOW 等級推理能力很差」	LOW 仍然優於完全不思考的模型，只是思考 token 更少
「MEDIUM 是新功能，可能不穩定」	MEDIUM 的推理深度 ≈ 舊版 3.0 Pro 的 HIGH，已經過充分驗證
「思考 token 不計費」	計費！按輸出 token 同價（$12/MTok）計費
「可以關閉 3.1 Pro 的思考」	不能，最低只能設爲 LOW，仍有基礎推理
「thinkingLevel 和 thinkingBudget 可以一起用」	不行！同時使用會返回 400 錯誤
「設高等級延遲會更長但結果立即返回」	HIGH 模式可能需要數分鐘才能開始返回，不是延遲一小會

總結: Gemini 3.1 Pro 思考等級選擇速查

等級	一句話	適用場景	相對成本
LOW	最快最便宜	翻譯、分類、摘要、補全	1x
MEDIUM	平衡首選（新增）	編碼、審查、分析、問答	2-3x
HIGH	Deep Think Mini	數學、調試、研究、Agent	5-10x+

核心建議:

日常開發用 MEDIUM — 質量好、成本合理，等價於舊版 HIGH
簡單任務用 LOW — 節省 70%+ 的思考 token 費用
深度推理用 HIGH — Deep Think Mini 能力獨一無二，但注意成本
默認是 HIGH — 不設置就是最貴模式，記得主動調整

推薦通過 API易 apiyi.com 平臺根據任務類型動態切換思考等級，實現質量與成本的最優平衡。

參考資料

Google AI 文檔: Gemini 思考配置指南
- 鏈接: ai.google.dev/gemini-api/docs/thinking
- 說明: thinkingLevel 參數的完整文檔
Google AI 文檔: Gemini 3.1 Pro 模型頁
- 鏈接: ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview
- 說明: 思考等級支持矩陣和注意事項
Gemini API 定價頁面: 思考 token 計費說明
- 鏈接: ai.google.dev/gemini-api/docs/pricing
- 說明: 思考 token 按輸出 token 價格計費
VentureBeat: Deep Think Mini 深度體驗
- 鏈接: venturebeat.com/technology/google-gemini-3-1-pro-first-impressions
- 說明: IMO 題 8 分鐘解出的實測數據
Google 官方博客: Gemini 3.1 Pro 發佈公告
- 鏈接: blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro
- 說明: 三級思考系統和 Deep Think Mini 的官方介紹

📝 作者: APIYI Team | 技術交流請訪問 API易 apiyi.com
📅 更新時間: 2026 年 2 月 20 日
🏷️ 關鍵詞: Gemini 3.1 Pro 思考等級， thinkingLevel， Deep Think Mini， LOW MEDIUM HIGH， API 調用，推理控制

Gemini 3.1 Pro 思考等級怎麼設? 3 級控制 + Deep Think Mini 完整配置教程

Gemini 3.1 Pro 思考等級完整支持矩陣

關鍵變化: 3 Pro → 3.1 Pro 的思考等級升級

Gemini 3.1 Pro 思考等級 API 設置方法

通過 API易調用（OpenAI 兼容格式）

通過 Google SDK 原生調用

REST API 調用

3 個思考等級的 Gemini 3.1 Pro 詳細對比

LOW: 最快最便宜

MEDIUM: 平衡首選（新增）

HIGH: Deep Think Mini （默認）

Gemini 3.1 Pro 思考 Token 計費規則

核心計費原則

三個等級的成本估算

任務類型與 Gemini 3.1 Pro 思考等級匹配指南

詳細場景推薦

動態等級選擇: 最佳實踐代碼

Gemini 3.1 Pro vs 3 Pro: 思考等級演進對照

Deep Think Mini 到底強在哪

Deep Think Mini 是什麼

Deep Think Mini 的實測表現

思考簽名（Thought Signatures）

什麼任務值得用 Deep Think Mini

thinkingLevel vs thinkingBudget: 別混淆

常見問題

Gemini 3.1 Pro 思考等級常見誤區

總結: Gemini 3.1 Pro 思考等級選擇速查

參考資料

3步完成 Google AI Studio 遷移到 API易：保留代碼僅改2處配置

5 種方法解決 Nano Banana Pro 503 模型過載錯誤：完整排查指南

解決 Gemini API thinking_budget 和 thinking_level 衝突報錯的 3 種方法

Sora 2 API 官轉 vs 官逆對比 – 3 種調用方案如何選擇

Gemini 3.1 Pro 能生成圖片嗎? 3 個關鍵區別幫你分清文本模型和圖片模型

Google Flow Veo 3.1 生成模式完全解析：Fast vs Quality 模式對比 + Relaxed 模式真相

Gemini 3.1 Pro 思考等級完整支持矩陣

關鍵變化: 3 Pro → 3.1 Pro 的思考等級升級

Gemini 3.1 Pro 思考等級 API 設置方法

通過 API易 調用 （OpenAI 兼容格式）

通過 Google SDK 原生調用

REST API 調用

3 個思考等級的 Gemini 3.1 Pro 詳細對比

LOW: 最快最便宜

MEDIUM: 平衡首選 （新增）

HIGH: Deep Think Mini （默認）

Gemini 3.1 Pro 思考 Token 計費規則

核心計費原則

三個等級的成本估算

任務類型與 Gemini 3.1 Pro 思考等級匹配指南

詳細場景推薦

動態等級選擇: 最佳實踐代碼

Gemini 3.1 Pro vs 3 Pro: 思考等級演進對照

Deep Think Mini 到底強在哪

Deep Think Mini 是什麼

Deep Think Mini 的實測表現

思考簽名 （Thought Signatures）

什麼任務值得用 Deep Think Mini

thinkingLevel vs thinkingBudget: 別混淆

常見問題

Gemini 3.1 Pro 思考等級常見誤區

總結: Gemini 3.1 Pro 思考等級選擇速查

參考資料

Similar Posts

通過 API易調用（OpenAI 兼容格式）

MEDIUM: 平衡首選（新增）

思考簽名（Thought Signatures）