Gemini 3.1 Pro Preview 新增了 medium 思考等級,這是與前代 Gemini 3 Pro 最大的區別之一。現在你可以在 low、medium、high 三個等級間精確控制模型的推理深度,而 high 模式更是激活了 Deep Think Mini 能力。
核心價值: 讀完本文,你將掌握 thinkingLevel 參數的完整配置方法,學會在質量、速度和成本之間找到最優平衡。

Gemini 3.1 Pro 思考等級完整支持矩陣
先看全局: 不同 Gemini 模型支持的思考等級不同。
| 思考等級 | Gemini 3.1 Pro | Gemini 3 Pro | Gemini 3 Flash | 說明 |
|---|---|---|---|---|
| minimal | ❌ 不支持 | ❌ 不支持 | ✅ 支持 | 接近關閉思考,僅 Flash 支持 |
| low | ✅ 支持 | ✅ 支持 | ✅ 支持 | 快速響應,最低成本 |
| medium | ✅ 新增支持 | ❌ 不支持 | ✅ 支持 | 平衡推理,3.1 Pro 的核心升級 |
| high | ✅ 支持 (默認) | ✅ 支持 (默認) | ✅ 支持 (默認) | 最深推理,激活 Deep Think Mini |
關鍵變化: 3 Pro → 3.1 Pro 的思考等級升級
| 對比 | Gemini 3 Pro | Gemini 3.1 Pro |
|---|---|---|
| 可用等級 | low, high (僅 2 級) | low, medium, high (3 級) |
| 默認等級 | high | high |
| high 模式含義 | 深度推理 | Deep Think Mini (更強) |
| 能否關閉思考 | 不能 | 不能 |
核心理解: Gemini 3 Pro 的 high 推理深度 ≈ Gemini 3.1 Pro 的 medium。而 3.1 Pro 的 high 是全新的 Deep Think Mini,推理深度遠超上代。
🎯 遷移建議: 如果你之前用 Gemini 3 Pro 的 high 模式,切換到 3.1 Pro 後建議先用 medium (保持類似的質量和成本),只在需要深度推理時開啓 high。API易 apiyi.com 同時支持所有 Gemini 模型和思考等級。
Gemini 3.1 Pro 思考等級 API 設置方法
通過 API易 調用 (OpenAI 兼容格式)
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # API易 統一接口
)
# LOW 模式: 快速響應
response_low = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "把這段英文翻譯成中文: Hello World"}],
extra_body={
"thinking": {"type": "enabled", "budget_tokens": 1024}
}
)
# MEDIUM 模式: 平衡推理 (新增!)
response_med = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "審查這段代碼有沒有內存泄漏風險"}],
extra_body={
"thinking": {"type": "enabled", "budget_tokens": 8192}
}
)
# HIGH 模式: Deep Think Mini
response_high = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "證明: 對所有正整數n, n^3-n能被6整除"}],
extra_body={
"thinking": {"type": "enabled", "budget_tokens": 32768}
}
)
通過 Google SDK 原生調用
from google import genai
from google.genai import types
client = genai.Client()
# 使用 thinkingLevel 參數
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents="你的提示詞",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(
thinking_level="MEDIUM" # "LOW" / "MEDIUM" / "HIGH"
)
),
)
# 查看思考 token 消耗
print(f"思考 token: {response.usage_metadata.thoughts_token_count}")
print(f"輸出 token: {response.usage_metadata.candidates_token_count}")
REST API 調用
POST https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent
{
"contents": [{"parts": [{"text": "你的提示詞"}]}],
"generationConfig": {
"thinkingConfig": {
"thinkingLevel": "MEDIUM"
}
}
}
⚠️ 重要提醒:
thinkingLevel和thinkingBudget不能同時使用,否則會返回 400 錯誤。Gemini 3+ 模型推薦使用thinkingLevel,Gemini 2.5 模型使用thinkingBudget。
3 個思考等級的 Gemini 3.1 Pro 詳細對比
LOW: 最快最便宜
| 維度 | 詳情 |
|---|---|
| 推理深度 | 最少的思考 token,仍優於不思考的模型 |
| 響應速度 | 秒級 (最快) |
| 成本 | 最低 (思考 token 少 → 輸出 token 少 → 費用低) |
| 適用場景 | 自動補全、分類、結構化數據提取、簡單翻譯、摘要 |
| 不適合 | 複雜推理、數學證明、多步調試 |
MEDIUM: 平衡首選 (新增)
| 維度 | 詳情 |
|---|---|
| 推理深度 | 中等思考 token,≈ 舊版 3.0 Pro 的 high 水平 |
| 響應速度 | 中等延遲 |
| 成本 | 中等 |
| 適用場景 | 代碼審查、文檔分析、日常編碼、標準 API 調用、問答 |
| 不適合 | IMO 級數學、極複雜的多步推理 |
HIGH: Deep Think Mini (默認)
| 維度 | 詳情 |
|---|---|
| 推理深度 | 最大化推理,激活 Deep Think Mini 能力 |
| 響應速度 | 可能需要數分鐘 (IMO 題 ~8 分鐘) |
| 成本 | 最高 (大量思考 token 按輸出價格計費) |
| 適用場景 | 複雜調試、算法設計、數學證明、研究任務、Agent 工作流 |
| 特殊能力 | 思考簽名 (thought signatures) 保持跨 API 調用的推理連續性 |

Gemini 3.1 Pro 思考 Token 計費規則
理解計費是選擇思考等級的關鍵。
核心計費原則
| 計費項 | 說明 |
|---|---|
| 思考 token 是否計費 | 是,按輸出 token 同等價格計費 |
| 輸出 token 價格 | $12.00 / 1M tokens (包含思考 token) |
| 計費基準 | 按完整內部推理鏈計費,不僅是摘要 |
| 思考摘要 | API 僅返回思考摘要,但按完整思考 token 數計費 |
谷歌官方說明:
"Thinking models generate full thoughts to improve the quality of the final response, and then output summaries to provide insight into the thought process. Pricing is based on the full thought tokens the model needs to generate to create a summary, despite only the summary being output from the API."
三個等級的成本估算
| 等級 | 估算思考 token | 以 1000 次調用計 | 月成本趨勢 |
|---|---|---|---|
| LOW | ~500-2K / 次 | $6-24 | 最低 |
| MEDIUM | ~2K-8K / 次 | $24-96 | 中等 |
| HIGH | ~8K-32K+ / 次 | $96-384+ | 較高,複雜任務更多 |
💰 成本優化: 不是每個請求都需要 HIGH。將 80% 的日常任務設爲 LOW 或 MEDIUM,僅 20% 的複雜任務用 HIGH,可以將 API 支出降低 50-70%。通過 API易 apiyi.com 平臺可以靈活配置。
任務類型與 Gemini 3.1 Pro 思考等級匹配指南
詳細場景推薦
| 任務類型 | 推薦等級 | 理由 | 延遲預期 |
|---|---|---|---|
| 簡單翻譯 | LOW | 不需要推理 | <5 秒 |
| 文本分類 | LOW | 模式匹配任務 | <5 秒 |
| 摘要提取 | LOW | 信息壓縮,非推理 | <10 秒 |
| 自動補全 | LOW | 延遲敏感 | <3 秒 |
| 代碼審查 | MEDIUM | 需要適度分析 | 10-30 秒 |
| 文檔問答 | MEDIUM | 理解 + 回答 | 10-30 秒 |
| 日常編碼 | MEDIUM | 常規代碼生成 | 15-40 秒 |
| Bug 分析 | MEDIUM | 中等複雜度推理 | 20-40 秒 |
| 複雜調試 | HIGH | 多步推理鏈 | 1-5 分鐘 |
| 數學證明 | HIGH | Deep Think Mini | 3-8 分鐘 |
| 算法設計 | HIGH | 深度推理 | 2-5 分鐘 |
| 研究分析 | HIGH | 多維度深度分析 | 2-5 分鐘 |
| Agent 工作流 | HIGH | 思考簽名保持連續 | 視任務而定 |
動態等級選擇: 最佳實踐代碼
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # API易 統一接口
)
# 根據任務類型自動選擇思考等級
THINKING_CONFIG = {
"simple": {"type": "enabled", "budget_tokens": 1024}, # LOW
"medium": {"type": "enabled", "budget_tokens": 8192}, # MEDIUM
"complex": {"type": "enabled", "budget_tokens": 32768}, # HIGH
}
def smart_think(prompt, complexity="medium"):
"""根據任務複雜度自動設置思考等級"""
return client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": prompt}],
extra_body={"thinking": THINKING_CONFIG[complexity]}
)
# 簡單翻譯 → LOW
resp1 = smart_think("翻譯: Good morning", "simple")
# 代碼審查 → MEDIUM
resp2 = smart_think("審查這段代碼的安全性: ...", "medium")
# 數學證明 → HIGH (Deep Think Mini)
resp3 = smart_think("證明黎曼猜想的某個特殊情況", "complex")
Gemini 3.1 Pro vs 3 Pro: 思考等級演進對照

Deep Think Mini 到底強在哪
Gemini 3.1 Pro 的 HIGH 模式激活的 Deep Think Mini 是這次升級的最大亮點。
Deep Think Mini 是什麼
Deep Think Mini 不是一個獨立模型,而是 Gemini 3.1 Pro 在 HIGH 思考等級下的特殊推理模式。谷歌將其描述爲「Gemini Deep Think 的迷你版本」— Deep Think 是谷歌的專用重型推理模型 (ARC-AGI-2 得分 84.6%)。
Deep Think Mini 的實測表現
| 測試項 | Deep Think Mini (3.1 Pro HIGH) | Gemini 3 Pro HIGH | 提升幅度 |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | 31.1% | +148% |
| IMO 數學題 | ~8 分鐘解出 | 無法解出 | 從不能到能 |
| 複雜規劃任務 | 基準提升 40-60% | 對比 Gemini 2.5 Pro | 顯著提升 |
思考簽名 (Thought Signatures)
Deep Think Mini 引入了一項獨特技術: 思考簽名 (thought signatures)。這是加密的、防篡改的中間推理狀態表示。
在 Agent 工作流中,模型的推理往往跨越多個 API 調用。思考簽名可以將前一次調用的推理上下文傳遞給下一次調用,保持推理連續性。這對多步驟 Agent 任務尤爲重要。
什麼任務值得用 Deep Think Mini
| 值得用 HIGH (Deep Think Mini) | 不值得用 HIGH |
|---|---|
| 數學競賽級推理 | 簡單四則運算 |
| 複雜 Bug 跨文件調試 | 語法錯誤修復 |
| 算法設計和優化 | CRUD 代碼生成 |
| 學術論文方法論分析 | 文章摘要 |
| 多步驟 Agent 長任務 | 單輪問答 |
| 安全漏洞深度分析 | 格式轉換 |
💡 實用建議: Deep Think Mini 的強大是有代價的 — 延遲和成本都很高。建議只在真正需要「深度思考」的任務上使用 HIGH,日常任務用 MEDIUM 足矣。通過 API易 apiyi.com 可以在每個請求級別靈活切換。
thinkingLevel vs thinkingBudget: 別混淆
谷歌有兩個控制思考的參數,適用於不同模型系列:
| 參數 | 適用模型 | 值類型 | 說明 |
|---|---|---|---|
| thinkingLevel | Gemini 3+ (3 Flash, 3 Pro, 3.1 Pro) | 枚舉: MINIMAL/LOW/MEDIUM/HIGH | 推薦用於 Gemini 3 系列 |
| thinkingBudget | Gemini 2.5 (Pro, Flash, Flash Lite) | 整數: 0-32768 | 適用於 2.5 系列 |
⚠️ 兩個參數不能同時使用! 同時傳入會返回 400 錯誤。
| 場景 | 正確做法 | 錯誤做法 |
|---|---|---|
| 調用 Gemini 3.1 Pro | 用 thinkingLevel: "MEDIUM" |
用 thinkingBudget: 8192 |
| 調用 Gemini 2.5 Pro | 用 thinkingBudget: 8192 |
用 thinkingLevel: "MEDIUM" |
| 兩個參數都傳 | — | 400 錯誤 ❌ |
🎯 簡單記憶: Gemini 3 系列 → thinkingLevel (字符串等級),Gemini 2.5 系列 → thinkingBudget (數字 token 數)。API易 apiyi.com 支持兩種參數格式。
常見問題
Q1: 默認不設置 thinkingLevel 是什麼等級?
默認是 HIGH。這意味着如果你不主動設置,每次調用都會使用 Deep Think Mini 的全部推理能力,消耗最多的思考 token。建議根據任務實際需要設置合適的等級以節省成本。通過 API易 apiyi.com 可以在請求級別靈活控制。
Q2: 思考 token 怎麼計費? 很貴嗎?
思考 token 按輸出 token 同等價格計費 ($12.00 / 1M tokens)。HIGH 模式下一個複雜請求可能消耗 3 萬+ 思考 token,費用約 $0.36。而 LOW 模式同樣的請求可能只消耗 1000 思考 token,費用約 $0.012。差距可達 30 倍。
Q3: 3.1 Pro 的 MEDIUM 就是 3.0 Pro 的 HIGH 嗎?
基本等價。谷歌的描述是 3.1 Pro 的 MEDIUM 提供「平衡的思維,適合處理大多數任務」,這和 3.0 Pro 的 HIGH 的定位一致。如果你從 3.0 Pro 遷移到 3.1 Pro,把 HIGH 改成 MEDIUM 可以保持相似的質量和成本。通過 API易 apiyi.com 可以同時調用兩個版本做對比。
Q4: 能關閉思考功能嗎?
Gemini 3.1 Pro 不能完全關閉思考。最低只能設爲 LOW,仍會進行基礎推理。如果需要完全無思考的響應,可以考慮 Gemini 3 Flash 的 MINIMAL 模式。
Gemini 3.1 Pro 思考等級常見誤區
| 誤區 | 事實 |
|---|---|
| 「HIGH 等級回答質量最好,應該一直用」 | HIGH 在簡單任務上的質量和 MEDIUM 接近,但成本高 5-10 倍 |
| 「LOW 等級推理能力很差」 | LOW 仍然優於完全不思考的模型,只是思考 token 更少 |
| 「MEDIUM 是新功能,可能不穩定」 | MEDIUM 的推理深度 ≈ 舊版 3.0 Pro 的 HIGH,已經過充分驗證 |
| 「思考 token 不計費」 | 計費! 按輸出 token 同價 ($12/MTok) 計費 |
| 「可以關閉 3.1 Pro 的思考」 | 不能,最低只能設爲 LOW,仍有基礎推理 |
| 「thinkingLevel 和 thinkingBudget 可以一起用」 | 不行! 同時使用會返回 400 錯誤 |
| 「設高等級延遲會更長但結果立即返回」 | HIGH 模式可能需要數分鐘才能開始返回,不是延遲一小會 |
總結: Gemini 3.1 Pro 思考等級選擇速查
| 等級 | 一句話 | 適用場景 | 相對成本 |
|---|---|---|---|
| LOW | 最快最便宜 | 翻譯、分類、摘要、補全 | 1x |
| MEDIUM | 平衡首選 (新增) | 編碼、審查、分析、問答 | 2-3x |
| HIGH | Deep Think Mini | 數學、調試、研究、Agent | 5-10x+ |
核心建議:
- 日常開發用 MEDIUM — 質量好、成本合理,等價於舊版 HIGH
- 簡單任務用 LOW — 節省 70%+ 的思考 token 費用
- 深度推理用 HIGH — Deep Think Mini 能力獨一無二,但注意成本
- 默認是 HIGH — 不設置就是最貴模式,記得主動調整
推薦通過 API易 apiyi.com 平臺根據任務類型動態切換思考等級,實現質量與成本的最優平衡。
參考資料
-
Google AI 文檔: Gemini 思考配置指南
- 鏈接:
ai.google.dev/gemini-api/docs/thinking - 說明: thinkingLevel 參數的完整文檔
- 鏈接:
-
Google AI 文檔: Gemini 3.1 Pro 模型頁
- 鏈接:
ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview - 說明: 思考等級支持矩陣和注意事項
- 鏈接:
-
Gemini API 定價頁面: 思考 token 計費說明
- 鏈接:
ai.google.dev/gemini-api/docs/pricing - 說明: 思考 token 按輸出 token 價格計費
- 鏈接:
-
VentureBeat: Deep Think Mini 深度體驗
- 鏈接:
venturebeat.com/technology/google-gemini-3-1-pro-first-impressions - 說明: IMO 題 8 分鐘解出的實測數據
- 鏈接:
-
Google 官方博客: Gemini 3.1 Pro 發佈公告
- 鏈接:
blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro - 說明: 三級思考系統和 Deep Think Mini 的官方介紹
- 鏈接:
📝 作者: APIYI Team | 技術交流請訪問 API易 apiyi.com
📅 更新時間: 2026 年 2 月 20 日
🏷️ 關鍵詞: Gemini 3.1 Pro 思考等級, thinkingLevel, Deep Think Mini, LOW MEDIUM HIGH, API 調用, 推理控制
