如果你一直在用 Claude 的 Extended Thinking (擴展思考) 模式,注意了——它在 Claude 4.6 上已經被標記爲 Deprecated (即將棄用)。取而代之的是一個更智能的模式:Adaptive Thinking (自適應思考)。
核心變化:以前你需要手動設置思考 token 預算 (budget_tokens),現在 Claude 自己決定要不要思考、思考多深。簡單問題秒回,複雜問題深入推理——一個參數搞定。
核心價值: 讀完本文,你將掌握 Adaptive Thinking 的 API 調用方法、4 大升級細節、effort 參數配置以及從 Extended Thinking 遷移的完整指南。
<!– 標題 –>
<!– 左側:舊模式 –>
<!– 中間升級箭頭 –>
<!– 右側:新模式 –>
<!– 底部模型標籤 –>
Adaptive Thinking 是什麼:一句話理解
Extended Thinking (舊模式): 開發者告訴 Claude "你有 10000 個 token 的預算來思考",Claude 就會用完這些預算。
Adaptive Thinking (新模式): Claude 自己評估問題複雜度,決定"需不需要思考"以及"思考多深"。
# ❌ 舊模式 (Extended Thinking) - 即將棄用
thinking={"type": "enabled", "budget_tokens": 10000}
# ✅ 新模式 (Adaptive Thinking) - 推薦
thinking={"type": "adaptive"}
核心信息速覽
| 信息項 | 詳情 |
|---|---|
| 功能名稱 | Adaptive Thinking (自適應思考) |
| 發佈時間 | 2026 年 2 月 5 日 (隨 Claude Opus 4.6 發佈) |
| 支持模型 | Claude Opus 4.6, Claude Sonnet 4.6 |
| API 參數 | thinking: {"type": "adaptive"} |
| 控制方式 | effort 參數 (替代 budget_tokens) |
| 狀態 | 官方推薦方式 (Extended Thinking 已 Deprecated) |
| 交錯思考 | 自動啓用 (無需 beta header) |
| Claude Code | 原生支持,可用 /effort 命令調整 |
🎯 遷移建議: 如果你的項目正在使用 Extended Thinking (
type: "enabled"),建議儘快遷移到 Adaptive Thinking。通過 API易 apiyi.com 平臺調用 Claude Opus 4.6 或 Sonnet 4.6 的 API,只需修改一個參數即可完成遷移。
Adaptive vs Extended Thinking:4 大核心升級
<!– 升級1 –>
<!– 升級2 –>
<!– 升級3 –>
<!– 升級4 –>
<!– 底部 –>
升級一:從"固定預算"到"動態決策"
這是最根本的變化。
舊模式的痛點: 你必須猜測一個 budget_tokens 值。設太低,複雜問題推理不充分;設太高,簡單問題浪費 token (和錢)。
# 舊模式: 你猜這個問題需要多少思考 token?
thinking={"type": "enabled", "budget_tokens": 10000}
# 問題: 簡單問題也會用掉大量思考 token
新模式: Claude 根據每個請求的複雜度自動決定。
# 新模式: Claude 自己判斷
thinking={"type": "adaptive"}
# 簡單問題: 不思考或輕度思考
# 複雜問題: 深度推理
實際影響: 對於"有時簡單有時複雜"的混合工作負載 (比如代碼審查場景——有的 PR 只是改個文案,有的涉及併發重構),Adaptive Thinking 的整體表現和成本效率都優於固定預算。
升級二:自動交錯思考 (Interleaved Thinking)
在代理式 (Agentic) 工作流中,Claude 需要在多次工具調用之間進行思考。
舊模式: 交錯思考需要手動添加 beta header,且 Opus 4.5 上不可用。
新模式: 使用 Adaptive Thinking 時,交錯思考自動啓用,無需任何額外配置。
用戶請求 → Claude 思考 → 調用工具 A → Claude 再次思考 → 調用工具 B → 最終回答
這對 Claude Code 和其他代理式應用尤爲重要——AI 在每次工具調用後都能"重新想想",顯著減少錯誤。
升級三:更靈活的多輪對話
舊模式: 多輪對話中,前一輪的 assistant 消息必須以 thinking block 開頭,否則報錯。這讓對話管理變得複雜。
新模式: 沒有這個限制。Adaptive Thinking 在多輪對話中更加靈活,因爲有些輪次 Claude 可能選擇不思考。
升級四:effort 參數取代 budget_tokens
effort 是一個行爲信號而非硬限制,比 budget_tokens 更符合實際需求。
| Effort 級別 | 行爲 | 適用場景 | 支持模型 |
|---|---|---|---|
max |
始終深度思考,無約束 | 最高難度推理 | 僅 Opus 4.6 |
high (默認) |
幾乎總是思考,複雜問題深入推理 | 代碼審查、架構設計 | Opus 4.6, Sonnet 4.6 |
medium |
中等思考,簡單問題可能跳過 | 日常開發、一般任務 | Opus 4.6, Sonnet 4.6 |
low |
最小化思考,優先速度 | 簡單問答、風格檢查 | Opus 4.6, Sonnet 4.6 |
重要: 即使在 low effort 下,如果問題足夠複雜,Claude 仍然會選擇思考。effort 是建議,不是命令。
💡 Sonnet 4.6 建議: Anthropic 官方推薦 Sonnet 4.6 默認使用
mediumeffort,在速度、成本和質量之間取得最佳平衡。通過 API易 apiyi.com 調用時,只需在請求中加入output_config參數即可。
API 調用完整指南
基礎調用:最簡單的 Adaptive Thinking
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # API易統一接口
)
response = client.chat.completions.create(
model="claude-opus-4-6",
messages=[
{"role": "user", "content": "解釋 Python 的 GIL 對多線程的影響"}
],
max_tokens=16000,
extra_body={
"thinking": {"type": "adaptive"}
}
)
print(response.choices[0].message.content)
使用 Anthropic 原生 SDK
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com" # API易統一接口
)
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[
{"role": "user", "content": "Review this code for race conditions..."}
]
)
# 解析響應:可能包含 thinking block 和 text block
for block in response.content:
if block.type == "thinking":
print(f"[思考過程] {block.thinking}")
elif block.type == "text":
print(f"[回答] {block.text}")
配合 effort 參數精細控制
# Anthropic SDK 示例
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"}, # 中等思考深度
messages=[
{"role": "user", "content": "這段代碼有什麼問題?"}
]
)
省略思考內容以降低延遲
如果你不需要看到思考過程,可以用 display: "omitted" 降低傳輸延遲:
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={
"type": "adaptive",
"display": "omitted" # 不返回思考文本
},
messages=[...]
)
# 注意: 思考 token 仍然會被計費
查看完整的代碼審查工作流示例
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com"
)
def review_pr(diff_content, risk_level="medium"):
"""根據風險級別自適應審查代碼"""
# 高風險: Opus + high effort
# 低風險: Sonnet + medium effort
if risk_level == "high":
model = "claude-opus-4-6"
effort = "high"
else:
model = "claude-sonnet-4-6"
effort = "medium"
response = client.messages.create(
model=model,
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": effort},
system="""你是資深代碼審查專家。
分析代碼變更,按嚴重級別分類:
🔴 必須修復 (安全/邏輯)
🟡 建議修復 (質量)
💡 改進建議""",
messages=[
{"role": "user", "content": f"審查:\n\n{diff_content}"}
]
)
thinking_text = ""
review_text = ""
for block in response.content:
if block.type == "thinking":
thinking_text = block.thinking
elif block.type == "text":
review_text = block.text
return {
"thinking": thinking_text,
"review": review_text,
"model": model,
"effort": effort,
"input_tokens": response.usage.input_tokens,
"output_tokens": response.usage.output_tokens
}
🚀 快速上手: 通過 API易 apiyi.com 調用 Claude 4.6 API,只需在請求中加入
thinking: {"type": "adaptive"}即可啓用自適應思考。無需額外配置,一行代碼升級你的 AI 推理能力。
Effort 參數實戰:不同場景的最優配置
場景化配置指南
| 場景 | 推薦模型 | Effort | 理由 |
|---|---|---|---|
| 簡單問答/翻譯 | Sonnet 4.6 | low |
無需深度推理,優先速度 |
| 代碼補全/格式化 | Sonnet 4.6 | low |
模式匹配任務,不需要思考 |
| 日常 PR 審查 | Sonnet 4.6 | medium |
平衡速度和審查深度 |
| 複雜 Bug 調試 | Opus 4.6 | high |
需要跨文件推理 |
| 安全漏洞審計 | Opus 4.6 | high |
不能漏過高危問題 |
| 數學/邏輯證明 | Opus 4.6 | max |
需要極致推理深度 |
| 架構方案設計 | Opus 4.6 | max |
需要全面考慮權衡 |
Claude Code 中使用 effort
Claude Code 2026 年 3 月更新後,新增了 /effort 命令:
# 在 Claude Code 終端中直接設置
/effort medium # 日常編碼
/effort high # 代碼審查
/effort max # 架構設計 (僅 Opus 4.6)
這讓開發者可以根據當前任務靈活調整 Claude 的思考深度,無需修改代碼。
💰 成本優化: effort 參數直接影響 token 消耗。對於日常編碼任務,將 Sonnet 4.6 設爲
medium或low可以顯著降低成本。通過 API易 apiyi.com 平臺調用,價格比官方更優惠,配合 effort 參數雙重省錢。
從 Extended Thinking 遷移到 Adaptive Thinking
遷移對照表
| 舊寫法 (Extended Thinking) | 新寫法 (Adaptive Thinking) |
|---|---|
thinking: {"type": "enabled", "budget_tokens": 5000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "low"} |
thinking: {"type": "enabled", "budget_tokens": 10000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "medium"} |
thinking: {"type": "enabled", "budget_tokens": 30000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "high"} |
thinking: {"type": "enabled", "budget_tokens": 100000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "max"} |
| 手動添加 interleaved thinking beta header | 自動啓用,無需任何 header |
遷移注意事項
1. Prompt 緩存會中斷
從 enabled 切換到 adaptive 模式時,消息級別的 prompt cache 斷點會失效。系統提示和工具定義的緩存不受影響。
建議: 一次性遷移所有請求到 adaptive 模式,而非混合使用。
2. 思考內容默認是摘要
Claude 4.6 模型默認返回摘要版的思考內容,而非完整思考文本。這意味着你看到的 thinking block 是簡化版。
- 摘要版 (
display: "summarized"): 默認行爲 - 省略版 (
display: "omitted"): 不返回思考文本 - 完整版: 需聯繫 Anthropic 銷售團隊開通
3. 計費按完整思考計算
無論你看到的是摘要還是省略,計費都按完整內部思考的 token 量。不要因爲看到的文本少就以爲花費少。
4. Prefill 不再支持
Claude Opus 4.6 不再支持預填充 (prefill) assistant 消息——發送預填充會返回 400 錯誤。如需控制輸出格式,使用 system prompt 或 structured output。
🎯 遷移建議: 建議在測試環境中先驗證遷移效果,特別是比較 adaptive 模式與之前固定 budget_tokens 的輸出質量差異。通過 API易 apiyi.com 可以方便地進行 A/B 測試——同一個 Key 調用不同配置。
<!– 標題 –>
<!– 左半:Effort 級別可視化 –>
<!– max –>
<!– high –>
<!– medium –>
<!– low –>
<!– 右半:計費機制 –>
<!– 底部:實際成本示例 –>
<!– 柱狀圖 –>
計費機制詳解
思考 Token 如何計費
理解計費機制對控制成本至關重要。
| 計費項 | 說明 |
|---|---|
| 輸入 token | 正常計費 ($5/MTok Opus, $3/MTok Sonnet) |
| 思考 token | 按輸出 token 價格計費 ($25/MTok Opus, $15/MTok Sonnet) |
| 響應文本 token | 按輸出 token 價格計費 |
| 摘要生成 token | 不額外計費 |
| display: "omitted" | 思考 token 仍計費,只是不傳輸 |
成本優化策略
簡單問題用 low effort → 可能跳過思考 → 節省大量輸出 token
↓
成本可降 50-80%
實際對比示例: 同一個代碼風格檢查任務
| 配置 | 思考 token | 響應 token | 總成本 (Sonnet) |
|---|---|---|---|
| effort: high | ~3000 | ~500 | ~$0.053 |
| effort: medium | ~800 | ~500 | ~$0.020 |
| effort: low | 0 (跳過思考) | ~500 | ~$0.009 |
對於簡單任務,low effort 比 high effort 便宜約 83%。
💰 省錢技巧: 對於批量處理場景 (比如對 100 個文件做風格檢查),將 effort 設爲
low可以節省大量成本。通過 API易 apiyi.com 調用 Claude 4.6 API,在已有優惠價格基礎上再配合 effort 參數優化,雙重降本。
常見問題
Q1: Adaptive Thinking 和 Extended Thinking 可以混用嗎?
可以,但不推薦。在 Claude 4.6 模型上,Extended Thinking (type: "enabled") 仍然可用但已標記爲 Deprecated,未來版本會移除。兩種模式混用還會導致 prompt cache 斷點失效。建議儘早統一遷移到 Adaptive Thinking。通過 API易 apiyi.com 調用時參數格式完全兼容。
Q2: Opus 4.5 支持 Adaptive Thinking 嗎?
不支持。Adaptive Thinking 僅支持 Claude Opus 4.6 和 Sonnet 4.6。Opus 4.5 仍需使用 type: "enabled" 模式並手動設置 budget_tokens。如果需要使用 Adaptive Thinking,建議升級到 4.6 系列模型。API易 apiyi.com 同時提供 4.5 和 4.6 全系列模型的 API 接入。
Q3: display: “omitted” 真的能省錢嗎?
不能省錢。display: "omitted" 只是讓 API 不返回思考文本,減少網絡傳輸延遲。但內部思考 token 仍然會生成並計費。真正省錢的方法是降低 effort 級別——low 或 medium 會讓 Claude 在簡單問題上跳過或減少思考。
Q4: 如何判斷 Claude 在某次請求中是否進行了思考?
檢查響應中是否包含 thinking 類型的 content block。如果 Claude 判斷不需要思考,響應中只會有 text block,沒有 thinking block。在 Adaptive 模式下,usage 字段中的 token 計數可以幫助你判斷思考消耗了多少 token。
Q5: Claude Code 中如何使用 Adaptive Thinking?
Claude Code 在使用 Opus 4.6 或 Sonnet 4.6 時默認啓用 Adaptive Thinking。你可以用 /effort 命令調整思考深度:/effort low (快速模式)、/effort medium (平衡模式)、/effort high (深度模式)。2026 年 3 月更新還修復了非標準模型字符串導致的 "adaptive thinking is not supported" 錯誤。
總結:Adaptive Thinking 是 Claude 4.6 的核心升級
Adaptive Thinking 代表了 AI 推理模式的一次重要演進——從"開發者猜測 AI 需要思考多少"到"AI 自己判斷需要思考多少"。
4 個核心升級:
- 動態決策: 簡單問題秒回,複雜問題深入推理
- 自動交錯思考: 代理式工作流中工具調用間自動推理
- 靈活多輪對話: 無需強制 thinking block 開頭
- effort 參數: 比 budget_tokens 更直覺的控制方式
遷移建議: 從 thinking: {"type": "enabled", "budget_tokens": N} 改爲 thinking: {"type": "adaptive"},配合 output_config: {"effort": "..."} 控制深度。
推薦通過 API易 apiyi.com 快速接入 Claude Opus 4.6 和 Sonnet 4.6 的 API,一行參數改動即可享受 Adaptive Thinking 帶來的智能推理和成本優化。
參考資料
-
Claude API 文檔 – Adaptive Thinking: 官方技術指南
- 鏈接:
platform.claude.com/docs/en/build-with-claude/adaptive-thinking
- 鏈接:
-
Claude API 文檔 – Effort 參數: effort 配置詳解
- 鏈接:
platform.claude.com/docs/en/build-with-claude/effort
- 鏈接:
-
Anthropic 官方 – Claude Opus 4.6: 發佈公告
- 鏈接:
anthropic.com/news/claude-opus-4-6
- 鏈接:
-
Claude API 文檔 – Extended Thinking: 原有擴展思考指南
- 鏈接:
platform.claude.com/docs/en/build-with-claude/extended-thinking
- 鏈接:
作者: APIYI Team | 掌握 Claude 最新 API 能力,歡迎訪問 API易 apiyi.com 獲取 Claude 4.6 全系列模型的 API 接口和技術支持。
