|

解讀 Claude Adaptive Thinking 自適應思考模式:取代 Extended Thinking 的 4 大升級

如果你一直在用 Claude 的 Extended Thinking (擴展思考) 模式,注意了——它在 Claude 4.6 上已經被標記爲 Deprecated (即將棄用)。取而代之的是一個更智能的模式:Adaptive Thinking (自適應思考)

核心變化:以前你需要手動設置思考 token 預算 (budget_tokens),現在 Claude 自己決定要不要思考、思考多深。簡單問題秒回,複雜問題深入推理——一個參數搞定。

核心價值: 讀完本文,你將掌握 Adaptive Thinking 的 API 調用方法、4 大升級細節、effort 參數配置以及從 Extended Thinking 遷移的完整指南。

<!– 標題 –> Claude Adaptive Thinking 從手動設置思考預算 → AI 自動決策思考深度

<!– 左側:舊模式 –> Extended Thinking (舊)

Deprecated

thinking: {“type”: “enabled”, “budget_tokens”: 10000}

痛點: ❌ 手動猜測 budget_tokens 值 ❌ 簡單問題也消耗大量思考 token ❌ 交錯思考需手動配置 beta header ❌ 多輪對話必須以 thinking 開頭 支持: Opus 4.5, Sonnet 4.5, Sonnet 3.7

<!– 中間升級箭頭 –> 升級

<!– 右側:新模式 –> Adaptive Thinking (新)

Recommended

thinking: {“type”: “adaptive”}

優勢: ✅ AI 自動判斷是否需要思考 ✅ 簡單問題跳過思考,節省 token ✅ 交錯思考自動啓用 ✅ 多輪對話更靈活 ✅ effort 參數精細控制 (low/med/high/max) 支持: Opus 4.6, Sonnet 4.6

<!– 底部模型標籤 –> Claude Opus 4.6 SWE-bench 81.4% · effort: max 獨佔

Claude Sonnet 4.6 SWE-bench 79.6% · 推薦 medium

2026年2月發佈 · Extended Thinking 已 Deprecated 通過 API易 apiyi.com 一行參數改動即可升級

Adaptive Thinking 是什麼:一句話理解

Extended Thinking (舊模式): 開發者告訴 Claude "你有 10000 個 token 的預算來思考",Claude 就會用完這些預算。

Adaptive Thinking (新模式): Claude 自己評估問題複雜度,決定"需不需要思考"以及"思考多深"。

# ❌ 舊模式 (Extended Thinking) - 即將棄用
thinking={"type": "enabled", "budget_tokens": 10000}

# ✅ 新模式 (Adaptive Thinking) - 推薦
thinking={"type": "adaptive"}

核心信息速覽

信息項 詳情
功能名稱 Adaptive Thinking (自適應思考)
發佈時間 2026 年 2 月 5 日 (隨 Claude Opus 4.6 發佈)
支持模型 Claude Opus 4.6, Claude Sonnet 4.6
API 參數 thinking: {"type": "adaptive"}
控制方式 effort 參數 (替代 budget_tokens
狀態 官方推薦方式 (Extended Thinking 已 Deprecated)
交錯思考 自動啓用 (無需 beta header)
Claude Code 原生支持,可用 /effort 命令調整

🎯 遷移建議: 如果你的項目正在使用 Extended Thinking (type: "enabled"),建議儘快遷移到 Adaptive Thinking。通過 API易 apiyi.com 平臺調用 Claude Opus 4.6 或 Sonnet 4.6 的 API,只需修改一個參數即可完成遷移。


Adaptive vs Extended Thinking:4 大核心升級

4 大核心升級詳解

<!– 升級1 –> ❌ 舊: 手動設置 budget_tokens 開發者猜測思考預算,設太高浪費, 設太低推理不足

✅ 新: AI 動態決策思考深度 Claude 評估複雜度,自動選擇思考量 用 effort (low/med/high/max) 做軟指導

<!– 升級2 –> ❌ 舊: 交錯思考需 beta header 工具調用間思考需手動開啓 Opus 4.5 完全不支持

✅ 新: 交錯思考自動啓用 無需 beta header,自動在工具調用間思考 代理式工作流質量顯著提升

<!– 升級3 –> ❌ 舊: 多輪對話限制嚴格 前一輪 assistant 消息必須以 thinking block 開頭,否則報錯

✅ 新: 多輪對話自由靈活 無 thinking block 強制要求 部分輪次可跳過思考,對話更自然

<!– 升級4 –> ❌ 舊: budget_tokens 硬限制 固定 token 數量,不夠靈活 簡單問題和複雜問題使用相同預算

✅ 新: effort 行爲信號 soft guidance: low/medium/high/max 即使 low 也會爲複雜問題適度思考

<!– 底部 –> Adaptive Thinking 在混合工作負載和代理式場景中表現優於固定 budget

升級一:從"固定預算"到"動態決策"

這是最根本的變化。

舊模式的痛點: 你必須猜測一個 budget_tokens 值。設太低,複雜問題推理不充分;設太高,簡單問題浪費 token (和錢)。

# 舊模式: 你猜這個問題需要多少思考 token?
thinking={"type": "enabled", "budget_tokens": 10000}
# 問題: 簡單問題也會用掉大量思考 token

新模式: Claude 根據每個請求的複雜度自動決定。

# 新模式: Claude 自己判斷
thinking={"type": "adaptive"}
# 簡單問題: 不思考或輕度思考
# 複雜問題: 深度推理

實際影響: 對於"有時簡單有時複雜"的混合工作負載 (比如代碼審查場景——有的 PR 只是改個文案,有的涉及併發重構),Adaptive Thinking 的整體表現和成本效率都優於固定預算。

升級二:自動交錯思考 (Interleaved Thinking)

在代理式 (Agentic) 工作流中,Claude 需要在多次工具調用之間進行思考。

舊模式: 交錯思考需要手動添加 beta header,且 Opus 4.5 上不可用。

新模式: 使用 Adaptive Thinking 時,交錯思考自動啓用,無需任何額外配置。

用戶請求 → Claude 思考 → 調用工具 A → Claude 再次思考 → 調用工具 B → 最終回答

這對 Claude Code 和其他代理式應用尤爲重要——AI 在每次工具調用後都能"重新想想",顯著減少錯誤。

升級三:更靈活的多輪對話

舊模式: 多輪對話中,前一輪的 assistant 消息必須以 thinking block 開頭,否則報錯。這讓對話管理變得複雜。

新模式: 沒有這個限制。Adaptive Thinking 在多輪對話中更加靈活,因爲有些輪次 Claude 可能選擇不思考。

升級四:effort 參數取代 budget_tokens

effort 是一個行爲信號而非硬限制,比 budget_tokens 更符合實際需求。

Effort 級別 行爲 適用場景 支持模型
max 始終深度思考,無約束 最高難度推理 僅 Opus 4.6
high (默認) 幾乎總是思考,複雜問題深入推理 代碼審查、架構設計 Opus 4.6, Sonnet 4.6
medium 中等思考,簡單問題可能跳過 日常開發、一般任務 Opus 4.6, Sonnet 4.6
low 最小化思考,優先速度 簡單問答、風格檢查 Opus 4.6, Sonnet 4.6

重要: 即使在 low effort 下,如果問題足夠複雜,Claude 仍然會選擇思考。effort 是建議,不是命令。

💡 Sonnet 4.6 建議: Anthropic 官方推薦 Sonnet 4.6 默認使用 medium effort,在速度、成本和質量之間取得最佳平衡。通過 API易 apiyi.com 調用時,只需在請求中加入 output_config 參數即可。


API 調用完整指南

基礎調用:最簡單的 Adaptive Thinking

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # API易統一接口
)

response = client.chat.completions.create(
    model="claude-opus-4-6",
    messages=[
        {"role": "user", "content": "解釋 Python 的 GIL 對多線程的影響"}
    ],
    max_tokens=16000,
    extra_body={
        "thinking": {"type": "adaptive"}
    }
)
print(response.choices[0].message.content)

使用 Anthropic 原生 SDK

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"  # API易統一接口
)

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Review this code for race conditions..."}
    ]
)

# 解析響應:可能包含 thinking block 和 text block
for block in response.content:
    if block.type == "thinking":
        print(f"[思考過程] {block.thinking}")
    elif block.type == "text":
        print(f"[回答] {block.text}")

配合 effort 參數精細控制

# Anthropic SDK 示例
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},  # 中等思考深度
    messages=[
        {"role": "user", "content": "這段代碼有什麼問題?"}
    ]
)

省略思考內容以降低延遲

如果你不需要看到思考過程,可以用 display: "omitted" 降低傳輸延遲:

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={
        "type": "adaptive",
        "display": "omitted"  # 不返回思考文本
    },
    messages=[...]
)
# 注意: 思考 token 仍然會被計費
查看完整的代碼審查工作流示例
import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"
)

def review_pr(diff_content, risk_level="medium"):
    """根據風險級別自適應審查代碼"""

    # 高風險: Opus + high effort
    # 低風險: Sonnet + medium effort
    if risk_level == "high":
        model = "claude-opus-4-6"
        effort = "high"
    else:
        model = "claude-sonnet-4-6"
        effort = "medium"

    response = client.messages.create(
        model=model,
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": effort},
        system="""你是資深代碼審查專家。
分析代碼變更,按嚴重級別分類:
🔴 必須修復 (安全/邏輯)
🟡 建議修復 (質量)
💡 改進建議""",
        messages=[
            {"role": "user", "content": f"審查:\n\n{diff_content}"}
        ]
    )

    thinking_text = ""
    review_text = ""
    for block in response.content:
        if block.type == "thinking":
            thinking_text = block.thinking
        elif block.type == "text":
            review_text = block.text

    return {
        "thinking": thinking_text,
        "review": review_text,
        "model": model,
        "effort": effort,
        "input_tokens": response.usage.input_tokens,
        "output_tokens": response.usage.output_tokens
    }

🚀 快速上手: 通過 API易 apiyi.com 調用 Claude 4.6 API,只需在請求中加入 thinking: {"type": "adaptive"} 即可啓用自適應思考。無需額外配置,一行代碼升級你的 AI 推理能力。


Effort 參數實戰:不同場景的最優配置

場景化配置指南

場景 推薦模型 Effort 理由
簡單問答/翻譯 Sonnet 4.6 low 無需深度推理,優先速度
代碼補全/格式化 Sonnet 4.6 low 模式匹配任務,不需要思考
日常 PR 審查 Sonnet 4.6 medium 平衡速度和審查深度
複雜 Bug 調試 Opus 4.6 high 需要跨文件推理
安全漏洞審計 Opus 4.6 high 不能漏過高危問題
數學/邏輯證明 Opus 4.6 max 需要極致推理深度
架構方案設計 Opus 4.6 max 需要全面考慮權衡

Claude Code 中使用 effort

Claude Code 2026 年 3 月更新後,新增了 /effort 命令:

# 在 Claude Code 終端中直接設置
/effort medium    # 日常編碼
/effort high      # 代碼審查
/effort max       # 架構設計 (僅 Opus 4.6)

這讓開發者可以根據當前任務靈活調整 Claude 的思考深度,無需修改代碼。

💰 成本優化: effort 參數直接影響 token 消耗。對於日常編碼任務,將 Sonnet 4.6 設爲 mediumlow 可以顯著降低成本。通過 API易 apiyi.com 平臺調用,價格比官方更優惠,配合 effort 參數雙重省錢。


從 Extended Thinking 遷移到 Adaptive Thinking

遷移對照表

舊寫法 (Extended Thinking) 新寫法 (Adaptive Thinking)
thinking: {"type": "enabled", "budget_tokens": 5000} thinking: {"type": "adaptive"}, output_config: {"effort": "low"}
thinking: {"type": "enabled", "budget_tokens": 10000} thinking: {"type": "adaptive"}, output_config: {"effort": "medium"}
thinking: {"type": "enabled", "budget_tokens": 30000} thinking: {"type": "adaptive"}, output_config: {"effort": "high"}
thinking: {"type": "enabled", "budget_tokens": 100000} thinking: {"type": "adaptive"}, output_config: {"effort": "max"}
手動添加 interleaved thinking beta header 自動啓用,無需任何 header

遷移注意事項

1. Prompt 緩存會中斷

enabled 切換到 adaptive 模式時,消息級別的 prompt cache 斷點會失效。系統提示和工具定義的緩存不受影響。

建議: 一次性遷移所有請求到 adaptive 模式,而非混合使用。

2. 思考內容默認是摘要

Claude 4.6 模型默認返回摘要版的思考內容,而非完整思考文本。這意味着你看到的 thinking block 是簡化版。

  • 摘要版 (display: "summarized"): 默認行爲
  • 省略版 (display: "omitted"): 不返回思考文本
  • 完整版: 需聯繫 Anthropic 銷售團隊開通

3. 計費按完整思考計算

無論你看到的是摘要還是省略,計費都按完整內部思考的 token 量。不要因爲看到的文本少就以爲花費少。

4. Prefill 不再支持

Claude Opus 4.6 不再支持預填充 (prefill) assistant 消息——發送預填充會返回 400 錯誤。如需控制輸出格式,使用 system prompt 或 structured output。

🎯 遷移建議: 建議在測試環境中先驗證遷移效果,特別是比較 adaptive 模式與之前固定 budget_tokens 的輸出質量差異。通過 API易 apiyi.com 可以方便地進行 A/B 測試——同一個 Key 調用不同配置。


<!– 標題 –> Effort 參數與思考 Token 計費機制 用 effort 控制思考深度 · 理解計費避免意外開銷

<!– 左半:Effort 級別可視化 –> Effort 級別 → 思考深度

<!– max –> max 始終深度思考 · 無約束 · 僅 Opus 4.6 數學證明 / 架構設計 / 最高難度推理

<!– high –> high 幾乎總是思考 · 默認值 代碼審查 / Bug 調試 / 安全審計

<!– medium –> med 適度思考 · 可跳過簡單題 日常編碼 / 一般任務 · Sonnet 推薦默認

<!– low –> low 最小化思考 簡單問答 / 風格檢查 / 翻譯 · 優先速度

<!– 右半:計費機制 –> 計費機制 (注意!)

⚠ 思考 token = 輸出 token 價格

Opus 4.6: 輸入 $5 / 輸出 $25 每百萬token Sonnet 4.6: 輸入 $3 / 輸出 $15 每百萬token

關鍵: 看到的 ≠ 計費的 • 默認返回摘要版思考 (非完整版) • 計費按完整內部思考 token 量 • display:"omitted" 僅減延遲,不減費

真正省錢: 降低 effort ! low effort 可能跳過思考 → 0 思考 token 同任務 high→low 可省約 83%

<!– 底部:實際成本示例 –> 同一代碼風格檢查任務 · Sonnet 4.6 成本對比

<!– 柱狀圖 –> effort: high $0.053

medium $0.020

low $0.009

省 83% low vs high

通過 API易 apiyi.com 享受更優惠價格 + effort 參數雙重省錢

計費機制詳解

思考 Token 如何計費

理解計費機制對控制成本至關重要。

計費項 說明
輸入 token 正常計費 ($5/MTok Opus, $3/MTok Sonnet)
思考 token 輸出 token 價格計費 ($25/MTok Opus, $15/MTok Sonnet)
響應文本 token 按輸出 token 價格計費
摘要生成 token 不額外計費
display: "omitted" 思考 token 仍計費,只是不傳輸

成本優化策略

簡單問題用 low effort → 可能跳過思考 → 節省大量輸出 token
                                                ↓
                                           成本可降 50-80%

實際對比示例: 同一個代碼風格檢查任務

配置 思考 token 響應 token 總成本 (Sonnet)
effort: high ~3000 ~500 ~$0.053
effort: medium ~800 ~500 ~$0.020
effort: low 0 (跳過思考) ~500 ~$0.009

對於簡單任務,low effort 比 high effort 便宜約 83%

💰 省錢技巧: 對於批量處理場景 (比如對 100 個文件做風格檢查),將 effort 設爲 low 可以節省大量成本。通過 API易 apiyi.com 調用 Claude 4.6 API,在已有優惠價格基礎上再配合 effort 參數優化,雙重降本。


常見問題

Q1: Adaptive Thinking 和 Extended Thinking 可以混用嗎?

可以,但不推薦。在 Claude 4.6 模型上,Extended Thinking (type: "enabled") 仍然可用但已標記爲 Deprecated,未來版本會移除。兩種模式混用還會導致 prompt cache 斷點失效。建議儘早統一遷移到 Adaptive Thinking。通過 API易 apiyi.com 調用時參數格式完全兼容。

Q2: Opus 4.5 支持 Adaptive Thinking 嗎?

不支持。Adaptive Thinking 僅支持 Claude Opus 4.6 和 Sonnet 4.6。Opus 4.5 仍需使用 type: "enabled" 模式並手動設置 budget_tokens。如果需要使用 Adaptive Thinking,建議升級到 4.6 系列模型。API易 apiyi.com 同時提供 4.5 和 4.6 全系列模型的 API 接入。

Q3: display: “omitted” 真的能省錢嗎?

不能省錢。display: "omitted" 只是讓 API 不返回思考文本,減少網絡傳輸延遲。但內部思考 token 仍然會生成並計費。真正省錢的方法是降低 effort 級別——lowmedium 會讓 Claude 在簡單問題上跳過或減少思考。

Q4: 如何判斷 Claude 在某次請求中是否進行了思考?

檢查響應中是否包含 thinking 類型的 content block。如果 Claude 判斷不需要思考,響應中只會有 text block,沒有 thinking block。在 Adaptive 模式下,usage 字段中的 token 計數可以幫助你判斷思考消耗了多少 token。

Q5: Claude Code 中如何使用 Adaptive Thinking?

Claude Code 在使用 Opus 4.6 或 Sonnet 4.6 時默認啓用 Adaptive Thinking。你可以用 /effort 命令調整思考深度:/effort low (快速模式)、/effort medium (平衡模式)、/effort high (深度模式)。2026 年 3 月更新還修復了非標準模型字符串導致的 "adaptive thinking is not supported" 錯誤。


總結:Adaptive Thinking 是 Claude 4.6 的核心升級

Adaptive Thinking 代表了 AI 推理模式的一次重要演進——從"開發者猜測 AI 需要思考多少"到"AI 自己判斷需要思考多少"。

4 個核心升級:

  1. 動態決策: 簡單問題秒回,複雜問題深入推理
  2. 自動交錯思考: 代理式工作流中工具調用間自動推理
  3. 靈活多輪對話: 無需強制 thinking block 開頭
  4. effort 參數: 比 budget_tokens 更直覺的控制方式

遷移建議: 從 thinking: {"type": "enabled", "budget_tokens": N} 改爲 thinking: {"type": "adaptive"},配合 output_config: {"effort": "..."} 控制深度。

推薦通過 API易 apiyi.com 快速接入 Claude Opus 4.6 和 Sonnet 4.6 的 API,一行參數改動即可享受 Adaptive Thinking 帶來的智能推理和成本優化。


參考資料

  1. Claude API 文檔 – Adaptive Thinking: 官方技術指南

    • 鏈接: platform.claude.com/docs/en/build-with-claude/adaptive-thinking
  2. Claude API 文檔 – Effort 參數: effort 配置詳解

    • 鏈接: platform.claude.com/docs/en/build-with-claude/effort
  3. Anthropic 官方 – Claude Opus 4.6: 發佈公告

    • 鏈接: anthropic.com/news/claude-opus-4-6
  4. Claude API 文檔 – Extended Thinking: 原有擴展思考指南

    • 鏈接: platform.claude.com/docs/en/build-with-claude/extended-thinking

作者: APIYI Team | 掌握 Claude 最新 API 能力,歡迎訪問 API易 apiyi.com 獲取 Claude 4.6 全系列模型的 API 接口和技術支持。

Similar Posts