解讀 Claude Adaptive Thinking 自適應思考模式：取代 Extended Thinking 的 4 大升級

如果你一直在用 Claude 的 Extended Thinking （擴展思考）模式，注意了——它在 Claude 4.6 上已經被標記爲 Deprecated （即將棄用）。取而代之的是一個更智能的模式：Adaptive Thinking （自適應思考）。

核心變化：以前你需要手動設置思考 token 預算（budget_tokens），現在 Claude 自己決定要不要思考、思考多深。簡單問題秒回，複雜問題深入推理——一個參數搞定。

核心價值: 讀完本文，你將掌握 Adaptive Thinking 的 API 調用方法、4 大升級細節、effort 參數配置以及從 Extended Thinking 遷移的完整指南。

<！– 標題 –> Claude Adaptive Thinking 從手動設置思考預算 → AI 自動決策思考深度

<！– 左側：舊模式 –> Extended Thinking （舊）

Deprecated

thinking: {“type”: “enabled”， “budget_tokens”: 10000}

痛點: ❌ 手動猜測 budget_tokens 值 ❌ 簡單問題也消耗大量思考 token ❌ 交錯思考需手動配置 beta header ❌ 多輪對話必須以 thinking 開頭支持: Opus 4.5， Sonnet 4.5， Sonnet 3.7

<！– 中間升級箭頭 –> 升級

<！– 右側：新模式 –> Adaptive Thinking （新）

Recommended

thinking: {“type”: “adaptive”}

優勢: ✅ AI 自動判斷是否需要思考 ✅ 簡單問題跳過思考，節省 token ✅ 交錯思考自動啓用 ✅ 多輪對話更靈活 ✅ effort 參數精細控制（low/med/high/max）支持: Opus 4.6， Sonnet 4.6

<！– 底部模型標籤 –> Claude Opus 4.6 SWE-bench 81.4% · effort: max 獨佔

Claude Sonnet 4.6 SWE-bench 79.6% · 推薦 medium

2026年2月發佈 · Extended Thinking 已 Deprecated 通過 API易 apiyi.com 一行參數改動即可升級

Adaptive Thinking 是什麼：一句話理解

Extended Thinking （舊模式）: 開發者告訴 Claude "你有 10000 個 token 的預算來思考"，Claude 就會用完這些預算。

Adaptive Thinking （新模式）: Claude 自己評估問題複雜度，決定"需不需要思考"以及"思考多深"。

# ❌ 舊模式 （Extended Thinking） - 即將棄用
thinking={"type": "enabled"， "budget_tokens": 10000}

# ✅ 新模式 （Adaptive Thinking） - 推薦
thinking={"type": "adaptive"}

核心信息速覽

信息項	詳情
功能名稱	Adaptive Thinking （自適應思考）
發佈時間	2026 年 2 月 5 日（隨 Claude Opus 4.6 發佈）
支持模型	Claude Opus 4.6， Claude Sonnet 4.6
API 參數	`thinking: {"type": "adaptive"}`
控制方式	`effort` 參數（替代 `budget_tokens`）
狀態	官方推薦方式（Extended Thinking 已 Deprecated）
交錯思考	自動啓用（無需 beta header）
Claude Code	原生支持，可用 `/effort` 命令調整

🎯 遷移建議: 如果你的項目正在使用 Extended Thinking （type: "enabled"），建議儘快遷移到 Adaptive Thinking。通過 API易 apiyi.com 平臺調用 Claude Opus 4.6 或 Sonnet 4.6 的 API，只需修改一個參數即可完成遷移。

Adaptive vs Extended Thinking：4 大核心升級

4 大核心升級詳解

<！– 升級1 –> ❌ 舊: 手動設置 budget_tokens 開發者猜測思考預算，設太高浪費，設太低推理不足

✅ 新: AI 動態決策思考深度 Claude 評估複雜度，自動選擇思考量用 effort （low/med/high/max）做軟指導

<！– 升級2 –> ❌ 舊: 交錯思考需 beta header 工具調用間思考需手動開啓 Opus 4.5 完全不支持

✅ 新: 交錯思考自動啓用無需 beta header，自動在工具調用間思考代理式工作流質量顯著提升

<！– 升級3 –> ❌ 舊: 多輪對話限制嚴格前一輪 assistant 消息必須以 thinking block 開頭，否則報錯

✅ 新: 多輪對話自由靈活無 thinking block 強制要求部分輪次可跳過思考，對話更自然

<！– 升級4 –> ❌ 舊: budget_tokens 硬限制固定 token 數量，不夠靈活簡單問題和複雜問題使用相同預算

✅ 新: effort 行爲信號 soft guidance: low/medium/high/max 即使 low 也會爲複雜問題適度思考

<！– 底部 –> Adaptive Thinking 在混合工作負載和代理式場景中表現優於固定 budget

升級一：從"固定預算"到"動態決策"

這是最根本的變化。

舊模式的痛點: 你必須猜測一個 budget_tokens 值。設太低，複雜問題推理不充分；設太高，簡單問題浪費 token （和錢）。

# 舊模式: 你猜這個問題需要多少思考 token？
thinking={"type": "enabled"， "budget_tokens": 10000}
# 問題: 簡單問題也會用掉大量思考 token

新模式: Claude 根據每個請求的複雜度自動決定。

# 新模式: Claude 自己判斷
thinking={"type": "adaptive"}
# 簡單問題: 不思考或輕度思考
# 複雜問題: 深度推理

實際影響: 對於"有時簡單有時複雜"的混合工作負載（比如代碼審查場景——有的 PR 只是改個文案，有的涉及併發重構），Adaptive Thinking 的整體表現和成本效率都優於固定預算。

升級二：自動交錯思考（Interleaved Thinking）

在代理式（Agentic）工作流中，Claude 需要在多次工具調用之間進行思考。

舊模式: 交錯思考需要手動添加 beta header，且 Opus 4.5 上不可用。

新模式: 使用 Adaptive Thinking 時，交錯思考自動啓用，無需任何額外配置。

用戶請求 → Claude 思考 → 調用工具 A → Claude 再次思考 → 調用工具 B → 最終回答

這對 Claude Code 和其他代理式應用尤爲重要——AI 在每次工具調用後都能"重新想想"，顯著減少錯誤。

升級三：更靈活的多輪對話

舊模式: 多輪對話中，前一輪的 assistant 消息必須以 thinking block 開頭，否則報錯。這讓對話管理變得複雜。

新模式: 沒有這個限制。Adaptive Thinking 在多輪對話中更加靈活，因爲有些輪次 Claude 可能選擇不思考。

升級四：effort 參數取代 budget_tokens

effort 是一個行爲信號而非硬限制，比 budget_tokens 更符合實際需求。

Effort 級別	行爲	適用場景	支持模型
`max`	始終深度思考，無約束	最高難度推理	僅 Opus 4.6
`high` （默認）	幾乎總是思考，複雜問題深入推理	代碼審查、架構設計	Opus 4.6， Sonnet 4.6
`medium`	中等思考，簡單問題可能跳過	日常開發、一般任務	Opus 4.6， Sonnet 4.6
`low`	最小化思考，優先速度	簡單問答、風格檢查	Opus 4.6， Sonnet 4.6

重要: 即使在 low effort 下，如果問題足夠複雜，Claude 仍然會選擇思考。effort 是建議，不是命令。

💡 Sonnet 4.6 建議: Anthropic 官方推薦 Sonnet 4.6 默認使用 medium effort，在速度、成本和質量之間取得最佳平衡。通過 API易 apiyi.com 調用時，只需在請求中加入 output_config 參數即可。

API 調用完整指南

基礎調用：最簡單的 Adaptive Thinking

import openai

client = openai.OpenAI（
    api_key="YOUR_API_KEY"，
    base_url="https://api.apiyi.com/v1"  # API易統一接口
）

response = client.chat.completions.create（
    model="claude-opus-4-6"，
    messages=[
        {"role": "user"， "content": "解釋 Python 的 GIL 對多線程的影響"}
    ]，
    max_tokens=16000，
    extra_body={
        "thinking": {"type": "adaptive"}
    }
）
print（response.choices[0].message.content）

使用 Anthropic 原生 SDK

import anthropic

client = anthropic.Anthropic（
    api_key="YOUR_API_KEY"，
    base_url="https://api.apiyi.com"  # API易統一接口
）

response = client.messages.create（
    model="claude-opus-4-6"，
    max_tokens=16000，
    thinking={"type": "adaptive"}，
    messages=[
        {"role": "user"， "content": "Review this code for race conditions..."}
    ]
）

# 解析響應：可能包含 thinking block 和 text block
for block in response.content:
    if block.type == "thinking":
        print（f"[思考過程] {block.thinking}"）
    elif block.type == "text":
        print（f"[回答] {block.text}"）

配合 effort 參數精細控制

# Anthropic SDK 示例
response = client.messages.create（
    model="claude-sonnet-4-6"，
    max_tokens=16000，
    thinking={"type": "adaptive"}，
    output_config={"effort": "medium"}，  # 中等思考深度
    messages=[
        {"role": "user"， "content": "這段代碼有什麼問題？"}
    ]
）

省略思考內容以降低延遲

如果你不需要看到思考過程，可以用 display: "omitted" 降低傳輸延遲：

response = client.messages.create（
    model="claude-opus-4-6"，
    max_tokens=16000，
    thinking={
        "type": "adaptive"，
        "display": "omitted"  # 不返回思考文本
    }，
    messages=[...]
）
# 注意: 思考 token 仍然會被計費

查看完整的代碼審查工作流示例

import anthropic

client = anthropic.Anthropic（
    api_key="YOUR_API_KEY"，
    base_url="https://api.apiyi.com"
）

def review_pr（diff_content， risk_level="medium"）:
    """根據風險級別自適應審查代碼"""

    # 高風險: Opus + high effort
    # 低風險: Sonnet + medium effort
    if risk_level == "high":
        model = "claude-opus-4-6"
        effort = "high"
    else:
        model = "claude-sonnet-4-6"
        effort = "medium"

    response = client.messages.create（
        model=model，
        max_tokens=16000，
        thinking={"type": "adaptive"}，
        output_config={"effort": effort}，
        system="""你是資深代碼審查專家。
分析代碼變更，按嚴重級別分類:
🔴 必須修復 （安全/邏輯）
🟡 建議修復 （質量）
💡 改進建議"""，
        messages=[
            {"role": "user"， "content": f"審查:\n\n{diff_content}"}
        ]
    ）

    thinking_text = ""
    review_text = ""
    for block in response.content:
        if block.type == "thinking":
            thinking_text = block.thinking
        elif block.type == "text":
            review_text = block.text

    return {
        "thinking": thinking_text，
        "review": review_text，
        "model": model，
        "effort": effort，
        "input_tokens": response.usage.input_tokens，
        "output_tokens": response.usage.output_tokens
    }

🚀 快速上手: 通過 API易 apiyi.com 調用 Claude 4.6 API，只需在請求中加入 thinking: {"type": "adaptive"} 即可啓用自適應思考。無需額外配置，一行代碼升級你的 AI 推理能力。

Effort 參數實戰：不同場景的最優配置

場景化配置指南

場景	推薦模型	Effort	理由
簡單問答/翻譯	Sonnet 4.6	`low`	無需深度推理，優先速度
代碼補全/格式化	Sonnet 4.6	`low`	模式匹配任務，不需要思考
日常 PR 審查	Sonnet 4.6	`medium`	平衡速度和審查深度
複雜 Bug 調試	Opus 4.6	`high`	需要跨文件推理
安全漏洞審計	Opus 4.6	`high`	不能漏過高危問題
數學/邏輯證明	Opus 4.6	`max`	需要極致推理深度
架構方案設計	Opus 4.6	`max`	需要全面考慮權衡

Claude Code 中使用 effort

Claude Code 2026 年 3 月更新後，新增了 /effort 命令：

# 在 Claude Code 終端中直接設置
/effort medium    # 日常編碼
/effort high      # 代碼審查
/effort max       # 架構設計 （僅 Opus 4.6）

這讓開發者可以根據當前任務靈活調整 Claude 的思考深度，無需修改代碼。

💰 成本優化: effort 參數直接影響 token 消耗。對於日常編碼任務，將 Sonnet 4.6 設爲 medium 或 low 可以顯著降低成本。通過 API易 apiyi.com 平臺調用，價格比官方更優惠，配合 effort 參數雙重省錢。

從 Extended Thinking 遷移到 Adaptive Thinking

遷移對照表

舊寫法（Extended Thinking）	新寫法（Adaptive Thinking）
`thinking: {"type": "enabled"， "budget_tokens": 5000}`	`thinking: {"type": "adaptive"}， output_config: {"effort": "low"}`
`thinking: {"type": "enabled"， "budget_tokens": 10000}`	`thinking: {"type": "adaptive"}， output_config: {"effort": "medium"}`
`thinking: {"type": "enabled"， "budget_tokens": 30000}`	`thinking: {"type": "adaptive"}， output_config: {"effort": "high"}`
`thinking: {"type": "enabled"， "budget_tokens": 100000}`	`thinking: {"type": "adaptive"}， output_config: {"effort": "max"}`
手動添加 interleaved thinking beta header	自動啓用，無需任何 header

遷移注意事項

1. Prompt 緩存會中斷

從 enabled 切換到 adaptive 模式時，消息級別的 prompt cache 斷點會失效。系統提示和工具定義的緩存不受影響。

建議: 一次性遷移所有請求到 adaptive 模式，而非混合使用。

2. 思考內容默認是摘要

Claude 4.6 模型默認返回摘要版的思考內容，而非完整思考文本。這意味着你看到的 thinking block 是簡化版。

摘要版（display: "summarized"）: 默認行爲
省略版（display: "omitted"）: 不返回思考文本
完整版: 需聯繫 Anthropic 銷售團隊開通

3. 計費按完整思考計算

無論你看到的是摘要還是省略，計費都按完整內部思考的 token 量。不要因爲看到的文本少就以爲花費少。

4. Prefill 不再支持

Claude Opus 4.6 不再支持預填充（prefill） assistant 消息——發送預填充會返回 400 錯誤。如需控制輸出格式，使用 system prompt 或 structured output。

🎯 遷移建議: 建議在測試環境中先驗證遷移效果，特別是比較 adaptive 模式與之前固定 budget_tokens 的輸出質量差異。通過 API易 apiyi.com 可以方便地進行 A/B 測試——同一個 Key 調用不同配置。

<！– 標題 –> Effort 參數與思考 Token 計費機制用 effort 控制思考深度 · 理解計費避免意外開銷

<！– 左半：Effort 級別可視化 –> Effort 級別 → 思考深度

<！– max –> max 始終深度思考 · 無約束 · 僅 Opus 4.6 數學證明 / 架構設計 / 最高難度推理

<！– high –> high 幾乎總是思考 · 默認值代碼審查 / Bug 調試 / 安全審計

<！– medium –> med 適度思考 · 可跳過簡單題日常編碼 / 一般任務 · Sonnet 推薦默認

<！– low –> low 最小化思考簡單問答 / 風格檢查 / 翻譯 · 優先速度

<！– 右半：計費機制 –> 計費機制（注意！）

⚠ 思考 token = 輸出 token 價格

Opus 4.6: 輸入 $5 / 輸出 $25 每百萬token Sonnet 4.6: 輸入 $3 / 輸出 $15 每百萬token

關鍵: 看到的 ≠ 計費的 • 默認返回摘要版思考（非完整版） • 計費按完整內部思考 token 量 • display:"omitted" 僅減延遲，不減費

真正省錢: 降低 effort ！ low effort 可能跳過思考 → 0 思考 token 同任務 high→low 可省約 83%

<！– 底部：實際成本示例 –> 同一代碼風格檢查任務 · Sonnet 4.6 成本對比

<！– 柱狀圖 –> effort: high $0.053

medium $0.020

low $0.009

省 83% low vs high

通過 API易 apiyi.com 享受更優惠價格 + effort 參數雙重省錢

計費機制詳解

思考 Token 如何計費

理解計費機制對控制成本至關重要。

計費項	說明
輸入 token	正常計費（$5/MTok Opus， $3/MTok Sonnet）
思考 token	按輸出 token 價格計費（$25/MTok Opus， $15/MTok Sonnet）
響應文本 token	按輸出 token 價格計費
摘要生成 token	不額外計費
display: "omitted"	思考 token 仍計費，只是不傳輸

成本優化策略

簡單問題用 low effort → 可能跳過思考 → 節省大量輸出 token
                                                ↓
                                           成本可降 50-80%

實際對比示例: 同一個代碼風格檢查任務

配置	思考 token	響應 token	總成本（Sonnet）
effort: high	~3000	~500	~$0.053
effort: medium	~800	~500	~$0.020
effort: low	0 （跳過思考）	~500	~$0.009

對於簡單任務，low effort 比 high effort 便宜約 83%。

💰 省錢技巧: 對於批量處理場景（比如對 100 個文件做風格檢查），將 effort 設爲 low 可以節省大量成本。通過 API易 apiyi.com 調用 Claude 4.6 API，在已有優惠價格基礎上再配合 effort 參數優化，雙重降本。

常見問題

Q1: Adaptive Thinking 和 Extended Thinking 可以混用嗎？

可以，但不推薦。在 Claude 4.6 模型上，Extended Thinking （type: "enabled"）仍然可用但已標記爲 Deprecated，未來版本會移除。兩種模式混用還會導致 prompt cache 斷點失效。建議儘早統一遷移到 Adaptive Thinking。通過 API易 apiyi.com 調用時參數格式完全兼容。

Q2: Opus 4.5 支持 Adaptive Thinking 嗎？

不支持。Adaptive Thinking 僅支持 Claude Opus 4.6 和 Sonnet 4.6。Opus 4.5 仍需使用 type: "enabled" 模式並手動設置 budget_tokens。如果需要使用 Adaptive Thinking，建議升級到 4.6 系列模型。API易 apiyi.com 同時提供 4.5 和 4.6 全系列模型的 API 接入。

Q3: display: “omitted” 真的能省錢嗎？

不能省錢。display: "omitted" 只是讓 API 不返回思考文本，減少網絡傳輸延遲。但內部思考 token 仍然會生成並計費。真正省錢的方法是降低 effort 級別——low 或 medium 會讓 Claude 在簡單問題上跳過或減少思考。

Q4: 如何判斷 Claude 在某次請求中是否進行了思考？

檢查響應中是否包含 thinking 類型的 content block。如果 Claude 判斷不需要思考，響應中只會有 text block，沒有 thinking block。在 Adaptive 模式下，usage 字段中的 token 計數可以幫助你判斷思考消耗了多少 token。

Q5: Claude Code 中如何使用 Adaptive Thinking？

Claude Code 在使用 Opus 4.6 或 Sonnet 4.6 時默認啓用 Adaptive Thinking。你可以用 /effort 命令調整思考深度：/effort low （快速模式）、/effort medium （平衡模式）、/effort high （深度模式）。2026 年 3 月更新還修復了非標準模型字符串導致的 "adaptive thinking is not supported" 錯誤。

總結：Adaptive Thinking 是 Claude 4.6 的核心升級

Adaptive Thinking 代表了 AI 推理模式的一次重要演進——從"開發者猜測 AI 需要思考多少"到"AI 自己判斷需要思考多少"。

4 個核心升級:

動態決策: 簡單問題秒回，複雜問題深入推理
自動交錯思考: 代理式工作流中工具調用間自動推理
靈活多輪對話: 無需強制 thinking block 開頭
effort 參數: 比 budget_tokens 更直覺的控制方式

遷移建議: 從 thinking: {"type": "enabled"， "budget_tokens": N} 改爲 thinking: {"type": "adaptive"}，配合 output_config: {"effort": "..."} 控制深度。

推薦通過 API易 apiyi.com 快速接入 Claude Opus 4.6 和 Sonnet 4.6 的 API，一行參數改動即可享受 Adaptive Thinking 帶來的智能推理和成本優化。

參考資料

Claude API 文檔 – Adaptive Thinking: 官方技術指南
- 鏈接: platform.claude.com/docs/en/build-with-claude/adaptive-thinking
Claude API 文檔 – Effort 參數: effort 配置詳解
- 鏈接: platform.claude.com/docs/en/build-with-claude/effort
Anthropic 官方 – Claude Opus 4.6: 發佈公告
- 鏈接: anthropic.com/news/claude-opus-4-6
Claude API 文檔 – Extended Thinking: 原有擴展思考指南
- 鏈接: platform.claude.com/docs/en/build-with-claude/extended-thinking

作者: APIYI Team | 掌握 Claude 最新 API 能力，歡迎訪問 API易 apiyi.com 獲取 Claude 4.6 全系列模型的 API 接口和技術支持。

解讀 Claude Adaptive Thinking 自適應思考模式：取代 Extended Thinking 的 4 大升級

Adaptive Thinking 是什麼：一句話理解

核心信息速覽

Adaptive vs Extended Thinking：4 大核心升級

升級一：從"固定預算"到"動態決策"

升級二：自動交錯思考（Interleaved Thinking）

升級三：更靈活的多輪對話

升級四：effort 參數取代 budget_tokens

API 調用完整指南

基礎調用：最簡單的 Adaptive Thinking

使用 Anthropic 原生 SDK

配合 effort 參數精細控制

省略思考內容以降低延遲

Effort 參數實戰：不同場景的最優配置

場景化配置指南

Claude Code 中使用 effort

從 Extended Thinking 遷移到 Adaptive Thinking

遷移對照表

遷移注意事項

計費機制詳解

思考 Token 如何計費

成本優化策略

常見問題

總結：Adaptive Thinking 是 Claude 4.6 的核心升級

參考資料

掌握 Claude Code Security 3大核心能力：AI 驅動的代碼漏洞掃描詳解

Claude Opus 4.7 爲什麼比 4.6 更不耐用? 5 大降級場景與 Max Plan 額度消耗實測

解讀微軟 MAI 3 款新模型：MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2 技術規格與 API 接入指南

Claude Cowork 體驗指南：AI 幫你操作電腦幹活是什麼感覺？附 Claude Code 對比

OpenAI 開源 imagegen-demo 深度解讀：4 步接入官轉 gpt-image-2 API

解讀 Claude 實名認證新政策：Anthropic 身份驗證 KYC 要求影響哪些用戶（2026年4月）

Adaptive Thinking 是什麼：一句話理解

核心信息速覽

Adaptive vs Extended Thinking：4 大核心升級

升級一：從"固定預算"到"動態決策"

升級二：自動交錯思考 （Interleaved Thinking）

升級三：更靈活的多輪對話

升級四：effort 參數取代 budget_tokens

API 調用完整指南

基礎調用：最簡單的 Adaptive Thinking

使用 Anthropic 原生 SDK

配合 effort 參數精細控制

省略思考內容以降低延遲

Effort 參數實戰：不同場景的最優配置

場景化配置指南

Claude Code 中使用 effort

從 Extended Thinking 遷移到 Adaptive Thinking

遷移對照表

遷移注意事項

計費機制詳解

思考 Token 如何計費

成本優化策略

常見問題

總結：Adaptive Thinking 是 Claude 4.6 的核心升級

參考資料

Similar Posts

升級二：自動交錯思考（Interleaved Thinking）