解读 Claude Adaptive Thinking 自适应思考模式：取代 Extended Thinking 的 4 大升级

如果你一直在用 Claude 的 Extended Thinking (扩展思考) 模式，注意了——它在 Claude 4.6 上已经被标记为 Deprecated (即将弃用)。取而代之的是一个更智能的模式：Adaptive Thinking (自适应思考)。

核心变化：以前你需要手动设置思考 token 预算 (budget_tokens)，现在 Claude 自己决定要不要思考、思考多深。简单问题秒回，复杂问题深入推理——一个参数搞定。

核心价值: 读完本文，你将掌握 Adaptive Thinking 的 API 调用方法、4 大升级细节、effort 参数配置以及从 Extended Thinking 迁移的完整指南。

Adaptive Thinking 是什么：一句话理解

Extended Thinking (旧模式): 开发者告诉 Claude "你有 10000 个 token 的预算来思考"，Claude 就会用完这些预算。

Adaptive Thinking (新模式): Claude 自己评估问题复杂度，决定"需不需要思考"以及"思考多深"。

# ❌ 旧模式 (Extended Thinking) - 即将弃用
thinking={"type": "enabled", "budget_tokens": 10000}

# ✅ 新模式 (Adaptive Thinking) - 推荐
thinking={"type": "adaptive"}

核心信息速览

信息项	详情
功能名称	Adaptive Thinking (自适应思考)
发布时间	2026 年 2 月 5 日 (随 Claude Opus 4.6 发布)
支持模型	Claude Opus 4.6, Claude Sonnet 4.6
API 参数	`thinking: {"type": "adaptive"}`
控制方式	`effort` 参数 (替代 `budget_tokens`)
状态	官方推荐方式 (Extended Thinking 已 Deprecated)
交错思考	自动启用 (无需 beta header)
Claude Code	原生支持，可用 `/effort` 命令调整

🎯 迁移建议: 如果你的项目正在使用 Extended Thinking (type: "enabled")，建议尽快迁移到 Adaptive Thinking。通过 API易 apiyi.com 平台调用 Claude Opus 4.6 或 Sonnet 4.6 的 API，只需修改一个参数即可完成迁移。

Adaptive vs Extended Thinking：4 大核心升级

升级一：从"固定预算"到"动态决策"

这是最根本的变化。

旧模式的痛点: 你必须猜测一个 budget_tokens 值。设太低，复杂问题推理不充分；设太高，简单问题浪费 token (和钱)。

# 旧模式: 你猜这个问题需要多少思考 token?
thinking={"type": "enabled", "budget_tokens": 10000}
# 问题: 简单问题也会用掉大量思考 token

新模式: Claude 根据每个请求的复杂度自动决定。

# 新模式: Claude 自己判断
thinking={"type": "adaptive"}
# 简单问题: 不思考或轻度思考
# 复杂问题: 深度推理

实际影响: 对于"有时简单有时复杂"的混合工作负载 (比如代码审查场景——有的 PR 只是改个文案，有的涉及并发重构)，Adaptive Thinking 的整体表现和成本效率都优于固定预算。

升级二：自动交错思考 (Interleaved Thinking)

在代理式 (Agentic) 工作流中，Claude 需要在多次工具调用之间进行思考。

旧模式: 交错思考需要手动添加 beta header，且 Opus 4.5 上不可用。

新模式: 使用 Adaptive Thinking 时，交错思考自动启用，无需任何额外配置。

用户请求 → Claude 思考 → 调用工具 A → Claude 再次思考 → 调用工具 B → 最终回答

这对 Claude Code 和其他代理式应用尤为重要——AI 在每次工具调用后都能"重新想想"，显著减少错误。

升级三：更灵活的多轮对话

旧模式: 多轮对话中，前一轮的 assistant 消息必须以 thinking block 开头，否则报错。这让对话管理变得复杂。

新模式: 没有这个限制。Adaptive Thinking 在多轮对话中更加灵活，因为有些轮次 Claude 可能选择不思考。

升级四：effort 参数取代 budget_tokens

effort 是一个行为信号而非硬限制，比 budget_tokens 更符合实际需求。

Effort 级别	行为	适用场景	支持模型
`max`	始终深度思考，无约束	最高难度推理	仅 Opus 4.6
`high` (默认)	几乎总是思考，复杂问题深入推理	代码审查、架构设计	Opus 4.6, Sonnet 4.6
`medium`	中等思考，简单问题可能跳过	日常开发、一般任务	Opus 4.6, Sonnet 4.6
`low`	最小化思考，优先速度	简单问答、风格检查	Opus 4.6, Sonnet 4.6

重要: 即使在 low effort 下，如果问题足够复杂，Claude 仍然会选择思考。effort 是建议，不是命令。

💡 Sonnet 4.6 建议: Anthropic 官方推荐 Sonnet 4.6 默认使用 medium effort，在速度、成本和质量之间取得最佳平衡。通过 API易 apiyi.com 调用时，只需在请求中加入 output_config 参数即可。

API 调用完整指南

基础调用：最简单的 Adaptive Thinking

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # API易统一接口
)

response = client.chat.completions.create(
    model="claude-opus-4-6",
    messages=[
        {"role": "user", "content": "解释 Python 的 GIL 对多线程的影响"}
    ],
    max_tokens=16000,
    extra_body={
        "thinking": {"type": "adaptive"}
    }
)
print(response.choices[0].message.content)

使用 Anthropic 原生 SDK

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"  # API易统一接口
)

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Review this code for race conditions..."}
    ]
)

# 解析响应：可能包含 thinking block 和 text block
for block in response.content:
    if block.type == "thinking":
        print(f"[思考过程] {block.thinking}")
    elif block.type == "text":
        print(f"[回答] {block.text}")

配合 effort 参数精细控制

# Anthropic SDK 示例
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},  # 中等思考深度
    messages=[
        {"role": "user", "content": "这段代码有什么问题？"}
    ]
)

省略思考内容以降低延迟

如果你不需要看到思考过程，可以用 display: "omitted" 降低传输延迟：

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={
        "type": "adaptive",
        "display": "omitted"  # 不返回思考文本
    },
    messages=[...]
)
# 注意: 思考 token 仍然会被计费

查看完整的代码审查工作流示例

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"
)

def review_pr(diff_content, risk_level="medium"):
    """根据风险级别自适应审查代码"""

    # 高风险: Opus + high effort
    # 低风险: Sonnet + medium effort
    if risk_level == "high":
        model = "claude-opus-4-6"
        effort = "high"
    else:
        model = "claude-sonnet-4-6"
        effort = "medium"

    response = client.messages.create(
        model=model,
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": effort},
        system="""你是资深代码审查专家。
分析代码变更，按严重级别分类:
🔴 必须修复 (安全/逻辑)
🟡 建议修复 (质量)
💡 改进建议""",
        messages=[
            {"role": "user", "content": f"审查:\n\n{diff_content}"}
        ]
    )

    thinking_text = ""
    review_text = ""
    for block in response.content:
        if block.type == "thinking":
            thinking_text = block.thinking
        elif block.type == "text":
            review_text = block.text

    return {
        "thinking": thinking_text,
        "review": review_text,
        "model": model,
        "effort": effort,
        "input_tokens": response.usage.input_tokens,
        "output_tokens": response.usage.output_tokens
    }

🚀 快速上手: 通过 API易 apiyi.com 调用 Claude 4.6 API，只需在请求中加入 thinking: {"type": "adaptive"} 即可启用自适应思考。无需额外配置，一行代码升级你的 AI 推理能力。

Effort 参数实战：不同场景的最优配置

场景化配置指南

场景	推荐模型	Effort	理由
简单问答/翻译	Sonnet 4.6	`low`	无需深度推理，优先速度
代码补全/格式化	Sonnet 4.6	`low`	模式匹配任务，不需要思考
日常 PR 审查	Sonnet 4.6	`medium`	平衡速度和审查深度
复杂 Bug 调试	Opus 4.6	`high`	需要跨文件推理
安全漏洞审计	Opus 4.6	`high`	不能漏过高危问题
数学/逻辑证明	Opus 4.6	`max`	需要极致推理深度
架构方案设计	Opus 4.6	`max`	需要全面考虑权衡

Claude Code 中使用 effort

Claude Code 2026 年 3 月更新后，新增了 /effort 命令：

# 在 Claude Code 终端中直接设置
/effort medium    # 日常编码
/effort high      # 代码审查
/effort max       # 架构设计 (仅 Opus 4.6)

这让开发者可以根据当前任务灵活调整 Claude 的思考深度，无需修改代码。

💰 成本优化: effort 参数直接影响 token 消耗。对于日常编码任务，将 Sonnet 4.6 设为 medium 或 low 可以显著降低成本。通过 API易 apiyi.com 平台调用，价格比官方更优惠，配合 effort 参数双重省钱。

从 Extended Thinking 迁移到 Adaptive Thinking

迁移对照表

旧写法 (Extended Thinking)	新写法 (Adaptive Thinking)
`thinking: {"type": "enabled", "budget_tokens": 5000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "low"}`
`thinking: {"type": "enabled", "budget_tokens": 10000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "medium"}`
`thinking: {"type": "enabled", "budget_tokens": 30000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "high"}`
`thinking: {"type": "enabled", "budget_tokens": 100000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "max"}`
手动添加 interleaved thinking beta header	自动启用，无需任何 header

迁移注意事项

1. Prompt 缓存会中断

从 enabled 切换到 adaptive 模式时，消息级别的 prompt cache 断点会失效。系统提示和工具定义的缓存不受影响。

建议: 一次性迁移所有请求到 adaptive 模式，而非混合使用。

2. 思考内容默认是摘要

Claude 4.6 模型默认返回摘要版的思考内容，而非完整思考文本。这意味着你看到的 thinking block 是简化版。

摘要版 (display: "summarized"): 默认行为
省略版 (display: "omitted"): 不返回思考文本
完整版: 需联系 Anthropic 销售团队开通

3. 计费按完整思考计算

无论你看到的是摘要还是省略，计费都按完整内部思考的 token 量。不要因为看到的文本少就以为花费少。

4. Prefill 不再支持

Claude Opus 4.6 不再支持预填充 (prefill) assistant 消息——发送预填充会返回 400 错误。如需控制输出格式，使用 system prompt 或 structured output。

🎯 迁移建议: 建议在测试环境中先验证迁移效果，特别是比较 adaptive 模式与之前固定 budget_tokens 的输出质量差异。通过 API易 apiyi.com 可以方便地进行 A/B 测试——同一个 Key 调用不同配置。

计费机制详解

思考 Token 如何计费

理解计费机制对控制成本至关重要。

计费项	说明
输入 token	正常计费 ($5/MTok Opus, $3/MTok Sonnet)
思考 token	按输出 token 价格计费 ($25/MTok Opus, $15/MTok Sonnet)
响应文本 token	按输出 token 价格计费
摘要生成 token	不额外计费
display: "omitted"	思考 token 仍计费，只是不传输

成本优化策略

简单问题用 low effort → 可能跳过思考 → 节省大量输出 token
                                                ↓
                                           成本可降 50-80%

实际对比示例: 同一个代码风格检查任务

配置	思考 token	响应 token	总成本 (Sonnet)
effort: high	~3000	~500	~$0.053
effort: medium	~800	~500	~$0.020
effort: low	0 (跳过思考)	~500	~$0.009

对于简单任务，low effort 比 high effort 便宜约 83%。

💰 省钱技巧: 对于批量处理场景 (比如对 100 个文件做风格检查)，将 effort 设为 low 可以节省大量成本。通过 API易 apiyi.com 调用 Claude 4.6 API，在已有优惠价格基础上再配合 effort 参数优化，双重降本。

常见问题

Q1: Adaptive Thinking 和 Extended Thinking 可以混用吗？

可以，但不推荐。在 Claude 4.6 模型上，Extended Thinking (type: "enabled") 仍然可用但已标记为 Deprecated，未来版本会移除。两种模式混用还会导致 prompt cache 断点失效。建议尽早统一迁移到 Adaptive Thinking。通过 API易 apiyi.com 调用时参数格式完全兼容。

Q2: Opus 4.5 支持 Adaptive Thinking 吗？

不支持。Adaptive Thinking 仅支持 Claude Opus 4.6 和 Sonnet 4.6。Opus 4.5 仍需使用 type: "enabled" 模式并手动设置 budget_tokens。如果需要使用 Adaptive Thinking，建议升级到 4.6 系列模型。API易 apiyi.com 同时提供 4.5 和 4.6 全系列模型的 API 接入。

Q3: display: “omitted” 真的能省钱吗？

不能省钱。display: "omitted" 只是让 API 不返回思考文本，减少网络传输延迟。但内部思考 token 仍然会生成并计费。真正省钱的方法是降低 effort 级别——low 或 medium 会让 Claude 在简单问题上跳过或减少思考。

Q4: 如何判断 Claude 在某次请求中是否进行了思考？

检查响应中是否包含 thinking 类型的 content block。如果 Claude 判断不需要思考，响应中只会有 text block，没有 thinking block。在 Adaptive 模式下，usage 字段中的 token 计数可以帮助你判断思考消耗了多少 token。

Q5: Claude Code 中如何使用 Adaptive Thinking？

Claude Code 在使用 Opus 4.6 或 Sonnet 4.6 时默认启用 Adaptive Thinking。你可以用 /effort 命令调整思考深度：/effort low (快速模式)、/effort medium (平衡模式)、/effort high (深度模式)。2026 年 3 月更新还修复了非标准模型字符串导致的 "adaptive thinking is not supported" 错误。

总结：Adaptive Thinking 是 Claude 4.6 的核心升级

Adaptive Thinking 代表了 AI 推理模式的一次重要演进——从"开发者猜测 AI 需要思考多少"到"AI 自己判断需要思考多少"。

4 个核心升级:

动态决策: 简单问题秒回，复杂问题深入推理
自动交错思考: 代理式工作流中工具调用间自动推理
灵活多轮对话: 无需强制 thinking block 开头
effort 参数: 比 budget_tokens 更直觉的控制方式

迁移建议: 从 thinking: {"type": "enabled", "budget_tokens": N} 改为 thinking: {"type": "adaptive"}，配合 output_config: {"effort": "..."} 控制深度。

推荐通过 API易 apiyi.com 快速接入 Claude Opus 4.6 和 Sonnet 4.6 的 API，一行参数改动即可享受 Adaptive Thinking 带来的智能推理和成本优化。

参考资料

Claude API 文档 – Adaptive Thinking: 官方技术指南
- 链接: platform.claude.com/docs/en/build-with-claude/adaptive-thinking
Claude API 文档 – Effort 参数: effort 配置详解
- 链接: platform.claude.com/docs/en/build-with-claude/effort
Anthropic 官方 – Claude Opus 4.6: 发布公告
- 链接: anthropic.com/news/claude-opus-4-6
Claude API 文档 – Extended Thinking: 原有扩展思考指南
- 链接: platform.claude.com/docs/en/build-with-claude/extended-thinking

作者: APIYI Team | 掌握 Claude 最新 API 能力，欢迎访问 API易 apiyi.com 获取 Claude 4.6 全系列模型的 API 接口和技术支持。

解读 Claude Adaptive Thinking 自适应思考模式：取代 Extended Thinking 的 4 大升级

Adaptive Thinking 是什么：一句话理解

核心信息速览

Adaptive vs Extended Thinking：4 大核心升级

升级一：从"固定预算"到"动态决策"

升级二：自动交错思考 (Interleaved Thinking)

升级三：更灵活的多轮对话

升级四：effort 参数取代 budget_tokens

API 调用完整指南

基础调用：最简单的 Adaptive Thinking

使用 Anthropic 原生 SDK

配合 effort 参数精细控制

省略思考内容以降低延迟

Effort 参数实战：不同场景的最优配置

场景化配置指南

Claude Code 中使用 effort

从 Extended Thinking 迁移到 Adaptive Thinking

迁移对照表

迁移注意事项

计费机制详解

思考 Token 如何计费

成本优化策略

常见问题

总结：Adaptive Thinking 是 Claude 4.6 的核心升级

参考资料

Qwen3.6-Plus 深度解读：编程 Agent 能力比肩 Claude Opus 4.5 的 5 大核心升级

OpenAI API 的 function call 是什么能力？Claude 也支持函数调用吗？支持的！

VSCode Cline 插件调用 Claude API 的 Token 优化指南：降低 Tokens 消耗还是有办法

HappyHorse 模型解密:Arena 神秘登顶又消失的 AI 视频黑马完整解析

Gemini 3 Pro 预览版 3 月 9 日关停：迁移 Gemini 3.1 Pro 的 5 个关键问题和应对方案

了解 Seedance 2.0 API 延期原因及 3 个替代接入方案（2026 年 2 月最新）

Adaptive Thinking 是什么：一句话理解

核心信息速览

Adaptive vs Extended Thinking：4 大核心升级

升级一：从"固定预算"到"动态决策"

升级二：自动交错思考 (Interleaved Thinking)

升级三：更灵活的多轮对话

升级四：effort 参数取代 budget_tokens

API 调用完整指南

基础调用：最简单的 Adaptive Thinking

使用 Anthropic 原生 SDK

配合 effort 参数精细控制

省略思考内容以降低延迟

Effort 参数实战：不同场景的最优配置

场景化配置指南

Claude Code 中使用 effort

从 Extended Thinking 迁移到 Adaptive Thinking

迁移对照表

迁移注意事项

计费机制详解

思考 Token 如何计费

成本优化策略

常见问题

总结：Adaptive Thinking 是 Claude 4.6 的核心升级

参考资料

类似文章