|

解读 Claude Adaptive Thinking 自适应思考模式:取代 Extended Thinking 的 4 大升级

如果你一直在用 Claude 的 Extended Thinking (扩展思考) 模式,注意了——它在 Claude 4.6 上已经被标记为 Deprecated (即将弃用)。取而代之的是一个更智能的模式:Adaptive Thinking (自适应思考)

核心变化:以前你需要手动设置思考 token 预算 (budget_tokens),现在 Claude 自己决定要不要思考、思考多深。简单问题秒回,复杂问题深入推理——一个参数搞定。

核心价值: 读完本文,你将掌握 Adaptive Thinking 的 API 调用方法、4 大升级细节、effort 参数配置以及从 Extended Thinking 迁移的完整指南。

claude-adaptive-thinking-mode-api-guide-replace-extended-thinking 图示

Adaptive Thinking 是什么:一句话理解

Extended Thinking (旧模式): 开发者告诉 Claude "你有 10000 个 token 的预算来思考",Claude 就会用完这些预算。

Adaptive Thinking (新模式): Claude 自己评估问题复杂度,决定"需不需要思考"以及"思考多深"。

# ❌ 旧模式 (Extended Thinking) - 即将弃用
thinking={"type": "enabled", "budget_tokens": 10000}

# ✅ 新模式 (Adaptive Thinking) - 推荐
thinking={"type": "adaptive"}

核心信息速览

信息项 详情
功能名称 Adaptive Thinking (自适应思考)
发布时间 2026 年 2 月 5 日 (随 Claude Opus 4.6 发布)
支持模型 Claude Opus 4.6, Claude Sonnet 4.6
API 参数 thinking: {"type": "adaptive"}
控制方式 effort 参数 (替代 budget_tokens)
状态 官方推荐方式 (Extended Thinking 已 Deprecated)
交错思考 自动启用 (无需 beta header)
Claude Code 原生支持,可用 /effort 命令调整

🎯 迁移建议: 如果你的项目正在使用 Extended Thinking (type: "enabled"),建议尽快迁移到 Adaptive Thinking。通过 API易 apiyi.com 平台调用 Claude Opus 4.6 或 Sonnet 4.6 的 API,只需修改一个参数即可完成迁移。


Adaptive vs Extended Thinking:4 大核心升级

claude-adaptive-thinking-mode-api-guide-replace-extended-thinking 图示

升级一:从"固定预算"到"动态决策"

这是最根本的变化。

旧模式的痛点: 你必须猜测一个 budget_tokens 值。设太低,复杂问题推理不充分;设太高,简单问题浪费 token (和钱)。

# 旧模式: 你猜这个问题需要多少思考 token?
thinking={"type": "enabled", "budget_tokens": 10000}
# 问题: 简单问题也会用掉大量思考 token

新模式: Claude 根据每个请求的复杂度自动决定。

# 新模式: Claude 自己判断
thinking={"type": "adaptive"}
# 简单问题: 不思考或轻度思考
# 复杂问题: 深度推理

实际影响: 对于"有时简单有时复杂"的混合工作负载 (比如代码审查场景——有的 PR 只是改个文案,有的涉及并发重构),Adaptive Thinking 的整体表现和成本效率都优于固定预算。

升级二:自动交错思考 (Interleaved Thinking)

在代理式 (Agentic) 工作流中,Claude 需要在多次工具调用之间进行思考。

旧模式: 交错思考需要手动添加 beta header,且 Opus 4.5 上不可用。

新模式: 使用 Adaptive Thinking 时,交错思考自动启用,无需任何额外配置。

用户请求 → Claude 思考 → 调用工具 A → Claude 再次思考 → 调用工具 B → 最终回答

这对 Claude Code 和其他代理式应用尤为重要——AI 在每次工具调用后都能"重新想想",显著减少错误。

升级三:更灵活的多轮对话

旧模式: 多轮对话中,前一轮的 assistant 消息必须以 thinking block 开头,否则报错。这让对话管理变得复杂。

新模式: 没有这个限制。Adaptive Thinking 在多轮对话中更加灵活,因为有些轮次 Claude 可能选择不思考。

升级四:effort 参数取代 budget_tokens

effort 是一个行为信号而非硬限制,比 budget_tokens 更符合实际需求。

Effort 级别 行为 适用场景 支持模型
max 始终深度思考,无约束 最高难度推理 仅 Opus 4.6
high (默认) 几乎总是思考,复杂问题深入推理 代码审查、架构设计 Opus 4.6, Sonnet 4.6
medium 中等思考,简单问题可能跳过 日常开发、一般任务 Opus 4.6, Sonnet 4.6
low 最小化思考,优先速度 简单问答、风格检查 Opus 4.6, Sonnet 4.6

重要: 即使在 low effort 下,如果问题足够复杂,Claude 仍然会选择思考。effort 是建议,不是命令。

💡 Sonnet 4.6 建议: Anthropic 官方推荐 Sonnet 4.6 默认使用 medium effort,在速度、成本和质量之间取得最佳平衡。通过 API易 apiyi.com 调用时,只需在请求中加入 output_config 参数即可。


API 调用完整指南

基础调用:最简单的 Adaptive Thinking

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # API易统一接口
)

response = client.chat.completions.create(
    model="claude-opus-4-6",
    messages=[
        {"role": "user", "content": "解释 Python 的 GIL 对多线程的影响"}
    ],
    max_tokens=16000,
    extra_body={
        "thinking": {"type": "adaptive"}
    }
)
print(response.choices[0].message.content)

使用 Anthropic 原生 SDK

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"  # API易统一接口
)

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Review this code for race conditions..."}
    ]
)

# 解析响应:可能包含 thinking block 和 text block
for block in response.content:
    if block.type == "thinking":
        print(f"[思考过程] {block.thinking}")
    elif block.type == "text":
        print(f"[回答] {block.text}")

配合 effort 参数精细控制

# Anthropic SDK 示例
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},  # 中等思考深度
    messages=[
        {"role": "user", "content": "这段代码有什么问题?"}
    ]
)

省略思考内容以降低延迟

如果你不需要看到思考过程,可以用 display: "omitted" 降低传输延迟:

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={
        "type": "adaptive",
        "display": "omitted"  # 不返回思考文本
    },
    messages=[...]
)
# 注意: 思考 token 仍然会被计费
查看完整的代码审查工作流示例
import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"
)

def review_pr(diff_content, risk_level="medium"):
    """根据风险级别自适应审查代码"""

    # 高风险: Opus + high effort
    # 低风险: Sonnet + medium effort
    if risk_level == "high":
        model = "claude-opus-4-6"
        effort = "high"
    else:
        model = "claude-sonnet-4-6"
        effort = "medium"

    response = client.messages.create(
        model=model,
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": effort},
        system="""你是资深代码审查专家。
分析代码变更,按严重级别分类:
🔴 必须修复 (安全/逻辑)
🟡 建议修复 (质量)
💡 改进建议""",
        messages=[
            {"role": "user", "content": f"审查:\n\n{diff_content}"}
        ]
    )

    thinking_text = ""
    review_text = ""
    for block in response.content:
        if block.type == "thinking":
            thinking_text = block.thinking
        elif block.type == "text":
            review_text = block.text

    return {
        "thinking": thinking_text,
        "review": review_text,
        "model": model,
        "effort": effort,
        "input_tokens": response.usage.input_tokens,
        "output_tokens": response.usage.output_tokens
    }

🚀 快速上手: 通过 API易 apiyi.com 调用 Claude 4.6 API,只需在请求中加入 thinking: {"type": "adaptive"} 即可启用自适应思考。无需额外配置,一行代码升级你的 AI 推理能力。


Effort 参数实战:不同场景的最优配置

场景化配置指南

场景 推荐模型 Effort 理由
简单问答/翻译 Sonnet 4.6 low 无需深度推理,优先速度
代码补全/格式化 Sonnet 4.6 low 模式匹配任务,不需要思考
日常 PR 审查 Sonnet 4.6 medium 平衡速度和审查深度
复杂 Bug 调试 Opus 4.6 high 需要跨文件推理
安全漏洞审计 Opus 4.6 high 不能漏过高危问题
数学/逻辑证明 Opus 4.6 max 需要极致推理深度
架构方案设计 Opus 4.6 max 需要全面考虑权衡

Claude Code 中使用 effort

Claude Code 2026 年 3 月更新后,新增了 /effort 命令:

# 在 Claude Code 终端中直接设置
/effort medium    # 日常编码
/effort high      # 代码审查
/effort max       # 架构设计 (仅 Opus 4.6)

这让开发者可以根据当前任务灵活调整 Claude 的思考深度,无需修改代码。

💰 成本优化: effort 参数直接影响 token 消耗。对于日常编码任务,将 Sonnet 4.6 设为 mediumlow 可以显著降低成本。通过 API易 apiyi.com 平台调用,价格比官方更优惠,配合 effort 参数双重省钱。


从 Extended Thinking 迁移到 Adaptive Thinking

迁移对照表

旧写法 (Extended Thinking) 新写法 (Adaptive Thinking)
thinking: {"type": "enabled", "budget_tokens": 5000} thinking: {"type": "adaptive"}, output_config: {"effort": "low"}
thinking: {"type": "enabled", "budget_tokens": 10000} thinking: {"type": "adaptive"}, output_config: {"effort": "medium"}
thinking: {"type": "enabled", "budget_tokens": 30000} thinking: {"type": "adaptive"}, output_config: {"effort": "high"}
thinking: {"type": "enabled", "budget_tokens": 100000} thinking: {"type": "adaptive"}, output_config: {"effort": "max"}
手动添加 interleaved thinking beta header 自动启用,无需任何 header

迁移注意事项

1. Prompt 缓存会中断

enabled 切换到 adaptive 模式时,消息级别的 prompt cache 断点会失效。系统提示和工具定义的缓存不受影响。

建议: 一次性迁移所有请求到 adaptive 模式,而非混合使用。

2. 思考内容默认是摘要

Claude 4.6 模型默认返回摘要版的思考内容,而非完整思考文本。这意味着你看到的 thinking block 是简化版。

  • 摘要版 (display: "summarized"): 默认行为
  • 省略版 (display: "omitted"): 不返回思考文本
  • 完整版: 需联系 Anthropic 销售团队开通

3. 计费按完整思考计算

无论你看到的是摘要还是省略,计费都按完整内部思考的 token 量。不要因为看到的文本少就以为花费少。

4. Prefill 不再支持

Claude Opus 4.6 不再支持预填充 (prefill) assistant 消息——发送预填充会返回 400 错误。如需控制输出格式,使用 system prompt 或 structured output。

🎯 迁移建议: 建议在测试环境中先验证迁移效果,特别是比较 adaptive 模式与之前固定 budget_tokens 的输出质量差异。通过 API易 apiyi.com 可以方便地进行 A/B 测试——同一个 Key 调用不同配置。


claude-adaptive-thinking-mode-api-guide-replace-extended-thinking 图示

计费机制详解

思考 Token 如何计费

理解计费机制对控制成本至关重要。

计费项 说明
输入 token 正常计费 ($5/MTok Opus, $3/MTok Sonnet)
思考 token 输出 token 价格计费 ($25/MTok Opus, $15/MTok Sonnet)
响应文本 token 按输出 token 价格计费
摘要生成 token 不额外计费
display: "omitted" 思考 token 仍计费,只是不传输

成本优化策略

简单问题用 low effort → 可能跳过思考 → 节省大量输出 token
                                                ↓
                                           成本可降 50-80%

实际对比示例: 同一个代码风格检查任务

配置 思考 token 响应 token 总成本 (Sonnet)
effort: high ~3000 ~500 ~$0.053
effort: medium ~800 ~500 ~$0.020
effort: low 0 (跳过思考) ~500 ~$0.009

对于简单任务,low effort 比 high effort 便宜约 83%

💰 省钱技巧: 对于批量处理场景 (比如对 100 个文件做风格检查),将 effort 设为 low 可以节省大量成本。通过 API易 apiyi.com 调用 Claude 4.6 API,在已有优惠价格基础上再配合 effort 参数优化,双重降本。


常见问题

Q1: Adaptive Thinking 和 Extended Thinking 可以混用吗?

可以,但不推荐。在 Claude 4.6 模型上,Extended Thinking (type: "enabled") 仍然可用但已标记为 Deprecated,未来版本会移除。两种模式混用还会导致 prompt cache 断点失效。建议尽早统一迁移到 Adaptive Thinking。通过 API易 apiyi.com 调用时参数格式完全兼容。

Q2: Opus 4.5 支持 Adaptive Thinking 吗?

不支持。Adaptive Thinking 仅支持 Claude Opus 4.6 和 Sonnet 4.6。Opus 4.5 仍需使用 type: "enabled" 模式并手动设置 budget_tokens。如果需要使用 Adaptive Thinking,建议升级到 4.6 系列模型。API易 apiyi.com 同时提供 4.5 和 4.6 全系列模型的 API 接入。

Q3: display: “omitted” 真的能省钱吗?

不能省钱。display: "omitted" 只是让 API 不返回思考文本,减少网络传输延迟。但内部思考 token 仍然会生成并计费。真正省钱的方法是降低 effort 级别——lowmedium 会让 Claude 在简单问题上跳过或减少思考。

Q4: 如何判断 Claude 在某次请求中是否进行了思考?

检查响应中是否包含 thinking 类型的 content block。如果 Claude 判断不需要思考,响应中只会有 text block,没有 thinking block。在 Adaptive 模式下,usage 字段中的 token 计数可以帮助你判断思考消耗了多少 token。

Q5: Claude Code 中如何使用 Adaptive Thinking?

Claude Code 在使用 Opus 4.6 或 Sonnet 4.6 时默认启用 Adaptive Thinking。你可以用 /effort 命令调整思考深度:/effort low (快速模式)、/effort medium (平衡模式)、/effort high (深度模式)。2026 年 3 月更新还修复了非标准模型字符串导致的 "adaptive thinking is not supported" 错误。


总结:Adaptive Thinking 是 Claude 4.6 的核心升级

Adaptive Thinking 代表了 AI 推理模式的一次重要演进——从"开发者猜测 AI 需要思考多少"到"AI 自己判断需要思考多少"。

4 个核心升级:

  1. 动态决策: 简单问题秒回,复杂问题深入推理
  2. 自动交错思考: 代理式工作流中工具调用间自动推理
  3. 灵活多轮对话: 无需强制 thinking block 开头
  4. effort 参数: 比 budget_tokens 更直觉的控制方式

迁移建议: 从 thinking: {"type": "enabled", "budget_tokens": N} 改为 thinking: {"type": "adaptive"},配合 output_config: {"effort": "..."} 控制深度。

推荐通过 API易 apiyi.com 快速接入 Claude Opus 4.6 和 Sonnet 4.6 的 API,一行参数改动即可享受 Adaptive Thinking 带来的智能推理和成本优化。


参考资料

  1. Claude API 文档 – Adaptive Thinking: 官方技术指南

    • 链接: platform.claude.com/docs/en/build-with-claude/adaptive-thinking
  2. Claude API 文档 – Effort 参数: effort 配置详解

    • 链接: platform.claude.com/docs/en/build-with-claude/effort
  3. Anthropic 官方 – Claude Opus 4.6: 发布公告

    • 链接: anthropic.com/news/claude-opus-4-6
  4. Claude API 文档 – Extended Thinking: 原有扩展思考指南

    • 链接: platform.claude.com/docs/en/build-with-claude/extended-thinking

作者: APIYI Team | 掌握 Claude 最新 API 能力,欢迎访问 API易 apiyi.com 获取 Claude 4.6 全系列模型的 API 接口和技术支持。

类似文章