如果你一直在用 Claude 的 Extended Thinking (扩展思考) 模式,注意了——它在 Claude 4.6 上已经被标记为 Deprecated (即将弃用)。取而代之的是一个更智能的模式:Adaptive Thinking (自适应思考)。
核心变化:以前你需要手动设置思考 token 预算 (budget_tokens),现在 Claude 自己决定要不要思考、思考多深。简单问题秒回,复杂问题深入推理——一个参数搞定。
核心价值: 读完本文,你将掌握 Adaptive Thinking 的 API 调用方法、4 大升级细节、effort 参数配置以及从 Extended Thinking 迁移的完整指南。

Adaptive Thinking 是什么:一句话理解
Extended Thinking (旧模式): 开发者告诉 Claude "你有 10000 个 token 的预算来思考",Claude 就会用完这些预算。
Adaptive Thinking (新模式): Claude 自己评估问题复杂度,决定"需不需要思考"以及"思考多深"。
# ❌ 旧模式 (Extended Thinking) - 即将弃用
thinking={"type": "enabled", "budget_tokens": 10000}
# ✅ 新模式 (Adaptive Thinking) - 推荐
thinking={"type": "adaptive"}
核心信息速览
| 信息项 | 详情 |
|---|---|
| 功能名称 | Adaptive Thinking (自适应思考) |
| 发布时间 | 2026 年 2 月 5 日 (随 Claude Opus 4.6 发布) |
| 支持模型 | Claude Opus 4.6, Claude Sonnet 4.6 |
| API 参数 | thinking: {"type": "adaptive"} |
| 控制方式 | effort 参数 (替代 budget_tokens) |
| 状态 | 官方推荐方式 (Extended Thinking 已 Deprecated) |
| 交错思考 | 自动启用 (无需 beta header) |
| Claude Code | 原生支持,可用 /effort 命令调整 |
🎯 迁移建议: 如果你的项目正在使用 Extended Thinking (
type: "enabled"),建议尽快迁移到 Adaptive Thinking。通过 API易 apiyi.com 平台调用 Claude Opus 4.6 或 Sonnet 4.6 的 API,只需修改一个参数即可完成迁移。
Adaptive vs Extended Thinking:4 大核心升级

升级一:从"固定预算"到"动态决策"
这是最根本的变化。
旧模式的痛点: 你必须猜测一个 budget_tokens 值。设太低,复杂问题推理不充分;设太高,简单问题浪费 token (和钱)。
# 旧模式: 你猜这个问题需要多少思考 token?
thinking={"type": "enabled", "budget_tokens": 10000}
# 问题: 简单问题也会用掉大量思考 token
新模式: Claude 根据每个请求的复杂度自动决定。
# 新模式: Claude 自己判断
thinking={"type": "adaptive"}
# 简单问题: 不思考或轻度思考
# 复杂问题: 深度推理
实际影响: 对于"有时简单有时复杂"的混合工作负载 (比如代码审查场景——有的 PR 只是改个文案,有的涉及并发重构),Adaptive Thinking 的整体表现和成本效率都优于固定预算。
升级二:自动交错思考 (Interleaved Thinking)
在代理式 (Agentic) 工作流中,Claude 需要在多次工具调用之间进行思考。
旧模式: 交错思考需要手动添加 beta header,且 Opus 4.5 上不可用。
新模式: 使用 Adaptive Thinking 时,交错思考自动启用,无需任何额外配置。
用户请求 → Claude 思考 → 调用工具 A → Claude 再次思考 → 调用工具 B → 最终回答
这对 Claude Code 和其他代理式应用尤为重要——AI 在每次工具调用后都能"重新想想",显著减少错误。
升级三:更灵活的多轮对话
旧模式: 多轮对话中,前一轮的 assistant 消息必须以 thinking block 开头,否则报错。这让对话管理变得复杂。
新模式: 没有这个限制。Adaptive Thinking 在多轮对话中更加灵活,因为有些轮次 Claude 可能选择不思考。
升级四:effort 参数取代 budget_tokens
effort 是一个行为信号而非硬限制,比 budget_tokens 更符合实际需求。
| Effort 级别 | 行为 | 适用场景 | 支持模型 |
|---|---|---|---|
max |
始终深度思考,无约束 | 最高难度推理 | 仅 Opus 4.6 |
high (默认) |
几乎总是思考,复杂问题深入推理 | 代码审查、架构设计 | Opus 4.6, Sonnet 4.6 |
medium |
中等思考,简单问题可能跳过 | 日常开发、一般任务 | Opus 4.6, Sonnet 4.6 |
low |
最小化思考,优先速度 | 简单问答、风格检查 | Opus 4.6, Sonnet 4.6 |
重要: 即使在 low effort 下,如果问题足够复杂,Claude 仍然会选择思考。effort 是建议,不是命令。
💡 Sonnet 4.6 建议: Anthropic 官方推荐 Sonnet 4.6 默认使用
mediumeffort,在速度、成本和质量之间取得最佳平衡。通过 API易 apiyi.com 调用时,只需在请求中加入output_config参数即可。
API 调用完整指南
基础调用:最简单的 Adaptive Thinking
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # API易统一接口
)
response = client.chat.completions.create(
model="claude-opus-4-6",
messages=[
{"role": "user", "content": "解释 Python 的 GIL 对多线程的影响"}
],
max_tokens=16000,
extra_body={
"thinking": {"type": "adaptive"}
}
)
print(response.choices[0].message.content)
使用 Anthropic 原生 SDK
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com" # API易统一接口
)
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[
{"role": "user", "content": "Review this code for race conditions..."}
]
)
# 解析响应:可能包含 thinking block 和 text block
for block in response.content:
if block.type == "thinking":
print(f"[思考过程] {block.thinking}")
elif block.type == "text":
print(f"[回答] {block.text}")
配合 effort 参数精细控制
# Anthropic SDK 示例
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"}, # 中等思考深度
messages=[
{"role": "user", "content": "这段代码有什么问题?"}
]
)
省略思考内容以降低延迟
如果你不需要看到思考过程,可以用 display: "omitted" 降低传输延迟:
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={
"type": "adaptive",
"display": "omitted" # 不返回思考文本
},
messages=[...]
)
# 注意: 思考 token 仍然会被计费
查看完整的代码审查工作流示例
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com"
)
def review_pr(diff_content, risk_level="medium"):
"""根据风险级别自适应审查代码"""
# 高风险: Opus + high effort
# 低风险: Sonnet + medium effort
if risk_level == "high":
model = "claude-opus-4-6"
effort = "high"
else:
model = "claude-sonnet-4-6"
effort = "medium"
response = client.messages.create(
model=model,
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": effort},
system="""你是资深代码审查专家。
分析代码变更,按严重级别分类:
🔴 必须修复 (安全/逻辑)
🟡 建议修复 (质量)
💡 改进建议""",
messages=[
{"role": "user", "content": f"审查:\n\n{diff_content}"}
]
)
thinking_text = ""
review_text = ""
for block in response.content:
if block.type == "thinking":
thinking_text = block.thinking
elif block.type == "text":
review_text = block.text
return {
"thinking": thinking_text,
"review": review_text,
"model": model,
"effort": effort,
"input_tokens": response.usage.input_tokens,
"output_tokens": response.usage.output_tokens
}
🚀 快速上手: 通过 API易 apiyi.com 调用 Claude 4.6 API,只需在请求中加入
thinking: {"type": "adaptive"}即可启用自适应思考。无需额外配置,一行代码升级你的 AI 推理能力。
Effort 参数实战:不同场景的最优配置
场景化配置指南
| 场景 | 推荐模型 | Effort | 理由 |
|---|---|---|---|
| 简单问答/翻译 | Sonnet 4.6 | low |
无需深度推理,优先速度 |
| 代码补全/格式化 | Sonnet 4.6 | low |
模式匹配任务,不需要思考 |
| 日常 PR 审查 | Sonnet 4.6 | medium |
平衡速度和审查深度 |
| 复杂 Bug 调试 | Opus 4.6 | high |
需要跨文件推理 |
| 安全漏洞审计 | Opus 4.6 | high |
不能漏过高危问题 |
| 数学/逻辑证明 | Opus 4.6 | max |
需要极致推理深度 |
| 架构方案设计 | Opus 4.6 | max |
需要全面考虑权衡 |
Claude Code 中使用 effort
Claude Code 2026 年 3 月更新后,新增了 /effort 命令:
# 在 Claude Code 终端中直接设置
/effort medium # 日常编码
/effort high # 代码审查
/effort max # 架构设计 (仅 Opus 4.6)
这让开发者可以根据当前任务灵活调整 Claude 的思考深度,无需修改代码。
💰 成本优化: effort 参数直接影响 token 消耗。对于日常编码任务,将 Sonnet 4.6 设为
medium或low可以显著降低成本。通过 API易 apiyi.com 平台调用,价格比官方更优惠,配合 effort 参数双重省钱。
从 Extended Thinking 迁移到 Adaptive Thinking
迁移对照表
| 旧写法 (Extended Thinking) | 新写法 (Adaptive Thinking) |
|---|---|
thinking: {"type": "enabled", "budget_tokens": 5000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "low"} |
thinking: {"type": "enabled", "budget_tokens": 10000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "medium"} |
thinking: {"type": "enabled", "budget_tokens": 30000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "high"} |
thinking: {"type": "enabled", "budget_tokens": 100000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "max"} |
| 手动添加 interleaved thinking beta header | 自动启用,无需任何 header |
迁移注意事项
1. Prompt 缓存会中断
从 enabled 切换到 adaptive 模式时,消息级别的 prompt cache 断点会失效。系统提示和工具定义的缓存不受影响。
建议: 一次性迁移所有请求到 adaptive 模式,而非混合使用。
2. 思考内容默认是摘要
Claude 4.6 模型默认返回摘要版的思考内容,而非完整思考文本。这意味着你看到的 thinking block 是简化版。
- 摘要版 (
display: "summarized"): 默认行为 - 省略版 (
display: "omitted"): 不返回思考文本 - 完整版: 需联系 Anthropic 销售团队开通
3. 计费按完整思考计算
无论你看到的是摘要还是省略,计费都按完整内部思考的 token 量。不要因为看到的文本少就以为花费少。
4. Prefill 不再支持
Claude Opus 4.6 不再支持预填充 (prefill) assistant 消息——发送预填充会返回 400 错误。如需控制输出格式,使用 system prompt 或 structured output。
🎯 迁移建议: 建议在测试环境中先验证迁移效果,特别是比较 adaptive 模式与之前固定 budget_tokens 的输出质量差异。通过 API易 apiyi.com 可以方便地进行 A/B 测试——同一个 Key 调用不同配置。

计费机制详解
思考 Token 如何计费
理解计费机制对控制成本至关重要。
| 计费项 | 说明 |
|---|---|
| 输入 token | 正常计费 ($5/MTok Opus, $3/MTok Sonnet) |
| 思考 token | 按输出 token 价格计费 ($25/MTok Opus, $15/MTok Sonnet) |
| 响应文本 token | 按输出 token 价格计费 |
| 摘要生成 token | 不额外计费 |
| display: "omitted" | 思考 token 仍计费,只是不传输 |
成本优化策略
简单问题用 low effort → 可能跳过思考 → 节省大量输出 token
↓
成本可降 50-80%
实际对比示例: 同一个代码风格检查任务
| 配置 | 思考 token | 响应 token | 总成本 (Sonnet) |
|---|---|---|---|
| effort: high | ~3000 | ~500 | ~$0.053 |
| effort: medium | ~800 | ~500 | ~$0.020 |
| effort: low | 0 (跳过思考) | ~500 | ~$0.009 |
对于简单任务,low effort 比 high effort 便宜约 83%。
💰 省钱技巧: 对于批量处理场景 (比如对 100 个文件做风格检查),将 effort 设为
low可以节省大量成本。通过 API易 apiyi.com 调用 Claude 4.6 API,在已有优惠价格基础上再配合 effort 参数优化,双重降本。
常见问题
Q1: Adaptive Thinking 和 Extended Thinking 可以混用吗?
可以,但不推荐。在 Claude 4.6 模型上,Extended Thinking (type: "enabled") 仍然可用但已标记为 Deprecated,未来版本会移除。两种模式混用还会导致 prompt cache 断点失效。建议尽早统一迁移到 Adaptive Thinking。通过 API易 apiyi.com 调用时参数格式完全兼容。
Q2: Opus 4.5 支持 Adaptive Thinking 吗?
不支持。Adaptive Thinking 仅支持 Claude Opus 4.6 和 Sonnet 4.6。Opus 4.5 仍需使用 type: "enabled" 模式并手动设置 budget_tokens。如果需要使用 Adaptive Thinking,建议升级到 4.6 系列模型。API易 apiyi.com 同时提供 4.5 和 4.6 全系列模型的 API 接入。
Q3: display: “omitted” 真的能省钱吗?
不能省钱。display: "omitted" 只是让 API 不返回思考文本,减少网络传输延迟。但内部思考 token 仍然会生成并计费。真正省钱的方法是降低 effort 级别——low 或 medium 会让 Claude 在简单问题上跳过或减少思考。
Q4: 如何判断 Claude 在某次请求中是否进行了思考?
检查响应中是否包含 thinking 类型的 content block。如果 Claude 判断不需要思考,响应中只会有 text block,没有 thinking block。在 Adaptive 模式下,usage 字段中的 token 计数可以帮助你判断思考消耗了多少 token。
Q5: Claude Code 中如何使用 Adaptive Thinking?
Claude Code 在使用 Opus 4.6 或 Sonnet 4.6 时默认启用 Adaptive Thinking。你可以用 /effort 命令调整思考深度:/effort low (快速模式)、/effort medium (平衡模式)、/effort high (深度模式)。2026 年 3 月更新还修复了非标准模型字符串导致的 "adaptive thinking is not supported" 错误。
总结:Adaptive Thinking 是 Claude 4.6 的核心升级
Adaptive Thinking 代表了 AI 推理模式的一次重要演进——从"开发者猜测 AI 需要思考多少"到"AI 自己判断需要思考多少"。
4 个核心升级:
- 动态决策: 简单问题秒回,复杂问题深入推理
- 自动交错思考: 代理式工作流中工具调用间自动推理
- 灵活多轮对话: 无需强制 thinking block 开头
- effort 参数: 比 budget_tokens 更直觉的控制方式
迁移建议: 从 thinking: {"type": "enabled", "budget_tokens": N} 改为 thinking: {"type": "adaptive"},配合 output_config: {"effort": "..."} 控制深度。
推荐通过 API易 apiyi.com 快速接入 Claude Opus 4.6 和 Sonnet 4.6 的 API,一行参数改动即可享受 Adaptive Thinking 带来的智能推理和成本优化。
参考资料
-
Claude API 文档 – Adaptive Thinking: 官方技术指南
- 链接:
platform.claude.com/docs/en/build-with-claude/adaptive-thinking
- 链接:
-
Claude API 文档 – Effort 参数: effort 配置详解
- 链接:
platform.claude.com/docs/en/build-with-claude/effort
- 链接:
-
Anthropic 官方 – Claude Opus 4.6: 发布公告
- 链接:
anthropic.com/news/claude-opus-4-6
- 链接:
-
Claude API 文档 – Extended Thinking: 原有扩展思考指南
- 链接:
platform.claude.com/docs/en/build-with-claude/extended-thinking
- 链接:
作者: APIYI Team | 掌握 Claude 最新 API 能力,欢迎访问 API易 apiyi.com 获取 Claude 4.6 全系列模型的 API 接口和技术支持。
