Se você tem usado o modo Extended Thinking (Pensamento Estendido) do Claude, atenção — ele foi marcado como Deprecated (em breve descontinuado) no Claude 4.6. No lugar, temos um modo mais inteligente: Adaptive Thinking (Pensamento Adaptativo).
A mudança principal: antes você precisava configurar manualmente o orçamento de tokens para pensar (budget_tokens). Agora, o Claude decide por si mesmo se precisa pensar e o quão profundo deve ser esse pensamento. Perguntas simples recebem respostas rápidas, problemas complexos recebem raciocínio profundo — tudo com um único parâmetro.
Valor principal deste artigo: Ao terminar de ler, você saberá como chamar a API do Adaptive Thinking, entenderá os 4 principais aprimoramentos, como configurar o parâmetro effort e terá um guia completo para migrar do Extended Thinking.

O que é Adaptive Thinking: entendendo em uma frase
Extended Thinking (modo antigo): O desenvolvedor diz ao Claude "você tem um orçamento de 10000 tokens para pensar", e o Claude usa todo esse orçamento.
Adaptive Thinking (novo modo): O Claude avalia a complexidade do problema por conta própria e decide "se precisa pensar" e "o quão profundo deve ser esse pensamento".
# ❌ Modo antigo (Extended Thinking) - Em breve descontinuado
thinking={"type": "enabled", "budget_tokens": 10000}
# ✅ Novo modo (Adaptive Thinking) - Recomendado
thinking={"type": "adaptive"}
Informações principais em resumo
| Item de Informação | Detalhes |
|---|---|
| Nome da funcionalidade | Adaptive Thinking (Pensamento Adaptativo) |
| Data de lançamento | 5 de fevereiro de 2026 (lançado com Claude Opus 4.6) |
| Modelos suportados | Claude Opus 4.6, Claude Sonnet 4.6 |
| Parâmetro da API | thinking: {"type": "adaptive"} |
| Método de controle | Parâmetro effort (substitui budget_tokens) |
| Status | Método oficialmente recomendado (Extended Thinking está Deprecated) |
| Pensamento intercalado | Ativado automaticamente (sem necessidade de header beta) |
| Claude Code | Suporte nativo, pode usar o comando /effort para ajustar |
🎯 Recomendação de migração: Se seu projeto está usando Extended Thinking (
type: "enabled"), é recomendado migrar para o Adaptive Thinking o quanto antes. Ao chamar a API do Claude Opus 4.6 ou Sonnet 4.6 através da plataforma APIYI apiyi.com, você só precisa modificar um parâmetro para completar a migração.
Pensamento Adaptativo vs Estendido: 4 Principais Atualizações

Atualização 1: De "Orçamento Fixo" para "Decisão Dinâmica"
Esta é a mudança mais fundamental.
Dor do modelo antigo: Você tinha que adivinhar um valor para budget_tokens. Definir muito baixo, problemas complexos não eram raciocinados adequadamente; definir muito alto, problemas simples desperdiçavam tokens (e dinheiro).
# Modelo antigo: você adivinha quantos tokens de pensamento este problema precisa?
thinking={"type": "enabled", "budget_tokens": 10000}
# Problema: problemas simples também usavam muitos tokens de pensamento
Novo modelo: O Claude decide automaticamente com base na complexidade de cada solicitação.
# Novo modelo: O Claude julga por si mesmo
thinking={"type": "adaptive"}
# Problema simples: sem pensamento ou pensamento leve
# Problema complexo: raciocínio profundo
Impacto real: Para cargas de trabalho mistas que são "às vezes simples, às vezes complexas" (como em cenários de revisão de código — alguns PRs são apenas mudanças de texto, outros envolvem refatoração de concorrência), o Pensamento Adaptativo supera o orçamento fixo tanto em desempenho geral quanto em eficiência de custos.
Atualização 2: Pensamento Intercalado Automático (Interleaved Thinking)
Em fluxos de trabalho do tipo agente (Agentic), o Claude precisa pensar entre múltiplas chamadas de ferramentas.
Modelo antigo: O pensamento intercalado exigia adicionar manualmente um cabeçalho beta, e não estava disponível no Opus 4.5.
Novo modelo: Ao usar o Pensamento Adaptativo, o pensamento intercalado é ativado automaticamente, sem necessidade de configuração adicional.
Solicitação do usuário → Claude pensa → Chama ferramenta A → Claude pensa novamente → Chama ferramenta B → Resposta final
Isso é particularmente importante para o Claude Code e outras aplicações do tipo agente — a IA pode "repensar" após cada chamada de ferramenta, reduzindo significativamente os erros.
Atualização 3: Diálogos Multiturno Mais Flexíveis
Modelo antigo: Em diálogos multiturno, a mensagem do assistente da rodada anterior tinha que começar com um bloco de pensamento, caso contrário, gerava erro. Isso tornava o gerenciamento da conversa complexo.
Novo modelo: Essa limitação não existe mais. O Pensamento Adaptativo é mais flexível em diálogos multiturno, porque em algumas rodadas o Claude pode optar por não pensar.
Atualização 4: Parâmetro effort substitui budget_tokens
effort é um sinal de comportamento e não uma limitação rígida, sendo mais alinhado com as necessidades reais do que budget_tokens.
| Nível de Esforço | Comportamento | Cenário Aplicável | Modelos Suportados |
|---|---|---|---|
max |
Sempre pensa profundamente, sem restrições | Raciocínio de maior dificuldade | Apenas Opus 4.6 |
high (padrão) |
Quase sempre pensa, raciocínio profundo para problemas complexos | Revisão de código, design de arquitetura | Opus 4.6, Sonnet 4.6 |
medium |
Pensamento moderado, pode pular problemas simples | Desenvolvimento diário, tarefas gerais | Opus 4.6, Sonnet 4.6 |
low |
Minimiza o pensamento, prioriza velocidade | Perguntas e respostas simples, verificação de estilo | Opus 4.6, Sonnet 4.6 |
Importante: Mesmo no nível low de esforço, se o problema for suficientemente complexo, o Claude ainda pode optar por pensar. O effort é uma sugestão, não um comando.
💡 Recomendação para Sonnet 4.6: A Anthropic recomenda oficialmente usar
mediumcomo padrão para o Sonnet 4.6, para obter o melhor equilíbrio entre velocidade, custo e qualidade. Ao chamar via APIYI apiyi.com, basta incluir o parâmetrooutput_configna solicitação.
Guia Completo para Invocação de API
Invocação Básica: Adaptive Thinking Mais Simples
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # Endpoint unificado da APIYI
)
response = client.chat.completions.create(
model="claude-opus-4-6",
messages=[
{"role": "user", "content": "Explique o impacto do GIL do Python na programação multithread"}
],
max_tokens=16000,
extra_body={
"thinking": {"type": "adaptive"}
}
)
print(response.choices[0].message.content)
Usando o SDK Nativo da Anthropic
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com" # Endpoint unificado da APIYI
)
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[
{"role": "user", "content": "Reveja este código em busca de condições de corrida..."}
]
)
# Analisar a resposta: pode conter blocos de thinking e text
for block in response.content:
if block.type == "thinking":
print(f"[Processo de Pensamento] {block.thinking}")
elif block.type == "text":
print(f"[Resposta] {block.text}")
Controle Fino com o Parâmetro effort
# Exemplo com SDK da Anthropic
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"}, # Profundidade de pensamento média
messages=[
{"role": "user", "content": "O que há de errado com este código?"}
]
)
Omitir o Conteúdo do Pensamento para Reduzir Latência
Se você não precisa ver o processo de pensamento, pode usar display: "omitted" para reduzir a latência de transmissão:
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={
"type": "adaptive",
"display": "omitted" # Não retorna o texto do pensamento
},
messages=[...]
)
# Atenção: os tokens de pensamento ainda serão cobrados
Ver exemplo completo de fluxo de trabalho de revisão de código
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com"
)
def review_pr(diff_content, risk_level="medium"):
"""Revisa código de forma adaptativa baseado no nível de risco"""
# Alto risco: Opus + high effort
# Baixo risco: Sonnet + medium effort
if risk_level == "high":
model = "claude-opus-4-6"
effort = "high"
else:
model = "claude-sonnet-4-6"
effort = "medium"
response = client.messages.create(
model=model,
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": effort},
system="""Você é um especialista sênior em revisão de código.
Analise as mudanças no código e categorize por nível de gravidade:
🔴 Deve ser corrigido (segurança/lógica)
🟡 Sugestão de correção (qualidade)
💡 Sugestão de melhoria""",
messages=[
{"role": "user", "content": f"Revisar:\n\n{diff_content}"}
]
)
thinking_text = ""
review_text = ""
for block in response.content:
if block.type == "thinking":
thinking_text = block.thinking
elif block.type == "text":
review_text = block.text
return {
"thinking": thinking_text,
"review": review_text,
"model": model,
"effort": effort,
"input_tokens": response.usage.input_tokens,
"output_tokens": response.usage.output_tokens
}
🚀 Início Rápido: Para chamar a API do Claude 4.6 via APIYI apiyi.com, basta adicionar
thinking: {"type": "adaptive"}à sua requisição. Isso habilita o pensamento adaptativo sem configuração extra, atualizando o poder de raciocínio da sua IA com uma linha de código.
Parâmetro Effort na Prática: Configurações Ótimas para Diferentes Cenários
Guia de Configuração por Cenário
| Cenário | Modelo Recomendado | Effort | Motivo |
|---|---|---|---|
| Perguntas/ Traduções Simples | Sonnet 4.6 | low |
Não requer raciocínio profundo, prioriza velocidade |
| Completar/Formatar Código | Sonnet 4.6 | low |
Tarefa de correspondência de padrões, não precisa pensar |
| Revisão Diária de PR | Sonnet 4.6 | medium |
Equilibra velocidade e profundidade da revisão |
| Depuração de Bug Complexo | Opus 4.6 | high |
Requer raciocínio entre arquivos |
| Auditoria de Vulnerabilidade de Segurança | Opus 4.6 | high |
Não pode deixar passar problemas de alto risco |
| Prova Matemática/Lógica | Opus 4.6 | max |
Requer profundidade de raciocínio extrema |
| Design de Solução de Arquitetura | Opus 4.6 | max |
Requer consideração abrangente de trade-offs |
Usando effort no Claude Code
Após a atualização de março de 2026, o Claude Code adicionou o comando /effort:
# Configure diretamente no terminal do Claude Code
/effort medium # Codificação diária
/effort high # Revisão de código
/effort max # Design de arquitetura (somente Opus 4.6)
Isso permite que desenvolvedores ajustem a profundidade de pensamento do Claude de forma flexível de acordo com a tarefa atual, sem precisar modificar o código.
💰 Otimização de Custo: O parâmetro
effortafeta diretamente o consumo de tokens. Para tarefas de codificação diárias, configurar o Sonnet 4.6 comomediumoulowpode reduzir significativamente os custos. Chamar via plataforma APIYI apiyi.com é mais barato que o oficial, combinando economia dupla com o parâmetroeffort.
Migrando do Extended Thinking para o Adaptive Thinking
Tabela de Migração
| Escrita Antiga (Extended Thinking) | Escrita Nova (Adaptive Thinking) |
|---|---|
thinking: {"type": "enabled", "budget_tokens": 5000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "low"} |
thinking: {"type": "enabled", "budget_tokens": 10000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "medium"} |
thinking: {"type": "enabled", "budget_tokens": 30000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "high"} |
thinking: {"type": "enabled", "budget_tokens": 100000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "max"} |
Adicionar manualmente o header interleaved thinking beta |
Ativado automaticamente, nenhum header necessário |
Considerações para a Migração
1. Cache de Prompt será interrompido
Ao mudar do modo enabled para adaptive, os pontos de interrupção do cache de prompt no nível da mensagem serão invalidados. O cache das definições de sistema e ferramentas não é afetado.
Recomendação: Migre todas as suas requisições para o modo adaptive de uma vez, em vez de usar uma mistura.
2. O conteúdo do pensamento é resumido por padrão
O modelo Claude 4.6 retorna por padrão uma versão resumida do conteúdo do pensamento, não o texto completo. Isso significa que o bloco de pensamento que você vê é uma versão simplificada.
- Versão resumida (
display: "summarized"): Comportamento padrão - Versão omitida (
display: "omitted"): Não retorna o texto do pensamento - Versão completa: É necessário entrar em contato com a equipe de vendas da Anthropic para habilitar
3. A cobrança é calculada com base no pensamento interno completo
Independentemente de você ver a versão resumida ou omitida, a cobrança é baseada na quantidade de tokens do pensamento interno completo. Não assuma que o custo é menor só porque o texto visível é menor.
4. Prefill não é mais suportado
O Claude Opus 4.6 não suporta mais o preenchimento prévio (prefill) de mensagens do assistente — enviar um prefill resultará em um erro 400. Se você precisa controlar o formato da saída, use o prompt do sistema ou structured output.
🎯 Recomendação de Migração: É recomendado validar primeiro o efeito da migração em um ambiente de teste, especialmente comparando a diferença na qualidade da saída entre o modo adaptive e os
budget_tokensfixos anteriores. Através do APIYI apiyi.com você pode facilmente realizar testes A/B — usando a mesma chave para chamar configurações diferentes.

Detalhamento do Mecanismo de Cobrança
Entendendo como os Tokens de Pensamento são Cobrados
Compreender o mecanismo de cobrança é crucial para controlar os custos.
| Item de Cobrança | Explicação |
|---|---|
| Token de entrada | Cobrado normalmente ($5/MTok Opus, $3/MTok Sonnet) |
| Token de pensamento | Cobrado pelo preço do token de saída ($25/MTok Opus, $15/MTok Sonnet) |
| Token de texto de resposta | Cobrado pelo preço do token de saída |
| Token de geração de resumo | Não há cobrança extra |
| display: "omitted" | Os tokens de pensamento ainda são cobrados, apenas não são transmitidos |
Estratégias de Otimização de Custos
Perguntas simples com low effort → pode pular o pensamento → economiza muitos tokens de saída
↓
Custo pode cair 50-80%
Exemplo de comparação real: A mesma tarefa de verificação de estilo de código
| Configuração | Tokens de Pensamento | Tokens de Resposta | Custo Total (Sonnet) |
|---|---|---|---|
| effort: high | ~3000 | ~500 | ~$0.053 |
| effort: medium | ~800 | ~500 | ~$0.020 |
| effort: low | 0 (pula pensamento) | ~500 | ~$0.009 |
Para tarefas simples, low effort é cerca de 83% mais barato que high effort.
💰 Dica de Economia: Para cenários de processamento em lote (por exemplo, verificar o estilo de 100 arquivos), definir o effort como
lowpode economizar muito. Ao chamar a API Claude 4.6 via APIYI apiyi.com, você combina preços promocionais já existentes com a otimização do parâmetroeffort, obtendo uma redução dupla de custos.
Perguntas Frequentes
Q1: O Adaptive Thinking e o Extended Thinking podem ser usados juntos?
Podem, mas não é recomendado. No modelo Claude 4.6, o Extended Thinking (type: "enabled") ainda está disponível, mas está marcado como Deprecated e será removido em versões futuras. Misturar os dois modos também pode quebrar a continuidade do cache de prompt. Recomenda-se migrar para o Adaptive Thinking o quanto antes. Ao chamar via APIYI apiyi.com, o formato dos parâmetros é totalmente compatível.
Q2: O Opus 4.5 suporta Adaptive Thinking?
Não suporta. O Adaptive Thinking é suportado apenas pelo Claude Opus 4.6 e Sonnet 4.6. O Opus 4.5 ainda precisa usar o modo type: "enabled" e definir budget_tokens manualmente. Se você precisa usar o Adaptive Thinking, é recomendado atualizar para os modelos da série 4.6. A APIYI apiyi.com oferece acesso à API para toda a série de modelos 4.5 e 4.6.
Q3: O display: “omitted” realmente economiza dinheiro?
Não economiza dinheiro. display: "omitted" apenas faz com que a API não retorne o texto do pensamento, reduzindo a latência de transmissão de rede. No entanto, os tokens de pensamento internos ainda são gerados e cobrados. A maneira real de economizar é reduzir o nível de effort — low ou medium fará com que o Claude pule ou reduza o pensamento em problemas simples.
Q4: Como saber se o Claude realizou pensamento em uma determinada requisição?
Verifique se a resposta contém um bloco de conteúdo do tipo thinking. Se o Claude julgar que o pensamento não é necessário, a resposta terá apenas blocos text, sem blocos thinking. No modo Adaptive, os campos de contagem de tokens em usage podem ajudá-lo a determinar quantos tokens foram consumidos pelo pensamento.
Q5: Como usar o Adaptive Thinking no Claude Code?
O Claude Code habilita o Adaptive Thinking por padrão ao usar o Opus 4.6 ou Sonnet 4.6. Você pode ajustar a profundidade do pensamento com o comando /effort: /effort low (modo rápido), /effort medium (modo balanceado), /effort high (modo profundo). A atualização de março de 2026 também corrigiu o erro "adaptive thinking is not supported" causado por strings de modelo não padrão.
Resumo: Adaptive Thinking é a principal atualização do Claude 4.6
O Adaptive Thinking representa uma evolução importante no modo de raciocínio da IA — passando de "o desenvolvedor adivinha quanto a IA precisa pensar" para "a IA decide por si mesma quanto precisa pensar".
4 atualizações principais:
- Decisão dinâmica: Respostas instantâneas para perguntas simples, raciocínio profundo para problemas complexos
- Pensamento intercalado automático: Raciocínio automático entre chamadas de ferramentas em fluxos de trabalho de agente
- Diálogo flexível em múltiplas rodadas: Não é necessário iniciar com um bloco de pensamento obrigatório
- Parâmetro
effort: Uma forma mais intuitiva de controle do quebudget_tokens
Recomendação de migração: Mude de thinking: {"type": "enabled", "budget_tokens": N} para thinking: {"type": "adaptive"}, combinado com output_config: {"effort": "..."} para controlar a profundidade.
Recomendamos usar o APIYI apiyi.com para integrar rapidamente as APIs do Claude Opus 4.6 e Sonnet 4.6. Com apenas uma alteração de parâmetro, você pode aproveitar o raciocínio inteligente e a otimização de custos proporcionados pelo Adaptive Thinking.
Referências
-
Documentação da API Claude – Adaptive Thinking: Guia técnico oficial
- Link:
platform.claude.com/docs/en/build-with-claude/adaptive-thinking
- Link:
-
Documentação da API Claude – Parâmetro Effort: Explicação detalhada da configuração
effort- Link:
platform.claude.com/docs/en/build-with-claude/effort
- Link:
-
Anthropic oficial – Claude Opus 4.6: Anúncio de lançamento
- Link:
anthropic.com/news/claude-opus-4-6
- Link:
-
Documentação da API Claude – Extended Thinking: Guia do pensamento estendido original
- Link:
platform.claude.com/docs/en/build-with-claude/extended-thinking
- Link:
Autor: Equipe APIYI | Para dominar as mais recentes capacidades da API Claude, visite o APIYI apiyi.com para obter as interfaces de API e suporte técnico para toda a série de modelos Claude 4.6.
