Interpretação do Modo de Pensamento Adaptativo Claude: As 4 Principais Atualizações que Substituem o Pensamento Estendido

Se você tem usado o modo Extended Thinking (Pensamento Estendido) do Claude, atenção — ele foi marcado como Deprecated (em breve descontinuado) no Claude 4.6. No lugar, temos um modo mais inteligente: Adaptive Thinking (Pensamento Adaptativo).

A mudança principal: antes você precisava configurar manualmente o orçamento de tokens para pensar (budget_tokens). Agora, o Claude decide por si mesmo se precisa pensar e o quão profundo deve ser esse pensamento. Perguntas simples recebem respostas rápidas, problemas complexos recebem raciocínio profundo — tudo com um único parâmetro.

Valor principal deste artigo: Ao terminar de ler, você saberá como chamar a API do Adaptive Thinking, entenderá os 4 principais aprimoramentos, como configurar o parâmetro effort e terá um guia completo para migrar do Extended Thinking.

O que é Adaptive Thinking: entendendo em uma frase

Extended Thinking (modo antigo): O desenvolvedor diz ao Claude "você tem um orçamento de 10000 tokens para pensar", e o Claude usa todo esse orçamento.

Adaptive Thinking (novo modo): O Claude avalia a complexidade do problema por conta própria e decide "se precisa pensar" e "o quão profundo deve ser esse pensamento".

# ❌ Modo antigo (Extended Thinking) - Em breve descontinuado
thinking={"type": "enabled", "budget_tokens": 10000}

# ✅ Novo modo (Adaptive Thinking) - Recomendado
thinking={"type": "adaptive"}

Informações principais em resumo

Item de Informação	Detalhes
Nome da funcionalidade	Adaptive Thinking (Pensamento Adaptativo)
Data de lançamento	5 de fevereiro de 2026 (lançado com Claude Opus 4.6)
Modelos suportados	Claude Opus 4.6, Claude Sonnet 4.6
Parâmetro da API	`thinking: {"type": "adaptive"}`
Método de controle	Parâmetro `effort` (substitui `budget_tokens`)
Status	Método oficialmente recomendado (Extended Thinking está Deprecated)
Pensamento intercalado	Ativado automaticamente (sem necessidade de header beta)
Claude Code	Suporte nativo, pode usar o comando `/effort` para ajustar

🎯 Recomendação de migração: Se seu projeto está usando Extended Thinking (type: "enabled"), é recomendado migrar para o Adaptive Thinking o quanto antes. Ao chamar a API do Claude Opus 4.6 ou Sonnet 4.6 através da plataforma APIYI apiyi.com, você só precisa modificar um parâmetro para completar a migração.

Pensamento Adaptativo vs Estendido: 4 Principais Atualizações

Atualização 1: De "Orçamento Fixo" para "Decisão Dinâmica"

Esta é a mudança mais fundamental.

Dor do modelo antigo: Você tinha que adivinhar um valor para budget_tokens. Definir muito baixo, problemas complexos não eram raciocinados adequadamente; definir muito alto, problemas simples desperdiçavam tokens (e dinheiro).

# Modelo antigo: você adivinha quantos tokens de pensamento este problema precisa?
thinking={"type": "enabled", "budget_tokens": 10000}
# Problema: problemas simples também usavam muitos tokens de pensamento

Novo modelo: O Claude decide automaticamente com base na complexidade de cada solicitação.

# Novo modelo: O Claude julga por si mesmo
thinking={"type": "adaptive"}
# Problema simples: sem pensamento ou pensamento leve
# Problema complexo: raciocínio profundo

Impacto real: Para cargas de trabalho mistas que são "às vezes simples, às vezes complexas" (como em cenários de revisão de código — alguns PRs são apenas mudanças de texto, outros envolvem refatoração de concorrência), o Pensamento Adaptativo supera o orçamento fixo tanto em desempenho geral quanto em eficiência de custos.

Atualização 2: Pensamento Intercalado Automático (Interleaved Thinking)

Em fluxos de trabalho do tipo agente (Agentic), o Claude precisa pensar entre múltiplas chamadas de ferramentas.

Modelo antigo: O pensamento intercalado exigia adicionar manualmente um cabeçalho beta, e não estava disponível no Opus 4.5.

Novo modelo: Ao usar o Pensamento Adaptativo, o pensamento intercalado é ativado automaticamente, sem necessidade de configuração adicional.

Solicitação do usuário → Claude pensa → Chama ferramenta A → Claude pensa novamente → Chama ferramenta B → Resposta final

Isso é particularmente importante para o Claude Code e outras aplicações do tipo agente — a IA pode "repensar" após cada chamada de ferramenta, reduzindo significativamente os erros.

Atualização 3: Diálogos Multiturno Mais Flexíveis

Modelo antigo: Em diálogos multiturno, a mensagem do assistente da rodada anterior tinha que começar com um bloco de pensamento, caso contrário, gerava erro. Isso tornava o gerenciamento da conversa complexo.

Novo modelo: Essa limitação não existe mais. O Pensamento Adaptativo é mais flexível em diálogos multiturno, porque em algumas rodadas o Claude pode optar por não pensar.

Atualização 4: Parâmetro `effort` substitui `budget_tokens`

effort é um sinal de comportamento e não uma limitação rígida, sendo mais alinhado com as necessidades reais do que budget_tokens.

Nível de Esforço	Comportamento	Cenário Aplicável	Modelos Suportados
`max`	Sempre pensa profundamente, sem restrições	Raciocínio de maior dificuldade	Apenas Opus 4.6
`high` (padrão)	Quase sempre pensa, raciocínio profundo para problemas complexos	Revisão de código, design de arquitetura	Opus 4.6, Sonnet 4.6
`medium`	Pensamento moderado, pode pular problemas simples	Desenvolvimento diário, tarefas gerais	Opus 4.6, Sonnet 4.6
`low`	Minimiza o pensamento, prioriza velocidade	Perguntas e respostas simples, verificação de estilo	Opus 4.6, Sonnet 4.6

Importante: Mesmo no nível low de esforço, se o problema for suficientemente complexo, o Claude ainda pode optar por pensar. O effort é uma sugestão, não um comando.

💡 Recomendação para Sonnet 4.6: A Anthropic recomenda oficialmente usar medium como padrão para o Sonnet 4.6, para obter o melhor equilíbrio entre velocidade, custo e qualidade. Ao chamar via APIYI apiyi.com, basta incluir o parâmetro output_config na solicitação.

Guia Completo para Invocação de API

Invocação Básica: Adaptive Thinking Mais Simples

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # Endpoint unificado da APIYI
)

response = client.chat.completions.create(
    model="claude-opus-4-6",
    messages=[
        {"role": "user", "content": "Explique o impacto do GIL do Python na programação multithread"}
    ],
    max_tokens=16000,
    extra_body={
        "thinking": {"type": "adaptive"}
    }
)
print(response.choices[0].message.content)

Usando o SDK Nativo da Anthropic

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"  # Endpoint unificado da APIYI
)

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Reveja este código em busca de condições de corrida..."}
    ]
)

# Analisar a resposta: pode conter blocos de thinking e text
for block in response.content:
    if block.type == "thinking":
        print(f"[Processo de Pensamento] {block.thinking}")
    elif block.type == "text":
        print(f"[Resposta] {block.text}")

Controle Fino com o Parâmetro `effort`

# Exemplo com SDK da Anthropic
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},  # Profundidade de pensamento média
    messages=[
        {"role": "user", "content": "O que há de errado com este código?"}
    ]
)

Omitir o Conteúdo do Pensamento para Reduzir Latência

Se você não precisa ver o processo de pensamento, pode usar display: "omitted" para reduzir a latência de transmissão:

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={
        "type": "adaptive",
        "display": "omitted"  # Não retorna o texto do pensamento
    },
    messages=[...]
)
# Atenção: os tokens de pensamento ainda serão cobrados

Ver exemplo completo de fluxo de trabalho de revisão de código

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"
)

def review_pr(diff_content, risk_level="medium"):
    """Revisa código de forma adaptativa baseado no nível de risco"""

    # Alto risco: Opus + high effort
    # Baixo risco: Sonnet + medium effort
    if risk_level == "high":
        model = "claude-opus-4-6"
        effort = "high"
    else:
        model = "claude-sonnet-4-6"
        effort = "medium"

    response = client.messages.create(
        model=model,
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": effort},
        system="""Você é um especialista sênior em revisão de código.
Analise as mudanças no código e categorize por nível de gravidade:
🔴 Deve ser corrigido (segurança/lógica)
🟡 Sugestão de correção (qualidade)
💡 Sugestão de melhoria""",
        messages=[
            {"role": "user", "content": f"Revisar:\n\n{diff_content}"}
        ]
    )

    thinking_text = ""
    review_text = ""
    for block in response.content:
        if block.type == "thinking":
            thinking_text = block.thinking
        elif block.type == "text":
            review_text = block.text

    return {
        "thinking": thinking_text,
        "review": review_text,
        "model": model,
        "effort": effort,
        "input_tokens": response.usage.input_tokens,
        "output_tokens": response.usage.output_tokens
    }

🚀 Início Rápido: Para chamar a API do Claude 4.6 via APIYI apiyi.com, basta adicionar thinking: {"type": "adaptive"} à sua requisição. Isso habilita o pensamento adaptativo sem configuração extra, atualizando o poder de raciocínio da sua IA com uma linha de código.

Parâmetro Effort na Prática: Configurações Ótimas para Diferentes Cenários

Guia de Configuração por Cenário

Cenário	Modelo Recomendado	Effort	Motivo
Perguntas/ Traduções Simples	Sonnet 4.6	`low`	Não requer raciocínio profundo, prioriza velocidade
Completar/Formatar Código	Sonnet 4.6	`low`	Tarefa de correspondência de padrões, não precisa pensar
Revisão Diária de PR	Sonnet 4.6	`medium`	Equilibra velocidade e profundidade da revisão
Depuração de Bug Complexo	Opus 4.6	`high`	Requer raciocínio entre arquivos
Auditoria de Vulnerabilidade de Segurança	Opus 4.6	`high`	Não pode deixar passar problemas de alto risco
Prova Matemática/Lógica	Opus 4.6	`max`	Requer profundidade de raciocínio extrema
Design de Solução de Arquitetura	Opus 4.6	`max`	Requer consideração abrangente de trade-offs

Usando `effort` no Claude Code

Após a atualização de março de 2026, o Claude Code adicionou o comando /effort:

# Configure diretamente no terminal do Claude Code
/effort medium    # Codificação diária
/effort high      # Revisão de código
/effort max       # Design de arquitetura (somente Opus 4.6)

Isso permite que desenvolvedores ajustem a profundidade de pensamento do Claude de forma flexível de acordo com a tarefa atual, sem precisar modificar o código.

💰 Otimização de Custo: O parâmetro effort afeta diretamente o consumo de tokens. Para tarefas de codificação diárias, configurar o Sonnet 4.6 como medium ou low pode reduzir significativamente os custos. Chamar via plataforma APIYI apiyi.com é mais barato que o oficial, combinando economia dupla com o parâmetro effort.

Migrando do Extended Thinking para o Adaptive Thinking

Tabela de Migração

Escrita Antiga (Extended Thinking)	Escrita Nova (Adaptive Thinking)
`thinking: {"type": "enabled", "budget_tokens": 5000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "low"}`
`thinking: {"type": "enabled", "budget_tokens": 10000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "medium"}`
`thinking: {"type": "enabled", "budget_tokens": 30000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "high"}`
`thinking: {"type": "enabled", "budget_tokens": 100000}`	`thinking: {"type": "adaptive"}, output_config: {"effort": "max"}`
Adicionar manualmente o header `interleaved thinking beta`	Ativado automaticamente, nenhum header necessário

Considerações para a Migração

1. Cache de Prompt será interrompido

Ao mudar do modo enabled para adaptive, os pontos de interrupção do cache de prompt no nível da mensagem serão invalidados. O cache das definições de sistema e ferramentas não é afetado.

Recomendação: Migre todas as suas requisições para o modo adaptive de uma vez, em vez de usar uma mistura.

2. O conteúdo do pensamento é resumido por padrão

O modelo Claude 4.6 retorna por padrão uma versão resumida do conteúdo do pensamento, não o texto completo. Isso significa que o bloco de pensamento que você vê é uma versão simplificada.

Versão resumida (display: "summarized"): Comportamento padrão
Versão omitida (display: "omitted"): Não retorna o texto do pensamento
Versão completa: É necessário entrar em contato com a equipe de vendas da Anthropic para habilitar

3. A cobrança é calculada com base no pensamento interno completo

Independentemente de você ver a versão resumida ou omitida, a cobrança é baseada na quantidade de tokens do pensamento interno completo. Não assuma que o custo é menor só porque o texto visível é menor.

4. Prefill não é mais suportado

O Claude Opus 4.6 não suporta mais o preenchimento prévio (prefill) de mensagens do assistente — enviar um prefill resultará em um erro 400. Se você precisa controlar o formato da saída, use o prompt do sistema ou structured output.

🎯 Recomendação de Migração: É recomendado validar primeiro o efeito da migração em um ambiente de teste, especialmente comparando a diferença na qualidade da saída entre o modo adaptive e os budget_tokens fixos anteriores. Através do APIYI apiyi.com você pode facilmente realizar testes A/B — usando a mesma chave para chamar configurações diferentes.

Detalhamento do Mecanismo de Cobrança

Entendendo como os Tokens de Pensamento são Cobrados

Compreender o mecanismo de cobrança é crucial para controlar os custos.

Item de Cobrança	Explicação
Token de entrada	Cobrado normalmente ($5/MTok Opus, $3/MTok Sonnet)
Token de pensamento	Cobrado pelo preço do token de saída ($25/MTok Opus, $15/MTok Sonnet)
Token de texto de resposta	Cobrado pelo preço do token de saída
Token de geração de resumo	Não há cobrança extra
display: "omitted"	Os tokens de pensamento ainda são cobrados, apenas não são transmitidos

Estratégias de Otimização de Custos

Perguntas simples com low effort → pode pular o pensamento → economiza muitos tokens de saída
                                                ↓
                                            Custo pode cair 50-80%

Exemplo de comparação real: A mesma tarefa de verificação de estilo de código

Configuração	Tokens de Pensamento	Tokens de Resposta	Custo Total (Sonnet)
effort: high	~3000	~500	~$0.053
effort: medium	~800	~500	~$0.020
effort: low	0 (pula pensamento)	~500	~$0.009

Para tarefas simples, low effort é cerca de 83% mais barato que high effort.

💰 Dica de Economia: Para cenários de processamento em lote (por exemplo, verificar o estilo de 100 arquivos), definir o effort como low pode economizar muito. Ao chamar a API Claude 4.6 via APIYI apiyi.com, você combina preços promocionais já existentes com a otimização do parâmetro effort, obtendo uma redução dupla de custos.

Perguntas Frequentes

Q1: O Adaptive Thinking e o Extended Thinking podem ser usados juntos?

Podem, mas não é recomendado. No modelo Claude 4.6, o Extended Thinking (type: "enabled") ainda está disponível, mas está marcado como Deprecated e será removido em versões futuras. Misturar os dois modos também pode quebrar a continuidade do cache de prompt. Recomenda-se migrar para o Adaptive Thinking o quanto antes. Ao chamar via APIYI apiyi.com, o formato dos parâmetros é totalmente compatível.

Q2: O Opus 4.5 suporta Adaptive Thinking?

Não suporta. O Adaptive Thinking é suportado apenas pelo Claude Opus 4.6 e Sonnet 4.6. O Opus 4.5 ainda precisa usar o modo type: "enabled" e definir budget_tokens manualmente. Se você precisa usar o Adaptive Thinking, é recomendado atualizar para os modelos da série 4.6. A APIYI apiyi.com oferece acesso à API para toda a série de modelos 4.5 e 4.6.

Q3: O display: “omitted” realmente economiza dinheiro?

Não economiza dinheiro. display: "omitted" apenas faz com que a API não retorne o texto do pensamento, reduzindo a latência de transmissão de rede. No entanto, os tokens de pensamento internos ainda são gerados e cobrados. A maneira real de economizar é reduzir o nível de effort — low ou medium fará com que o Claude pule ou reduza o pensamento em problemas simples.

Q4: Como saber se o Claude realizou pensamento em uma determinada requisição?

Verifique se a resposta contém um bloco de conteúdo do tipo thinking. Se o Claude julgar que o pensamento não é necessário, a resposta terá apenas blocos text, sem blocos thinking. No modo Adaptive, os campos de contagem de tokens em usage podem ajudá-lo a determinar quantos tokens foram consumidos pelo pensamento.

Q5: Como usar o Adaptive Thinking no Claude Code?

O Claude Code habilita o Adaptive Thinking por padrão ao usar o Opus 4.6 ou Sonnet 4.6. Você pode ajustar a profundidade do pensamento com o comando /effort: /effort low (modo rápido), /effort medium (modo balanceado), /effort high (modo profundo). A atualização de março de 2026 também corrigiu o erro "adaptive thinking is not supported" causado por strings de modelo não padrão.

Resumo: Adaptive Thinking é a principal atualização do Claude 4.6

O Adaptive Thinking representa uma evolução importante no modo de raciocínio da IA — passando de "o desenvolvedor adivinha quanto a IA precisa pensar" para "a IA decide por si mesma quanto precisa pensar".

4 atualizações principais:

Decisão dinâmica: Respostas instantâneas para perguntas simples, raciocínio profundo para problemas complexos
Pensamento intercalado automático: Raciocínio automático entre chamadas de ferramentas em fluxos de trabalho de agente
Diálogo flexível em múltiplas rodadas: Não é necessário iniciar com um bloco de pensamento obrigatório
Parâmetro effort: Uma forma mais intuitiva de controle do que budget_tokens

Recomendação de migração: Mude de thinking: {"type": "enabled", "budget_tokens": N} para thinking: {"type": "adaptive"}, combinado com output_config: {"effort": "..."} para controlar a profundidade.

Recomendamos usar o APIYI apiyi.com para integrar rapidamente as APIs do Claude Opus 4.6 e Sonnet 4.6. Com apenas uma alteração de parâmetro, você pode aproveitar o raciocínio inteligente e a otimização de custos proporcionados pelo Adaptive Thinking.

Referências

Documentação da API Claude – Adaptive Thinking: Guia técnico oficial
- Link: platform.claude.com/docs/en/build-with-claude/adaptive-thinking
Documentação da API Claude – Parâmetro Effort: Explicação detalhada da configuração effort
- Link: platform.claude.com/docs/en/build-with-claude/effort
Anthropic oficial – Claude Opus 4.6: Anúncio de lançamento
- Link: anthropic.com/news/claude-opus-4-6
Documentação da API Claude – Extended Thinking: Guia do pensamento estendido original
- Link: platform.claude.com/docs/en/build-with-claude/extended-thinking

Autor: Equipe APIYI | Para dominar as mais recentes capacidades da API Claude, visite o APIYI apiyi.com para obter as interfaces de API e suporte técnico para toda a série de modelos Claude 4.6.

Interpretação do Modo de Pensamento Adaptativo Claude: As 4 Principais Atualizações que Substituem o Pensamento Estendido

O que é Adaptive Thinking: entendendo em uma frase

Informações principais em resumo

Pensamento Adaptativo vs Estendido: 4 Principais Atualizações

Atualização 1: De "Orçamento Fixo" para "Decisão Dinâmica"

Atualização 2: Pensamento Intercalado Automático (Interleaved Thinking)

Atualização 3: Diálogos Multiturno Mais Flexíveis

Atualização 4: Parâmetro `effort` substitui `budget_tokens`

Guia Completo para Invocação de API

Invocação Básica: Adaptive Thinking Mais Simples

Usando o SDK Nativo da Anthropic

Controle Fino com o Parâmetro `effort`

Omitir o Conteúdo do Pensamento para Reduzir Latência

Parâmetro Effort na Prática: Configurações Ótimas para Diferentes Cenários

Guia de Configuração por Cenário

Usando `effort` no Claude Code

Migrando do Extended Thinking para o Adaptive Thinking

Tabela de Migração

Considerações para a Migração

Detalhamento do Mecanismo de Cobrança

Entendendo como os Tokens de Pensamento são Cobrados

Estratégias de Otimização de Custos

Perguntas Frequentes

Resumo: Adaptive Thinking é a principal atualização do Claude 4.6

Referências

Alcançando 80,2% de capacidade de codificação no SWE-Bench com MiniMax-M2.5: Acesso à API em 2 versões e guia prático

OpenClaw + PinchBench: Entendendo as 5 dimensões principais dos benchmarks de avaliação de agentes de IA

Domine os 3 pontos-chave do faturamento de cache do Claude: por que você deve usar o formato nativo da Anthropic para a invocação

用 Seedance 2.0 制作 AI 漫剧的 5 个核心技巧与小说视频化实战指南

Análise profunda do Claude Mythos Preview: As 5 principais capacidades do Modelo de Linguagem Grande mais poderoso da Anthropic

Teste real do Nano Banana 2 já disponível: 6 descobertas principais baseadas no Gemini 3.1 Flash

O que é Adaptive Thinking: entendendo em uma frase

Informações principais em resumo

Pensamento Adaptativo vs Estendido: 4 Principais Atualizações

Atualização 1: De "Orçamento Fixo" para "Decisão Dinâmica"

Atualização 2: Pensamento Intercalado Automático (Interleaved Thinking)

Atualização 3: Diálogos Multiturno Mais Flexíveis

Atualização 4: Parâmetro effort substitui budget_tokens

Guia Completo para Invocação de API

Invocação Básica: Adaptive Thinking Mais Simples

Usando o SDK Nativo da Anthropic

Controle Fino com o Parâmetro effort

Omitir o Conteúdo do Pensamento para Reduzir Latência

Parâmetro Effort na Prática: Configurações Ótimas para Diferentes Cenários

Guia de Configuração por Cenário

Usando effort no Claude Code

Migrando do Extended Thinking para o Adaptive Thinking

Tabela de Migração

Considerações para a Migração

Detalhamento do Mecanismo de Cobrança

Entendendo como os Tokens de Pensamento são Cobrados

Estratégias de Otimização de Custos

Perguntas Frequentes

Resumo: Adaptive Thinking é a principal atualização do Claude 4.6

Referências

Similar Posts

Atualização 4: Parâmetro `effort` substitui `budget_tokens`

Controle Fino com o Parâmetro `effort`

Usando `effort` no Claude Code