|

Interpretação do Modo de Pensamento Adaptativo Claude: As 4 Principais Atualizações que Substituem o Pensamento Estendido

Se você tem usado o modo Extended Thinking (Pensamento Estendido) do Claude, atenção — ele foi marcado como Deprecated (em breve descontinuado) no Claude 4.6. No lugar, temos um modo mais inteligente: Adaptive Thinking (Pensamento Adaptativo).

A mudança principal: antes você precisava configurar manualmente o orçamento de tokens para pensar (budget_tokens). Agora, o Claude decide por si mesmo se precisa pensar e o quão profundo deve ser esse pensamento. Perguntas simples recebem respostas rápidas, problemas complexos recebem raciocínio profundo — tudo com um único parâmetro.

Valor principal deste artigo: Ao terminar de ler, você saberá como chamar a API do Adaptive Thinking, entenderá os 4 principais aprimoramentos, como configurar o parâmetro effort e terá um guia completo para migrar do Extended Thinking.

claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-pt-pt 图示

O que é Adaptive Thinking: entendendo em uma frase

Extended Thinking (modo antigo): O desenvolvedor diz ao Claude "você tem um orçamento de 10000 tokens para pensar", e o Claude usa todo esse orçamento.

Adaptive Thinking (novo modo): O Claude avalia a complexidade do problema por conta própria e decide "se precisa pensar" e "o quão profundo deve ser esse pensamento".

# ❌ Modo antigo (Extended Thinking) - Em breve descontinuado
thinking={"type": "enabled", "budget_tokens": 10000}

# ✅ Novo modo (Adaptive Thinking) - Recomendado
thinking={"type": "adaptive"}

Informações principais em resumo

Item de Informação Detalhes
Nome da funcionalidade Adaptive Thinking (Pensamento Adaptativo)
Data de lançamento 5 de fevereiro de 2026 (lançado com Claude Opus 4.6)
Modelos suportados Claude Opus 4.6, Claude Sonnet 4.6
Parâmetro da API thinking: {"type": "adaptive"}
Método de controle Parâmetro effort (substitui budget_tokens)
Status Método oficialmente recomendado (Extended Thinking está Deprecated)
Pensamento intercalado Ativado automaticamente (sem necessidade de header beta)
Claude Code Suporte nativo, pode usar o comando /effort para ajustar

🎯 Recomendação de migração: Se seu projeto está usando Extended Thinking (type: "enabled"), é recomendado migrar para o Adaptive Thinking o quanto antes. Ao chamar a API do Claude Opus 4.6 ou Sonnet 4.6 através da plataforma APIYI apiyi.com, você só precisa modificar um parâmetro para completar a migração.


Pensamento Adaptativo vs Estendido: 4 Principais Atualizações

claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-pt-pt 图示

Atualização 1: De "Orçamento Fixo" para "Decisão Dinâmica"

Esta é a mudança mais fundamental.

Dor do modelo antigo: Você tinha que adivinhar um valor para budget_tokens. Definir muito baixo, problemas complexos não eram raciocinados adequadamente; definir muito alto, problemas simples desperdiçavam tokens (e dinheiro).

# Modelo antigo: você adivinha quantos tokens de pensamento este problema precisa?
thinking={"type": "enabled", "budget_tokens": 10000}
# Problema: problemas simples também usavam muitos tokens de pensamento

Novo modelo: O Claude decide automaticamente com base na complexidade de cada solicitação.

# Novo modelo: O Claude julga por si mesmo
thinking={"type": "adaptive"}
# Problema simples: sem pensamento ou pensamento leve
# Problema complexo: raciocínio profundo

Impacto real: Para cargas de trabalho mistas que são "às vezes simples, às vezes complexas" (como em cenários de revisão de código — alguns PRs são apenas mudanças de texto, outros envolvem refatoração de concorrência), o Pensamento Adaptativo supera o orçamento fixo tanto em desempenho geral quanto em eficiência de custos.

Atualização 2: Pensamento Intercalado Automático (Interleaved Thinking)

Em fluxos de trabalho do tipo agente (Agentic), o Claude precisa pensar entre múltiplas chamadas de ferramentas.

Modelo antigo: O pensamento intercalado exigia adicionar manualmente um cabeçalho beta, e não estava disponível no Opus 4.5.

Novo modelo: Ao usar o Pensamento Adaptativo, o pensamento intercalado é ativado automaticamente, sem necessidade de configuração adicional.

Solicitação do usuário → Claude pensa → Chama ferramenta A → Claude pensa novamente → Chama ferramenta B → Resposta final

Isso é particularmente importante para o Claude Code e outras aplicações do tipo agente — a IA pode "repensar" após cada chamada de ferramenta, reduzindo significativamente os erros.

Atualização 3: Diálogos Multiturno Mais Flexíveis

Modelo antigo: Em diálogos multiturno, a mensagem do assistente da rodada anterior tinha que começar com um bloco de pensamento, caso contrário, gerava erro. Isso tornava o gerenciamento da conversa complexo.

Novo modelo: Essa limitação não existe mais. O Pensamento Adaptativo é mais flexível em diálogos multiturno, porque em algumas rodadas o Claude pode optar por não pensar.

Atualização 4: Parâmetro effort substitui budget_tokens

effort é um sinal de comportamento e não uma limitação rígida, sendo mais alinhado com as necessidades reais do que budget_tokens.

Nível de Esforço Comportamento Cenário Aplicável Modelos Suportados
max Sempre pensa profundamente, sem restrições Raciocínio de maior dificuldade Apenas Opus 4.6
high (padrão) Quase sempre pensa, raciocínio profundo para problemas complexos Revisão de código, design de arquitetura Opus 4.6, Sonnet 4.6
medium Pensamento moderado, pode pular problemas simples Desenvolvimento diário, tarefas gerais Opus 4.6, Sonnet 4.6
low Minimiza o pensamento, prioriza velocidade Perguntas e respostas simples, verificação de estilo Opus 4.6, Sonnet 4.6

Importante: Mesmo no nível low de esforço, se o problema for suficientemente complexo, o Claude ainda pode optar por pensar. O effort é uma sugestão, não um comando.

💡 Recomendação para Sonnet 4.6: A Anthropic recomenda oficialmente usar medium como padrão para o Sonnet 4.6, para obter o melhor equilíbrio entre velocidade, custo e qualidade. Ao chamar via APIYI apiyi.com, basta incluir o parâmetro output_config na solicitação.


Guia Completo para Invocação de API

Invocação Básica: Adaptive Thinking Mais Simples

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # Endpoint unificado da APIYI
)

response = client.chat.completions.create(
    model="claude-opus-4-6",
    messages=[
        {"role": "user", "content": "Explique o impacto do GIL do Python na programação multithread"}
    ],
    max_tokens=16000,
    extra_body={
        "thinking": {"type": "adaptive"}
    }
)
print(response.choices[0].message.content)

Usando o SDK Nativo da Anthropic

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"  # Endpoint unificado da APIYI
)

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Reveja este código em busca de condições de corrida..."}
    ]
)

# Analisar a resposta: pode conter blocos de thinking e text
for block in response.content:
    if block.type == "thinking":
        print(f"[Processo de Pensamento] {block.thinking}")
    elif block.type == "text":
        print(f"[Resposta] {block.text}")

Controle Fino com o Parâmetro effort

# Exemplo com SDK da Anthropic
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},  # Profundidade de pensamento média
    messages=[
        {"role": "user", "content": "O que há de errado com este código?"}
    ]
)

Omitir o Conteúdo do Pensamento para Reduzir Latência

Se você não precisa ver o processo de pensamento, pode usar display: "omitted" para reduzir a latência de transmissão:

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={
        "type": "adaptive",
        "display": "omitted"  # Não retorna o texto do pensamento
    },
    messages=[...]
)
# Atenção: os tokens de pensamento ainda serão cobrados
Ver exemplo completo de fluxo de trabalho de revisão de código
import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"
)

def review_pr(diff_content, risk_level="medium"):
    """Revisa código de forma adaptativa baseado no nível de risco"""

    # Alto risco: Opus + high effort
    # Baixo risco: Sonnet + medium effort
    if risk_level == "high":
        model = "claude-opus-4-6"
        effort = "high"
    else:
        model = "claude-sonnet-4-6"
        effort = "medium"

    response = client.messages.create(
        model=model,
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": effort},
        system="""Você é um especialista sênior em revisão de código.
Analise as mudanças no código e categorize por nível de gravidade:
🔴 Deve ser corrigido (segurança/lógica)
🟡 Sugestão de correção (qualidade)
💡 Sugestão de melhoria""",
        messages=[
            {"role": "user", "content": f"Revisar:\n\n{diff_content}"}
        ]
    )

    thinking_text = ""
    review_text = ""
    for block in response.content:
        if block.type == "thinking":
            thinking_text = block.thinking
        elif block.type == "text":
            review_text = block.text

    return {
        "thinking": thinking_text,
        "review": review_text,
        "model": model,
        "effort": effort,
        "input_tokens": response.usage.input_tokens,
        "output_tokens": response.usage.output_tokens
    }

🚀 Início Rápido: Para chamar a API do Claude 4.6 via APIYI apiyi.com, basta adicionar thinking: {"type": "adaptive"} à sua requisição. Isso habilita o pensamento adaptativo sem configuração extra, atualizando o poder de raciocínio da sua IA com uma linha de código.


Parâmetro Effort na Prática: Configurações Ótimas para Diferentes Cenários

Guia de Configuração por Cenário

Cenário Modelo Recomendado Effort Motivo
Perguntas/ Traduções Simples Sonnet 4.6 low Não requer raciocínio profundo, prioriza velocidade
Completar/Formatar Código Sonnet 4.6 low Tarefa de correspondência de padrões, não precisa pensar
Revisão Diária de PR Sonnet 4.6 medium Equilibra velocidade e profundidade da revisão
Depuração de Bug Complexo Opus 4.6 high Requer raciocínio entre arquivos
Auditoria de Vulnerabilidade de Segurança Opus 4.6 high Não pode deixar passar problemas de alto risco
Prova Matemática/Lógica Opus 4.6 max Requer profundidade de raciocínio extrema
Design de Solução de Arquitetura Opus 4.6 max Requer consideração abrangente de trade-offs

Usando effort no Claude Code

Após a atualização de março de 2026, o Claude Code adicionou o comando /effort:

# Configure diretamente no terminal do Claude Code
/effort medium    # Codificação diária
/effort high      # Revisão de código
/effort max       # Design de arquitetura (somente Opus 4.6)

Isso permite que desenvolvedores ajustem a profundidade de pensamento do Claude de forma flexível de acordo com a tarefa atual, sem precisar modificar o código.

💰 Otimização de Custo: O parâmetro effort afeta diretamente o consumo de tokens. Para tarefas de codificação diárias, configurar o Sonnet 4.6 como medium ou low pode reduzir significativamente os custos. Chamar via plataforma APIYI apiyi.com é mais barato que o oficial, combinando economia dupla com o parâmetro effort.

Migrando do Extended Thinking para o Adaptive Thinking

Tabela de Migração

Escrita Antiga (Extended Thinking) Escrita Nova (Adaptive Thinking)
thinking: {"type": "enabled", "budget_tokens": 5000} thinking: {"type": "adaptive"}, output_config: {"effort": "low"}
thinking: {"type": "enabled", "budget_tokens": 10000} thinking: {"type": "adaptive"}, output_config: {"effort": "medium"}
thinking: {"type": "enabled", "budget_tokens": 30000} thinking: {"type": "adaptive"}, output_config: {"effort": "high"}
thinking: {"type": "enabled", "budget_tokens": 100000} thinking: {"type": "adaptive"}, output_config: {"effort": "max"}
Adicionar manualmente o header interleaved thinking beta Ativado automaticamente, nenhum header necessário

Considerações para a Migração

1. Cache de Prompt será interrompido

Ao mudar do modo enabled para adaptive, os pontos de interrupção do cache de prompt no nível da mensagem serão invalidados. O cache das definições de sistema e ferramentas não é afetado.

Recomendação: Migre todas as suas requisições para o modo adaptive de uma vez, em vez de usar uma mistura.

2. O conteúdo do pensamento é resumido por padrão

O modelo Claude 4.6 retorna por padrão uma versão resumida do conteúdo do pensamento, não o texto completo. Isso significa que o bloco de pensamento que você vê é uma versão simplificada.

  • Versão resumida (display: "summarized"): Comportamento padrão
  • Versão omitida (display: "omitted"): Não retorna o texto do pensamento
  • Versão completa: É necessário entrar em contato com a equipe de vendas da Anthropic para habilitar

3. A cobrança é calculada com base no pensamento interno completo

Independentemente de você ver a versão resumida ou omitida, a cobrança é baseada na quantidade de tokens do pensamento interno completo. Não assuma que o custo é menor só porque o texto visível é menor.

4. Prefill não é mais suportado

O Claude Opus 4.6 não suporta mais o preenchimento prévio (prefill) de mensagens do assistente — enviar um prefill resultará em um erro 400. Se você precisa controlar o formato da saída, use o prompt do sistema ou structured output.

🎯 Recomendação de Migração: É recomendado validar primeiro o efeito da migração em um ambiente de teste, especialmente comparando a diferença na qualidade da saída entre o modo adaptive e os budget_tokens fixos anteriores. Através do APIYI apiyi.com você pode facilmente realizar testes A/B — usando a mesma chave para chamar configurações diferentes.


claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-pt-pt 图示

Detalhamento do Mecanismo de Cobrança

Entendendo como os Tokens de Pensamento são Cobrados

Compreender o mecanismo de cobrança é crucial para controlar os custos.

Item de Cobrança Explicação
Token de entrada Cobrado normalmente ($5/MTok Opus, $3/MTok Sonnet)
Token de pensamento Cobrado pelo preço do token de saída ($25/MTok Opus, $15/MTok Sonnet)
Token de texto de resposta Cobrado pelo preço do token de saída
Token de geração de resumo Não há cobrança extra
display: "omitted" Os tokens de pensamento ainda são cobrados, apenas não são transmitidos

Estratégias de Otimização de Custos

Perguntas simples com low effort → pode pular o pensamento → economiza muitos tokens de saída
                                                ↓
                                            Custo pode cair 50-80%

Exemplo de comparação real: A mesma tarefa de verificação de estilo de código

Configuração Tokens de Pensamento Tokens de Resposta Custo Total (Sonnet)
effort: high ~3000 ~500 ~$0.053
effort: medium ~800 ~500 ~$0.020
effort: low 0 (pula pensamento) ~500 ~$0.009

Para tarefas simples, low effort é cerca de 83% mais barato que high effort.

💰 Dica de Economia: Para cenários de processamento em lote (por exemplo, verificar o estilo de 100 arquivos), definir o effort como low pode economizar muito. Ao chamar a API Claude 4.6 via APIYI apiyi.com, você combina preços promocionais já existentes com a otimização do parâmetro effort, obtendo uma redução dupla de custos.


Perguntas Frequentes

Q1: O Adaptive Thinking e o Extended Thinking podem ser usados juntos?

Podem, mas não é recomendado. No modelo Claude 4.6, o Extended Thinking (type: "enabled") ainda está disponível, mas está marcado como Deprecated e será removido em versões futuras. Misturar os dois modos também pode quebrar a continuidade do cache de prompt. Recomenda-se migrar para o Adaptive Thinking o quanto antes. Ao chamar via APIYI apiyi.com, o formato dos parâmetros é totalmente compatível.

Q2: O Opus 4.5 suporta Adaptive Thinking?

Não suporta. O Adaptive Thinking é suportado apenas pelo Claude Opus 4.6 e Sonnet 4.6. O Opus 4.5 ainda precisa usar o modo type: "enabled" e definir budget_tokens manualmente. Se você precisa usar o Adaptive Thinking, é recomendado atualizar para os modelos da série 4.6. A APIYI apiyi.com oferece acesso à API para toda a série de modelos 4.5 e 4.6.

Q3: O display: “omitted” realmente economiza dinheiro?

Não economiza dinheiro. display: "omitted" apenas faz com que a API não retorne o texto do pensamento, reduzindo a latência de transmissão de rede. No entanto, os tokens de pensamento internos ainda são gerados e cobrados. A maneira real de economizar é reduzir o nível de effortlow ou medium fará com que o Claude pule ou reduza o pensamento em problemas simples.

Q4: Como saber se o Claude realizou pensamento em uma determinada requisição?

Verifique se a resposta contém um bloco de conteúdo do tipo thinking. Se o Claude julgar que o pensamento não é necessário, a resposta terá apenas blocos text, sem blocos thinking. No modo Adaptive, os campos de contagem de tokens em usage podem ajudá-lo a determinar quantos tokens foram consumidos pelo pensamento.

Q5: Como usar o Adaptive Thinking no Claude Code?

O Claude Code habilita o Adaptive Thinking por padrão ao usar o Opus 4.6 ou Sonnet 4.6. Você pode ajustar a profundidade do pensamento com o comando /effort: /effort low (modo rápido), /effort medium (modo balanceado), /effort high (modo profundo). A atualização de março de 2026 também corrigiu o erro "adaptive thinking is not supported" causado por strings de modelo não padrão.


Resumo: Adaptive Thinking é a principal atualização do Claude 4.6

O Adaptive Thinking representa uma evolução importante no modo de raciocínio da IA — passando de "o desenvolvedor adivinha quanto a IA precisa pensar" para "a IA decide por si mesma quanto precisa pensar".

4 atualizações principais:

  1. Decisão dinâmica: Respostas instantâneas para perguntas simples, raciocínio profundo para problemas complexos
  2. Pensamento intercalado automático: Raciocínio automático entre chamadas de ferramentas em fluxos de trabalho de agente
  3. Diálogo flexível em múltiplas rodadas: Não é necessário iniciar com um bloco de pensamento obrigatório
  4. Parâmetro effort: Uma forma mais intuitiva de controle do que budget_tokens

Recomendação de migração: Mude de thinking: {"type": "enabled", "budget_tokens": N} para thinking: {"type": "adaptive"}, combinado com output_config: {"effort": "..."} para controlar a profundidade.

Recomendamos usar o APIYI apiyi.com para integrar rapidamente as APIs do Claude Opus 4.6 e Sonnet 4.6. Com apenas uma alteração de parâmetro, você pode aproveitar o raciocínio inteligente e a otimização de custos proporcionados pelo Adaptive Thinking.


Referências

  1. Documentação da API Claude – Adaptive Thinking: Guia técnico oficial

    • Link: platform.claude.com/docs/en/build-with-claude/adaptive-thinking
  2. Documentação da API Claude – Parâmetro Effort: Explicação detalhada da configuração effort

    • Link: platform.claude.com/docs/en/build-with-claude/effort
  3. Anthropic oficial – Claude Opus 4.6: Anúncio de lançamento

    • Link: anthropic.com/news/claude-opus-4-6
  4. Documentação da API Claude – Extended Thinking: Guia do pensamento estendido original

    • Link: platform.claude.com/docs/en/build-with-claude/extended-thinking

Autor: Equipe APIYI | Para dominar as mais recentes capacidades da API Claude, visite o APIYI apiyi.com para obter as interfaces de API e suporte técnico para toda a série de modelos Claude 4.6.

Similar Posts