|

Grok 4.3 lançado na API da xAI: Guia completo de migração para 8 modelos antigos descontinuados em 15 de maio

No dia 6 de maio de 2026, a xAI enviou um comunicado oficial a todos os usuários da API com o título "Grok 4.3 release and xAI API model retirement". A mensagem trouxe duas informações cruciais para os desenvolvedores: o Grok 4.3 já está totalmente disponível na API e, simultaneamente, oito modelos legados — incluindo grok-4-fast, grok-4-0709, grok-3, grok-code-fast-1 e grok-imagine-image-pro — serão descontinuados em 15 de maio de 2026, às 12:00 PT. Por trás deste e-mail, há não apenas uma grande atualização de versão, mas também uma contagem regressiva de apenas 9 dias para a migração.

grok-4-3-release-xai-api-model-retirement-pt-pt 图示

O que mais chama a atenção no lançamento do Grok 4.3 não é apenas a mudança de nome, mas a combinação de uma janela de contexto de 1M de tokens, preços de entrada/saída de US$ 1,25/US$ 2,50 e três níveis ajustáveis de intensidade de raciocínio. Essa faixa de preço coloca o Grok 4.3 diretamente na concorrência com modelos de raciocínio mainstream como o Gemini 3.1 Pro e o GPT-5.4, mantendo a vantagem característica da xAI de alta velocidade de processamento de tokens. Recomendamos que as equipes que dependem da família Grok realizem testes de integração o quanto antes através da plataforma APIYI (apiyi.com); a interface compatível com OpenAI permite reduzir ao mínimo os custos de migração ao alternar entre modelos.

Análise completa das especificações e preços do Grok 4.3

O Grok 4.3 é o modelo emblemático de última geração que a xAI descreveu no e-mail como "o modelo mais rápido e inteligente que já construímos". Ele ocupa as primeiras posições nos rankings de agentic tool calling e instruction following, sendo posicionado como um carro-chefe versátil para código, agentes e raciocínio complexo. Em termos de especificações, o Grok 4.3 expandiu a janela de contexto de 256K, da era do Grok 4, para 1M de tokens, equiparando-se ao Gemini 3 Pro e ao Claude 4.7, o que significa que é possível inserir bases de código completas ou longos documentos técnicos de uma só vez.

A tabela abaixo resume os parâmetros principais do Grok 4.3 na API da xAI, com dados provenientes do e-mail oficial da xAI e da página de testes de terceiros da Artificial Analysis.

Parâmetro Valor no Grok 4.3 Observações
Janela de contexto 1.000.000 de tokens Entrada + Saída compartilhadas
Preço de entrada US$ 1,25 / 1M tokens 50% mais barato que o GPT-5.4, igual ao Gemini 3.1 Pro
Preço de saída US$ 2,50 / 1M tokens Redução de cerca de 83% em relação aos US$ 15 da era Grok 4
Intensidade de raciocínio 3 níveis: low / medium / high Controla o orçamento de raciocínio profundo via parâmetro
Modalidade de entrada Texto + Imagem Suporta compreensão visual
Modalidade de saída Texto Não gera imagens diretamente
Chamada de ferramentas Function calling nativo Suporta saída estruturada e chamadas paralelas
Velocidade de saída Aprox. 207 tokens/s Testado pela Artificial Analysis

Os 3 níveis de intensidade de raciocínio (reasoning effort) são a principal novidade que diferencia o Grok 4.3 da geração anterior. Eles permitem que os desenvolvedores ajustem a profundidade de "pensamento" do modelo de acordo com a complexidade da tarefa, impactando diretamente a latência e o custo. Esse mecanismo é inspirado no design de reasoning_effort da OpenAI, mas a xAI manteve o raciocínio como um estado "sempre ativo", permitindo apenas o ajuste da profundidade. A tabela abaixo organiza os cenários de uso típicos e os impactos de cada nível.

Intensidade de raciocínio Cenários típicos Características de latência Impacto no custo
low Classificação simples, resumos, extração de regras Próximo a modelos sem raciocínio Menor volume de tokens de saída
medium Chamada de função, análise de dados, preenchimento de código Equilíbrio entre latência e qualidade Nível recomendado por padrão
high Agentes de múltiplos passos, matemática complexa, código longo Fase de "pensamento" mais longa Aumento significativo de tokens de saída

🎯 Dica de integração: Para equipes que não têm certeza de qual nível escolher, recomendamos realizar um teste com um conjunto de amostras reais de negócio usando o nível medium na plataforma APIYI (apiyi.com) e, em seguida, decidir se vale a pena subir para o nível high com base na precisão e no retorno sobre o custo. A interface unificada permite alternar o parâmetro reasoning_effort entre diferentes modelos com um clique, sem a necessidade de reescrever o SDK.

grok-4-3-release-xai-api-model-retirement-pt-pt 图示

Desempenho do Grok 4.3 nos rankings de agentic e instruction following

O motivo pelo qual o Grok 4.3 foi destacado pela xAI em e-mails como "líder nos rankings de agentic tool calling e instruction following" baseia-se em dados de benchmarks de terceiros, como Artificial Analysis, τ²-Bench, IFBench e GDPval-AA. O Artificial Analysis Intelligence Index atribuiu uma pontuação global de 53,2, com um custo total de execução de cerca de US$ 395, o que representa uma economia de aproximadamente 20% em relação ao Grok 4.20. No τ²-Bench Telecom (que simula chamadas de ferramentas bidirecionais em atendimento ao cliente), o cenário mais próximo de um agente real, o Grok 4.3 alcançou 98%, uma melhoria de 5 pontos percentuais em relação ao Grok 4.20, empatando com o GLM-5.1.

Para os desenvolvedores, o que merece mais atenção é o GDPval-AA, um benchmark que mede o valor real do fluxo de trabalho econômico. O Grok 4.3 obteve 1500 ELO no GDPval-AA, um salto de 321 pontos em relação aos 1179 ELO do Grok 4.20 0309 v2, superando modelos como Gemini 3.1 Pro Preview, Muse Spark, GPT-5.4 mini (xhigh) e Kimi K2.5. Em termos de instruction following, o Grok 4.3 manteve 81% no IFBench, empatado com o Grok 4.20 0309 v2.

Benchmark Pontuação Grok 4.3 Referência da Categoria Capacidade Avaliada
AA Intelligence Index 53.2 Superior a 98% dos modelos Inteligência Geral
AA Coding Index 41.0 Superior a 89% dos modelos Codificação e Refatoração
τ²-Bench Telecom 98% Empatado com GLM-5.1 Chamada de ferramenta + Colaboração
IFBench 81% Empatado com Grok 4.20 Seguimento de instruções complexas
GDPval-AA ELO 1500 Superou Gemini 3.1 Pro Preview Valor real de fluxo de trabalho

Vale notar que o ponto forte do Grok 4.3 são os fluxos de trabalho de agentes e a chamada de ferramentas, não competições puras de algoritmos. Para aplicações como agentes de código, agentes de navegador ou bots de atendimento que exigem saída JSON estável e chamadas de ferramentas em várias etapas, a confiabilidade do Grok 4.3 é significativamente superior à da geração anterior. No entanto, se o cenário principal da sua equipe for a síntese pura de código (estilo SWE-bench), recomendamos testar o Grok 4.3, Claude 4.7 Opus e GPT-5.4 no mesmo conjunto de testes na plataforma APIYI (apiyi.com) e decidir o modelo principal com base na taxa de sucesso.

Lista de descontinuação de modelos da API xAI e sugestões de migração

A xAI está descontinuando 8 modelos de uma só vez, abrangendo raciocínio de texto, modelos de código e geração de imagens, essencialmente limpando todo o portfólio da era Grok 4. Para equipes que possuem nomes de modelos "hard-coded" em seus sistemas, este é um prazo rigoroso que exige a atualização do código em até 9 dias. A tabela abaixo resume os modelos afetados e os caminhos de substituição recomendados oficialmente.

Modelo a ser descontinuado Tipo Substituição Recomendada Notas de Migração
grok-4-1-fast-reasoning Raciocínio grok-4.3 Melhor qualidade, menor preço
grok-4-1-fast-non-reasoning Não-raciocínio grok-4.20-non-reasoning Mantém baixa latência
grok-4-fast-reasoning Raciocínio grok-4.3 Ganha 1M de janela de contexto
grok-4-fast-non-reasoning Não-raciocínio grok-4.20-non-reasoning Compatível com a API
grok-4-0709 Raciocínio grok-4.3 Snapshot inicial do Grok 4
grok-code-fast-1 Código grok-4.3 Cenários de código unificados
grok-3 Geral grok-4.3 Fim da era Grok 3
grok-imagine-image-pro Geração de imagem grok-imagine-image Simplificação de SKU

A data de descontinuação é 15 de maio de 2026, às 12:00 PT (16 de maio, às 03:00 no horário de Pequim). Após esse prazo, todas as solicitações enviadas a esses 8 IDs de modelo retornarão erro. Contando a partir do e-mail enviado em 6 de maio, restam apenas 9 dias, um cronograma apertado para operações de médio e grande porte. Recomendamos dividir a migração em 3 etapas: primeiro, localizar todos os IDs de modelo hard-coded no código; segundo, executar um teste de carga na plataforma APIYI (apiyi.com); terceiro, alternar o campo model via variáveis de ambiente em vez de alterar a lógica de negócio.

grok-4-3-release-xai-api-model-retirement-pt-pt 图示

Um lembrete especial: o grok-code-fast-1 foi o modelo padrão para muitos projetos de agentes de código no último semestre. Sua descontinuação significa que todas as ferramentas do tipo Cursor, plugins de IDE e agentes de CLI que dependem desse ID precisarão migrar para o grok-4.3. Em cenários de código, a estabilidade de chamada de ferramenta do Grok 4.3 é melhor que a do grok-code-fast-1, mas o custo por token é ligeiramente maior, sendo necessário reavaliar o orçamento de chamadas.

Comparativo: Grok 4.3 vs. GPT-5.4, Claude 4.7 e Gemini 3.1 Pro

Com o lançamento do Grok 4.3 no segundo trimestre de 2026, o mercado de modelos de ponta vive seu período de competição mais intenso da história. O Claude Opus 4.7 mantém a liderança no SWE-bench Verified com 87,6%, o Gemini 3.1 Pro atingiu 94,3% no GPQA Diamond, e o GPT-5.4 continua sendo a referência básica em estabilidade de raciocínio para textos longos. O posicionamento do Grok 4.3 é claro: "inteligência média + preço baixíssimo + cadeia de ferramentas de agente robusta", focado em cenários de alta frequência sensíveis a custos.

A tabela abaixo compara os dados principais dos quatro modelos emblemáticos em dimensões comuns. Os preços estão em dólares por milhão de tokens.

Modelo Preço Entrada Preço Saída Janela de Contexto Cenários de Vantagem
Grok 4.3 $1,25 $2,50 1M Cadeia de ferramentas de agente, alta frequência, raciocínio médio
GPT-5.4 $2,50 $15,00 400K Consistência em textos longos, planejamento complexo
Claude 4.7 Opus $15,00 $75,00 1M Programação de elite, escrita de documentos, análise profunda
Gemini 3.1 Pro $2,00 $12,00 2M Multimodal, compreensão de vídeo, documentos ultralongos

A partir desta tabela, um fato fica evidente: o preço do token de saída do Grok 4.3 é 30 vezes mais barato que o do Claude 4.7 Opus e cerca de 4,8 vezes mais barato que o do Gemini 3.1 Pro. Para negócios como agentes de atendimento ao cliente de alta frequência, linters de código ou limpeza de dados em lote, a vantagem de custo unitário do Grok 4.3 é amplificada exponencialmente. No entanto, em cenários que exigem qualidade de codificação extrema ou compreensão multimodal, o Claude 4.7 Opus e o Gemini 3.1 Pro continuam insubstituíveis.

🎯 Sugestão de estratégia multimodelo: Recomendamos usar o Grok 4.3 como camada geral de alta frequência, o Claude 4.7 Opus para camadas de código complexo e saída de documentos, e o Gemini 3.1 Pro para a camada multimodal. Utilize a interface unificada da APIYI (apiyi.com) na camada de roteamento de negócios para distribuir as chamadas. Assim, você aproveita o benefício de baixo custo do Grok 4.3 e, ao mesmo tempo, utiliza modelos mais potentes em pontos críticos.

Guia de migração e exemplo de código para Grok 4.3

A migração para o Grok 4.3 é bastante direta do ponto de vista de engenharia. A xAI fornece uma interface de chat completions compatível com a OpenAI; a maior parte do trabalho de migração consiste em modificar os campos base_url e model. Para projetos que já utilizam o SDK da OpenAI, o exemplo minimalista em Python abaixo é o código de integração completo.

from openai import OpenAI

# Configuração do cliente apontando para o serviço proxy de API da APIYI
client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://vip.apiyi.com/v1",
)

resp = client.chat.completions.create(
    model="grok-4.3",
    messages=[
        {"role": "user", "content": "Explique o que é reasoning effort em uma frase."},
    ],
    extra_body={"reasoning_effort": "medium"},
)

print(resp.choices[0].message.content)

Ao apontar a base_url para a plataforma APIYI (apiyi.com), sua aplicação ganha um ponto de entrada unificado para Grok 4.3, Claude 4.7, GPT-5.4 e Gemini 3.1 Pro. Posteriormente, a troca de modelos exige apenas a alteração do parâmetro model, sem a necessidade de reescrever a autenticação ou o código de roteamento. Essa abstração unificada reduz significativamente os riscos de migração antes do prazo final de desativação em 15 de maio.

Para a migração de modelos antigos, preparamos uma tabela de referência com as alterações mínimas necessárias para atualizar os IDs dos modelos, que pode ser aplicada diretamente ao seu código.

ID do modelo antigo ID do novo modelo Precisa alterar outros parâmetros?
grok-3 grok-4.3 Opcional: adicionar reasoning_effort
grok-4-0709 grok-4.3 Opcional: adicionar reasoning_effort
grok-4-fast-reasoning grok-4.3 Opcional: adicionar reasoning_effort
grok-4-fast-non-reasoning grok-4.20-non-reasoning Nenhuma alteração necessária
grok-code-fast-1 grok-4.3 Recomendado: reasoning_effort=high
grok-imagine-image-pro grok-imagine-image Endpoint da API de imagem permanece igual

FAQ: Perguntas Frequentes sobre o Grok 4.3

P1: O Grok 4.3 realmente suporta 1M de janela de contexto? O desempenho cai em textos longos?

Sim, o Grok 4.3 oferece oficialmente uma janela de contexto de 1M de tokens na API da xAI, equiparando-se ao Claude 4.7 Opus. No entanto, como ocorre com todos os modelos de contexto longo, a compreensão de solicitações pode sofrer uma certa degradação após os 600K tokens. Recomendamos colocar as informações cruciais na primeira metade do documento. Você pode usar a plataforma APIYI (apiyi.com) para realizar um teste de taxa de recuperação de busca com seus documentos reais de negócio antes de decidir adotar o Grok 4.3 como seu principal modelo para textos longos.

P2: Como escolher entre as intensidades de raciocínio low / medium / high?

Use low para tarefas de baixo risco (classificação, resumo, extração de regras), medium para operações de rotina (atendimento ao cliente, invocação de funções, análise de dados) e high para raciocínios complexos (Agentes de múltiplas etapas, código de longa cadeia, matemática complexa). O nível high aumentará significativamente o consumo de tokens de saída e a latência; recomendamos avaliar com base no seu orçamento e no SLA de latência.

P3: Após 15 de maio às 12:00 PT, os modelos antigos ainda poderão ser usados?

Não. O e-mail da xAI afirma claramente: "Após 15 de maio de 2026, as solicitações para esses modelos não funcionarão mais". Solicitações expiradas retornarão um erro diretamente. Todo código com IDs de modelos antigos "hard-coded" deve ser atualizado antes do prazo.

P4: Como reduzir ao mínimo o custo de migração?

A abordagem mais segura é abstrair o campo model em variáveis de ambiente ou itens de configuração no seu negócio, em vez de deixá-lo fixo no código. Com o endpoint compatível com OpenAI da APIYI (apiyi.com), a migração se resume a uma única alteração de configuração e um teste de regressão.

P5: O Grok 4.3 é adequado para um Agente de Programação (Coding Agent)?

Sim. O Grok 4.3 obteve 98% no τ²-Bench Telecom; a estabilidade na invocação de ferramentas e em diálogos de múltiplas rodadas é superior ao grok-code-fast-1. Além disso, o custo unitário é extremamente baixo, tornando-o ideal para plugins de IDE de alta frequência, Agentes CLI e scripts de automação de operações.

Resumo: Pontos principais sobre o lançamento do Grok 4.3 e a migração da API da xAI

O maior destaque do lançamento do Grok 4.3 não é apenas ser "mais forte", mas ser "mais barato e mais forte ao mesmo tempo". O preço de $1,25/$2,50 coloca a xAI no mesmo patamar de custo do Gemini 3.1 Pro, oferecendo 1M de janela de contexto e invocação de ferramentas de alta qualidade, redefinindo o padrão de custo-benefício para a camada de uso geral de alta frequência. Ao mesmo tempo, a descontinuação de 8 modelos antigos em 15 de maio serve como um lembrete para todas as equipes: os IDs de modelos não devem ser "hard-coded" no código de negócio, mas sim abstraídos por trás de uma camada de roteamento configurável.

Recomendamos utilizar o Grok 4.3 como o principal motor para invocações de alta frequência e cadeias de ferramentas de Agentes, realizando a migração através da interface unificada da APIYI (apiyi.com). Isso reduz o custo de troca ao mínimo, mantendo a capacidade de combinar múltiplos modelos, como Claude 4.7 Opus, GPT-5.4 e Gemini 3.1 Pro, permitindo um agendamento dinâmico entre diferentes tarefas para alcançar o equilíbrio ideal entre custo e qualidade.

Equipe técnica da APIYI · Focada em conteúdos práticos sobre APIs de modelos de IA e ferramentas para desenvolvedores. Para mais artigos técnicos, visite apiyi.com

Similar Posts