|

8 modelos Grok antigos da xAI serão desativados em 15 de maio: guia de migração para grok-4.3 e 5 mudanças de custo

O anúncio oficial da xAI acaba de ser publicado: 8 modelos Grok antigos serão oficialmente desativados em 15 de maio de 2026, às 12:00 PT. As solicitações serão redirecionadas automaticamente para o grok-4.3, mas o faturamento seguirá a tabela de preços do novo modelo. Este artigo analisa o impacto real dessa mudança para desenvolvedores de IA e usuários corporativos.

Valor central: Entenda em 3 minutos a lista de modelos Grok desativados, as regras de redirecionamento, as mudanças de custo e como atualizar seu código de invocação do modelo com a estratégia de sincronização da APIYI.

8 modelos Grok da xAI foram desativados coletivamente Redirecionamento para grok-4.3 a partir de 15 de maio de 2026 às 12:00 PT

grok-4-1-fast-reasoning Desativado

<rect x="40" y="164" width="320" height="36" rx="6" fill="#1f2937" stroke="#475569" stroke-width="1" />
<text x="60" y="187" fill="#cbd5e1" font-size="13">grok-4-1-fast-non-reasoning</text>
<text x="340" y="187" text-anchor="end" fill="#94a3b8" font-size="11">Desativado</text>

<rect x="40" y="208" width="320" height="36" rx="6" fill="#1f2937" stroke="#475569" stroke-width="1" />
<text x="60" y="231" fill="#cbd5e1" font-size="13">grok-4-fast-reasoning</text>
<text x="340" y="231" text-anchor="end" fill="#94a3b8" font-size="11">Desativado</text>

<rect x="40" y="252" width="320" height="36" rx="6" fill="#1f2937" stroke="#475569" stroke-width="1" />
<text x="60" y="275" fill="#cbd5e1" font-size="13">grok-4-fast-non-reasoning</text>
<text x="340" y="275" text-anchor="end" fill="#94a3b8" font-size="11">Desativado</text>

<rect x="40" y="296" width="320" height="36" rx="6" fill="#1f2937" stroke="#475569" stroke-width="1" />
<text x="60" y="319" fill="#cbd5e1" font-size="13">grok-4-0709</text>
<text x="340" y="319" text-anchor="end" fill="#94a3b8" font-size="11">Desativado</text>

<rect x="40" y="340" width="320" height="36" rx="6" fill="#1f2937" stroke="#475569" stroke-width="1" />
<text x="60" y="363" fill="#cbd5e1" font-size="13">grok-code-fast-1</text>
<text x="340" y="363" text-anchor="end" fill="#94a3b8" font-size="11">Desativado</text>

<rect x="40" y="384" width="320" height="36" rx="6" fill="#1f2937" stroke="#475569" stroke-width="1" />
<text x="60" y="407" fill="#cbd5e1" font-size="13">grok-3</text>
<text x="340" y="407" text-anchor="end" fill="#94a3b8" font-size="11">Desativado</text>

<rect x="40" y="428" width="320" height="36" rx="6" fill="#1f2937" stroke="#475569" stroke-width="1" />
<text x="60" y="451" fill="#cbd5e1" font-size="13">grok-imagine-image-pro</text>
<text x="340" y="451" text-anchor="end" fill="#94a3b8" font-size="11">Desativado</text>

destino de redirecionamento grok-4.3 raciocínio sempre ativo · janela de contexto de 1M

<rect x="486" y="304" width="248" height="40" rx="6" fill="#0f172a" opacity="0.35" />
<text x="498" y="329" fill="#ffffff" font-family="ui-monospace, SFMono-Regular, Menlo, monospace" font-size="14">entrada</text>
<text x="722" y="329" text-anchor="end" fill="#ffffff" font-family="ui-monospace, SFMono-Regular, Menlo, monospace" font-size="14" font-weight="700">$1,25 / 1M</text>

<rect x="486" y="352" width="248" height="40" rx="6" fill="#0f172a" opacity="0.35" />
<text x="498" y="377" fill="#ffffff" font-family="ui-monospace, SFMono-Regular, Menlo, monospace" font-size="14">Saída</text>
<text x="722" y="377" text-anchor="end" fill="#ffffff" font-family="ui-monospace, SFMono-Regular, Menlo, monospace" font-size="14" font-weight="700">US$ 2,50 / 1M</text>

Fonte: docs.x.ai/developers/migration/may-15-retirement · APIYI descontinuado simultaneamente

Visão geral da desativação dos modelos Grok

A xAI deixou claro na documentação de migração o cronograma completo e o escopo do impacto. Esta desativação não é apenas uma limpeza de modelos pouco utilizados, mas abrange modelos de raciocínio, não raciocínio, código e geração de imagens que foram pilares nos últimos seis meses. Para equipes que dependem desses slugs em ambientes de produção, 15 de maio é o prazo final para concluir a migração do código.

Item de informação Detalhes
Data de desativação 15/05/2026, 12:00 PT
Fonte xAI (docs.x.ai)
Quantidade de modelos 8
Destino do redirecionamento grok-4.3 / grok-imagine-image-quality
Preço do novo modelo $1.25 / 1M entrada, $2.50 / 1M saída
Janela de contexto 1.000.000 tokens
Fonte de dados docs.x.ai/developers/migration/may-15-retirement

Detalhes da lista de modelos Grok desativados

Os 8 modelos que serão desativados cobrem 4 tipos de cargas de trabalho: a série fast-reasoning (incluindo grok-4-1-fast-reasoning e grok-4-fast-reasoning) voltada para inferência de alto throughput; a série fast-non-reasoning (incluindo grok-4-1-fast-non-reasoning e grok-4-fast-non-reasoning) voltada para conversação de baixa latência; o grok-4-0709 e o grok-3 como modelos generalistas; e o grok-code-fast-1 e grok-imagine-image-pro para geração de código e imagens.

Slug do modelo Categoria Uso típico Destino do redirecionamento
grok-4-1-fast-reasoning reasoning Inferência alto throughput grok-4.3 (low effort)
grok-4-1-fast-non-reasoning non-reasoning Conversação baixa latência grok-4.3 (none effort)
grok-4-fast-reasoning reasoning Inferência rápida grok-4.3 (low effort)
grok-4-fast-non-reasoning non-reasoning Respostas em tempo real grok-4.3 (none effort)
grok-4-0709 reasoning Flagship generalista grok-4.3 (low effort)
grok-code-fast-1 coding Codificação inteligente grok-4.3 (low effort)
grok-3 non-reasoning Produção de longo prazo grok-4.3 (none effort)
grok-imagine-image-pro image Imagens de alta qualidade grok-imagine-image-quality

De acordo com a documentação oficial, todos os modelos da categoria reasoning serão atendidos pelo grok-4.3 com low reasoning effort, enquanto os modelos non-reasoning usarão none effort para garantir que a latência permaneça próxima à dos modelos originais. As solicitações de geração de imagens serão redirecionadas para o grok-imagine-image-quality.

Análise das Regras de Redirecionamento da Aposentadoria do Modelo Grok

Após as 12:00 PT do dia 15 de maio, os slugs antigos não retornarão imediatamente um erro 404; em vez disso, serão redirecionados silenciosamente pelo gateway para o grok-4.3. Essa "transição suave" é excelente para a compatibilidade, mas também esconde uma armadilha de custos: muitas equipes podem pensar que "se a solicitação foi bem-sucedida, está tudo bem", apenas para descobrir no final do mês que o preço unitário aumentou silenciosamente.

xai-grok-models-retirement-may-15-grok-4-3-migration-guide-pt-pt 图示

Mudanças no comportamento de raciocínio com a aposentadoria do modelo Grok

A maior diferença entre o grok-4.3 e a antiga série fast-reasoning reside no design de "raciocínio sempre ativo" (always-on reasoning). O grok-4.3 transformou o raciocínio (chain-of-thought) de um recurso opcional para um comportamento padrão do modelo. Os desenvolvedores podem escolher entre três níveis de intensidade de raciocínio (low, medium, high), não havendo opção para desativar o raciocínio completamente. Já os modelos antigos fast-non-reasoning ignoravam o processo de raciocínio; com o redirecionamento, o nível none effort fará com que o grok-4.3 simule a experiência de "resposta direta" original, mas, na prática, ainda consumirá uma pequena quantidade de tokens de raciocínio internos.

Vale ressaltar que a xAI não forneceu um "parâmetro de modo de compatibilidade" na camada de SDK desta vez. Isso significa que, embora o código que utiliza model="grok-4-fast-reasoning" continue funcionando, ele não conseguirá controlar a intensidade do raciocínio com precisão. Se a sua aplicação for sensível à latência e consistência, é obrigatório passar explicitamente o campo reasoning_effort; caso contrário, você obterá apenas o nível padrão e não conseguirá reproduzir a curva de comportamento do modelo antigo.

Para aplicações em tempo real que buscam uma velocidade de resposta extrema, recomendamos combinar o uso do serviço proxy de API da APIYI (apiyi.com) para testar a diferença de latência entre os dois níveis de esforço antes de decidir se deve ajustar o design do comando (prompt) no lado da aplicação. Ao migrar para uma interface unificada, você pode comparar rapidamente o throughput e a latência do primeiro token para diferentes níveis de esforço de raciocínio, sem precisar modificar parâmetros adicionais.

Mudanças no modelo de imagem do Grok

O grok-imagine-image-pro foi o principal modelo de geração de imagens promovido pela xAI no último semestre, focado em alta resolução. Com a transição para o grok-imagine-image-quality, o novo modelo traz otimizações adicionais nos detalhes da imagem e na aderência ao comando (prompt), porém, as características de custo e latência por geração também sofreram alterações.

🎯 Sugestão de migração: Recomendamos que projetos que utilizam o grok-imagine-image-pro realizem imediatamente uma rodada de testes de regressão com os comandos (prompts) mais comuns em um ambiente de sandbox. Compare as diferenças visuais, a velocidade de geração e a variação de custo por imagem entre os modelos novo e antigo, evitando que o seu ambiente de produção seja forçado a migrar sem preparo.

Análise de Impacto de Custos com a Aposentadoria dos Modelos Grok

A mudança nos custos é o ponto crucial e subestimado no anúncio de aposentadoria dos modelos. O preço unificado do grok-4.3 é de $1,25/1M de tokens de entrada e $2,50/1M de tokens de saída. Para equipes que já utilizavam o grok-4-0709 ou o grok-3, o impacto é praticamente nulo, mas para projetos que dependiam dos slugs de baixo custo (fast-reasoning, fast-non-reasoning e grok-code-fast-1), haverá um aumento significativo no preço unitário.

xai-grok-models-retirement-may-15-grok-4-3-migration-guide-pt-pt 图示

5 Mudanças Críticas de Custo com a Aposentadoria do Grok

A tabela abaixo resume os 5 pontos de mudança de custo que os desenvolvedores encontrarão mais facilmente após 15 de maio. Recomendamos uma verificação antes da migração.

Ponto de Mudança de Custo Desempenho do Modelo Antigo Desempenho do grok-4.3 Nível de Risco
Preço unitário de entrada Série fast geralmente < $0,5/1M Unificado $1,25/1M Alto
Preço unitário de saída grok-code-fast-1 apenas $1,50/1M Unificado $2,50/1M Alto
Cobrança de tokens de raciocínio Alguns modelos não contabilizam Tokens de raciocínio cobrados como saída Médio
Janela de contexto 256K~512K 1M de cobrança total Médio
Cache e chamadas de ferramenta Estratégia de preço dispersa 0,20/1M prompt cache + chamadas por uso Baixo

Vale ressaltar que o grok-4.3 possui raciocínio always-on (sempre ativo) por padrão. Mesmo selecionando low effort, cada solicitação consumirá mais tokens de raciocínio do que a versão antiga fast-non-reasoning. Essa parte é cobrada pelo preço de saída, sendo o "aumento invisível" mais fácil de ser ignorado na fatura mensal. Em nossos testes internos, observamos que, ao alternar um conjunto de prompts de perguntas e respostas curtas para o grok-4.3 (low effort), o número médio de tokens de saída aumentou de 20% a 35% em comparação ao fast-non-reasoning. Isso significa que, mesmo que o preço unitário fosse o mesmo, a fatura mensal aumentaria naturalmente.

Tomando como exemplo um cenário típico de Agente de Atendimento ao Cliente: originalmente com 1 milhão de invocações diárias, cada uma com 800 tokens de entrada + 400 de saída, o custo mensal usando grok-4-fast-non-reasoning girava em torno de 4.000 dólares. Com a mesma carga de trabalho migrada para o grok-4.3, o custo mensal calculado pelo preço oficial subiria para cerca de 13.500 dólares, e com o incremento dos tokens de raciocínio, a fatura real chegaria perto de 17.000 dólares. Essa diferença de magnitude é suficiente para que as equipes de operações e financeiras realizem uma revisão orçamentária formal em maio.

Outro tipo de custo frequentemente subestimado é o esforço de adaptação de prompts. O comportamento de raciocínio do grok-4.3 tende a "dar a resposta após uma dedução passo a passo", o que faz com que modelos de prompt otimizados para o grok-3 apresentem "saídas prolixas e sem conclusão no primeiro parágrafo". Para restaurar o estilo de resposta de "resposta direta + conclusão curta" dos modelos antigos, é necessário restringir explicitamente a estrutura de saída via system prompt ou ajustar o reasoning effort para none. Ambas as opções trazem horas de trabalho adicionais para testes de regressão e iteração da biblioteca de prompts.

💰 Controle de Custos: Recomendamos que, durante a fase de migração, você utilize o painel de logs de solicitação da APIYI (apiyi.com) para verificar o uso de tokens agregados por slug de modelo, combinando isso com o cenário real para decidir se é necessário mudar para medium effort para melhorar a qualidade ou definir como none effort para controlar os custos.

Análise de Impacto da Descontinuação dos Modelos Grok

Impacto para desenvolvedores

A descontinuação coletiva afeta mais diretamente os desenvolvedores de camada de aplicação que utilizam o grok-code-fast-1, que anteriormente oferecia uma excelente relação custo-benefício, alcançando 80,0% de pontuação no LiveCodeBench por US$ 0,20/US$ 1,50. Com a migração para o grok-4.3, o preço unitário dobra, exigindo que as equipes reavaliem o orçamento de custos para tarefas de alta frequência, como preenchimento de código, revisão de PRs e orquestração de agentes. Combinações que funcionavam bem, como "preenchimento em linha + recuperação de contexto longo", podem precisar ser divididas em várias etapas para controlar o consumo de tokens.

Para usuários de frameworks de agentes, o fluxo que dependia da série "fast" para decisões de invocação de ferramentas também será afetado. O grok-4.3 possui uma capacidade de invocação de ferramentas superior, mas a latência do primeiro token (TTFT) é ligeiramente maior, exigindo que os engenheiros reajustem os parâmetros de timeout, retry e concorrência. Recomendamos realizar testes de regressão no ambiente de staging da APIYI (apiyi.com) para confirmar se a taxa de sucesso e a distribuição de latência estão dentro de limites aceitáveis antes de iniciar a migração total.

Impacto para usuários corporativos

O foco dos usuários corporativos está no SLA e na conformidade. A atualização para o grok-4.3 cobre todos os cenários dos 8 modelos anteriores, simplificando a matriz de seleção de modelos, o que é positivo para a governança corporativa (registro de modelos, auditoria e conformidade de segurança). No entanto, o setor financeiro precisa revisar os orçamentos e regras de dedução existentes, especialmente se os pacotes de tokens mensais e descontos por compromisso de volume forem afetados pela unificação de preços. A equipe de operações também deve atualizar os limites de alerta para evitar aumentos inesperados na fatura de maio sem o devido aviso prévio.

Para cenários de chamadas combinadas entre modelos, sugerimos agregar Grok, Claude e GPT em uma visão de faturamento unificada, realizando a atribuição de custos por departamento ou linha de negócio para mitigar o impacto das iterações frequentes de modelos no controle orçamentário. Esta descontinuação coletiva também serve como um lembrete de que o risco de dependência de um único fornecedor não se limita apenas à interrupção do serviço, mas também aos custos implícitos causados por "mudanças internas silenciosas" por trás do mesmo slug.

Impacto na indústria

A decisão da xAI de descontinuar 8 modelos de uma só vez sinaliza que a combinação "always-on reasoning + 1M context" do grok-4.3 já é versátil o suficiente para lidar com cargas de trabalho de raciocínio, conversação, código e invocação de ferramentas simultaneamente. Isso está alinhado com a direção que Claude e OpenAI têm tomado nos últimos anos, unificando gradualmente os "modelos de raciocínio" e os "modelos de instrução". Isso indica que a comercialização de Modelos de Linguagem Grande está entrando em uma fase de "um único modelo carro-chefe para tudo", onde o ecossistema de modelos será mais enxuto, mas as fronteiras de capacidade e a elasticidade de preço de cada modelo serão ampliadas.

Outra tendência importante é que o "raciocínio ativado por padrão + níveis de esforço (effort)" está se tornando o novo padrão da indústria. Esse design devolve ao desenvolvedor a escolha entre latência e custo, desde que o SDK e a plataforma de monitoramento suportem nativamente o campo effort. Para serviços proxy de API e plataformas de agregação, o gerenciamento do ciclo de vida dos modelos se tornará uma nova competência central. A APIYI (apiyi.com) já sincronizou a documentação de migração do Grok no console do produto e enviou avisos de descontinuação para os slugs afetados, ajudando os desenvolvedores a não perderem prazos.

Instruções de Descontinuação da APIYI

Para manter o alinhamento com a estratégia oficial da xAI e evitar confusões no faturamento, a APIYI (apiyi.com) estabeleceu um plano de descontinuação, oferecendo um canal de transição suave para usuários que ainda utilizam slugs antigos. O console contabilizará, por conta, o número de invocações e a proporção de gastos de cada slug descontinuado nos últimos 30 dias, permitindo que os líderes de equipe tenham uma visão global clara dos módulos de negócio afetados antes da migração.

Fase Prazo Ação da APIYI
Período de aviso Antes de 15/05/2026 Banner de aviso no console, notificação por e-mail para contas afetadas
Período de redirecionamento A partir de 15/05/2026, 12:00 PT Slugs antigos redirecionados automaticamente para o grok-4.3, com marcação deprecated no cabeçalho de resposta
Descontinuação total Conforme o cronograma da xAI Remoção das opções de slugs antigos no console

Os desenvolvedores não precisam alterar a base_url, basta substituir o campo model nos parâmetros da requisição por grok-4.3. Se o seu negócio utiliza chamadas de raciocínio e não-raciocínio, recomendamos adicionar uma configuração de effort na camada de encapsulamento do SDK para facilitar a orquestração durante testes de carga e experimentos A/B. O exemplo de invocação completo está abaixo e pode ser copiado diretamente para o seu projeto para validação.

import openai

# Configuração do cliente para usar a APIYI
client = openai.OpenAI(
    api_key="SUA_CHAVE_APIYI",
    base_url="https://api.apiyi.com/v1"
)

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[
        {"role": "user", "content": "Explique o conceito de always-on reasoning em 200 palavras"}
    ],
    extra_body={"reasoning_effort": "low"}
)
print(response.choices[0].message.content)
Ver versão para Node.js / TypeScript
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.APIYI_KEY,
  baseURL: "https://api.apiyi.com/v1",
});

const completion = await client.chat.completions.create({
  model: "grok-4.3",
  messages: [{ role: "user", content: "Resuma os pontos principais da migração para o grok-4.3" }],
  // @ts-expect-error campo extra da xAI
  reasoning_effort: "low",
});

console.log(completion.choices[0].message.content);

🚀 Dica de migração: Recomendamos que, antes de migrar, você utilize o painel de "Comparação de Modelos" da APIYI (apiyi.com) para enviar o mesmo conjunto de comandos para o grok-4.3 e para o modelo original. Compare a qualidade da resposta e a latência do primeiro token antes de decidir o nível final de reasoning effort.

Perguntas Frequentes

Q1: Os slugs antigos ainda funcionarão após 15 de maio?

Sim, mas o modelo executado será o grok-4.3, e a cobrança seguirá os novos preços de $1,25/$2,50 do grok-4.3. Recomendamos atualizar o campo model no seu código para grok-4.3 o mais rápido possível, para evitar aumentos inesperados na sua fatura mensal.

Q2: O grok-code-fast-1 ainda é adequado para preenchimento de código após a migração?

O grok-4.3 apresenta melhorias em relação ao grok-code-fast-1 nos benchmarks LiveCodeBench e SWE-bench, oferecendo uma capacidade de codificação geral superior, porém com maior latência e custo unitário. Sugerimos realizar testes com amostras reais do seu negócio para medir a latência P95 e o consumo médio de tokens por PR, antes de decidir se ele continua adequado para o preenchimento de código em linha.

Q3: Preciso solicitar uma nova chave API na plataforma APIYI?

Não é necessário. Sua chave APIYI original é totalmente compatível com novos modelos como o grok-4.3, e a base_url permanece a mesma; basta ajustar o nome do modelo no corpo da requisição. A lista completa de modelos e seus status pode ser consultada no painel da APIYI em apiyi.com.

Q4: Quais são os cuidados ao migrar para o modelo de geração de imagens grok-imagine-image-pro?

As solicitações serão redirecionadas para o grok-imagine-image-quality, que possui diferenças no estilo visual, sementes de amostragem e parâmetros padrão. Recomendamos executar seus comandos (prompts) históricos em um ambiente de sandbox para confirmar se os resultados estão estáveis antes de colocar em produção, evitando mudanças repentinas nas imagens do seu serviço.

Resumo

A xAI está aposentando oito de seus principais modelos, incluindo fast-reasoning, fast-non-reasoning, grok-code-fast-1, grok-3 e grok-imagine-image-pro. A partir das 12:00 PT do dia 15 de maio, todos serão migrados para o grok-4.3 e grok-imagine-image-quality. Embora a migração técnica não seja complexa, as mudanças nos preços unitários e na cobrança de tokens de raciocínio impactam significativamente negócios sensíveis a custos. Recomendamos priorizar três ações: atualizar o campo model no código de produção para grok-4.3, passar explicitamente o parâmetro reasoning_effort para controlar a latência e o custo, e realizar uma estimativa de custos ponta a ponta com amostras reais do seu negócio.

Nossa sugestão é encarar esta atualização de modelo como uma oportunidade de governança: utilize a APIYI (apiyi.com) para comparar a latência e os custos entre o grok-4.3, Claude, GPT e outros modelos. Mudar a estratégia de seleção de modelos de "seguir o ritmo do fornecedor" para "selecionar com base em métricas de negócio" trará mais estabilidade a longo prazo e permitirá que, na próxima vez que um anúncio de descontinuação ocorrer, você consiga realizar a transição em poucas horas.


Autor: Equipe APIYI — APIYI (apiyi.com), serviço proxy de API para Modelos de Linguagem Grande de nível empresarial, com suporte para integração unificada de modelos como Grok, Claude, GPT, Gemini e outros.

Similar Posts