No dia 21 de janeiro de 2026, às 18:00 (horário de Pequim), um grande número de desenvolvedores relatou que as chamadas da API do Nano Banana Pro estavam sofrendo timeouts constantes, com a taxa de falha em requisições de resolução 4K disparando. Este artigo apresenta uma retrospectiva completa dessa falha, analisa a causa raiz e oferece 3 soluções emergenciais práticas.
Valor central: Entenda o cenário real de estabilidade da API Imagen do Google, domine os métodos de resposta a emergências quando ocorrerem falhas e reduza os riscos de interrupção do seu negócio.

Registro Completo da Linha do Tempo da Falha no Nano Banana Pro
Esta falha começou por volta das 18:00 (horário de Pequim) e durou pelo menos 5,5 horas, com um amplo escopo de impacto.
| Horário (Pequim) | Descrição do Evento | Nível de Impacto |
|---|---|---|
| 18:00 | Surgem os primeiros relatos de timeout, requisições 4K começam a falhar | Alguns usuários |
| 18:30 | Taxa de falha aumenta, mensagem de erro exibe Deadline expired |
40% dos usuários |
| 19:00 | Resoluções 1-2K ainda operam, requisições 4K quase todas em timeout | 70% dos usuários |
| 20:00 | O limite oficial de timeout foi estendido de 300s para 600s | Todos os usuários |
| 21:00 | Algumas requisições 4K ocasionalmente têm sucesso, mas instáveis | Em andamento |
| 23:30 | Falha ainda não totalmente recuperada, taxa de sucesso 4K em cerca de 15% | Em andamento |
Fenômenos Críticos da Falha no Nano Banana Pro
Durante esta falha, observamos três características distintas:
Fenômeno 1: Dependência de Resolução
- Resoluções 1K-2K: Requisições basicamente normais, taxa de sucesso > 90%.
- Resolução 4K: Taxa de falha altíssima, taxa de sucesso < 20%.
Fenômeno 2: Isolamento de Modelo
Sob a mesma conta, as APIs de texto do Gemini funcionaram perfeitamente, o que indica que não se trata de uma restrição ao nível da conta, mas de uma falha específica no módulo de geração de imagens.
Fenômeno 3: Mudança no Tempo de Timeout
A equipe oficial estendeu silenciosamente o limite de timeout de 300 para 600 segundos. Isso mostra que o Google está ciente do problema e tentando amenizá-lo aumentando o tempo de espera, mas isso trata apenas o sintoma, não a causa raiz.
Análise de Causa Raiz do Nano Banana Pro

Análise Técnica
A falha do Nano Banana Pro (Gemini 3 Pro Image) originou-se de problemas na alocação de poder computacional das TPUs no backend do Google.
| Fator | Descrição | Impacto |
|---|---|---|
| Gargalo de TPU v7 | Lançada em abril de 2025, a implantação em larga escala ainda está em andamento | Falta de poder computacional em horários de pico |
| Custo do Modelo Diffusion | A geração de imagem consome de 5 a 10 vezes mais processamento que a inferência de texto | Resoluções 4K são especialmente exigentes |
| Tarefas de Treino do Gemini 3.0 | Grande parte dos recursos de TPU foi ocupada por tarefas de treinamento | Serviços de inferência acabam sendo comprimidos |
| Limitações do Estágio Preview Pago | Atualmente ainda em estado de "Paid Preview" | Planejamento de capacidade conservador |
De acordo com discussões no fórum de desenvolvedores de IA do Google, os problemas de instabilidade do Nano Banana Pro começaram a aparecer no segundo semestre de 2025, e a equipe oficial ainda não conseguiu resolver a questão de forma definitiva.
Entendendo o erro "Deadline expired"
Error: Deadline expired before operation could complete.
O significado desta mensagem de erro é claro:
- Deadline: O limite de tempo (timeout) definido pelo servidor do Google (antes era 300s, agora 600s).
- expired: A geração da imagem não foi concluída dentro do tempo estipulado.
- Causa Raiz: Congestionamento na fila das TPUs; o tempo de espera na fila da requisição foi longo demais.
🎯 Dica Técnica: Ao encontrar falhas em larga escala desse tipo, sugerimos monitorar o status da API através da plataforma APIYI (apiyi.com). A plataforma sincroniza o status do serviço upstream em tempo real, ajudando os desenvolvedores a identificar falhas imediatamente.
Detalhes do Impacto da Resolução no Nano Banana Pro

Por que a resolução 4K é a mais afetada? Isso está diretamente relacionado ao consumo de processamento do modelo Diffusion.
| Resolução | Quantidade de Pixels | Consumo de Poder Relativo | Taxa de Sucesso (durante falha) | Tempo Médio de Resposta |
|---|---|---|---|---|
| 1024×1024 (1K) | 1M pixels | 1x (Base) | ~95% | 15-30s |
| 2048×2048 (2K) | 4M pixels | ~4x | ~70% | 45-90s |
| 4096×4096 (4K) | 16M pixels | ~16x | <20% | Timeout (>600s) |
Fórmula de Consumo Computacional
A carga de cálculo dos modelos Diffusion possui uma relação quadrática com a resolução:
Consumo ≈ (Largura × Altura) × Passos de Difusão × Complexidade do Modelo
Isso significa que a geração de uma imagem 4K requer aproximadamente 16 vezes mais poder computacional que uma de 1K. Quando o cluster TPU atinge sua carga crítica, as tarefas com maior demanda são as primeiras a serem interrompidas.
Estratégia de Redução de Resolução (Downgrade)
Durante períodos de instabilidade, se o seu negócio permitir, você pode adotar uma estratégia de downgrade de resolução:
# 故障期间的降级代码示例
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1"
)
def generate_with_fallback(prompt, preferred_size="4096x4096"):
"""带降级的图像生成函数"""
size_fallback = ["4096x4096", "2048x2048", "1024x1024"]
for size in size_fallback:
try:
response = client.images.generate(
model="nano-banana-pro",
prompt=prompt,
size=size,
timeout=120 # 单次尝试 2 分钟超时
)
print(f"成功生成 {size} 图像")
return response
except Exception as e:
print(f"{size} 生成失败: {e}")
continue
return None
Ver código completo da estratégia de downgrade
import time
from typing import Optional
from openai import OpenAI
class NanoBananaProClient:
"""带故障降级的 Nano Banana Pro 客户端"""
def __init__(self, api_key: str):
self.client = OpenAI(
api_key=api_key,
base_url="https://api.apiyi.com/v1"
)
self.size_priority = ["4096x4096", "2048x2048", "1024x1024"]
self.max_retries = 3
def generate_image(
self,
prompt: str,
preferred_size: str = "4096x4096",
allow_downgrade: bool = True
) -> Optional[dict]:
"""
生成图像,支持分辨率降级
Args:
prompt: 图像描述
preferred_size: 首选分辨率
allow_downgrade: 是否允许降级到较低分辨率
"""
sizes_to_try = (
self.size_priority
if allow_downgrade
else [preferred_size]
)
for size in sizes_to_try:
for attempt in range(self.max_retries):
try:
response = self.client.images.generate(
model="nano-banana-pro",
prompt=prompt,
size=size,
timeout=180
)
return {
"success": True,
"size": size,
"data": response,
"downgraded": size != preferred_size
}
except Exception as e:
wait_time = (attempt + 1) * 30
print(f"尝试 {attempt + 1}/{self.max_retries} "
f"({size}) 失败: {e}")
if attempt < self.max_retries - 1:
time.sleep(wait_time)
return {"success": False, "error": "所有尝试均失败"}
# 使用示例
client = NanoBananaProClient(api_key="YOUR_API_KEY")
result = client.generate_image(
prompt="A futuristic cityscape at sunset",
preferred_size="4096x4096",
allow_downgrade=True
)
💡 Recomendação: Para ambientes de produção, recomendamos chamar a API do Nano Banana Pro através da plataforma APIYI (apiyi.com). A plataforma oferece detecção automática de falhas e funções de roteamento inteligente, permitindo a alternância automática para canais de backup quando o serviço upstream apresenta anomalias.
Planos de Emergência para o Nano Banana Pro
Diante de falhas desse tipo, os desenvolvedores podem adotar as seguintes 3 estratégias de emergência.
Plano 1: Redução de Resolução
Cenário de uso: Quando o negócio aceita uma resolução menor.
| Estratégia | Ação | Efeito esperado |
|---|---|---|
| Downgrade imediato | 4K → 2K | Taxa de sucesso sobe para 70% |
| Downgrade conservador | 4K → 1K | Taxa de sucesso sobe para 95% |
| Estratégia híbrida | Downgrade automático em cascata | Maximizar taxa de sucesso |
Plano 2: Retentativa e Fila
Cenário de uso: Uso obrigatório de 4K, mas com latência aceitável.
import asyncio
from collections import deque
class RetryQueue:
"""Fila de retentativa com backoff"""
def __init__(self, max_concurrent=2):
self.queue = deque()
self.max_concurrent = max_concurrent
self.base_delay = 60 # Intervalo inicial de retentativa de 60 segundos
async def add_task(self, task_id, prompt):
self.queue.append({
"id": task_id,
"prompt": prompt,
"attempts": 0,
"max_attempts": 5
})
async def process_with_backoff(self, task):
delay = self.base_delay * (2 ** task["attempts"])
print(f"Aguardando {delay}s antes de tentar novamente a tarefa {task['id']}")
await asyncio.sleep(delay)
# Executar a chamada real...
Plano 3: Troca por modelos alternativos
Cenário de uso: Quando o negócio aceita estilos diferentes.
| Modelo alternativo | Vantagens | Desvantagens | Recomendação |
|---|---|---|---|
| DALL-E 3 | Alta estabilidade, boa renderização de texto | Diferença de estilo marcante | ⭐⭐⭐⭐ |
| Midjourney API | Forte apelo artístico | Exige integração independente | ⭐⭐⭐ |
| Stable Diffusion 3 | Auto-hospedável, controle total | Exige recursos de GPU | ⭐⭐⭐⭐⭐ |
| Flux Pro | Alta qualidade e velocidade | Preço mais elevado | ⭐⭐⭐⭐ |
💰 Otimização de custos: Usando a plataforma APIYI (apiyi.com), você pode chamar múltiplos modelos de geração de imagem com uma única chave de API (API Key). Isso permite alternar rapidamente para um modelo alternativo se o serviço principal falhar, sem precisar mexer na arquitetura do código.
Histórico de Estabilidade do Nano Banana Pro
Esta não é a primeira vez que o Nano Banana Pro apresenta falhas em larga escala.
| Data | Tipo de falha | Duração | Resposta oficial |
|---|---|---|---|
| Agosto de 2025 | Inundação de erros 429 (quota) | ~3 dias | Ajuste na política de cotas |
| Outubro de 2025 | Timeout em horários de pico | ~12 horas | Expansão de capacidade |
| Dezembro de 2025 | Corte drástico nas cotas da camada gratuita | Permanente | Mudança de política |
| 21 de janeiro de 2026 | Timeouts massivos em 4K | >5,5 horas | Aumento do limite de timeout |
De acordo com informações da comunidade de desenvolvedores do Google AI, a raiz desses problemas está em:
- Aumento gradual da produção do TPU v7: Lançado em abril de 2025, mas a implantação em larga escala só deve ser concluída em 2026.
- Prioridade no treinamento do Gemini 3.0: As tarefas de treinamento consomem muitos TPUs, sobrecarregando os serviços de inferência.
- Demanda de processamento dos modelos Diffusion: A geração de imagens consome de 5 a 10 vezes mais poder computacional do que a inferência de texto (Modelo de Linguagem Grande).
Perguntas Frequentes
Q1: Por que a API de texto do Gemini funciona normalmente na mesma conta, mas a API de imagem dá timeout?
A API de texto do Gemini e o Nano Banana Pro (geração de imagens) utilizam pools de recursos de backend diferentes. A geração de imagens depende de modelos de Difusão (Diffusion), e a demanda por poder computacional é de 5 a 10 vezes maior que a inferência de texto. Quando os recursos de TPU estão escassos, os serviços de alta computação são os primeiros afetados. Isso mostra que a falha é no nível de recursos, e não um problema de permissão da conta.
Q2: O que significa o aumento do timeout oficial de 300s para 600s?
Isso indica que o Google reconhece a existência do problema, mas não consegue resolver a falta de poder computacional das TPUs de forma definitiva no curto prazo. Aumentar o timeout é apenas um paliativo para permitir que as requisições fiquem mais tempo na fila de espera. Para os desenvolvedores, isso significa que é necessário ajustar as configurações de timeout no lado do cliente e gerenciar a expectativa de tempos de espera mais longos.
Q3: Como a APIYI, sendo um serviço de redistribuição, lida com esse tipo de falha?
Como um serviço de redistribuição, a plataforma APIYI (apiyi.com) fica limitada quando o serviço upstream apresenta falhas. No entanto, o valor agregado da plataforma inclui: monitoramento de status em tempo real, alertas de falha, mecanismos de tentativa automática (retry) e a capacidade de alternar rapidamente entre modelos. Quando o Nano Banana Pro apresenta problemas, é possível mudar para modelos alternativos como DALL-E 3 ou Flux Pro com apenas um clique.
Q4: Quando o Nano Banana Pro se tornará totalmente estável?
De acordo com análises do setor, é necessário que duas condições sejam atendidas: primeiro, a conclusão da implantação em larga escala das TPU v7 (prevista para meados de 2026); segundo, a finalização do treinamento da série Gemini 3.0. Até lá, a instabilidade em horários de pico pode continuar ocorrendo. Recomendamos adotar uma arquitetura redundante com múltiplos modelos.
Resumo
Pontos centrais da falha na API Nano Banana Pro em 21 de janeiro de 2026:
- Características da falha: Taxa de falha altíssima em resoluções 4K, enquanto resoluções de 1-2K funcionam basicamente de forma normal; o problema está na alocação de poder computacional das TPUs.
- Causa raiz: Capacidade insuficiente das Google TPU v7 + alta demanda de processamento dos modelos de Difusão + treinamento do Gemini 3.0 consumindo recursos de inferência.
- Plano de contingência: Redução da resolução, filas de tentativa com recuo (backoff) e alternância rápida para modelos reserva.
Para operações de produção que dependem do Nano Banana Pro, recomendamos o acesso através da plataforma APIYI (apiyi.com). A plataforma oferece uma interface unificada para múltiplos modelos, suportando DALL-E 3, Flux Pro, Stable Diffusion 3, entre outros modelos populares, permitindo uma alternância rápida em caso de falha no serviço principal para garantir a continuidade do negócio.
Autor: Equipe Técnica APIYI
Troca de Experiências: Visite APIYI (apiyi.com) para mais informações sobre APIs de geração de imagem por IA e suporte técnico.
Referências
-
Google AI Developers – Nano Banana Image Generation: Documentação oficial
- Link:
ai.google.dev/gemini-api/docs/image-generation - Descrição: Guia oficial de geração de imagens da Gemini API
- Link:
-
Google Cloud Service Health: Painel de status do serviço
- Link:
status.cloud.google.com - Descrição: Monitoramento em tempo real do status dos serviços do Google Cloud
- Link:
-
StatusGator – Google AI Studio and Gemini API: Monitoramento de status de terceiros
- Link:
statusgator.com/services/google-ai-studio-and-gemini-api - Descrição: Histórico de falhas e rastreamento de status
- Link:
-
Gemini API Rate Limits: Documentação oficial de limites de taxa
- Link:
ai.google.dev/gemini-api/docs/rate-limits - Descrição: Explicação sobre IPM (imagens por minuto) e políticas de cota
- Link:
