
Está desenvolvendo um projeto no Google AI Studio e de repente recebeu o erro 429 RESOURCE_EXHAUSTED? Você não está sozinho — após o Google reduzir drasticamente as cotas gratuitas em dezembro de 2025, milhares de projetos de desenvolvedores ao redor do mundo pararam da noite para o dia.
Neste artigo, vamos detalhar o mecanismo de limites do Google AI Studio e oferecer 5 soluções comprovadas para ajudar você a retomar seu desenvolvimento rapidamente.
Entenda o mecanismo de limites do Google AI Studio
O que são os limites do Google AI Studio
O Google AI Studio impõe restrições multidimensionais às chamadas da API Gemini, incluindo principalmente:
| Dimensão do Limite | Significado | Tempo de Reset |
|---|---|---|
| RPM (Requests Per Minute) | Requisições por minuto | Reset contínuo a cada minuto |
| RPD (Requests Per Day) | Requisições por dia | Meia-noite (Horário do Pacífico) |
| TPM (Tokens Per Minute) | Tokens processados por minuto | Reset contínuo a cada minuto |
| IPM (Images Per Minute) | Imagens processadas por minuto | Reset contínuo a cada minuto |
🔑 Informação chave: Os limites são calculados por projeto (Project), não por API Key. Criar várias chaves de API não aumentará sua cota.
Limites da cota gratuita do Google AI Studio em 2026
Em 7 de dezembro de 2025, o Google reduziu significativamente as cotas da camada gratuita da API Gemini (entre 50% e 92%). Confira os limites atuais para cada modelo:
| Modelo | Limite de RPM | Limite de RPD | Limite de TPM |
|---|---|---|---|
| Gemini 2.5 Pro | 5 | 100 | 250.000 |
| Gemini 2.5 Flash | 10 | 250 | 250.000 |
| Gemini 2.5 Flash-Lite | 15 | 1.000 | 250.000 |
| Gemini 3 Pro Preview | 10-50* | 100+* | 250.000 |
*Os limites do Gemini 3 Pro Preview são ajustados dinamicamente com base na idade da conta e na região.

Por que você está recebendo o erro 429 no Google AI Studio
O erro 429 é acionado quando qualquer uma das dimensões ultrapassa o limite. Cenários comuns:
- RPM excedido: Muitas requisições enviadas em um curto intervalo de tempo.
- RPD esgotado: O total de requisições diárias atingiu o teto.
- TPM excedido: O número de tokens em uma única requisição é muito alto ou há muitas requisições simultâneas.
- Status da conta anômalo: Mesmo após o upgrade para o Tier 1, alguns usuários relatam que ainda enfrentam restrições da camada gratuita.
# Resposta típica de erro 429
{
"error": {
"code": 429,
"message": "You exceeded your current quota, please check your plan and billing details.",
"status": "RESOURCE_EXHAUSTED"
}
}
5 formas de resolver o limite do Google AI Studio
Opção 1: Aguardar o reset da cota (Gratuito, mas demorado)
Cenário de uso: Testes leves, projetos não urgentes.
Regras de reset de cota do Google AI Studio:
- RPM/TPM: Reset automático em uma janela deslizante de 60 segundos.
- RPD: Reset à meia-noite no horário do Pacífico (16h no horário de Brasília).
Implementação de retentativa com backoff exponencial:
import time
import random
def call_with_retry(func, max_retries=5):
"""Mecanismo de retentativa com backoff exponencial"""
for attempt in range(max_retries):
try:
return func()
except Exception as e:
if "429" in str(e):
wait_time = (2 ** attempt) + random.uniform(0, 1)
print(f"Cota excedida, aguardando {wait_time:.1f} segundos para tentar novamente...")
time.sleep(wait_time)
else:
raise
raise Exception("Tentativas esgotadas")
| Vantagens | Desvantagens |
|---|---|
| ✅ Totalmente gratuito | ❌ Pode exigir espera de horas |
| ✅ Sem necessidade de configuração | ❌ A cota continua sendo pequena |
| ✅ Ideal para testes de aprendizado | ❌ Não indicado para desenvolvimento oficial |
Opção 2: Upgrade para o Nível Pago (Tier 1)
Cenário de uso: Desenvolvedores com cartão de crédito internacional.
Aumento da cota após o upgrade para o Tier 1:
| Métrica | Nível Gratuito | Tier 1 |
|---|---|---|
| RPM | 5-15 | 150-300 |
| RPD | 100-1000 | Basicamente sem limites |
| Tempo de ativação | – | Imediato |
Passos para o upgrade:
- Acesse o console do Google AI Studio.
- Vá para a página "API Keys".
- Clique no botão "Set up Billing".
- Vincule uma conta de faturamento do Google Cloud.
- Selecione o plano Tier 1.
Referência de preços do Tier 1:
- Gemini 2.5 Flash: $0.075 / milhão de tokens de entrada.
- Gemini 2.5 Pro: $1.25 / milhão de tokens de entrada.
- Geração de imagem 4K: $0.24 / foto.
| Vantagens | Desvantagens |
|---|---|
| ✅ RPM sobe para 150-300 | ❌ Exige cartão de crédito internacional |
| ✅ Restrição de RPD basicamente removida | ❌ Alguns modelos ainda possuem limites |
| ✅ Ativação imediata | ❌ Dificuldade de vinculação em certas regiões |
Opção 3: Usar o serviço de intermediação APIYI (Recomendado)
Cenário de uso: Todos os desenvolvedores, especialmente quem busca facilidade de pagamento e acesso.
🎯 Solução Recomendada: Chame a API do Gemini através da plataforma APIYI (apiyi.com). Você não precisa se preocupar com limites de cota e conta com suporte a pagamentos locais.
Comparativo de vantagens APIYI:
| Item de Comparação | Google Oficial | APIYI |
|---|---|---|
| Limite de RPM | 5-300 | Sem limites |
| Limite de RPD | 100-Ilimitado | Sem limites |
| Preço Imagem 4K | $0.24 / foto | $0.05 / foto |
| Forma de Pagamento | Cartão Internacional | Pix / Cartão Local |
| Disponibilidade | Requer Proxy | Acesso Direto |
| Suporte Técnico | Inglês | Português / Chinês |

Código de acesso rápido:
import openai
# Configuração de acesso APIYI
client = openai.OpenAI(
api_key="seu-apiyi-key", # Obtenha em api.apiyi.com
base_url="https://api.apiyi.com/v1"
)
# Chamada do modelo Gemini
response = client.chat.completions.create(
model="gemini-2.5-pro",
messages=[
{"role": "user", "content": "Olá, por favor, apresente-se."}
]
)
print(response.choices[0].message.content)
💡 Dica: Recomendamos o uso da plataforma APIYI (apiyi.com) para desenvolvimento e testes. Ela oferece uma interface unificada para mais de 200 Modelos de Linguagem Grandes, com preços cerca de 80% mais baratos que os oficiais.
Opção 4: Criar múltiplos projetos no Google Cloud
Cenário de uso: Desenvolvedores com maior conhecimento técnico.
Como o limite é calculado por projeto, teoricamente é possível aumentar a cota total criando vários projetos:
import random
class MultiProjectClient:
"""Cliente de rodízio (round-robin) multi-projeto"""
def __init__(self, api_keys: list):
self.api_keys = api_keys
self.current_index = 0
def get_next_key(self):
"""Obtém a próxima API Key via rodízio"""
key = self.api_keys[self.current_index]
self.current_index = (self.current_index + 1) % len(self.api_keys)
return key
def call_api(self, prompt):
"""Chama a API usando a Key do rodízio"""
api_key = self.get_next_key()
# Use esta key para chamar a API do Gemini
pass
# Exemplo de uso
client = MultiProjectClient([
"key_do_projeto_1",
"key_do_projeto_2",
"key_do_projeto_3"
])
| Vantagens | Desvantagens |
|---|---|
| ✅ Aumenta a cota gratuitamente | ❌ Gestão complexa |
| ✅ Sem custos financeiros | ❌ Risco de violar os Termos de Serviço (ToS) |
| – | ❌ Risco de detecção e banimento pelo Google |
⚠️ Aviso de Risco: Este método pode violar os termos de serviço do Google e não é recomendado para ambientes de produção.
Opção 5: Otimizar a estratégia de requisições
Cenário de uso: Todos os desenvolvedores.
Mesmo com cota limitada, você pode maximizar o uso através de estratégias de otimização:
1. Implementar fila de requisições:
import asyncio
from collections import deque
class RateLimitedQueue:
"""Fila de requisições com limite de taxa"""
def __init__(self, rpm_limit=5):
self.rpm_limit = rpm_limit
self.queue = deque()
self.request_times = deque()
async def add_request(self, request_func):
"""Adiciona requisição à fila"""
self.queue.append(request_func)
await self._process_queue()
async def _process_queue(self):
"""Processa as requisições na fila"""
now = asyncio.get_event_loop().time()
# Limpa registros com mais de 60 segundos
while self.request_times and now - self.request_times[0] > 60:
self.request_times.popleft()
# Verifica se pode enviar a requisição
if len(self.request_times) < self.rpm_limit and self.queue:
request_func = self.queue.popleft()
self.request_times.append(now)
await request_func()
2. Processamento em lote (Batching):
def batch_prompts(prompts: list, batch_size: int = 5):
"""Combina múltiplos comandos em uma requisição em lote"""
combined_prompt = "\n\n---\n\n".join([
f"Pergunta {i+1}: {p}" for i, p in enumerate(prompts)
])
return combined_prompt
# Transforma 5 requisições independentes em 1
prompts = ["Pergunta 1", "Pergunta 2", "Pergunta 3", "Pergunta 4", "Pergunta 5"]
batch_prompt = batch_prompts(prompts)
# Consome apenas 1 unidade da cota de RPM
3. Cache de requisições repetidas:
import hashlib
import json
class ResponseCache:
"""Cache de respostas"""
def __init__(self):
self.cache = {}
def get_cache_key(self, prompt, model):
"""Gera uma chave de cache"""
content = f"{model}:{prompt}"
return hashlib.md5(content.encode()).hexdigest()
def get(self, prompt, model):
"""Recupera do cache"""
key = self.get_cache_key(prompt, model)
return self.cache.get(key)
def set(self, prompt, model, response):
"""Salva no cache"""
key = self.get_cache_key(prompt, model)
self.cache[key] = response
Comparativo de Planos de Limites do Google AI Studio
Considerando as 5 opções acima, aqui está um comparativo detalhado:
| Solução | Custo | Aumento de Cota | Dificuldade | Recomendação |
|---|---|---|---|---|
| Aguardar Reset | Grátis | Nenhum | ⭐ | ⭐⭐ |
| Upgrade Tier 1 | Pagamento por uso | 10-60x | ⭐⭐ | ⭐⭐⭐ |
| Intermediário APIYI | 80% de desconto | Sem limites | ⭐ | ⭐⭐⭐⭐⭐ |
| Rodízio de Projetos | Grátis | Multiplicado | ⭐⭐⭐⭐ | ⭐⭐ |
| Estratégias de Otimização | Grátis | Indireto | ⭐⭐⭐ | ⭐⭐⭐ |

🎯 Dica de Escolha: Para a maioria dos desenvolvedores, recomendamos o uso do APIYI (apiyi.com) como solução principal. A plataforma não só resolve o problema dos limites de cota, como também oferece uma vantagem de preço de 80% de desconto em relação ao oficial, além de suporte técnico simplificado.
Perguntas Frequentes (FAQ)
Q1: Por que continuo recebendo erro 429 após o upgrade para Tier 1?
Este é um problema conhecido do Google AI Studio. Alguns usuários relatam que, mesmo após vincular uma conta de pagamento, o sistema continua aplicando os limites da camada gratuita.
Como resolver:
- Acesse o AI Studio e confirme se todos os projetos foram atualizados.
- Gere uma nova API Key.
- Aguarde até 24 horas para que o sistema sincronize totalmente.
Se o problema persistir, sugerimos mudar para uma plataforma de terceiros como o APIYI (apiyi.com) para evitar dores de cabeça com cotas.
Q2: Quando a cota de RPD é resetada?
A cota de RPD (Requisições por Dia) do Google AI Studio é resetada à meia-noite no horário do Pacífico (PT), o que corresponde às 4h ou 5h da manhã no horário de Brasília, dependendo do horário de verão.
Q3: Por que o limite do Gemini 3 Pro Preview não é fixo?
Como um modelo em versão preview, os limites do Gemini 3 Pro Preview são ajustados dinamicamente com base em:
- Tempo de criação da conta
- Região de uso
- Histórico de utilização
- Carga nos servidores do Google
Q4: Como verificar meu uso atual de cota?
- Faça login no Google AI Studio.
- Vá para a página "API Keys".
- Verifique as estatísticas de uso na seção "Quota".
Q5: Quais modelos Gemini o APIYI suporta?
O APIYI suporta todos os principais modelos Gemini lançados pelo Google, incluindo:
- Gemini 2.5 Pro / Flash / Flash-Lite
- Gemini 3 Pro Preview
- Além de mais de 200 outros modelos de IA (Claude, GPT, Llama, etc.)
Visite apiyi.com para conferir a lista completa de modelos e preços em tempo real.
Q6: O rodízio de múltiplos projetos pode causar banimento?
Existe esse risco. Os termos de serviço do Google proíbem a criação de múltiplas contas para burlar restrições. Embora não existam relatos de banimentos em massa até o momento, não recomendamos este método para ambientes de produção.
Resumo
Após o Google AI Studio reduzir drasticamente as cotas gratuitas no final de 2025, os desenvolvedores passaram a enfrentar limites de RPM/RPD muito mais rigorosos. As 5 soluções apresentadas neste artigo têm seus prós e contras:
- Aguardar o reset da cota: Ideal para testes de aprendizado, mas a eficiência é muito baixa.
- Fazer upgrade para o Tier 1: O aumento na cota é significativo, mas exige um cartão de crédito internacional.
- Proxy da APIYI: Sem limites de cota, preços mais baixos e suporte a Alipay/WeChat, altamente recomendado.
- Rodízio de múltiplos projetos (Polling): Risco de banimento da conta, não recomendado.
- Otimizar estratégias de requisição: Vale a pena aprender e pode ser usado em conjunto com outras soluções.
Para desenvolvedores, recomendamos usar diretamente a plataforma APIYI (apiyi.com), uma solução completa para resolver os três grandes problemas: limites de cota, dificuldades de pagamento e acesso à rede.
📝 Autor: APIYI Team
🔗 Site oficial da APIYI: apiyi.com – Plataforma de proxy de API de Modelo de Linguagem Grande estável e confiável, com suporte a mais de 200 modelos e preços de apenas 20% do valor oficial.
