
¿Estás desarrollando un proyecto con Google AI Studio y de repente recibes el error 429 RESOURCE_EXHAUSTED? No estás solo: tras el drástico recorte de la cuota gratuita por parte de Google en diciembre de 2025, miles de proyectos de desarrolladores en todo el mundo se detuvieron de la noche a la mañana.
En este artículo, analizaremos en detalle el mecanismo de límites de Google AI Studio y te ofreceremos 5 soluciones probadas para que recuperes el ritmo de tu desarrollo cuanto antes.
Explicación detallada de los límites de Google AI Studio
¿Qué son los límites de Google AI Studio?
Google AI Studio aplica restricciones multidimensionales a las llamadas de la API de Gemini, que incluyen principalmente:
| Dimensión del límite | Significado | Tiempo de reinicio |
|---|---|---|
| RPM (Requests Per Minute) | Solicitudes por minuto | Reinicio móvil cada minuto |
| RPD (Requests Per Day) | Solicitudes por día | Medianoche (hora del Pacífico) |
| TPM (Tokens Per Minute) | Tokens procesados por minuto | Reinicio móvil cada minuto |
| IPM (Images Per Minute) | Imágenes procesadas por minuto | Reinicio móvil cada minuto |
🔑 Información clave: Los límites se calculan por proyecto (Project), no por clave de API. Crear múltiples claves de API dentro del mismo proyecto no aumentará tu cuota.
Límites actuales de la cuota gratuita de Google AI Studio (2026)
El 7 de diciembre de 2025, Google redujo drásticamente la cuota del nivel gratuito de la API de Gemini (entre un 50% y un 92%). Aquí tienes los límites actuales por modelo:
| Modelo | Límite RPM | Límite RPD | Límite TPM |
|---|---|---|---|
| Gemini 2.5 Pro | 5 | 100 | 250,000 |
| Gemini 2.5 Flash | 10 | 250 | 250,000 |
| Gemini 2.5 Flash-Lite | 15 | 1,000 | 250,000 |
| Gemini 3 Pro Preview | 10-50* | 100+* | 250,000 |
*Los límites de Gemini 3 Pro Preview se ajustan dinámicamente según la antigüedad de la cuenta y la región.

¿Por qué se activa el error 429 en Google AI Studio?
El error 429 se activa cuando se supera cualquiera de las dimensiones de límite. Escenarios comunes:
- RPM excedido: Se envían demasiadas solicitudes en un corto periodo de tiempo.
- RPD agotado: El total de solicitudes diarias ha alcanzado su tope.
- TPM excedido: Los tokens de una sola solicitud son demasiado largos o hay demasiadas solicitudes simultáneas.
- Estado de cuenta anómalo: Incluso tras subir al Tier 1, algunos usuarios reportan seguir bajo las restricciones del nivel gratuito.
# Respuesta típica de error 429
{
"error": {
"code": 429,
"message": "You exceeded your current quota, please check your plan and billing details.",
"status": "RESOURCE_EXHAUSTED"
}
}
5 formas de solucionar los límites de Google AI Studio
Opción 1: Esperar al restablecimiento de la cuota (Gratis pero lento)
Escenario de uso: Pruebas ligeras, proyectos no urgentes.
Reglas de restablecimiento de cuota de Google AI Studio:
- RPM/TPM: Se restablece automáticamente en una ventana deslizante de 60 segundos.
- RPD: Se restablece a la medianoche, hora del Pacífico (4:00 PM hora de Beijing).
Implementación de reintentos con retroceso exponencial:
import time
import random
def call_with_retry(func, max_retries=5):
"""带指数退避的重试机制"""
for attempt in range(max_retries):
try:
return func()
except Exception as e:
if "429" in str(e):
wait_time = (2 ** attempt) + random.uniform(0, 1)
print(f"配额超限,等待 {wait_time:.1f} 秒后重试...")
time.sleep(wait_time)
else:
raise
raise Exception("重试次数耗尽")
| Ventajas | Desventajas |
|---|---|
| ✅ Completamente gratis | ❌ Requiere esperar varias horas |
| ✅ Sin necesidad de configuración | ❌ La cuota sigue siendo muy baja |
| ✅ Ideal para aprendizaje y pruebas | ❌ No apto para desarrollo formal |
Opción 2: Actualizar al nivel de pago Tier 1
Escenario de uso: Desarrolladores con tarjeta de crédito internacional.
Aumento de cuota tras actualizar a Tier 1:
| Indicador | Nivel Gratuito | Tier 1 |
|---|---|---|
| RPM | 5-15 | 150-300 |
| RPD | 100-1000 | Básicamente sin límite |
| Tiempo de activación | – | Inmediato |
Pasos para la actualización:
- Accede a la consola de Google AI Studio.
- Ve a la página de "API Keys".
- Haz clic en el botón "Set up Billing".
- Vincula una cuenta de facturación de Google Cloud.
- Selecciona el plan Tier 1.
Referencia de precios de Tier 1:
- Gemini 2.5 Flash: $0.075 / millón de tokens de entrada.
- Gemini 2.5 Pro: $1.25 / millón de tokens de entrada.
- Generación de imágenes 4K: $0.24 / imagen.
| Ventajas | Desventajas |
|---|---|
| ✅ RPM aumentado a 150-300 | ❌ Requiere tarjeta de crédito internacional |
| ✅ Límite de RPD básicamente eliminado | ❌ Algunos modelos aún tienen restricciones |
| ✅ Activación inmediata | ❌ Dificultad para vincular tarjetas desde China continental |
Opción 3: Usar el servicio intermediario de APIYI (Recomendado)
Escenario de uso: Todos los desarrolladores, especialmente usuarios en China continental.
🎯 Solución recomendada: Llama a la API de Gemini a través de la plataforma APIYI (apiyi.com). No te preocupes por los límites de cuota y admite pagos mediante Alipay/WeChat.
Comparativa de ventajas de APIYI:
| Ítem de comparación | Google Oficial | APIYI |
|---|---|---|
| Límite de RPM | 5-300 | Sin límites |
| Límite de RPD | 100-Ilimitado | Sin límites |
| Precio imagen 4K | $0.24/ud. | $0.05/ud. |
| Método de pago | Tarjeta internacional | Alipay/WeChat |
| Disponible en China | Requiere proxy | Acceso directo |
| Soporte técnico | Inglés | Chino |

Código de acceso rápido:
import openai
# APIYI 接入配置
client = openai.OpenAI(
api_key="your-apiyi-key", # 在 api.apiyi.com 获取
base_url="https://api.apiyi.com/v1"
)
# 调用 Gemini 模型
response = client.chat.completions.create(
model="gemini-2.5-pro",
messages=[
{"role": "user", "content": "你好,请介绍一下自己"}
]
)
print(response.choices[0].message.content)
💡 Sugerencia: Recomendamos utilizar la plataforma APIYI (apiyi.com) para el desarrollo y las pruebas. Esta plataforma admite una interfaz unificada para más de 200 Modelos de Lenguaje Grande populares, con precios que rondan el 20% de los oficiales.
Opción 4: Crear múltiples proyectos en Google Cloud
Escenario de uso: Desarrolladores con sólidas capacidades técnicas.
Dado que los límites se calculan por proyecto, teóricamente puedes aumentar tu cuota total creando múltiples proyectos:
import random
class MultiProjectClient:
"""多项目轮询客户端"""
def __init__(self, api_keys: list):
self.api_keys = api_keys
self.current_index = 0
def get_next_key(self):
"""轮询获取下一个 API Key"""
key = self.api_keys[self.current_index]
self.current_index = (self.current_index + 1) % len(self.api_keys)
return key
def call_api(self, prompt):
"""使用轮询的 Key 调用 API"""
api_key = self.get_next_key()
# 使用该 key 调用 Gemini API
pass
# 使用示例
client = MultiProjectClient([
"key_from_project_1",
"key_from_project_2",
"key_from_project_3"
])
| Ventajas | Desventajas |
|---|---|
| ✅ Aumenta la cuota gratis | ❌ Gestión compleja |
| ✅ Sin necesidad de pago | ❌ Riesgo de violar los Términos de Servicio (ToS) |
| – | ❌ Posibilidad de detección y baneo por parte de Google |
⚠️ Advertencia de riesgo: Este método conlleva el riesgo de violar los términos de servicio de Google y no se recomienda para entornos de producción.
Opción 5: Optimizar la estrategia de peticiones
Escenario de uso: Todos los desarrolladores.
Incluso con una cuota limitada, puedes maximizar su uso mediante estrategias de optimización:
1. Implementar una cola de peticiones:
import asyncio
from collections import deque
class RateLimitedQueue:
"""限速请求队列"""
def __init__(self, rpm_limit=5):
self.rpm_limit = rpm_limit
self.queue = deque()
self.request_times = deque()
async def add_request(self, request_func):
"""添加请求到队列"""
self.queue.append(request_func)
await self._process_queue()
async def _process_queue(self):
"""处理队列中的请求"""
now = asyncio.get_event_loop().time()
# 清理超过 60 秒的记录
while self.request_times and now - self.request_times[0] > 60:
self.request_times.popleft()
# 检查是否可以发送请求
if len(self.request_times) < self.rpm_limit and self.queue:
request_func = self.queue.popleft()
self.request_times.append(now)
await request_func()
2. Procesamiento por lotes de peticiones:
def batch_prompts(prompts: list, batch_size: int = 5):
"""将多个提示合并为批量请求"""
combined_prompt = "\n\n---\n\n".join([
f"问题 {i+1}: {p}" for i, p in enumerate(prompts)
])
return combined_prompt
# 将 5 个独立请求合并为 1 个
prompts = ["问题1", "问题2", "问题3", "问题4", "问题5"]
batch_prompt = batch_prompts(prompts)
# 只消耗 1 次 RPM 配额
3. Almacenar en caché peticiones repetidas:
import hashlib
import json
class ResponseCache:
"""响应缓存"""
def __init__(self):
self.cache = {}
def get_cache_key(self, prompt, model):
"""生成缓存键"""
content = f"{model}:{prompt}"
return hashlib.md5(content.encode()).hexdigest()
def get(self, prompt, model):
"""获取缓存"""
key = self.get_cache_key(prompt, model)
return self.cache.get(key)
def set(self, prompt, model, response):
"""设置缓存"""
key = self.get_cache_key(prompt, model)
self.cache[key] = response
Comparativa de soluciones para los límites de Google AI Studio
Combinando las 5 opciones anteriores, aquí tienes una comparativa detallada:
| Plan | Costo | Aumento de cuota | Dificultad | Recomendación |
|---|---|---|---|---|
| Esperar reinicio | Gratis | Ninguno | ⭐ | ⭐⭐ |
| Subir a Tier 1 | Pago por uso | 10-60 veces | ⭐⭐ | ⭐⭐⭐ |
| Intermediario APIYI | 20% del precio oficial | Ilimitado | ⭐ | ⭐⭐⭐⭐⭐ |
| Rotación de proyectos | Gratis | Multiplicado por proyectos | ⭐⭐⭐⭐ | ⭐⭐ |
| Estrategias de optimización | Gratis | Mejora indirecta | ⭐⭐⭐ | ⭐⭐⭐ |
🎯 Sugerencia de elección: Para la mayoría de los desarrolladores, recomendamos usar APIYI (apiyi.com) como solución principal. Esta plataforma no solo resuelve las restricciones de cuota, sino que también ofrece la ventaja de un precio al 20% del oficial y soporte técnico en chino.
Preguntas frecuentes (FAQ)
Q1: ¿Por qué sigo recibiendo el error 429 tras subir a Tier 1?
Este es un problema conocido de Google AI Studio. Algunos usuarios informan que, incluso después de vincular una cuenta de pago, el sistema sigue aplicando los límites de la capa gratuita.
Solución:
- Entra en AI Studio y confirma que todos los proyectos han sido actualizados.
- Genera una nueva API Key.
- Espera 24 horas para que el sistema se sincronice por completo.
Si el problema persiste, te sugerimos cambiar a una plataforma de terceros como APIYI (apiyi.com) para evitar dolores de cabeza con las cuotas.
Q2: ¿A qué hora se reinicia la cuota RPD?
La cuota RPD (solicitudes por día) de Google AI Studio se reinicia a la medianoche, hora del Pacífico (PT). Esto corresponde a las 4:00 PM en Beijing (horario de verano) o 3:00 PM (horario de invierno).
Q3: ¿Por qué los límites de Gemini 3 Pro Preview no son fijos?
Al ser un modelo en versión preliminar (Preview), los límites de Gemini 3 Pro Preview se ajustan dinámicamente según:
- Antigüedad de la cuenta.
- Región de uso.
- Historial de uso.
- Carga de los servidores de Google.
Q4: ¿Cómo puedo ver mi consumo de cuota actual?
- Inicia sesión en Google AI Studio.
- Ve a la página de "API Keys".
- Revisa las estadísticas de uso en la sección "Quota".
Q5: ¿Qué modelos de Gemini admite APIYI?
APIYI admite todos los modelos principales de Gemini lanzados por Google, incluyendo:
- Gemini 2.5 Pro / Flash / Flash-Lite
- Gemini 3 Pro Preview
- Y más de 200 otros modelos de IA (Claude, GPT, Llama, etc.)
Visita apiyi.com para ver la lista completa de modelos y precios en tiempo real.
Q6: ¿Puede Google banearme por usar rotación de múltiples proyectos?
Existe un riesgo. Los términos de servicio de Google prohíben la creación de múltiples cuentas para eludir las restricciones. Aunque no hay informes de baneos masivos por ahora, no se recomienda este método para entornos de producción.
Resumen
Tras el drástico recorte de las cuotas gratuitas de Google AI Studio a finales de 2025, los desarrolladores se enfrentan a límites de RPM/RPD mucho más estrictos. Las 5 soluciones presentadas en este artículo tienen sus ventajas y desventajas:
- Esperar al restablecimiento de la cuota: Ideal para pruebas de aprendizaje, pero la eficiencia es demasiado baja.
- Subir al Tier 1: El aumento de la cuota es notable, pero requiere una tarjeta de crédito internacional.
- Proxy de APIYI: Sin límites de cuota, precios más bajos y soporte para Alipay/WeChat. Es la opción recomendada.
- Rotación de múltiples proyectos: Existe riesgo de baneo, por lo que no se recomienda.
- Optimizar la estrategia de peticiones: Una técnica que vale la pena aprender y que se puede combinar con otras soluciones.
Para los desarrolladores, recomendamos utilizar directamente la plataforma APIYI (apiyi.com), una solución integral para resolver los tres grandes problemas: límites de cuota, dificultades de pago y acceso a la red.
📝 Autor: APIYI Team
🔗 Sitio oficial de APIYI: apiyi.com – Plataforma proxy de API de Modelos de Lenguaje Grande estable y confiable, con soporte para más de 200 modelos y precios hasta un 80% más bajos que los oficiales.
