
正在使用 Google AI Studio 開發項目,突然收到 429 RESOURCE_EXHAUSTED 錯誤?你不是一個人 – 2025 年 12 月 Google 大幅削減免費配額後,全球數以萬計的開發者項目一夜之間陷入停滯。
本文將詳細解析 Google AI Studio 限額機制,並提供 5 種經過驗證的解決方案,幫助你快速恢復開發進度。
Google AI Studio 限額機制詳解
什麼是 Google AI Studio 限額
Google AI Studio 對 Gemini API 的調用實施多維度限制,主要包括:
| 限制維度 | 含義 | 重置時間 |
|---|---|---|
| RPM (Requests Per Minute) | 每分鐘請求次數 | 每分鐘滾動重置 |
| RPD (Requests Per Day) | 每日請求次數 | 太平洋時間午夜重置 |
| TPM (Tokens Per Minute) | 每分鐘處理 Token 數 | 每分鐘滾動重置 |
| IPM (Images Per Minute) | 每分鐘圖片處理數 | 每分鐘滾動重置 |
🔑 關鍵信息: 限額是按項目 (Project) 計算的,不是按 API Key。創建多個 API Key 並不能增加配額。
2026 年最新 Google AI Studio 免費配額限制
2025 年 12 月 7 日,Google 對 Gemini API 免費層配額進行了大幅削減(50%-92%),以下是當前各模型的限額:
| 模型 | RPM 限制 | RPD 限制 | TPM 限制 |
|---|---|---|---|
| Gemini 2.5 Pro | 5 | 100 | 250,000 |
| Gemini 2.5 Flash | 10 | 250 | 250,000 |
| Gemini 2.5 Flash-Lite | 15 | 1,000 | 250,000 |
| Gemini 3 Pro Preview | 10-50* | 100+* | 250,000 |
*Gemini 3 Pro Preview 的限額會根據賬戶年齡和地區動態調整

爲什麼會觸發 Google AI Studio 429 錯誤
429 錯誤的觸發條件是任意一個維度超限。常見場景:
- RPM 超限: 短時間內發送過多請求
- RPD 耗盡: 當日請求總數達到上限
- TPM 超限: 單次請求 Token 過長或併發請求過多
- 賬戶狀態異常: 即使升級 Tier 1,部分用戶仍報告遭遇免費層限制
# 典型的 429 錯誤響應
{
"error": {
"code": 429,
"message": "You exceeded your current quota, please check your plan and billing details.",
"status": "RESOURCE_EXHAUSTED"
}
}
解決 Google AI Studio 限額的 5 種方法
方案一:等待配額重置(免費但耗時)
適用場景: 輕度測試、非緊急項目
Google AI Studio 的配額重置規則:
- RPM/TPM: 60 秒滾動窗口自動重置
- RPD: 太平洋時間午夜(北京時間下午 4 點)重置
實現指數退避重試:
import time
import random
def call_with_retry(func, max_retries=5):
"""帶指數退避的重試機制"""
for attempt in range(max_retries):
try:
return func()
except Exception as e:
if "429" in str(e):
wait_time = (2 ** attempt) + random.uniform(0, 1)
print(f"配額超限,等待 {wait_time:.1f} 秒後重試...")
time.sleep(wait_time)
else:
raise
raise Exception("重試次數耗盡")
| 優點 | 缺點 |
|---|---|
| ✅ 完全免費 | ❌ 需要等待數小時 |
| ✅ 無需配置 | ❌ 配額依然很少 |
| ✅ 適合學習測試 | ❌ 不適合正式開發 |
方案二:升級 Tier 1 付費層
適用場景: 有國際信用卡的開發者
升級到 Tier 1 後的配額提升:
| 指標 | 免費層 | Tier 1 |
|---|---|---|
| RPM | 5-15 | 150-300 |
| RPD | 100-1000 | 基本無限制 |
| 生效時間 | – | 即時 |
升級步驟:
- 訪問 Google AI Studio 控制檯
- 進入 API Keys 頁面
- 點擊 "Set up Billing" 按鈕
- 綁定 Google Cloud 賬單賬戶
- 選擇 Tier 1 計劃
Tier 1 定價參考:
- Gemini 2.5 Flash: $0.075/百萬輸入 Token
- Gemini 2.5 Pro: $1.25/百萬輸入 Token
- 4K 圖片生成: $0.24/張
| 優點 | 缺點 |
|---|---|
| ✅ RPM 提升到 150-300 | ❌ 需要國際信用卡 |
| ✅ RPD 限制基本解除 | ❌ 部分模型仍有限制 |
| ✅ 即時生效 | ❌ 中國大陸綁卡困難 |
方案三:使用 API易 中轉服務(推薦)
適用場景: 所有開發者,尤其是中國大陸用戶
🎯 推薦方案: 通過 API易 apiyi.com 平臺調用 Gemini API,無需擔心配額限制,支持支付寶/微信付款。
API易 優勢對比:
| 對比項 | Google 官方 | API易 |
|---|---|---|
| RPM 限制 | 5-300 | 無限制 |
| RPD 限制 | 100-無限 | 無限制 |
| 4K 圖片價格 | $0.24/張 | $0.05/張 |
| 支付方式 | 國際信用卡 | 支付寶/微信 |
| 中國大陸可用 | 需要代理 | 直接訪問 |
| 技術支持 | 英文 | 中文 |

快速接入代碼:
import openai
# API易 接入配置
client = openai.OpenAI(
api_key="your-apiyi-key", # 在 api.apiyi.com 獲取
base_url="https://api.apiyi.com/v1"
)
# 調用 Gemini 模型
response = client.chat.completions.create(
model="gemini-2.5-pro",
messages=[
{"role": "user", "content": "你好,請介紹一下自己"}
]
)
print(response.choices[0].message.content)
💡 建議: 我們建議通過 API易 apiyi.com 平臺進行開發測試,該平臺支持 200+ 主流 AI 模型的統一接口調用,價格僅爲官方的 2 折左右。
方案四:創建多個 Google Cloud 項目
適用場景: 技術能力較強的開發者
由於限額是按項目計算,理論上可以通過創建多個項目來增加總配額:
import random
class MultiProjectClient:
"""多項目輪詢客戶端"""
def __init__(self, api_keys: list):
self.api_keys = api_keys
self.current_index = 0
def get_next_key(self):
"""輪詢獲取下一個 API Key"""
key = self.api_keys[self.current_index]
self.current_index = (self.current_index + 1) % len(self.api_keys)
return key
def call_api(self, prompt):
"""使用輪詢的 Key 調用 API"""
api_key = self.get_next_key()
# 使用該 key 調用 Gemini API
pass
# 使用示例
client = MultiProjectClient([
"key_from_project_1",
"key_from_project_2",
"key_from_project_3"
])
| 優點 | 缺點 |
|---|---|
| ✅ 免費增加配額 | ❌ 管理複雜 |
| ✅ 無需付費 | ❌ 違反 ToS 風險 |
| – | ❌ 可能被 Google 檢測封禁 |
⚠️ 風險提示: 此方法存在違反 Google 服務條款的風險,不建議用於生產環境。
方案五:優化請求策略
適用場景: 所有開發者
即使配額有限,通過優化策略也能最大化利用:
1. 實現請求隊列:
import asyncio
from collections import deque
class RateLimitedQueue:
"""限速請求隊列"""
def __init__(self, rpm_limit=5):
self.rpm_limit = rpm_limit
self.queue = deque()
self.request_times = deque()
async def add_request(self, request_func):
"""添加請求到隊列"""
self.queue.append(request_func)
await self._process_queue()
async def _process_queue(self):
"""處理隊列中的請求"""
now = asyncio.get_event_loop().time()
# 清理超過 60 秒的記錄
while self.request_times and now - self.request_times[0] > 60:
self.request_times.popleft()
# 檢查是否可以發送請求
if len(self.request_times) < self.rpm_limit and self.queue:
request_func = self.queue.popleft()
self.request_times.append(now)
await request_func()
2. 批量處理請求:
def batch_prompts(prompts: list, batch_size: int = 5):
"""將多個提示合併爲批量請求"""
combined_prompt = "\n\n---\n\n".join([
f"問題 {i+1}: {p}" for i, p in enumerate(prompts)
])
return combined_prompt
# 將 5 個獨立請求合併爲 1 個
prompts = ["問題1", "問題2", "問題3", "問題4", "問題5"]
batch_prompt = batch_prompts(prompts)
# 只消耗 1 次 RPM 配額
3. 緩存重複請求:
import hashlib
import json
class ResponseCache:
"""響應緩存"""
def __init__(self):
self.cache = {}
def get_cache_key(self, prompt, model):
"""生成緩存鍵"""
content = f"{model}:{prompt}"
return hashlib.md5(content.encode()).hexdigest()
def get(self, prompt, model):
"""獲取緩存"""
key = self.get_cache_key(prompt, model)
return self.cache.get(key)
def set(self, prompt, model, response):
"""設置緩存"""
key = self.get_cache_key(prompt, model)
self.cache[key] = response
Google AI Studio 限額方案對比
綜合以上 5 種方案,以下是詳細對比:
| 方案 | 成本 | 配額提升 | 實施難度 | 推薦指數 |
|---|---|---|---|---|
| 等待重置 | 免費 | 無 | ⭐ | ⭐⭐ |
| 升級 Tier 1 | 按量付費 | 10-60倍 | ⭐⭐ | ⭐⭐⭐ |
| API易中轉 | 官方2折 | 無限制 | ⭐ | ⭐⭐⭐⭐⭐ |
| 多項目輪詢 | 免費 | 項目數倍 | ⭐⭐⭐⭐ | ⭐⭐ |
| 優化策略 | 免費 | 間接提升 | ⭐⭐⭐ | ⭐⭐⭐ |

🎯 選擇建議: 對於大多數開發者,我們建議使用 API易 apiyi.com 作爲主要方案。該平臺不僅解決了配額限制問題,還提供官網 2 折的價格優勢和中文技術支持。
常見問題解答
Q1: 爲什麼升級 Tier 1 後還是報 429 錯誤?
這是 Google AI Studio 的已知問題。部分用戶報告即使綁定了付費賬戶,系統仍然按免費層限制計費。
解決方法:
- 進入 AI Studio,確認所有項目都已升級
- 重新生成 API Key
- 等待 24 小時讓系統同步
如果問題持續,建議切換到 API易 apiyi.com 等第三方平臺,避免配額困擾。
Q2: RPD 配額什麼時候重置?
Google AI Studio 的 RPD(每日請求數)在太平洋時間午夜重置,對應北京時間下午 4 點(夏令時)或下午 3 點(冬令時)。
Q3: Gemini 3 Pro Preview 的限額爲什麼不固定?
作爲預覽版模型,Gemini 3 Pro Preview 的限額會根據以下因素動態調整:
- 賬戶創建時間
- 使用地區
- 歷史使用情況
- Google 服務器負載
Q4: 如何查看當前配額使用情況?
- 登錄 Google AI Studio
- 進入 API Keys 頁面
- 查看 "Quota" 部分的使用量統計
Q5: API易 支持哪些 Gemini 模型?
API易 支持 Google 發佈的所有主流 Gemini 模型,包括:
- Gemini 2.5 Pro / Flash / Flash-Lite
- Gemini 3 Pro Preview
- 以及 200+ 其他 AI 模型(Claude、GPT、Llama 等)
訪問 apiyi.com 查看完整模型列表和實時價格。
Q6: 多項目輪詢會被 Google 封禁嗎?
存在風險。Google 的服務條款禁止通過創建多個賬戶來規避限制。雖然目前沒有大規模封禁報告,但不建議在生產環境使用此方法。
總結
Google AI Studio 在 2025 年底大幅削減免費配額後,開發者面臨着更嚴格的 RPM/RPD 限制。本文介紹的 5 種解決方案各有優劣:
- 等待配額重置: 適合學習測試,但效率太低
- 升級 Tier 1: 配額提升明顯,但需要國際信用卡
- API易中轉: 無配額限制、價格更低、支持支付寶/微信,推薦使用
- 多項目輪詢: 有封禁風險,不推薦
- 優化請求策略: 值得學習,可與其他方案配合使用
對於中國開發者,我們建議直接使用 API易 apiyi.com 平臺,一站式解決配額限制、支付困難和網絡訪問三大問題。
📝 作者: APIYI Team
🔗 API易官網: apiyi.com – 穩定可靠的 AI 大模型 API 中轉平臺,支持 200+ 模型,價格低至官方 2 折
