Note de l'auteur : Cet article fait le point sur la série de réductions de quotas imposées par Google Antigravity (AI Studio) entre fin 2025 et mars 2026. Nous analysons la baisse de 92 % du quota gratuit, l'introduction du système de crédits, les limitations imposées aux utilisateurs Ultra et les stratégies de réponse pour les développeurs.
Si vous avez l'impression que Google Antigravity (Google AI Studio) devient de plus en plus "lent" ou capricieux ces derniers temps, ce n'est pas un problème de connexion — c'est Google qui réduit massivement les quotas. Entre la chute de 92 % du RPD (requêtes par jour) sur le niveau gratuit en décembre 2025 et l'introduction du système de crédits (AI Credits) en mars 2026, sans oublier les limitations imposées aux utilisateurs Ultra sans préavis, les forums de développeurs Google AI sont devenus un véritable champ de bataille. Cet article retrace la chronologie de ces changements, leur impact concret et les solutions pour les développeurs.
Valeur ajoutée : Comprenez la dynamique derrière les réductions de quotas d'Antigravity, déterminez si votre niveau d'utilisation est affecté et trouvez des alternatives.

Chronologie complète des réductions de quotas d'Antigravity
Voici un récapitulatif des changements de politique par ordre chronologique.
| Date | Événement | Niveau d'impact | Réaction des développeurs |
|---|---|---|---|
| 07.12.2025 | Le RPD du niveau gratuit chute de 250 à 20 (-92 %) | Utilisateurs gratuits | 210+ commentaires sur Reddit, plantages en production |
| Déc. 2025 | Le RPM du niveau gratuit passe de 10 à 5 (-50 %) | Utilisateurs gratuits | Erreurs 429 fréquentes, intégration Home Assistant HS |
| Fév. 2026 | RPD de Flash Image partiellement rétabli à ~500 | Utilisateurs gratuits | Légère amélioration, sans retour au niveau initial |
| Fév. 2026 | Quota d'images Nano Banana Pro réduit à 20/jour | Utilisateurs gratuits | Génération d'images gravement impactée |
| 11.03.2026 | Introduction du système de crédits AI (25 $/2500 crédits) | Tous les utilisateurs | Protestations relayées par The Register et DevClass |
| 11.03.2026 | Le rafraîchissement des 5h pour les Pro remis en cause | Utilisateurs Pro | Plaintes massives sur les forums : "promesses non tenues" |
| 12.03.2026 | Blocages de quotas sur plusieurs jours pour les Pro | Utilisateurs Pro | PiunikaWeb rapporte des "verrouillages hebdomadaires" |
| 18.03.2026+ | Les utilisateurs Ultra subissent soudainement des limites | Utilisateurs Ultra | Demandes d'explications officielles, "réduction drastique" |
Impacts détaillés des réductions de quotas
Première vague : Décembre 2025 — Chute de 92 % du niveau gratuit
C'est la plus destructrice. Le 7 décembre 2025, Google a réduit drastiquement les quotas du niveau gratuit sans aucun préavis :
| Modèle | RPD avant changement | RPD après changement | Baisse |
|---|---|---|---|
| Gemini 2.5 Flash | ~250 | 20 | -92 % |
| Gemini 2.0 Flash | ~250 | 20-50 | -80 %+ |
| Autres modèles gratuits | Variable | Réduction massive | -50 % ~ 92 % |
Le RPM (requêtes par minute) a également été ajusté : de 10 RPM à 5 RPM.
Impact direct :
- De nombreuses applications en production basées sur l'API gratuite de Gemini ont planté du jour au lendemain.
- L'intégration domotique Home Assistant est devenue inutilisable à cause des erreurs 429 répétées.
- Projets prototypes et développeurs indépendants contraints à l'arrêt ou à la migration.
- Plus de 210 commentaires sur le subreddit r/GeminiAI, majoritairement de développeurs en colère.
Explication de Google : "Pour garantir une qualité de service durable" — mais la communauté n'est pas convaincue, faute de communication préalable.
Deuxième vague : Mars 2026 — Introduction du système de crédits
Le 11 mars 2026, Google a annoncé une "mise à jour du programme AI", introduisant les crédits AI (AI Credits) :
| Changement | Détails |
|---|---|
| Tarification | 25 $ pour 2 500 crédits |
| Utilisateurs Pro | Inclut des crédits intégrés, achat nécessaire au-delà |
| Utilisateurs Ultra | Inclut plus de crédits, avec la promesse des "limites les plus généreuses" |
| Mécanisme de rafraîchissement | Annoncé comme "toutes les 5 heures", mais les utilisateurs constatent un cycle hebdomadaire |
Le cœur du mécontentement des développeurs :
- Promesse des "5 heures" non tenue : De nombreux utilisateurs Pro rapportent qu'une fois le quota épuisé, il faut attendre une semaine pour le rétablissement, et non 5 heures. "Au-delà des modèles les moins chers, la règle des 5 heures semble être un mythe."
- Crédits insuffisants : 25 $ pour 2 500 crédits, mais une conversation approfondie peut en consommer des centaines, faisant grimper les coûts rapidement en cas d'usage intensif.
- Consommation fantôme : Certains utilisateurs signalent : "Je n'ai pas utilisé Antigravity depuis deux jours, mais mon quota pour Gemini 3.1 Pro est déjà épuisé."
Troisième vague : Mi-mars 2026 — Les Ultra également limités
C'est ce qui a le plus exaspéré la communauté : les utilisateurs payants du niveau le plus élevé ont aussi vu leurs quotas réduits.
Le titre d'un sujet sur le forum était sans équivoque : "[Ultra] Dramatic quota reduction after update — this needs an official explanation"
| Plainte | Détails |
|---|---|
| Limites soudaines | Les utilisateurs Ultra se sont réveillés avec des accès restreints |
| Aucun préavis | Comme pour le niveau gratuit, aucune alerte préalable |
| Tous les modèles impactés | Pas seulement les modèles Pro, mais aussi Claude Sonnet et Opus (via Antigravity) |
| Blocages prolongés | Certains utilisateurs ont été bloqués pendant plusieurs jours |
🎯 Problème fondamental : La stratégie de Google semble être : "Attirer les développeurs avec des quotas élevés → Une fois l'écosystème installé, réduire les quotas pour forcer le paiement → Continuer à réduire même après le paiement". Cela a créé une crise de confiance : les développeurs craignent que les quotas d'aujourd'hui ne disparaissent demain, les dissuadant de construire des dépendances à long terme sur Antigravity.
Si votre activité nécessite des quotas stables pour l'API Gemini, le service proxy API APIYI (apiyi.com) permet de contourner les limites par compte.

Les critiques récurrentes sur les forums de développeurs
Voici un condensé des voix représentatives recueillies sur les forums de développeurs Google AI, Reddit et The Register :
| Source | Contenu de la critique | Revendication principale |
|---|---|---|
| Forum | "Le quota du plan Ultra a été drastiquement réduit du jour au lendemain — nous exigeons une explication officielle" | Les utilisateurs payants méritent une garantie de quota stable |
| Forum | "J'ai souscrit à l'offre Ultra la plus élevée, mais tous les modèles indiquent un quota épuisé à 100 %" | Payer le prix fort sans obtenir le service correspondant |
| "Je n'ai pas utilisé Antigravity depuis deux jours, pourtant le quota de Gemini 3.1 Pro s'affiche comme épuisé" | Logique de facturation défaillante ou présence de bugs | |
| "Les quotas de Claude Sonnet et Opus s'épuisent aussi mystérieusement, alors que je les utilise rarement" | Les quotas entre différents modèles semblent s'influencer mutuellement | |
| The Register | "Les utilisateurs protestent contre la hausse des prix d'Antigravity chez Google" | Le système de crédit est une hausse de prix déguisée |
| DevClass | "Les utilisateurs protestent contre la fluctuation à la hausse des prix d'Antigravity" | Manque de transparence tarifaire, impossibilité de prédire les coûts |
| PiunikaWeb | "Certains utilisateurs Pro font face à des blocages de quota pendant plusieurs jours" | Impossibilité totale de travailler pendant la période de blocage |
Pourquoi Google réduit-il les quotas ?
La raison officielle : contrôle des coûts
La version officielle de Google évoque la nécessité de "garantir une qualité de service durable" et de "répondre à une croissance de la demande dépassant les prévisions".
Cependant, des raisons plus profondes sont en jeu :
| Raison | Analyse |
|---|---|
| Tension sur la puissance GPU | La demande a explosé après la sortie des modèles de la série Gemini 3, et les utilisateurs gratuits consomment énormément de ressources GPU |
| Abus massifs | Google cite la "fraude et les abus" comme l'une des causes principales de ces réductions |
| Pression commerciale | Nécessité de convertir les utilisateurs gratuits en payants ; le système de crédit IA est un outil de monétisation |
| La leçon de Sora | OpenAI a prouvé avec Sora que les coûts de calcul pour des services IA gratuits ou à bas prix ne sont pas viables |
| Stratégie concurrentielle | Établir un écosystème via des quotas gratuits, puis resserrer progressivement pour migrer vers le payant |
Le problème n'est pas "si", mais "comment"
La colère de la communauté ne vient pas du fait que Google commence à faire payer — les développeurs comprennent que la puissance de calcul IA n'est pas gratuite. La frustration vient de :
- L'absence de préavis : Les règles changent "du jour au lendemain", ce qui fait planter les environnements de production.
- Les promesses non tenues : Le "rafraîchissement toutes les 5 heures" promis se transforme en réalité en une fréquence hebdomadaire.
- La limitation des utilisateurs payants : Payer pour le niveau le plus élevé et subir quand même des restrictions.
- L'opacité des limites : La documentation précise que les "limites de débit spécifiées ne sont pas garanties" — ce qui revient à ne rien garantir du tout.
Astuce : Si votre activité dépend de l'API Gemini et que vous souhaitez éviter d'être constamment impacté par les politiques de quotas de Google, passer par le service proxy API d'APIYI (apiyi.com) est la solution la plus fiable. Vous bénéficiez d'un pool de comptes multiples non soumis aux limites individuelles, avec en prime une réduction de 28 %.
Solutions pour les développeurs

FAQ
Q1 : Google va-t-il continuer à réduire les quotas ?
C'est fort probable. La politique de quotas gratuits d'AI Studio de Google ne cesse de se durcir, et la documentation officielle précise explicitement que les « limites de débit spécifiées ne sont pas garanties ». La tendance montre que le niveau gratuit devient de plus en plus restreint et que le « rapport qualité-prix » des niveaux payants continue de baisser. Si votre activité dépend de l'API Gemini, ne misez pas sur la stabilité des promesses de Google : passez par le service proxy API d'APIYI (apiyi.com) et utilisez un mécanisme de pool multi-comptes pour masquer les fluctuations de quotas individuels.
Q2 : Si je souscris au plan Ultra, suis-je épargné ?
Non. Les événements de mars 2026 l'ont prouvé : les utilisateurs Ultra peuvent également subir des réductions de quotas du jour au lendemain, sans préavis. Le sujet sur le forum intitulé « Réduction drastique des quotas après mise à jour » a été publié par un utilisateur Ultra. Google promet simplement que le plan Ultra offre les « limites les plus élevées et les plus généreuses », mais ne garantit aucun chiffre précis ni aucune stabilité dans le temps.
Q3 : Les quotas pour les développeurs API et pour les utilisateurs finaux d’Antigravity sont-ils les mêmes ?
Pas exactement. Antigravity (le produit grand public de Google AI Studio) possède son propre système de quotas (crédits AI), tandis que l'API Gemini (interface développeur) dispose de son propre système de limites RPM/RPD/TPM. Cependant, les deux partagent les mêmes ressources GPU sous-jacentes. Les réductions de quotas sur Antigravity reflètent une tension globale sur la puissance de calcul de Google, ce qui impacte également le niveau API (par exemple, une augmentation du taux d'erreurs 503 sur les modèles Preview).
Q4 : Existe-t-il des alternatives non affectées par la politique d’Antigravity ?
Oui. 1) Utilisez le service proxy API d'APIYI (apiyi.com) pour invoquer l'API Gemini ; le pool multi-comptes permet de ne pas être impacté par les limites d'un seul compte. 2) Passez à Vertex AI (niveau entreprise, avec SLA, mais configuration complexe). 3) Utilisez des modèles alternatifs : Claude Opus 4.6 est numéro 1 sur les classements Texte et Code de l'Arena, et est accessible via APIYI avec 20 % de réduction. La solution la plus robuste est une architecture multi-modèles : Gemini comme moteur principal (via le proxy APIYI) et Claude/GPT en solution de secours.
Résumé
Les points clés de la réduction des quotas Antigravity de Google :
- 4 réductions de quotas en 4 mois : Décembre 2025, baisse de 92 % du niveau gratuit → Février 2026, durcissement des quotas d'images → Mars 2026, introduction du système de crédits → Même les utilisateurs Ultra sont limités. À chaque fois, sans aucun préavis.
- Le problème central est la confiance : Les développeurs ne craignent pas de payer, ils craignent que « le quota accordé aujourd'hui soit retiré demain ». La mention dans la documentation indiquant que les « limites ne sont pas garanties » équivaut à une absence totale d'engagement.
- Stratégies de réponse : L'utilisation d'une plateforme de proxy API (APIYI, avec son pool multi-comptes pour contourner les limites) combinée à une stratégie de secours multi-modèles (Gemini + Claude + GPT) constitue la combinaison la plus fiable.
Nous vous recommandons d'accéder à l'API Gemini via APIYI (apiyi.com) : vous ne serez pas affecté par les limites d'Antigravity, vous bénéficierez d'une réduction de 28 %, aucune facturation en cas d'échec, et vous profiterez d'un support pour Claude et GPT comme solutions de secours.
📚 Références
-
The Register : Les utilisateurs protestent contre la hausse des prix de Google Antigravity : Protestations de la communauté suite au système de crédit
- Lien :
theregister.com/2026/03/12/users_protest_as_google_antigravity/ - Description : Détails sur la tarification au crédit et les réactions des développeurs
- Lien :
-
Forum des développeurs Google AI : Réduction drastique des quotas Ultra : Fil de discussion des plaintes des utilisateurs Ultra
- Lien :
discuss.ai.google.dev/t/ultra-dramatic-quota-reduction-after-update-this-needs-an-official-explanation/135526 - Description : Les quotas des utilisateurs haut de gamme réduits du jour au lendemain
- Lien :
-
Documentation officielle des limites de débit de l'API Gemini : Explications sur les limites actuelles
- Lien :
ai.google.dev/gemini-api/docs/rate-limits - Description : Attention à la clause de non-responsabilité indiquant que les "limites de débit spécifiées ne sont pas garanties"
- Lien :
-
Centre de documentation APIYI : Accès à l'API Gemini sans subir les limites d'Antigravity
- Lien :
docs.apiyi.com - Description : Contournement des limites grâce au pool multi-comptes + 28 % de réduction + pas de facturation en cas d'échec
- Lien :
Auteur : Équipe technique APIYI
Échanges techniques : N'hésitez pas à discuter dans les commentaires. Pour plus d'informations, consultez le centre de documentation APIYI sur docs.apiyi.com.
