Anmerkung des Autors: Analyse der Serie von Kontingentkürzungen bei Google Antigravity (AI Studio) zwischen Ende 2025 und März 2026. Wir untersuchen die 92-prozentige Reduzierung der kostenlosen Kontingente, die Einführung eines Kreditsystems sowie die Einschränkungen für Ultra-Nutzer und zeigen Lösungswege für Entwickler auf.
Wenn Sie in letzter Zeit das Gefühl hatten, dass Google Antigravity (Google AI Studio) immer „langsamer“ wird, liegt das nicht an Ihrer Internetverbindung – Google kürzt massiv die Kontingente. Von einem Einbruch der RPD (Requests per Day) im kostenlosen Bereich um 92 % im Dezember 2025 bis hin zur Einführung eines Kreditsystems (AI Credits) im März 2026, bei dem selbst Ultra-Nutzer ohne Vorankündigung limitiert wurden, ist das Google AI-Entwicklerforum zu einem Ort des Frusts geworden. Dieser Artikel fasst die Chronologie dieser Richtlinienänderungen, deren konkrete Auswirkungen und die Strategien für Entwickler zusammen.
Kernnutzen: Verstehen Sie den vollständigen Verlauf der Kontingentkürzungen bei Antigravity, bewerten Sie, ob Ihr Nutzungsgrad betroffen ist, und finden Sie alternative Lösungen.

Vollständige Chronik der Antigravity-Kontingentkürzungen
Hier ist eine Übersicht aller bekannten politischen Änderungen, chronologisch sortiert.
| Datum | Ereignis | Auswirkung | Reaktion der Entwickler |
|---|---|---|---|
| 07.12.2025 | RPD für kostenlose Ebene von 250 auf 20 gesenkt (-92%) | Kostenlose Nutzer | 210+ Kommentare auf Reddit, Produktionsumgebungen ausgefallen |
| 12.2025 | RPM für kostenlose Ebene von 10 auf 5 gesenkt (-50%) | Kostenlose Nutzer | Häufige 429-Fehler, Home Assistant-Integration ausgefallen |
| 02.2026 | Flash Image RPD teilweise auf ~500 erhöht | Kostenlose Nutzer | Leichte Entspannung, aber nicht auf altem Niveau |
| 02.2026 | Nano Banana Pro Bildkontingent auf 20 Bilder/Tag begrenzt | Kostenlose Nutzer | Bilderzeugung stark beeinträchtigt |
| 11.03.2026 | Einführung des AI-Guthabensystems ($25/2500 Credits) | Alle Nutzer | Proteste in The Register und DevClass |
| 11.03.2026 | 5-Stunden-Reset für Pro-Nutzer angezweifelt (wöchentlich) | Pro-Nutzer | Massive Beschwerden im Forum über "gebrochene Versprechen" |
| 12.03.2026 | Pro-Nutzer erleben mehrtägige Kontingentsperren | Pro-Nutzer | PiunikaWeb berichtet über "wöchentliche Sperren" |
| Ab 18.03.2026 | Ultra-Nutzer über Nacht mit Limits belegt | Ultra-Nutzer | Forderung nach offizieller Erklärung, "dramatische Kontingentkürzung" |
Die konkreten Auswirkungen der jeweiligen Kürzungen
Erste Welle: Dezember 2025 – 92% Kürzung bei der kostenlosen Ebene
Dies war der zerstörerischste Einschnitt. Am 7. Dezember 2025 kürzte Google ohne Vorankündigung die Kontingente der kostenlosen Ebene drastisch:
| Modell | RPD vor Änderung | RPD nach Änderung | Rückgang |
|---|---|---|---|
| Gemini 2.5 Flash | ~250 | 20 | -92% |
| Gemini 2.0 Flash | ~250 | 20-50 | -80%+ |
| Andere kostenlose Modelle | Variabel | Drastisch reduziert | -50%~92% |
Auch die RPM (Anfragen pro Minute) wurden angepasst: Von 10 RPM auf 5 RPM gesenkt.
Direkte Auswirkungen:
- Zahlreiche produktive Anwendungen, die auf der kostenlosen Gemini-API basierten, brachen über Nacht zusammen.
- Die Home Assistant-Smart-Home-Integration fiel aufgrund häufiger 429-Fehler aus.
- Prototypen und Projekte privater Entwickler mussten eingestellt oder migriert werden.
- Über 210 Kommentare im Reddit-Subreddit r/GeminiAI, die überwiegend von verärgerten Entwicklern stammten.
Googles Erklärung: "Um eine nachhaltige Servicequalität zu gewährleisten" – die Community akzeptierte dies jedoch nicht, da es keine Vorwarnung gab.
Zweite Welle: März 2026 – Einführung des Guthabensystems
Am 11. März 2026 kündigte Google ein "AI-Plan-Upgrade" an und führte das AI-Guthabensystem (AI Credits) ein:
| Änderung | Details |
|---|---|
| Guthaben-Preise | $25 für 2.500 Credits |
| Pro-Nutzer | Enthalten ein gewisses Startguthaben, danach kostenpflichtig |
| Ultra-Nutzer | Enthalten mehr Startguthaben, versprochen wurden "die höchsten und großzügigsten Limits" |
| Reset-Mechanismus | Versprochen wurde ein "5-Stunden-Reset", Nutzer berichten jedoch von wöchentlichen Zyklen |
Die Kernkritik der Entwickler:
- "5-Stunden-Reset" nicht eingehalten: Mehrere Pro-Nutzer berichten, dass sie nach Verbrauch des Kontingents tatsächlich eine Woche warten müssen, statt der versprochenen 5 Stunden. "Außer bei den günstigsten Modellen scheint der 5-Stunden-Reset nicht mehr zu existieren."
- Guthaben reicht nicht aus: $25 für 2.500 Credits klingen gut, aber eine tiefgehende Konversation kann Hunderte Credits verbrauchen, was die Kosten bei intensiver Nutzung schnell in die Höhe treibt.
- Geisterverbrauch: Nutzer berichten: "Ich habe Antigravity zwei Tage lang nicht benutzt, aber das Kontingent für Gemini 3.1 Pro wird als aufgebraucht angezeigt."
Dritte Welle: Mitte März 2026 – Auch Ultra-Nutzer limitiert
Dies löste die größte Wut in der Community aus – selbst die zahlenden Premium-Nutzer wurden in ihren Kontingenten beschnitten.
Forentitel lauteten direkt: "[Ultra] Dramatische Kontingentkürzung nach Update – das erfordert eine offizielle Erklärung"
| Beschwerde | Details |
|---|---|
| Limitierung über Nacht | Ultra-Nutzer stellten morgens fest, dass ihre Modelle limitiert waren |
| Keine Vorankündigung | Wie bei der kostenlosen Ebene gab es keinerlei Warnung |
| Alle Modelle betroffen | Nicht nur Pro-Modelle, auch Claude Sonnet und Opus (via Antigravity) zeigten ein aufgebrauchtes Kontingent |
| Mehrtägige Sperren | Einige Nutzer waren tagelang von der Nutzung ausgeschlossen |
🎯 Kernproblem: Googles Strategie scheint zu lauten: "Erst mit hohen Kontingenten Entwickler anlocken → nach Etablierung des Ökosystems die Kontingente kürzen, um zur Zahlung zu zwingen → selbst nach der Zahlung weiter kürzen." Dies hat zu einer Vertrauenskrise geführt – Entwickler fürchten, dass "heute gewährte Kontingente morgen wieder entzogen werden", und wagen es nicht, langfristige Abhängigkeiten von Antigravity aufzubauen.
Wenn Ihr Unternehmen stabile Gemini-API-Kontingente benötigt, können Sie über den API-Proxy-Dienst APIYI (apiyi.com) die Limits pro Konto umgehen.

Typische Kritikpunkte aus Entwicklerforen
Repräsentative Stimmen, gesammelt aus den Google AI-Entwicklerforen, Reddit und The Register:
| Quelle | Kritikpunkt | Kernanliegen |
|---|---|---|
| Forenbeitrag | "Das Kontingent für den Ultra-Plan wurde über Nacht drastisch gekürzt – wir brauchen eine offizielle Erklärung" | Bezahlende Nutzer benötigen garantierte, stabile Kontingente |
| Forenbeitrag | "Ich habe das höchste Ultra-Abo, aber alle Modelle zeigen 100 % Kontingentverbrauch an" | Höchste Kosten ohne entsprechende Gegenleistung |
| "Ich habe Antigravity zwei Tage nicht genutzt, aber das Kontingent für Gemini 3.1 Pro ist erschöpft" | Fehlerhafte Abrechnungslogik oder Bugs | |
| "Die Kontingente für Claude Sonnet und Opus sind ebenfalls unerklärlicherweise leer, obwohl ich sie kaum nutze" | Mögliche gegenseitige Beeinflussung der Kontingente zwischen Modellen | |
| The Register | "Nutzer protestieren gegen die Preiserhöhung von Google Antigravity" | Das Kreditsystem ist faktisch eine versteckte Preiserhöhung |
| DevClass | "Nutzer protestieren gegen die schwankenden Preissteigerungen bei Google Antigravity" | Intransparente Preise, Nutzer können Kosten nicht kalkulieren |
| PiunikaWeb | "Einige Pro-Nutzer sind tagelang von Kontingentsperren betroffen" | Vollständiger Arbeitsausfall während der Sperrzeit |
Warum kürzt Google die Kontingente?
Offizielle Begründung: Kostenkontrolle
Googles offizielle Darstellung spricht davon, "eine nachhaltige Servicequalität zu gewährleisten" und "auf das unerwartet hohe Nachfragewachstum zu reagieren".
Doch dahinter stecken tieferliegende Gründe:
| Grund | Analyse |
|---|---|
| GPU-Engpässe | Nach der Veröffentlichung der Gemini 3-Modellreihe explodierte die Nachfrage; kostenlose Nutzer verbrauchen enorme GPU-Ressourcen |
| Massiver Missbrauch | Google nennt "Betrug und Missbrauch" als einen der Hauptgründe für die Kürzungen |
| Kommerzialisierungsdruck | Die Notwendigkeit, kostenlose Nutzer in zahlende Kunden zu konvertieren; das AI-Kreditsystem dient als Monetarisierungswerkzeug |
| Die Lektion von Sora | OpenAIs Sora hat gezeigt, dass die Rechenkosten für kostenlose/günstige KI-Dienste nicht nachhaltig sind |
| Wettbewerbsstrategie | Erst mit kostenlosen Kontingenten ein Ökosystem aufbauen, dann schrittweise einschränken und zur Bezahlung migrieren |
Das Problem ist das "Wie", nicht das "Ob"
Der Zorn der Community richtet sich nicht dagegen, dass Google Gebühren erhebt – Entwickler verstehen, dass KI-Rechenleistung nicht kostenlos ist. Die Wut resultiert aus folgenden Punkten:
- Keine Vorankündigung: Die Regeln werden jedes Mal "über Nacht" geändert, was Produktionsumgebungen sofort lahmlegt
- Nichteinhaltung von Versprechen: Die versprochene "5-Stunden-Aktualisierung" findet in der Praxis oft nur wöchentlich statt
- Kürzungen auch bei zahlenden Nutzern: Wer den höchsten Tarif zahlt, wird trotzdem limitiert
- Intransparente Limits: In der Dokumentation heißt es "specified rate limits are not guaranteed" – das bedeutet faktisch, dass gar nichts garantiert wird
Hinweis: Wenn Ihr Unternehmen auf die Gemini API angewiesen ist und Sie sich nicht ständig von Googles Kontingentpolitik beeinflussen lassen möchten, ist die Nutzung eines API-Proxy-Dienstes wie APIYI (apiyi.com) die stabilste Lösung – durch Multi-Account-Pools sind Sie unabhängig von Einzel-Account-Limits und profitieren zudem von 28 % Rabatt.
Entwickler-Lösungsansätze

Häufig gestellte Fragen
Q1: Wird Google die Kontingente weiter kürzen?
Sehr wahrscheinlich. Die Richtlinie für kostenlose Kontingente von Google AI Studio wird immer restriktiver, und in der offiziellen Dokumentation steht ausdrücklich: „specified rate limits are not guaranteed“ (die angegebenen Ratenbegrenzungen sind nicht garantiert). Der Trend zeigt, dass die kostenlose Ebene immer knapper wird und das Preis-Leistungs-Verhältnis der kostenpflichtigen Ebenen kontinuierlich sinkt. Wenn Ihr Unternehmen auf die Gemini API angewiesen ist, sollten Sie sich nicht auf die Zusagen von Google verlassen – nutzen Sie stattdessen den API-Proxy-Dienst von APIYI (apiyi.com), um durch einen Multi-Account-Pool Schwankungen bei den Kontingenten einzelner Konten auszugleichen.
Q2: Bin ich als Ultra-Plan-Nutzer nicht davon betroffen?
Nein. Die Ereignisse vom März 2026 haben gezeigt, dass auch Ultra-Nutzer über Nacht mit Kontingentkürzungen belegt werden können – und das ohne Vorankündigung. Der Forenbeitrag „Dramatic quota reduction after update“ stammt von einem Ultra-Nutzer. Google verspricht lediglich, dass Ultra die „höchsten und großzügigsten Kontingente“ bietet, macht jedoch keine konkreten Zusagen zu Zahlen oder zur Beständigkeit dieser Limits.
Q3: Sind die Kontingente für API-Entwickler und Antigravity-Endnutzer identisch?
Nicht ganz. Antigravity (das Endkundenprodukt von Google AI Studio) hat ein eigenes Kontingentsystem (AI-Credit-System), während die Gemini API (die Entwicklerschnittstelle) ein unabhängiges RPM/RPD/TPM-Limit-System besitzt. Beide teilen sich jedoch die zugrunde liegenden GPU-Ressourcen. Die Kürzungen bei Antigravity spiegeln die allgemeine Knappheit der Rechenleistung bei Google wider, was sich auch auf die API-Ebene auswirkt (z. B. durch eine erhöhte 503-Fehlerrate bei Preview-Modellen).
Q4: Gibt es Alternativen, die nicht von der Antigravity-Richtlinie betroffen sind?
Ja. 1) Nutzen Sie den API-Proxy-Dienst von APIYI (apiyi.com) für den Modellaufruf der Gemini API; durch den Multi-Account-Pool sind Sie nicht von den Limits einzelner Konten betroffen. 2) Wechseln Sie zu Vertex AI (Unternehmensebene mit SLA, aber komplexer Konfiguration). 3) Verwenden Sie alternative Modelle – Claude Opus 4.6 führt die Arena-Bestenlisten für Text und Code an und ist über APIYI mit 20 % Rabatt verfügbar. Die sicherste Strategie ist eine Multi-Modell-Architektur: Hauptnutzung von Gemini (via APIYI-Proxy) und Ausweichen auf Claude/GPT bei Bedarf.
Zusammenfassung
Die Kernpunkte der Kontingentkürzungen durch Google Antigravity:
- 4 Kürzungen in 4 Monaten: Dez. 2025: Kostenlose Ebene um 92 % reduziert → Feb. 2026: Bildkontingente verschärft → März 2026: Einführung des Credit-Systems → Auch Ultra-Nutzer betroffen. Jedes Mal ohne Vorankündigung.
- Das Kernproblem ist das Vertrauen: Entwickler scheuen nicht die Kosten, sondern die Unsicherheit, dass „heute gewährte Kontingente morgen wieder entzogen werden“. Der Hinweis in der Dokumentation, dass Limits nicht garantiert werden, kommt einem Versprechen ohne Substanz gleich.
- Lösungsansatz: API-Proxy-Plattformen (APIYI, Multi-Account-Pools zur Umgehung von Limits) + Multi-Modell-Strategie (Gemini + Claude + GPT) sind die sicherste Kombination.
Wir empfehlen den Zugriff auf die Gemini API über APIYI (apiyi.com) – Sie sind unabhängig von Antigravity-Limits, erhalten 28 % Rabatt, zahlen nicht bei Fehlern und können Claude sowie GPT als Ausweichoptionen nutzen.
📚 Referenzen
-
The Register: Nutzer protestieren gegen Preiserhöhungen bei Google Antigravity: Community-Proteste aufgrund des kreditbasierten Systems
- Link:
theregister.com/2026/03/12/users_protest_as_google_antigravity/ - Beschreibung: Beinhaltet Informationen zur kreditbasierten Preisgestaltung und die Reaktionen der Entwickler
- Link:
-
Google AI Developer Forum: Massive Kürzung der Ultra-Kontingente: Beschwerde-Thread von Ultra-Nutzern
- Link:
discuss.ai.google.dev/t/ultra-dramatic-quota-reduction-after-update-this-needs-an-official-explanation/135526 - Beschreibung: Kontingente für Nutzer der höchsten Stufe wurden über Nacht drastisch reduziert
- Link:
-
Offizielle Dokumentation zu Gemini API Rate Limits: Erläuterung der aktuellen Limits
- Link:
ai.google.dev/gemini-api/docs/rate-limits - Beschreibung: Beachten Sie den Haftungsausschluss, dass "angegebene Ratenbegrenzungen nicht garantiert sind"
- Link:
-
APIYI Dokumentationszentrum: Gemini API-Zugriff ohne Einschränkungen durch Antigravity-Limits
- Link:
docs.apiyi.com - Beschreibung: Umgehung von Limits durch Multi-Account-Pools + 28 % Rabatt + keine Gebühren bei Fehlern
- Link:
Autor: APIYI Technik-Team
Technischer Austausch: Diskutieren Sie gerne in den Kommentaren. Weitere Informationen finden Sie im APIYI Dokumentationszentrum unter docs.apiyi.com.
