Wenn Sie die offizielle Gemini-Dokumentation öffnen, vor allem Seiten zur Bilderzeugung wie Nano Banana, fällt Ihnen vielleicht oben ein Umschalter auf: auf der einen Seite Interactions API, auf der anderen generateContent API. Das ist weit mehr als nur ein neues Layout in der Doku – Google hat die Interactions API im Juni 2026 offiziell als GA freigegeben und empfiehlt sie für alle neuen Projekte. Dieser Artikel fasst auf Basis der offiziellen Doku und der Praxistests mit dem APIYI-Gateway die wichtigsten Unterschiede, Fähigkeitslücken und konkreten Aufrufempfehlungen zusammen.
Kernwert: Nach dem Lesen wissen Sie genau, worin sich Interactions API und generateContent bei Design, Zustandsverwaltung und Funktionsumfang unterscheiden – und welche Variante Sie bei Gemini-Aufrufen über APIYI wählen sollten.

Die Kernunterschiede zwischen Interactions API und generateContent
Zuerst das Fazit: Diese beiden APIs sind nicht einfach eine Versionsbeziehung, sondern zwei unterschiedliche Designansätze. generateContent ist ein zustandsloses „eine Anfrage, eine Antwort“-Modell, bei dem der Client den vollständigen Gesprächsverlauf selbst verwalten muss. Die Interactions API dagegen verlagert die Zustandsverwaltung auf den Server und gestaltet die gesamte Interaktion rund um das neue Konzept der „Interaction“ neu.
In der offiziellen Dokumentation wird eine Interaction als „eine vollständige Gesprächs- oder Aufgabenrunde“ definiert, die intern aus einer Reihe zeitlich geordneter Ausführungsschritte besteht – darunter der Denkprozess des Modells, Tool-Aufrufe und deren Ergebnisse sowie die finale Modellausgabe. Das bedeutet: Die Interactions API ist von Grund auf für mehrstufige Dialoge und agentenartige Aufgaben ausgelegt, nicht nur für einzelne Fragen und Antworten.
Das erklärt auch, warum Google hier von „GA“ spricht und nicht einfach von einem normalen Funktionsupdate. Die Interactions API ging im Dezember 2025 in die Beta und wurde im Juni 2026 offiziell als GA angekündigt. Im offiziellen Blog steht klar: „Wir empfehlen für alle neuen Projekte und Anwendungen die Interactions API.“ Gleichzeitig zeigen inzwischen alle offiziellen Dokumente standardmäßig dieses neue Paradigma, und Google treibt auch Drittanbieter-SDKs und Partner im Ökosystem dazu, es als Standard-Interface zu übernehmen. Mit anderen Worten: Das ist kein optionales Feature-Update, sondern eine Neudefinition der Art, wie Gemini aufgerufen wird – ergänzt um Migrationsleitfäden, damit Entwickler schrittweise umsteigen können, statt gezwungen zu sein, alles auf einmal zu ändern.
| Vergleichspunkt | generateContent (legacy) | Interactions API |
|---|---|---|
| Aktueller Status | Legacy, aber voll unterstützt | Seit Juni 2026 offiziell GA |
| Offizielle Empfehlung | Kann in bestehenden Projekten weiterverwendet werden | Für alle neuen Projekte empfohlen |
| Kernmethode | generateContent | interactions.create / get / delete |
| Designidee | Zustandslose Einzelanfrage | Zustandsbasierte Aufgabenrunde rund um eine Interaction |
| Zukünftige neue Funktionen | Erhält weiterhin neue Modell-Features | Zukunftsnahe Agent-Funktionen kommen zuerst hier an |
🎯 Technische Empfehlung: Wenn Sie Gemini-Modelle über APIYI apiyi.com aufrufen, sollten Sie zuerst kurz anhand der offiziellen Doku prüfen, welches Paradigma Ihr Projekt aktuell nutzt, und dann entscheiden, ob sich eine Migration lohnt. So vermeiden Sie, dass die neue Standardanzeige der Interactions API den Eindruck erweckt, Ihr bestehender Code sei bereits veraltet.
Der Kernunterschied zwischen Request-Ansatz und State-Management: Zwei unterschiedliche Paradigmen

Der entscheidende Punkt beim Verständnis des Unterschieds zwischen beiden liegt in der Frage: Wer verwaltet den Gesprächsverlauf? generateContent verlangt vom Client, bei jeder Anfrage den vollständigen Verlauf der Nachrichtenarrays neu zusammenzusetzen. Selbst in der zehnten Gesprächsrunde müssen also die Inhalte der ersten neun Runden unverändert mitgeschickt werden. Das ist zwar einfach und direkt, aber je länger das Gespräch wird, desto größer wird der Request-Body, und die erneut übertragenen Verlaufsteile werden auch erneut berechnet und abgerechnet.
Die Interactions API bietet dafür eine Lösung: Die interaction id aus dem vorherigen Aufruf wird als Parameter previous_interaction_id in die nächste Anfrage übernommen, und der Server holt den kompletten Verlauf automatisch zurück. Der Client muss den Verlauf also nicht mehr manuell zusammensetzen und erneut senden. Die offizielle Doku nennt außerdem background=true für lang laufende Aufgaben sowie die Möglichkeit, „observable execution steps“ einzusehen. Das erleichtert Debugging und die Darstellung der Zwischenschritte des Modells in der Frontend-UI – besonders wertvoll für den Aufbau von Agent-ähnlichen Produkten.
Serverseitiges State-Management hat aber auch seinen Preis. Standardmäßig ist der store-Parameter auf true gesetzt, das System speichert also die Interaction-Daten: Bei zahlenden Konten für 55 Tage, bei kostenlosen Konten nur für 1 Tag. Wenn man aus Datenschutz- oder Compliance-Gründen store=false setzt, lässt sich die Speicherung zwar abschalten, aber gleichzeitig gehen auch die Fortsetzung des Gesprächs über previous_interaction_id und die Hintergrundausführung verloren. Das ist ein Kompromiss, den man vorher bewusst abwägen sollte.
Aus Kostensicht formuliert der Anbieter den Nutzen sehr klar: Wenn der Server den Zustand verwaltet, müssen die Verlaufsteile desselben Gesprächs nicht bei jeder Anfrage erneut in die Input-Tokens einfließen, wodurch die Cache-Trefferquote deutlich steigt. Die offizielle Formulierung lautet sinngemäß: „niedrigere Kosten, höhere Cache-Trefferquote“. Für Anwendungsfälle wie Kundensupport-Bots oder Fragen zu langen Dokumenten, bei denen viel Kontext aufrechterhalten werden muss, wird dieser Unterschied bei steigender Aufrufzahl schnell spürbar. Für Single-Turn-Generierung oder Batch-Verarbeitung hingegen, also für von Natur aus zustandslose Aufgaben, bringt dieser Kostenvorteil kaum etwas.
Ein weiteres leicht zu übersehendes Detail: Parameter wie tools, system_instruction und generation_config – einschließlich Feldern wie thinking_level und temperature – werden „pro Aufruf“ gesetzt. Auch wenn man ein Gespräch mit previous_interaction_id fortsetzt, werden diese Konfigurationen nicht automatisch übernommen. Sie müssen bei jeder Anfrage erneut explizit übergeben werden.
| Fähigkeit | generateContent | Interactions API |
|---|---|---|
| Verwaltung des Gesprächsverlaufs | Client setzt den gesamten Verlauf manuell zusammen | Server ruft über previous_interaction_id automatisch ab |
| Hintergrundausführung langer Aufgaben | Nicht unterstützt | Unterstützt mit background=true |
| Sichtbarkeit der Zwischenschritte | Muss selbst ausgewertet werden | Bietet observable execution steps |
| Aufbewahrungsstrategie für Datensätze | Kein entsprechendes Konzept | Standardmäßig gespeichert, 55 Tage für zahlende / 1 Tag für kostenlose Konten |
| Vererbung von Tool- und Generierungsparametern | Jedes Mal explizit übergeben | Jedes Mal explizit übergeben, keine automatische Vererbung |
💡 Empfehlung zur Auswahl: Für Projekte mit häufigen Multi-Turn-Dialogen oder für Agent-Workflows kann das State-Management der Interactions API tatsächlich einiges an Boilerplate-Code sparen. Wenn dein Szenario aber vor allem aus Einzelgenerierungen besteht, zeigt sich dieser Vorteil oft kaum. Wir empfehlen, vorher über die Plattform APIYI apiyi.com einen kleinen Test mit wenig Traffic zu machen und dann erst zu entscheiden, ob sich eine Migration lohnt.
Die Fähigkeitslücke zwischen beiden: Wer kann was, wer noch nicht?
Auch wenn die Interactions API das neuere Paradigma ist, listet die offizielle Doku ganz klar einige Fähigkeiten auf, die derzeit noch nicht unterstützt werden. Das sollte bei der Auswahl unbedingt berücksichtigt werden – nur weil etwas neuer ist, ist es noch lange nicht vollständiger.
Die Doku sagt ausdrücklich, dass die Interactions API aktuell noch keine video metadata-Felder in der Videoverarbeitung unterstützt, ebenso wenig die Batch API, das automatische Funktionsaufrufen in Python (automatic function calling) und explizites Caching (explicit caching) – wobei das implizite Caching über previous_interaction_id unterstützt wird. generateContent hingegen unterstützt vollständige Streaming-Ausgaben, Funktionsaufrufe, Batch API, explizites Caching sowie multimodale Eingaben mit Text, Bildern, Audio, Video und Dokumenten.
| Fähigkeit | generateContent | Interactions API |
|---|---|---|
| Batch API | ✅ Unterstützt | ❌ Derzeit nicht unterstützt |
| Explizites Caching | ✅ Unterstützt | ⚠️ Nur implizites Caching |
video metadata-Felder |
✅ Unterstützt | ❌ Derzeit nicht unterstützt |
| Automatisches Funktionsaufrufen in Python | ✅ Unterstützt | ❌ Derzeit nicht unterstützt |
| Streaming-Ausgabe / Funktionsaufrufe | ✅ Unterstützt | ✅ Unterstützt |
| Angegebene Kosten und Cache-Trefferquote | Normale Abrechnung | Laut Anbieter geringere Kosten und höhere Trefferquote |
Am Beispiel der Nano-Banana-Bilderzeugung wird der Unterschied zwischen beiden Paradigmen am direktesten bei der Art sichtbar, wie man das Ergebnis abruft. Die Interactions API stellt bequeme Eigenschaften wie interaction.output_image und interaction.output_text bereit, über die man direkt das zuletzt erzeugte Bild oder den Textblock bekommt. generateContent arbeitet dagegen auf einer niedrigeren Ebene mit dem Array candidates[0].content.parts, bei dem man jeden part selbst auf seinen Typ prüfen muss. Für Projekte, die bereits eine fertige generateContent-Parsing-Logik haben, bedeutet dieser Unterschied oft einen erheblichen Umbau des Codes – das ist nicht einfach nur ein Austausch des Endpoints.
Diese Lücken sind keine Nebensächlichkeiten. Batch API ist für kostenkritische Projekte, die Offline-Aufgaben in großen Mengen verarbeiten, oft ein zentrales Werkzeug. Wenn eine Migration plötzlich bedeutet, dass diese Funktion fehlt, muss die gesamte Offline-Verarbeitungskette neu gedacht werden. Explizites Caching wiederum ist direkt relevant für die Kosten in Long-Context-Szenarien: Wenn im Geschäftsfall große feste Teile eines System-Prompts oder Referenzmaterialien immer wieder verwendet werden, kann man ohne explizites Caching nicht genau steuern, was genau gespeichert wird und wie lange. Deshalb behält die offizielle Doku beide technischen Wege parallel bei, statt generateContent einfach abzuschaffen – zumindest solange diese Fähigkeiten noch nicht nachgezogen wurden, ist es weiterhin nicht ersetzbar.
🔧 Praxis-Tipp: Wenn dein Business stark von Batch API für Massenverarbeitung oder von explizitem Caching zur Kostensenkung abhängt, kann ein vorschneller Wechsel zur Interactions API diese Fähigkeiten kosten. Beobachte besser erst den offiziellen Migrationsleitfaden und dessen Update-Takt, statt die Produktionsumgebung überstürzt umzustellen.
APIYI-Gateway im Praxistest: Welches Paradigma sollte man aktuell verwenden
Das Ergebnis gleich vorweg: Nach dem Praxistest vom 4. Juli 2026 sollte Gemini über das APIYI-Gateway weiterhin im nativen generateContent-Format aufgerufen werden.

Das APIYI-Technikteam hat die kritischen Pfade der Interactions API direkt getestet und dabei beide gängigen Authentifizierungsarten abgedeckt. Das Ergebnis:
| Testendpunkt | Authentifizierung | Ergebnis |
|---|---|---|
| POST /v1beta2/interactions | Bearer token | ❌ 404(Invalid URL) |
| POST /v1beta/interactions | Bearer token | ❌ 404(Invalid URL) |
| POST /v1beta2/interactions | x-goog-api-key header | ❌ 404(Invalid URL) |
| POST /v1beta/models/{model}:generateContent | Bearer token | ✅ Erfolgreiche Antwort |
Der offizielle Wortlaut in der APIYI-Dokumentation lautet: „Das APIYI-Gateway unterstützt derzeit kein Interactions-API-Proxying — die Pfade /v1beta2/interactions und /v1beta/interactions liefern beide 404“, und es wird eine klare Empfehlung gegeben: „Bitte für Gemini-Aufrufe über APIYI weiterhin das native generateContent-Format verwenden.“ Genau deshalb sind aktuell alle Gemini-bezogenen Dokumente auf der APIYI-Website einheitlich im generateContent-Format geschrieben. So lässt sich der Code direkt übernehmen und ausführen, ohne an einem 404-Pfad hängen zu bleiben.
Wichtig ist: Das ist ein dynamischer Status und keine dauerhafte Einschränkung. Wenn sich die Interactions API mehr und mehr zum offiziellen Standard entwickelt, wird das Gateway mit hoher Wahrscheinlichkeit nachziehen; APIYI wird die entsprechende Dokumentation dann aktualisieren. Aktuell könnt ihr die neueste Support-Information auf der Seite docs.apiyi.com/api-capabilities/gemini/interactions-api verfolgen, ohne jedes Mal selbst Endpunkte testen zu müssen.
Diese Testergebnisse erinnern auch an eine leicht übersehene Realität: „offiziell verfügbar“ auf Dokumentationsebene und „bereits im konkreten Proxy-Gateway oder in einem Drittanbieter-SDK unterstützt“ sind zwei völlig verschiedene Dinge. Wer nur die Standardbeispiele aus der offiziellen Doku nimmt und den Code der Interactions API direkt in eine bestehende Proxy-Konfiguration kopiert, läuft sehr wahrscheinlich zuerst in einen 404 und verbringt dann Zeit damit herauszufinden, ob der eigene Code falsch ist oder das Gateway einfach noch nicht nachgezogen hat. In solchen Fällen ist es meist schneller, zuerst die gesamte Aufrufkette zu prüfen — also Direktverbindung zur offiziellen API oder Nutzung über einen Drittanbieter-Proxy — statt immer wieder den Business-Code zu kontrollieren.
🚀 Schnellstart: Wenn du jetzt direkt prüfen willst, ob deine Gemini-Aufrufkette korrekt funktioniert, empfehle ich die Einbindung über APIYI apiyi.com im generateContent-Format. Die Plattform stellt eine einheitliche base_url bereit, unterstützt Aufrufe verschiedener Gemini-Modelle für Text, Bilder und mehr und erfordert keine zusätzlichen Authentifizierungsdetails.
So entscheidet man: Empfehlungen nach Szenario
Basierend auf dem Funktionsvergleich oben und dem Praxistest folgt hier eine einfache Entscheidungshilfe nach Szenarien.

| Einsatzszenario | Empfohlene Lösung | Begründung |
|---|---|---|
| Gemini über das APIYI-Gateway aufrufen | generateContent | Das Gateway unterstützt aktuell nur dieses Format, die Interactions-API-Pfade liefern 404 |
| Auf Batch API für Massenverarbeitung angewiesen | generateContent | Interactions API unterstützt Batch API derzeit nicht |
| Explizites Caching zur Kostensenkung nötig | generateContent | Interactions API bietet derzeit nur implizites Caching |
| Mehrturn-Dialog-Agent bauen, direkte Verbindung zur offiziellen API | Interactions API prüfen | Zustandsverwaltung auf Serverseite spart das Zusammenfügen des Verlaufs |
| Modell-Zwischenschritte zur Fehlersuche beobachten müssen | Interactions API | Native Unterstützung für observable execution steps |
| Bestehendes Projekt läuft bereits mit generateContent | Vorerst nicht migrieren | legacy wird weiterhin vollständig unterstützt und bekommt kurzfristig neue Modelle |
Kurz gesagt: Ob man migriert, hängt nicht davon ab, ob etwas „neu“ ist, sondern davon, ob die eigenen Abhängigkeiten von der Interactions API بالفعل vollständig abgedeckt werden und ob die Aufrufkette zu Gemini — direkte offizielle API oder Proxy-Gateway — das neue Paradigma bereits unterstützt. Für die meisten Entwickler, die Gemini über APIYI proxy-basiert nutzen, ist es derzeit die sicherere Wahl, bei generateContent zu bleiben.
Häufige Fragen
Q1: Wird generateContent abgeschaltet? Lohnt es sich noch, darauf basierend neue Projekte zu entwickeln?
Kurzfristig nicht. Die offizielle Stellungnahme sagt ausdrücklich, dass generateContent zwar als legacy markiert ist, aber „weiterhin vollständig unterstützt“ wird und auch in absehbarer Zukunft weiterhin neue Gemini-Modelle der Hauptlinie erhalten soll. Wenn Sie Gemini über APIYI apiyi.com aufrufen, gibt es derzeit keinen Grund zur Sorge: Neue Projekte auf Basis von generateContent zu entwickeln ist völlig unproblematisch, und Sie müssen nicht nervös werden, nur weil die Dokumentation standardmäßig die Interactions API anzeigt.
Q2: Wann wird das APIYI-Gateway die Interactions API unterstützen?
Derzeit gibt es keinen genauen Zeitplan. Das hängt davon ab, wie stark sich dieses Paradigma im offiziellen Ökosystem durchsetzt und wie weit die Anpassungen auf Gateway-Seite fortgeschritten sind. Es empfiehlt sich, die offiziellen Dokument-Updates der Plattform APIYI apiyi.com im Blick zu behalten. Sobald die Interactions API als Proxy unterstützt wird, werden die entsprechenden Dokumente umgehend aktualisiert; ein wiederholtes manuelles Testen des Endpoint-Status ist dann nicht nötig.
Q3: Können beide APIs im selben Projekt gemischt verwendet werden?
Technisch gesehen ja, solange die Aufrufkette es unterstützt, können beide Paradigmen nebeneinander existieren. Zum Beispiel kann generateContent für Batch-API-Stapelaufgaben genutzt werden, während man in Szenarien mit direkter offizieller API-Anbindung für mehrstufige Gespräche die Interactions API ausprobiert. Beim Aufruf über das APIYI-Gateway ist der Pfad der Interactions API derzeit jedoch mit 404 nicht erreichbar. Daher empfiehlt es sich vorerst, einheitlich das generateContent-Format zu verwenden, um zu vermeiden, dass zwei unterschiedliche Aufruflogiken im selben Projekt die Wartung erschweren.
Zusammenfassung
Die Interactions API, die im Juni 2026 offiziell freigegeben wurde, steht tatsächlich für Googles langfristige Richtung bei der Gemini-Nutzung. Funktionen wie serverseitiges Zustandsmanagement und nachvollziehbare Ausführungsschritte sind für agent-basierte Anwendungen sehr attraktiv. Allerdings gibt es weiterhin deutliche Lücken bei Batch-API, explizitem Cache und Video-Metadaten, während generateContent nach wie vor vollständig unterstützt wird und auch kurzfristig weiter aktualisiert wird. Wichtiger noch: Bei der Nutzung von Gemini über das APIYI-Gateway zeigen die bisherigen Tests, dass alle Pfade der Interactions API derzeit mit 404 antworten und generateContent das einzige aktuell nutzbare Format ist. Wenn Sie die Gemini-Modelle stabil und zuverlässig aufrufen möchten, empfehlen wir die Einbindung im nativen generateContent-Format über APIYI apiyi.com; sobald das Gateway das neue Paradigma unterstützt, wird die Dokumentation entsprechend aktualisiert.
Die in diesem Artikel verwendeten Testdaten sowie die Verifikation der offiziellen Informationen wurden vom APIYI-Technikteam durchgeführt. Wenn Sie mehr Details zu den Gemini-Modellaufrufen benötigen, wenden Sie sich gerne über APIYI apiyi.com an den technischen Support.
Referenzmaterial
-
Google AI for Developers – Überblick über die Interactions API: Konzept von Interaction, zentrale Methoden und Funktionsumfang
- Link:
ai.google.dev/gemini-api/docs/interactions-overview
- Link:
-
Google AI for Developers – generateContent (Legacy): Unterstützungsstatus und Funktionsumfang der Legacy-API
- Link:
ai.google.dev/gemini-api/docs/interactions
- Link:
-
APIYI-Offizielle Dokumentation – Unterstützungsstatus der Gemini Interactions API: Ergebnis der Endpunktprüfung im Gateway und Empfehlungen für den Aufruf
- Link:
docs.apiyi.com/api-capabilities/gemini/interactions-api
- Link:
