Gemini Interactions API versus generateContent: Wie wählen? 4 Tabellen erklären den neuesten Vergleich 2026 klar und verständlich

Wenn Sie die offizielle Gemini-Dokumentation öffnen, vor allem Seiten zur Bilderzeugung wie Nano Banana, fällt Ihnen vielleicht oben ein Umschalter auf: auf der einen Seite Interactions API, auf der anderen generateContent API. Das ist weit mehr als nur ein neues Layout in der Doku – Google hat die Interactions API im Juni 2026 offiziell als GA freigegeben und empfiehlt sie für alle neuen Projekte. Dieser Artikel fasst auf Basis der offiziellen Doku und der Praxistests mit dem APIYI-Gateway die wichtigsten Unterschiede, Fähigkeitslücken und konkreten Aufrufempfehlungen zusammen.

Kernwert: Nach dem Lesen wissen Sie genau, worin sich Interactions API und generateContent bei Design, Zustandsverwaltung und Funktionsumfang unterscheiden – und welche Variante Sie bei Gemini-Aufrufen über APIYI wählen sollten.

Die Kernunterschiede zwischen Interactions API und generateContent

Zuerst das Fazit: Diese beiden APIs sind nicht einfach eine Versionsbeziehung, sondern zwei unterschiedliche Designansätze. generateContent ist ein zustandsloses „eine Anfrage, eine Antwort“-Modell, bei dem der Client den vollständigen Gesprächsverlauf selbst verwalten muss. Die Interactions API dagegen verlagert die Zustandsverwaltung auf den Server und gestaltet die gesamte Interaktion rund um das neue Konzept der „Interaction“ neu.

In der offiziellen Dokumentation wird eine Interaction als „eine vollständige Gesprächs- oder Aufgabenrunde“ definiert, die intern aus einer Reihe zeitlich geordneter Ausführungsschritte besteht – darunter der Denkprozess des Modells, Tool-Aufrufe und deren Ergebnisse sowie die finale Modellausgabe. Das bedeutet: Die Interactions API ist von Grund auf für mehrstufige Dialoge und agentenartige Aufgaben ausgelegt, nicht nur für einzelne Fragen und Antworten.

Das erklärt auch, warum Google hier von „GA“ spricht und nicht einfach von einem normalen Funktionsupdate. Die Interactions API ging im Dezember 2025 in die Beta und wurde im Juni 2026 offiziell als GA angekündigt. Im offiziellen Blog steht klar: „Wir empfehlen für alle neuen Projekte und Anwendungen die Interactions API.“ Gleichzeitig zeigen inzwischen alle offiziellen Dokumente standardmäßig dieses neue Paradigma, und Google treibt auch Drittanbieter-SDKs und Partner im Ökosystem dazu, es als Standard-Interface zu übernehmen. Mit anderen Worten: Das ist kein optionales Feature-Update, sondern eine Neudefinition der Art, wie Gemini aufgerufen wird – ergänzt um Migrationsleitfäden, damit Entwickler schrittweise umsteigen können, statt gezwungen zu sein, alles auf einmal zu ändern.

Vergleichspunkt	generateContent (legacy)	Interactions API
Aktueller Status	Legacy, aber voll unterstützt	Seit Juni 2026 offiziell GA
Offizielle Empfehlung	Kann in bestehenden Projekten weiterverwendet werden	Für alle neuen Projekte empfohlen
Kernmethode	generateContent	interactions.create / get / delete
Designidee	Zustandslose Einzelanfrage	Zustandsbasierte Aufgabenrunde rund um eine Interaction
Zukünftige neue Funktionen	Erhält weiterhin neue Modell-Features	Zukunftsnahe Agent-Funktionen kommen zuerst hier an

🎯 Technische Empfehlung: Wenn Sie Gemini-Modelle über APIYI apiyi.com aufrufen, sollten Sie zuerst kurz anhand der offiziellen Doku prüfen, welches Paradigma Ihr Projekt aktuell nutzt, und dann entscheiden, ob sich eine Migration lohnt. So vermeiden Sie, dass die neue Standardanzeige der Interactions API den Eindruck erweckt, Ihr bestehender Code sei bereits veraltet.

Der Kernunterschied zwischen Request-Ansatz und State-Management: Zwei unterschiedliche Paradigmen

Der entscheidende Punkt beim Verständnis des Unterschieds zwischen beiden liegt in der Frage: Wer verwaltet den Gesprächsverlauf? generateContent verlangt vom Client, bei jeder Anfrage den vollständigen Verlauf der Nachrichtenarrays neu zusammenzusetzen. Selbst in der zehnten Gesprächsrunde müssen also die Inhalte der ersten neun Runden unverändert mitgeschickt werden. Das ist zwar einfach und direkt, aber je länger das Gespräch wird, desto größer wird der Request-Body, und die erneut übertragenen Verlaufsteile werden auch erneut berechnet und abgerechnet.

Die Interactions API bietet dafür eine Lösung: Die interaction id aus dem vorherigen Aufruf wird als Parameter previous_interaction_id in die nächste Anfrage übernommen, und der Server holt den kompletten Verlauf automatisch zurück. Der Client muss den Verlauf also nicht mehr manuell zusammensetzen und erneut senden. Die offizielle Doku nennt außerdem background=true für lang laufende Aufgaben sowie die Möglichkeit, „observable execution steps“ einzusehen. Das erleichtert Debugging und die Darstellung der Zwischenschritte des Modells in der Frontend-UI – besonders wertvoll für den Aufbau von Agent-ähnlichen Produkten.

Serverseitiges State-Management hat aber auch seinen Preis. Standardmäßig ist der store-Parameter auf true gesetzt, das System speichert also die Interaction-Daten: Bei zahlenden Konten für 55 Tage, bei kostenlosen Konten nur für 1 Tag. Wenn man aus Datenschutz- oder Compliance-Gründen store=false setzt, lässt sich die Speicherung zwar abschalten, aber gleichzeitig gehen auch die Fortsetzung des Gesprächs über previous_interaction_id und die Hintergrundausführung verloren. Das ist ein Kompromiss, den man vorher bewusst abwägen sollte.

Aus Kostensicht formuliert der Anbieter den Nutzen sehr klar: Wenn der Server den Zustand verwaltet, müssen die Verlaufsteile desselben Gesprächs nicht bei jeder Anfrage erneut in die Input-Tokens einfließen, wodurch die Cache-Trefferquote deutlich steigt. Die offizielle Formulierung lautet sinngemäß: „niedrigere Kosten, höhere Cache-Trefferquote“. Für Anwendungsfälle wie Kundensupport-Bots oder Fragen zu langen Dokumenten, bei denen viel Kontext aufrechterhalten werden muss, wird dieser Unterschied bei steigender Aufrufzahl schnell spürbar. Für Single-Turn-Generierung oder Batch-Verarbeitung hingegen, also für von Natur aus zustandslose Aufgaben, bringt dieser Kostenvorteil kaum etwas.

Ein weiteres leicht zu übersehendes Detail: Parameter wie tools, system_instruction und generation_config – einschließlich Feldern wie thinking_level und temperature – werden „pro Aufruf“ gesetzt. Auch wenn man ein Gespräch mit previous_interaction_id fortsetzt, werden diese Konfigurationen nicht automatisch übernommen. Sie müssen bei jeder Anfrage erneut explizit übergeben werden.

Fähigkeit	generateContent	Interactions API
Verwaltung des Gesprächsverlaufs	Client setzt den gesamten Verlauf manuell zusammen	Server ruft über `previous_interaction_id` automatisch ab
Hintergrundausführung langer Aufgaben	Nicht unterstützt	Unterstützt mit `background=true`
Sichtbarkeit der Zwischenschritte	Muss selbst ausgewertet werden	Bietet observable execution steps
Aufbewahrungsstrategie für Datensätze	Kein entsprechendes Konzept	Standardmäßig gespeichert, 55 Tage für zahlende / 1 Tag für kostenlose Konten
Vererbung von Tool- und Generierungsparametern	Jedes Mal explizit übergeben	Jedes Mal explizit übergeben, keine automatische Vererbung

💡 Empfehlung zur Auswahl: Für Projekte mit häufigen Multi-Turn-Dialogen oder für Agent-Workflows kann das State-Management der Interactions API tatsächlich einiges an Boilerplate-Code sparen. Wenn dein Szenario aber vor allem aus Einzelgenerierungen besteht, zeigt sich dieser Vorteil oft kaum. Wir empfehlen, vorher über die Plattform APIYI apiyi.com einen kleinen Test mit wenig Traffic zu machen und dann erst zu entscheiden, ob sich eine Migration lohnt.

Die Fähigkeitslücke zwischen beiden: Wer kann was, wer noch nicht?

Auch wenn die Interactions API das neuere Paradigma ist, listet die offizielle Doku ganz klar einige Fähigkeiten auf, die derzeit noch nicht unterstützt werden. Das sollte bei der Auswahl unbedingt berücksichtigt werden – nur weil etwas neuer ist, ist es noch lange nicht vollständiger.

Die Doku sagt ausdrücklich, dass die Interactions API aktuell noch keine video metadata-Felder in der Videoverarbeitung unterstützt, ebenso wenig die Batch API, das automatische Funktionsaufrufen in Python (automatic function calling) und explizites Caching (explicit caching) – wobei das implizite Caching über previous_interaction_id unterstützt wird. generateContent hingegen unterstützt vollständige Streaming-Ausgaben, Funktionsaufrufe, Batch API, explizites Caching sowie multimodale Eingaben mit Text, Bildern, Audio, Video und Dokumenten.

Fähigkeit	generateContent	Interactions API
Batch API	✅ Unterstützt	❌ Derzeit nicht unterstützt
Explizites Caching	✅ Unterstützt	⚠️ Nur implizites Caching
`video metadata`-Felder	✅ Unterstützt	❌ Derzeit nicht unterstützt
Automatisches Funktionsaufrufen in Python	✅ Unterstützt	❌ Derzeit nicht unterstützt
Streaming-Ausgabe / Funktionsaufrufe	✅ Unterstützt	✅ Unterstützt
Angegebene Kosten und Cache-Trefferquote	Normale Abrechnung	Laut Anbieter geringere Kosten und höhere Trefferquote

Am Beispiel der Nano-Banana-Bilderzeugung wird der Unterschied zwischen beiden Paradigmen am direktesten bei der Art sichtbar, wie man das Ergebnis abruft. Die Interactions API stellt bequeme Eigenschaften wie interaction.output_image und interaction.output_text bereit, über die man direkt das zuletzt erzeugte Bild oder den Textblock bekommt. generateContent arbeitet dagegen auf einer niedrigeren Ebene mit dem Array candidates[0].content.parts, bei dem man jeden part selbst auf seinen Typ prüfen muss. Für Projekte, die bereits eine fertige generateContent-Parsing-Logik haben, bedeutet dieser Unterschied oft einen erheblichen Umbau des Codes – das ist nicht einfach nur ein Austausch des Endpoints.

Diese Lücken sind keine Nebensächlichkeiten. Batch API ist für kostenkritische Projekte, die Offline-Aufgaben in großen Mengen verarbeiten, oft ein zentrales Werkzeug. Wenn eine Migration plötzlich bedeutet, dass diese Funktion fehlt, muss die gesamte Offline-Verarbeitungskette neu gedacht werden. Explizites Caching wiederum ist direkt relevant für die Kosten in Long-Context-Szenarien: Wenn im Geschäftsfall große feste Teile eines System-Prompts oder Referenzmaterialien immer wieder verwendet werden, kann man ohne explizites Caching nicht genau steuern, was genau gespeichert wird und wie lange. Deshalb behält die offizielle Doku beide technischen Wege parallel bei, statt generateContent einfach abzuschaffen – zumindest solange diese Fähigkeiten noch nicht nachgezogen wurden, ist es weiterhin nicht ersetzbar.

🔧 Praxis-Tipp: Wenn dein Business stark von Batch API für Massenverarbeitung oder von explizitem Caching zur Kostensenkung abhängt, kann ein vorschneller Wechsel zur Interactions API diese Fähigkeiten kosten. Beobachte besser erst den offiziellen Migrationsleitfaden und dessen Update-Takt, statt die Produktionsumgebung überstürzt umzustellen.

APIYI-Gateway im Praxistest: Welches Paradigma sollte man aktuell verwenden

Das Ergebnis gleich vorweg: Nach dem Praxistest vom 4. Juli 2026 sollte Gemini über das APIYI-Gateway weiterhin im nativen generateContent-Format aufgerufen werden.

Das APIYI-Technikteam hat die kritischen Pfade der Interactions API direkt getestet und dabei beide gängigen Authentifizierungsarten abgedeckt. Das Ergebnis:

Testendpunkt	Authentifizierung	Ergebnis
POST /v1beta2/interactions	Bearer token	❌ 404（Invalid URL）
POST /v1beta/interactions	Bearer token	❌ 404（Invalid URL）
POST /v1beta2/interactions	x-goog-api-key header	❌ 404（Invalid URL）
POST /v1beta/models/{model}:generateContent	Bearer token	✅ Erfolgreiche Antwort

Der offizielle Wortlaut in der APIYI-Dokumentation lautet: „Das APIYI-Gateway unterstützt derzeit kein Interactions-API-Proxying — die Pfade /v1beta2/interactions und /v1beta/interactions liefern beide 404“, und es wird eine klare Empfehlung gegeben: „Bitte für Gemini-Aufrufe über APIYI weiterhin das native generateContent-Format verwenden.“ Genau deshalb sind aktuell alle Gemini-bezogenen Dokumente auf der APIYI-Website einheitlich im generateContent-Format geschrieben. So lässt sich der Code direkt übernehmen und ausführen, ohne an einem 404-Pfad hängen zu bleiben.

Wichtig ist: Das ist ein dynamischer Status und keine dauerhafte Einschränkung. Wenn sich die Interactions API mehr und mehr zum offiziellen Standard entwickelt, wird das Gateway mit hoher Wahrscheinlichkeit nachziehen; APIYI wird die entsprechende Dokumentation dann aktualisieren. Aktuell könnt ihr die neueste Support-Information auf der Seite docs.apiyi.com/api-capabilities/gemini/interactions-api verfolgen, ohne jedes Mal selbst Endpunkte testen zu müssen.

Diese Testergebnisse erinnern auch an eine leicht übersehene Realität: „offiziell verfügbar“ auf Dokumentationsebene und „bereits im konkreten Proxy-Gateway oder in einem Drittanbieter-SDK unterstützt“ sind zwei völlig verschiedene Dinge. Wer nur die Standardbeispiele aus der offiziellen Doku nimmt und den Code der Interactions API direkt in eine bestehende Proxy-Konfiguration kopiert, läuft sehr wahrscheinlich zuerst in einen 404 und verbringt dann Zeit damit herauszufinden, ob der eigene Code falsch ist oder das Gateway einfach noch nicht nachgezogen hat. In solchen Fällen ist es meist schneller, zuerst die gesamte Aufrufkette zu prüfen — also Direktverbindung zur offiziellen API oder Nutzung über einen Drittanbieter-Proxy — statt immer wieder den Business-Code zu kontrollieren.

🚀 Schnellstart: Wenn du jetzt direkt prüfen willst, ob deine Gemini-Aufrufkette korrekt funktioniert, empfehle ich die Einbindung über APIYI apiyi.com im generateContent-Format. Die Plattform stellt eine einheitliche base_url bereit, unterstützt Aufrufe verschiedener Gemini-Modelle für Text, Bilder und mehr und erfordert keine zusätzlichen Authentifizierungsdetails.

So entscheidet man: Empfehlungen nach Szenario

Basierend auf dem Funktionsvergleich oben und dem Praxistest folgt hier eine einfache Entscheidungshilfe nach Szenarien.

Einsatzszenario	Empfohlene Lösung	Begründung
Gemini über das APIYI-Gateway aufrufen	generateContent	Das Gateway unterstützt aktuell nur dieses Format, die Interactions-API-Pfade liefern 404
Auf Batch API für Massenverarbeitung angewiesen	generateContent	Interactions API unterstützt Batch API derzeit nicht
Explizites Caching zur Kostensenkung nötig	generateContent	Interactions API bietet derzeit nur implizites Caching
Mehrturn-Dialog-Agent bauen, direkte Verbindung zur offiziellen API	Interactions API prüfen	Zustandsverwaltung auf Serverseite spart das Zusammenfügen des Verlaufs
Modell-Zwischenschritte zur Fehlersuche beobachten müssen	Interactions API	Native Unterstützung für observable execution steps
Bestehendes Projekt läuft bereits mit generateContent	Vorerst nicht migrieren	legacy wird weiterhin vollständig unterstützt und bekommt kurzfristig neue Modelle

Kurz gesagt: Ob man migriert, hängt nicht davon ab, ob etwas „neu“ ist, sondern davon, ob die eigenen Abhängigkeiten von der Interactions API بالفعل vollständig abgedeckt werden und ob die Aufrufkette zu Gemini — direkte offizielle API oder Proxy-Gateway — das neue Paradigma bereits unterstützt. Für die meisten Entwickler, die Gemini über APIYI proxy-basiert nutzen, ist es derzeit die sicherere Wahl, bei generateContent zu bleiben.

Häufige Fragen

Q1: Wird generateContent abgeschaltet? Lohnt es sich noch, darauf basierend neue Projekte zu entwickeln?

Kurzfristig nicht. Die offizielle Stellungnahme sagt ausdrücklich, dass generateContent zwar als legacy markiert ist, aber „weiterhin vollständig unterstützt“ wird und auch in absehbarer Zukunft weiterhin neue Gemini-Modelle der Hauptlinie erhalten soll. Wenn Sie Gemini über APIYI apiyi.com aufrufen, gibt es derzeit keinen Grund zur Sorge: Neue Projekte auf Basis von generateContent zu entwickeln ist völlig unproblematisch, und Sie müssen nicht nervös werden, nur weil die Dokumentation standardmäßig die Interactions API anzeigt.

Q2: Wann wird das APIYI-Gateway die Interactions API unterstützen?

Derzeit gibt es keinen genauen Zeitplan. Das hängt davon ab, wie stark sich dieses Paradigma im offiziellen Ökosystem durchsetzt und wie weit die Anpassungen auf Gateway-Seite fortgeschritten sind. Es empfiehlt sich, die offiziellen Dokument-Updates der Plattform APIYI apiyi.com im Blick zu behalten. Sobald die Interactions API als Proxy unterstützt wird, werden die entsprechenden Dokumente umgehend aktualisiert; ein wiederholtes manuelles Testen des Endpoint-Status ist dann nicht nötig.

Q3: Können beide APIs im selben Projekt gemischt verwendet werden?

Technisch gesehen ja, solange die Aufrufkette es unterstützt, können beide Paradigmen nebeneinander existieren. Zum Beispiel kann generateContent für Batch-API-Stapelaufgaben genutzt werden, während man in Szenarien mit direkter offizieller API-Anbindung für mehrstufige Gespräche die Interactions API ausprobiert. Beim Aufruf über das APIYI-Gateway ist der Pfad der Interactions API derzeit jedoch mit 404 nicht erreichbar. Daher empfiehlt es sich vorerst, einheitlich das generateContent-Format zu verwenden, um zu vermeiden, dass zwei unterschiedliche Aufruflogiken im selben Projekt die Wartung erschweren.

Zusammenfassung

Die Interactions API, die im Juni 2026 offiziell freigegeben wurde, steht tatsächlich für Googles langfristige Richtung bei der Gemini-Nutzung. Funktionen wie serverseitiges Zustandsmanagement und nachvollziehbare Ausführungsschritte sind für agent-basierte Anwendungen sehr attraktiv. Allerdings gibt es weiterhin deutliche Lücken bei Batch-API, explizitem Cache und Video-Metadaten, während generateContent nach wie vor vollständig unterstützt wird und auch kurzfristig weiter aktualisiert wird. Wichtiger noch: Bei der Nutzung von Gemini über das APIYI-Gateway zeigen die bisherigen Tests, dass alle Pfade der Interactions API derzeit mit 404 antworten und generateContent das einzige aktuell nutzbare Format ist. Wenn Sie die Gemini-Modelle stabil und zuverlässig aufrufen möchten, empfehlen wir die Einbindung im nativen generateContent-Format über APIYI apiyi.com; sobald das Gateway das neue Paradigma unterstützt, wird die Dokumentation entsprechend aktualisiert.

Die in diesem Artikel verwendeten Testdaten sowie die Verifikation der offiziellen Informationen wurden vom APIYI-Technikteam durchgeführt. Wenn Sie mehr Details zu den Gemini-Modellaufrufen benötigen, wenden Sie sich gerne über APIYI apiyi.com an den technischen Support.

Referenzmaterial

Google AI for Developers – Überblick über die Interactions API: Konzept von Interaction, zentrale Methoden und Funktionsumfang
- Link: ai.google.dev/gemini-api/docs/interactions-overview
Google AI for Developers – generateContent (Legacy): Unterstützungsstatus und Funktionsumfang der Legacy-API
- Link: ai.google.dev/gemini-api/docs/interactions
APIYI-Offizielle Dokumentation – Unterstützungsstatus der Gemini Interactions API: Ergebnis der Endpunktprüfung im Gateway und Empfehlungen für den Aufruf
- Link: docs.apiyi.com/api-capabilities/gemini/interactions-api

Gemini Interactions API versus generateContent: Wie wählen? 4 Tabellen erklären den neuesten Vergleich 2026 klar und verständlich

Die Kernunterschiede zwischen Interactions API und generateContent

Der Kernunterschied zwischen Request-Ansatz und State-Management: Zwei unterschiedliche Paradigmen

Die Fähigkeitslücke zwischen beiden: Wer kann was, wer noch nicht?

APIYI-Gateway im Praxistest: Welches Paradigma sollte man aktuell verwenden

So entscheidet man: Empfehlungen nach Szenario

Häufige Fragen

Zusammenfassung

Referenzmaterial

Gemini 3.1 Pro Ausgabe-Token warum so groß? 3 Schritte, um die versteckten Thinking Tokens des Reasoning-Modells zu verstehen

Wie man mit KI E-Commerce-Detailseiten erstellt? 3 wichtige Techniken zur Generierung von Vier-Raster-Erzählbildern mit Nano Banana Pro API-Unterstützung

Nano Banana Pro API zu teuer? 5 Alternativen helfen Ihnen, 79 % Kosten zu sparen

Gemini API Bildgenerierung abgelehnt: Bekannte IP verweigert die Bilderstellung, finishReason OTHER Fehlerursache und Lösungen

Nano Banana 2 im Praxistest jetzt online: 6 wichtige Erkenntnisse basierend auf Gemini 3.1 Flash

5 Methoden zur Lösung von Google AI Studio Limit-Problemen – Vollständiger Leitfaden 2026

Die Kernunterschiede zwischen Interactions API und generateContent

Der Kernunterschied zwischen Request-Ansatz und State-Management: Zwei unterschiedliche Paradigmen

Die Fähigkeitslücke zwischen beiden: Wer kann was, wer noch nicht?

APIYI-Gateway im Praxistest: Welches Paradigma sollte man aktuell verwenden

So entscheidet man: Empfehlungen nach Szenario

Häufige Fragen

Zusammenfassung

Referenzmaterial

Ähnliche Beiträge