Anmerkung des Autors: banana-slides ist eine Open-Source-KI-PPT-Generierungsanwendung, die auf nano banana pro basiert. Dieser Artikel führt Sie aus der Perspektive eines Neulings durch den vollständigen Fork- und Bereitstellungsprozess und zeigt Ihnen, wie Sie den standardmäßigen AIHubMix-Proxy durch APIYI ersetzen, um stabilere Modellaufrufe zu erzielen.
Auf GitHub gibt es einen kürzlich viral gegangenen Open-Source-KI-PPT-Generator namens banana-slides. Er basiert auf dem neuesten nano banana pro Bildmodell von Google und zeichnet sich dadurch aus, dass er "mit einem einzigen Satz bearbeitbare PPTs erstellt, Videoexporte unterstützt und die Änderung beliebiger Bereiche durch natürliche Sprache ermöglicht". Das Projekt hat bereits über 14.000 GitHub-Sterne gesammelt.
Dies ist kein weiteres "Wrapper"-KI-PPT-Tool, sondern ein echtes, lokal bereitstellbares "Vibe PPT"-System mit vollständig offenem Quellcode. Es unterstützt verschiedene Modellformate wie Gemini, OpenAI, Anthropic und Vertex AI. Die offizielle Dokumentation empfiehlt standardmäßig AIHubMix als Proxy.
Kernnutzen: Nach dem Lesen dieses Artikels wissen Sie, wie Sie das banana-slides-Projekt forken und lokal bereitstellen. Noch wichtiger ist, dass Sie die vollständige Konfigurationsmethode beherrschen, um den standardmäßigen AIHubMix-Proxy durch den API-Proxy-Dienst von APIYI (apiyi.com) zu ersetzen. So profitieren Sie von unbegrenzter Parallelität, nativem Format-Support und einem Kostenvorteil von 10 % Bonus bei einer Aufladung von 100 USD.

I. Was ist banana-slides: Die 3 Kernpositionierungen des Open-Source-KI-PPT-Generators
banana-slides ist ein Open-Source-Projekt unter der Leitung des Entwicklers Anionex und ist als native KI-PPT-Generierungsanwendung auf Basis von nano banana pro positioniert. Das Kernkonzept ist "Vibe PPT" – Sie können die KI mit konversationeller Sprache anweisen, jede beliebige Folie zu erstellen, zu bearbeiten oder zu iterieren.
1.1 Kernpositionierung von banana-slides
| Dimension | Eigenschaften von banana-slides | Unterschied zu traditionellen KI-PPT-Tools |
|---|---|---|
| Basis-Modell | Bilderzeugung auf Basis von nano banana pro | Die meisten Tools nutzen Vorlagen-Stitching |
| Bereitstellung | Vollständig Open Source + lokale Bereitstellung | SaaS-Produkte sind an die Cloud gebunden |
| Lizenz | AGPL-3.0 (kommerzielle Nutzung erfordert Autorisierung) | Proprietäres Abonnementmodell |
| Bearbeitung | Natürliche Sprache ("Vibe-Bearbeitung") | Manuelle Bearbeitung per Drag-and-Drop |
| Input-Material | Beliebige Formate (PDF/DOCX/MD/TXT) | Nur Text/Gliederungen |
| Export-Formate | Bearbeitbare PPTX + PDF + MP4 (inkl. TTS-Vertonung) | Meist nur PPTX |
| API-Anbieter | Unterstützt mehrere, AIHubMix standardmäßig empfohlen | Meist an einen einzigen Anbieter gebunden |
1.2 Warum banana-slides für Neulinge interessant ist
Wenn Sie neu im Bereich der KI-PPT-Generierung sind, bietet banana-slides eine "freiere" Wahl als kommerzielle SaaS-Lösungen:
- Vollständig quelloffener Code: Ermöglicht Weiterentwicklung und private Bereitstellung.
- Hervorragende Bildqualität: Basiert auf nano banana pro; die generierten Bilder übertreffen herkömmliche PPT-Vorlagen bei weitem.
- Multi-Modell-Anpassung: Sie können Gemini, OpenAI oder Anthropic als Backend nutzen.
- Flexible API-Ersetzung: AIHubMix wird empfohlen, kann aber problemlos durch andere kompatible Dienste (wie APIYI apiyi.com) ersetzt werden.
💡 Tipp für Neulinge: Wenn Sie keinen Google API-Schlüssel oder OpenAI-Schlüssel haben, ist der API-Proxy-Dienst von APIYI (apiyi.com) der einfachste Weg. Mit einem einzigen Schlüssel können Sie auf die gesamte Modellpalette von Gemini, Claude, GPT usw. zugreifen und vermeiden so den Aufwand, bei mehreren Anbietern Konten zu beantragen.
1.3 Für wen ist banana-slides geeignet?
- Studierende: Schnelle Erstellung von Kursarbeiten oder Abschlusspräsentationen.
- Lehrkräfte: Umwandlung von Unterrichtsinhalten in illustrierte Lehrmaterialien.
- Berufstätige: Geschäftsvorschläge, Projektberichte, Quartalsberichte.
- Entwickler: Teams, die ein KI-PPT-Tool privat bereitstellen möchten.
- Designer: Inspiration aus KI-generierten Layouts gewinnen.
2. banana-slides Kernfunktionen: Die 4 Hauptmerkmale im Detail
Das Funktionsdesign von banana-slides zielt darauf ab, die "Hürden bei der PPT-Erstellung zu senken", und umfasst vier zentrale Leistungsbereiche.

2.1 Multimodale Inhaltserstellung
banana-slides unterstützt drei Eingabemethoden für Inhalte, die sich an verschiedene Szenarien anpassen:
| Eingabemethode | Anwendungsszenario | Ausgabegranularität |
|---|---|---|
| Generierung per Satz | Spontane Präsentationen, erste Entwürfe | KI erstellt automatisch Gliederung + alle Folien |
| Gliederungsmodus | Klare Struktur vorhanden | Automatische Erweiterung jeder Seite basierend auf der Gliederung |
| Seitenbeschreibungsmodus | Präzise Kontrolle | Seitenspezifische Texte + Bilder festlegen |
2.2 Intelligente Materialanalyse
banana-slides kann Materialdateien in verschiedenen Formaten verarbeiten und automatisch wichtige Informationen extrahieren:
- PDF: Automatische Extraktion von Texten, Bildern und Diagrammdaten
- DOCX: Analyse der Kapitelstruktur und eingebetteter Bilder
- Markdown: Beibehaltung der H1/H2-Hierarchie
- TXT: Intelligente Extraktion von Kernpunkten
Das bedeutet, Sie können ein technisches Dokument direkt in banana-slides ziehen und die KI damit beauftragen, eine vollständige Präsentation daraus zu erstellen.
2.3 Natürliche Sprache "Vibe-Bearbeitung"
Dies ist die innovativste Funktion von banana-slides. Nach der Generierung der PPT können Sie jede Seite mit natürlicher Sprache bearbeiten:
- "Ändere Seite 3 in einen Fallstudien-Stil"
- "Füge dem Titel einen orangen Hintergrund hinzu"
- "Das Bild auf dieser Seite ist zu komplex, ersetze es durch einen minimalistischen Linienstil"
Die KI lokalisiert die Stelle präzise und generiert sie neu. Diese Interaktionsweise fühlt sich an wie ein echtes "Gespräch mit einem Designer".
🎯 Empfehlung: Die Vibe-Bearbeitung löst mehrere Modellaufrufe aus (jede Änderung ist eine vollständige Eingabeaufforderung + Bilderzeugung). Wenn Sie eine lange Präsentation (über 20 Seiten) erstellen, empfehlen wir die Nutzung des API-Proxy-Dienstes von APIYI (apiyi.com), um Ratenbegrenzungen der offiziellen Schnittstellen zu vermeiden.
2.4 Export in verschiedene Formate
| Exportformat | Eigenschaften | Anwendungsszenario |
|---|---|---|
| Bearbeitbare PPTX | Texte, Bilder und Formen sind nachträglich bearbeitbar | Feinanpassungen erforderlich |
| Bildbasierte PPTX | Jede Seite ist ein hochauflösendes Bild | Verhindert Formatierungsfehler |
| Stabile Anzeige plattformübergreifend | Verteilung, Druck | |
| MP4-Video | Inklusive TTS-Vertonung + Untertitel | Aufgezeichnete Kurse, automatische Erklärungen |
Der MP4-Export unterstützt chinesische, englische und japanische TTS-Vertonungen mit verschiedenen Stimmen, was besonders im Bildungsbereich sehr nützlich ist.
III. Fork und lokale Bereitstellung von banana-slides: 3 Schritte zum schnellen Start
3.1 Systemanforderungen
Bitte überprüfen Sie vor der Bereitstellung von banana-slides Ihre lokale Umgebung:
| Abhängigkeit | Versionsanforderung | Hinweis |
|---|---|---|
| Docker | 20.x+ | Docker Compose für die Bereitstellung empfohlen |
| Python | 3.10+ | Für die Bereitstellung aus dem Quellcode erforderlich |
| Node.js | 16+ | Für die Frontend-Entwicklung erforderlich |
| LibreOffice | Optional | Zum Parsen von PPTX-Uploads |
| Git | Beliebig | Zum Forken und Klonen |
3.2 Schritt 1: Repository auf das eigene Konto forken
Öffnen Sie die GitHub-Projektseite github.com/Anionex/banana-slides in Ihrem Browser und klicken Sie oben rechts auf die Schaltfläche Fork, um das Repository auf Ihr eigenes Konto zu kopieren. Die Vorteile eines Forks:
- Sie können eigene Änderungen (insbesondere API-Konfigurationen) committen
- Einfachere Konfliktlösung beim Abrufen von Upstream-Updates
- Erleichtert die Bereitstellung im Team
Nachdem der Fork abgeschlossen ist, klonen Sie ihn lokal:
# Ersetzen Sie YOUR_USERNAME durch Ihren GitHub-Benutzernamen
git clone https://github.com/YOUR_USERNAME/banana-slides.git
cd banana-slides
3.3 Schritt 2: Konfigurationsdatei erstellen
Kopieren Sie die Beispiel-Konfigurationsdatei als offizielle Konfiguration:
cp .env.example .env
Die .env-Datei enthält alle API-Schlüssel, die Basis-URL, die Modellauswahl und weitere Konfigurationsoptionen. Im nächsten Kapitel wird detailliert erklärt, wie Sie diese durch den API-Proxy-Dienst von APIYI ersetzen.
3.4 Schritt 3: Start mit Docker Compose
Der einfachste Weg zum Starten ist Docker Compose:
docker compose -f docker-compose.prod.yml up -d
Nach dem Start können Sie auf folgende Dienste zugreifen:
- Frontend-Oberfläche:
http://localhost:3000 - Backend-API:
http://localhost:5000
Wenn Sie aus dem Quellcode starten möchten (für die Weiterentwicklung), können Sie Backend und Frontend separat starten:
# Backend
uv sync
uv run alembic upgrade head
uv run python app.py
# Frontend (in einem neuen Terminal)
cd frontend
npm install
npm run dev
3.5 Überprüfung der erfolgreichen Bereitstellung
Öffnen Sie http://localhost:3000. Sie sollten Folgendes sehen:
- ✅ banana-slides Startseite (gelbes Bananen-Thema)
- ✅ Die Schaltfläche "Neue PPT" ist anklickbar
- ✅ Die Generierung funktioniert nach Eingabe eines Themas
Falls bei der Generierung der Fehler "API connection failed" auftritt, liegt dies meist an einem falschen API-Schlüssel oder einer fehlerhaften Basis-URL in der .env-Datei. Lesen Sie das nächste Kapitel, um die Umstellung auf den API-Proxy-Dienst von APIYI vorzunehmen.
IV. Ersetzen von AIHubMix durch APIYI: Vollständiger Konfigurationsleitfaden für banana-slides
Die offizielle Dokumentation von banana-slides empfiehlt standardmäßig AIHubMix als API-Proxy (siehe docs.bananaslides.online/configuration#aihubmix-recommended-proxy). Sie können diesen jedoch problemlos durch APIYI (apiyi.com) ersetzen, um von günstigeren Preisen, unbegrenzter Parallelität und stabileren inländischen Proxy-Verbindungen zu profitieren.

4.1 Warum APIYI wählen?
Obwohl AIHubMix der Standard-Proxy für banana-slides ist, bietet APIYI (apiyi.com) für Langzeitnutzer mehrere klare Vorteile:
| Vergleichsmerkmal | AIHubMix (Standard) | APIYI (apiyi.com) (Empfohlen) |
|---|---|---|
| Zahlungsmethode | USD / RMB | RMB (WeChat/Alipay) |
| Preisvorteil | Standardpreis | 10% Bonus bei 100 USD Aufladung (≈ 15% Rabatt) |
| Parallelitätslimit | Gestaffelt nach Paket | Keine Begrenzung |
| API-Format | Kompatibel mit OpenAI/Gemini | Vollständig kompatibel mit nativen Formaten |
| Integrationsaufwand | base_url anpassen | base_url anpassen (ebenso einfach) |
| Failover | Einzelkanal | Lastverteilung über mehrere Server |
| Technischer Support | Ticketsystem | Chinesischer Support + WeChat-Gruppe |
4.2 .env-Datei anpassen: Gemini-Format (empfohlen für nano banana pro)
banana-slides verwendet standardmäßig das Gemini-Format für den Aufruf von nano banana pro. Öffnen Sie die .env-Datei und suchen Sie die folgenden Konfigurationen:
Vor der Änderung (AIHubMix-Standardkonfiguration):
AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=your-aihubmix-key
GOOGLE_API_BASE=https://aihubmix.com/gemini
Nach der Änderung (Ersetzung durch APIYI apiyi.com):
AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=sk-your-apiyi-key-here
GOOGLE_API_BASE=https://vip.apiyi.com/gemini
🎯 Wichtiger Hinweis: APIYI (apiyi.com) ist vollständig mit dem nativen Gemini-Pfaddesign der
base_urlkompatibel. Sie müssen lediglich die Domainaihubmix.comdurchvip.apiyi.comersetzen; der Pfad/geminibleibt unverändert.
4.3 .env-Datei anpassen: OpenAI-Format
Wenn Sie GPT-Modelle für die Generierung von PPT-Textinhalten verwenden möchten, können Sie auf das OpenAI-Format umstellen:
Vor der Änderung:
AI_PROVIDER_FORMAT=openai
OPENAI_API_KEY=your-aihubmix-key
OPENAI_API_BASE=https://aihubmix.com/v1
Nach der Änderung (Ersetzung durch APIYI):
AI_PROVIDER_FORMAT=openai
OPENAI_API_KEY=sk-your-apiyi-key-here
OPENAI_API_BASE=https://vip.apiyi.com/v1
4.4 .env-Datei anpassen: Anthropic-Format
Wenn Sie Claude-Modelle für eine höhere Qualität der PPT-Texte nutzen möchten, unterstützt banana-slides auch das Anthropic-Format:
Nach der Änderung (Ersetzung durch APIYI):
AI_PROVIDER_FORMAT=anthropic
ANTHROPIC_API_KEY=sk-your-apiyi-key-here
ANTHROPIC_API_BASE=https://vip.apiyi.com
4.5 Mischkonfiguration: Unterschiedliche Modelle für Text und Bilder
banana-slides unterstützt die Verwendung unterschiedlicher Modellquellen für die Text- und Bilderzeugung. Nutzen Sie beispielsweise Claude Sonnet 4.5 für Text und nano banana pro für Bilder:
# Textgenerierung - Anthropic-Format für Claude
TEXT_MODEL_PROVIDER=anthropic
TEXT_MODEL_NAME=claude-sonnet-4-5
ANTHROPIC_API_KEY=sk-your-apiyi-key-here
ANTHROPIC_API_BASE=https://vip.apiyi.com
# Bilderzeugung - Gemini-Format für nano banana pro
IMAGE_MODEL_PROVIDER=gemini
IMAGE_MODEL_NAME=gemini-2.5-flash-image
GOOGLE_API_KEY=sk-your-apiyi-key-here
GOOGLE_API_BASE=https://vip.apiyi.com/gemini
💡 Wichtiger Vorteil: Mit einem einzigen API-Schlüssel von APIYI (apiyi.com) können Sie alle Modelle der Formate Gemini, OpenAI und Anthropic gleichzeitig aufrufen, ohne bei drei verschiedenen Anbietern Konten beantragen zu müssen – ein deutlicher Komfortgewinn gegenüber der offiziellen Direktverbindung.
4.6 Dienst neu starten und überprüfen
Starten Sie banana-slides nach der Änderung der .env-Datei neu, damit die Konfiguration wirksam wird:
# Docker Compose Modus
docker compose -f docker-compose.prod.yml down
docker compose -f docker-compose.prod.yml up -d
# Quellcode-Modus
# Starten Sie uv run python app.py neu
Erstellen Sie im Frontend eine Test-PPT mit dem Befehl: "Erstelle eine 5-seitige PPT über AI Agents" und beobachten Sie die Terminal-Logs:
- ✅ Wenn Sie
Connecting to https://vip.apiyi.com/...sehen, wird der API-Proxy-Dienst von APIYI genutzt - ✅ Antwortzeit < 30 Sekunden (für die erste Generierung)
- ✅ Keine 429 / 503 Fehler
4.7 Änderungen in den eigenen Fork committen (Team-Bereitstellung)
Bei einer Bereitstellung im Team können Sie die angepasste .env.example in Ihren Fork committen (achten Sie darauf, die echte .env-Datei nicht zu committen):
# Erstellen Sie eine .env.example.apiyi Konfigurationsvorlage
cp .env .env.example.apiyi
# Bearbeiten Sie die Datei, ersetzen Sie den echten API-Schlüssel durch einen Platzhalter
# Und committen Sie
git add .env.example.apiyi
git commit -m "feat: add APIYI (apiyi.com) configuration template"
git push origin main
Auf diese Weise können Teammitglieder, die Ihren Fork klonen, diese Vorlage direkt verwenden und sparen Zeit bei der Konfiguration.
V. banana-slides in der Praxis: 5 typische Anwendungsszenarien
5.1 Szenario 1: Schüler erstellen schnell eine Präsentation für den Unterricht
Ziel: Erstellung einer Präsentation mit 10 Folien für einen Kurs innerhalb von 30 Minuten.
Ablauf:
- banana-slides öffnen und den Modus "Generierung mit einem Satz" wählen.
- Thema eingeben, z. B.: "Einführung in die Prinzipien der Quantencomputer".
- Die KI generiert automatisch eine Gliederung (ca. 30 Sekunden).
- Klick auf "Alle Seiten generieren" (ca. 5-8 Minuten, abhängig von der Geschwindigkeit der Bilderzeugung).
- Einzelne Seiten mit Vibe bearbeiten und feinjustieren.
- Als PPTX exportieren.
Geschätzter API-Verbrauch: 10 Folien verbrauchen ca. 50-80K Tokens (Text) + 10-15 Aufrufe für die Bilderzeugung. Es wird empfohlen, den API-Proxy-Dienst von APIYI (apiyi.com) zu nutzen, um Ratenbegrenzungen zu vermeiden.
5.2 Szenario 2: Lehrer wandeln Unterrichtspläne in Lehrmaterialien um
Ziel: Vorhandene Word-Unterrichtspläne in illustrierte Lehr-Präsentationen umwandeln.
Ablauf:
- DOCX-Unterrichtsplan hochladen.
- banana-slides analysiert automatisch die Kapitelstruktur.
- Modus "Seiten nach Kapiteln generieren" wählen.
- Die KI generiert für jeden Wissenspunkt das passende Bild.
- Export als MP4 (inklusive chinesischer TTS-Vertonung), direkt als Aufzeichnung für den Unterricht verwendbar.
5.3 Szenario 3: Berufstätige erstellen Geschäftsvorschläge
Ziel: Basierend auf einer Anforderungsbeschreibung eine professionelle Geschäftspräsentation erstellen.
Ablauf:
- Modus "Seitenbeschreibung" wählen, um den Inhalt jeder Seite präzise zu steuern.
- Firmenlogo und Markenfarben als Vorlagenreferenz hochladen.
- Vibe-Editor verwenden, um den Stil der Bilder auf jeder Seite anzupassen.
- Export als bearbeitbare PPTX-Datei für den letzten Feinschliff.
5.4 Szenario 4: Tech-Blogger erstellen Produktpräsentationen
Ziel: Erstellung einer Produktpräsentation mit 30 Folien innerhalb von 3 Stunden.
Ablauf:
- Markdown-Dokument mit Produktfunktionen vorbereiten.
- In banana-slides hochladen und "Seiten nach H2/H3 trennen" wählen.
- Die KI generiert automatisch die entsprechenden Visualisierungen.
- Vorlagenbilder verwenden, um einen einheitlichen visuellen Stil zu gewährleisten.
- Export in beiden Formaten: PDF + PPTX.
5.5 Szenario 5: Private Bereitstellung für das Team
Ziel: banana-slides im Firmennetzwerk für das gesamte Team bereitstellen.
Ablauf:
- Repository in die GitHub-Organisation des Unternehmens forken.
.env-Konfiguration auf den API-Proxy-Dienst von APIYI (apiyi.com) umstellen.- Auf einem internen Server bereitstellen (Docker Compose).
- Internen Domainnamen über Nginx konfigurieren.
- Teammitglieder greifen über das Intranet zu.
💡 Gemeinsame Empfehlung für alle Szenarien: Alle 5 Szenarien erfordern zahlreiche Modellaufrufe (jede Präsentation enthält mehrere Text- und Bilderzeugungen). Wir empfehlen, banana-slides an den API-Proxy-Dienst von APIYI (apiyi.com) anzubinden, um von unbegrenzter Parallelität zu profitieren und sicherzustellen, dass die Geschwindigkeit der Präsentationserstellung nicht durch die Ratenbegrenzungen der offiziellen Schnittstellen beeinträchtigt wird.
VI. Häufig gestellte Fragen (FAQ) zu banana-slides
Q1: Was unterscheidet banana-slides von kommerziellen KI-PPT-Tools (wie Gamma, MindStudio)?
Der Hauptunterschied liegt im Open-Source-Charakter und der Anpassbarkeit. Kommerzielle Tools wie Gamma sind Cloud-SaaS-Lösungen mit Abonnement-Modellen; banana-slides ist ein Open-Source-Projekt (AGPL-3.0-Lizenz), das lokal bereitgestellt, frei modifiziert und mit beliebigen KI-Modellen verbunden werden kann.
Wenn Sie nur gelegentlich Präsentationen erstellen, ist Gamma möglicherweise bequemer. Wenn Sie jedoch:
- eine private Bereitstellung im Team benötigen,
- API-Kosten kontrollieren möchten,
- die Generierungslogik anpassen wollen,
- oder auf APIs zugreifen müssen, die in China erreichbar sind,
dann ist banana-slides die bessere Wahl. In Kombination mit dem API-Proxy-Dienst von APIYI (apiyi.com) erreichen Sie volle Autonomie.
Q2: Ich habe keinen Google API-Schlüssel, muss ich zwingend Gemini beantragen, um banana-slides zu nutzen?
Nein. banana-slides unterstützt drei API-Formate (Gemini / OpenAI / Anthropic). Sie benötigen lediglich einen Schlüssel von einem dieser Anbieter.
Der einfachste Weg ist die Registrierung bei APIYI (apiyi.com). Mit einem einzigen Schlüssel können Sie gleichzeitig Gemini (inkl. nano banana pro Bilderzeugung), GPT und Claude aufrufen, ohne separate Anträge stellen zu müssen. Zahlungen in RMB sind möglich, inklusive WeChat/Alipay.
Q3: Werden bestehende Funktionen beeinträchtigt, wenn ich AIHubMix durch APIYI ersetze?
Überhaupt nicht. banana-slides bestimmt die API-Aufrufadresse über die Umgebungsvariablen GOOGLE_API_BASE und OPENAI_API_BASE. Solange der Dienstleister die entsprechenden API-Protokolle unterstützt (APIYI (apiyi.com) ist vollständig kompatibel mit den nativen Formaten von Gemini, OpenAI und Anthropic), funktionieren alle Funktionen einwandfrei, einschließlich nano banana pro Bilderzeugung, TTS-Vertonung und Vibe-Editor.
Q4: Wie lautet der Modellname für nano banana pro bei APIYI?
Die offizielle Modell-ID für nano banana pro bei APIYI (apiyi.com) lautet gemini-2.5-flash-image (offizielle Google-Bezeichnung). In der .env-Datei von banana-slides kann dies wie folgt konfiguriert werden:
IMAGE_MODEL_NAME=gemini-2.5-flash-image
GOOGLE_API_BASE=https://vip.apiyi.com/gemini
Q5: Wie hoch sind die API-Kosten für eine Präsentation mit 30 Folien?
Schätzung:
- Textgenerierung (Gliederung + Inhalt): ca. 100-200K Tokens
- Bilderzeugung (1-2 Bilder pro Seite): ca. 30-60 Aufrufe
- Gesamtkosten: Nach Abzug des 10%-Bonus bei Aufladung über APIYI (apiyi.com) (ca. 15% Rabatt), liegen die Kosten bei etwa 1-3 USD.
Q6: Gibt es Verzögerungen, wenn mehrere Personen gleichzeitig auf dem Firmenserver arbeiten?
Der Hauptengpass liegt bei der API-Parallelität. banana-slides selbst basiert auf einer Flask + SQLite-Architektur und kann 10-20 Personen gleichzeitig bedienen. Der Engpass tritt normalerweise auf der Ebene der API-Aufrufe auf – bei offiziellen API-Schnittstellen greifen Ratenbegrenzungen. Mit dem API-Proxy-Dienst von APIYI (apiyi.com) profitieren Sie von unbegrenzter Parallelität, sodass auch bei gleichzeitiger Erstellung durch mehrere Personen keine Drosselung erfolgt.
Q7: Ist die kommerzielle Nutzung von banana-slides kostenpflichtig?
Ja. banana-slides unterliegt der AGPL-3.0-Lizenz. Die private und nicht-kommerzielle Nutzung ist kostenlos. Für eine kommerzielle Bereitstellung müssen Sie den Autor kontaktieren, um eine kommerzielle Lizenz zu erwerben (Kontakt-E-Mail: [email protected]). Auch bei einer kommerziellen Lizenz kann der API-Proxy-Dienst von APIYI (apiyi.com) weiterhin genutzt werden; beides schließt sich nicht aus.
Q8: Wie bleibe ich bei Updates von banana-slides auf dem Laufenden?
Da Sie das Repository geforkt haben, können Sie Upstream-Updates regelmäßig wie folgt synchronisieren:
# Upstream-Repository hinzufügen
git remote add upstream https://github.com/Anionex/banana-slides.git
# Upstream-Updates abrufen
git fetch upstream
git checkout main
git merge upstream/main
# Auf den eigenen Fork pushen
git push origin main
Achten Sie darauf, Ihre modifizierte .env-Konfiguration beizubehalten, damit diese nicht überschrieben wird.
VII. banana-slides: Die wichtigsten Erkenntnisse
- ✅ banana-slides ist ein Open-Source-KI-PPT-Generator, der auf dem nano banana pro Bildmodell basiert und über 14.000 GitHub-Sterne verfügt.
- ✅ Unterstützt verschiedene Eingabemethoden: Einzelsatz, Gliederung, Seitenbeschreibung sowie Upload von PDF-, DOCX-, MD- oder TXT-Materialien.
- ✅ Drei Exportformate: Editierbare PPTX-Dateien, PDF und MP4-Videos (inklusive TTS-Vertonung).
- ✅ Fork & Deployment in 3 Schritten: Forken →
cp .env.example .env→docker compose up. - ✅ Unterstützt 3 API-Formate: Gemini (Standard), OpenAI und Anthropic.
- ✅ Einfacher Wechsel von AIHubMix zu APIYI: Ändern Sie einfach die
base_urlvonaihubmix.comaufvip.apiyi.com. - ✅ Vorteile von APIYI (apiyi.com): Native Formatkompatibilität, keine Begrenzung der Parallelität, 10 % Bonus bei 100 USD Aufladung (entspricht ca. 15 % Rabatt) und Zahlung in RMB möglich.
- ✅ Ein API-Schlüssel für drei Formate: Vollständige Kompatibilität mit Gemini, OpenAI und Anthropic.
VIII. Fazit
banana-slides ist ein Open-Source-KI-PPT-Generator, den man langfristig im Auge behalten sollte. Er kombiniert die Bilderzeugungsfähigkeiten von nano banana pro mit dem „Vibe-Editing“-Interaktionsparadigma, sodass auch Laien innerhalb von 30 Minuten professionelle Präsentationen erstellen können.
Für Entwickler, die sich für ein Fork-Deployment entscheiden, ist die Konfiguration des API-Anbieters der entscheidende Schritt. Obwohl der offiziell empfohlene Dienst AIHubMix funktioniert, bietet der Wechsel zu APIYI (apiyi.com) klare Vorteile: volle Kompatibilität mit den nativen Formaten von Gemini, OpenAI und Anthropic (ohne Anpassung des Geschäftscodes), keine Begrenzung der Parallelität (keine Drosselung bei mehreren Benutzern oder großen PPTs), Kostenvorteile durch 10 % Bonus bei 100 USD Aufladung (entspricht 85 % des offiziellen Preises) sowie einfache Zahlung in RMB (via WeChat/Alipay).
Der Austauschprozess ist denkbar einfach: Ändern Sie lediglich die GOOGLE_API_BASE (oder OPENAI_API_BASE bzw. ANTHROPIC_API_BASE) in der .env-Datei von https://aihubmix.com/... auf https://vip.apiyi.com/... und tragen Sie Ihren API-Schlüssel von APIYI ein.
Wenn Sie ein KI-PPT-Generierungssystem für Ihr Team aufbauen oder sich selbst bzw. Studenten ein kostengünstiges Tool zur Verfügung stellen möchten, ist die Kombination aus banana-slides und APIYI (apiyi.com) derzeit die benutzerfreundlichste Lösung für Entwickler in China. Forken Sie das Projekt noch heute – innerhalb einer Stunde können Sie Ihre erste KI-generierte Präsentation erstellen.
🎯 Nächste Schritte: Besuchen Sie APIYI (apiyi.com), registrieren Sie ein Konto und fordern Sie Ihren API-Schlüssel an. Forken Sie anschließend
github.com/Anionex/banana-slidesauf Ihr GitHub-Konto, passen Sie die.env-Datei gemäß Kapitel 4 an und starten Sie den Dienst, um mit einer einfachen Eingabeaufforderung Ihre erste PPT zu generieren.
Referenzmaterialien
-
banana-slides GitHub-Repository: Haupt-Repository des Projekts
- Link:
github.com/Anionex/banana-slides - Beschreibung: Enthält den vollständigen Quellcode, Docker-Compose-Konfigurationen und eine englischsprachige README.
- Link:
-
Offizielle banana-slides-Dokumentation: Leitfaden für Konfiguration und Bereitstellung
- Link:
docs.bananaslides.online/configuration - Beschreibung: Enthält einen Abschnitt zu empfohlenen Proxys für AIHubMix; dieser Artikel zeigt Ihnen, wie Sie diese durch APIYI ersetzen.
- Link:
-
nano banana pro Modellbeschreibung: Offizielles Bilderzeugungsmodell von Google
- Link:
ai.google.dev/gemini-api/docs/image-generation - Beschreibung: Die Modell-ID lautet
gemini-2.5-flash-image.
- Link:
-
APIYI-Website: Plattform für API-Proxy-Dienste für Claude, Gemini und OpenAI
- Link:
apiyi.com - Beschreibung: Native Formatkompatibilität, unbegrenzte Nebenläufigkeit, Aufladung in RMB möglich, 10 % Bonus bei einer Aufladung von 100 USD.
- Link:
Autor: Technisches Team
Letzte Aktualisierung: 01.05.2026
Über APIYI: APIYI (apiyi.com) ist ein professioneller Anbieter für API-Proxy-Dienste für große Sprachmodelle. Wir bieten einen stabilen Zugang zu einer vollständigen Palette von Modellen, darunter Gemini (einschließlich nano banana pro), Claude Sonnet 4.5, Claude Opus 4.7, die GPT-Serie und mehr. Der Dienst ist vollständig kompatibel mit den nativen Formaten von Gemini, OpenAI und Anthropic. Bei einer Aufladung von 100 USD erhalten Sie 10 % Bonus (entspricht einem Rabatt von 15 % gegenüber den offiziellen Preisen), es gibt keine Begrenzung der Nebenläufigkeit und wir bieten einen schnellen technischen Support.
