作者注:banana-slides 是基於 nano banana pro 的開源 AI PPT 生成應用,本文從新人視角完整介紹 Fork 部署流程,並教你將默認的 AIHubMix 代理替換爲 API易,實現更穩定的中轉調用。
GitHub 上有一款最近爆火的開源 AI PPT 生成器 banana-slides,它基於 Google 最新的 nano banana pro 圖像模型,主打"一句話生成可編輯 PPT、支持視頻導出、自然語言修改任意區域",目前已經收穫 14K+ GitHub Stars。
這不是又一個套殼的 AI PPT 工具,而是一個真正可以本地化部署、源碼完全開放的"Vibe PPT"系統,支持 Gemini、OpenAI、Anthropic、Vertex AI 等多種模型格式,官方文檔默認推薦使用 AIHubMix 作爲代理。
核心價值: 讀完本文,你將學會如何 Fork banana-slides 項目並完成本地部署,更重要的是——掌握將默認的 AIHubMix 代理替換爲 API易 apiyi.com 中轉的完整配置方法,享受不限併發、原生格式、充值 100 美金送 10% 的成本優勢。

一、banana-slides 是什麼:開源 AI PPT 生成器的 3 個核心定位
banana-slides 是由開發者 Anionex 主導的開源項目,定位是 基於 nano banana pro 的原生 AI PPT 生成應用。它的核心理念是"Vibe PPT"——你可以用對話式的語言指揮 AI 生成、修改、迭代任意一頁幻燈片。
1.1 banana-slides 的核心定位
| 定位維度 | banana-slides 的特點 | 與傳統 AI PPT 工具差異 |
|---|---|---|
| 底層模型 | 基於 nano banana pro 圖像生成 | 多數工具用模板拼接 |
| 部署模式 | 完全開源 + 本地化部署 | SaaS 產品鎖定雲端 |
| License | AGPL-3.0(商用需授權) | 閉源訂閱制 |
| 修改方式 | 自然語言"Vibe 編輯" | 拖拽手工編輯 |
| 輸入素材 | PDF/DOCX/MD/TXT 任意格式 | 僅支持文本/大綱 |
| 導出格式 | 可編輯 PPTX + PDF + MP4(含 TTS 配音) | 多數僅 PPTX |
| API 提供商 | 支持多家,默認推薦 AIHubMix | 通常綁定單一供應商 |
1.2 爲什麼 banana-slides 值得新人關注
如果你剛接觸 AI PPT 生成這個領域,banana-slides 提供了一個比商業 SaaS 更"自由"的選擇:
- 代碼完全開源:可以二次開發、私有化部署
- 圖像質量出衆:依賴 nano banana pro,生成的配圖遠超傳統 PPT 模板
- 多模型適配:可以用 Gemini、OpenAI、Anthropic 中的任意一家作爲後端
- 靈活替換 API:默認推薦 AIHubMix,但完全可以替換爲其他兼容服務(如 API易 apiyi.com)
💡 新人建議:如果你沒有 Google API Key 或 OpenAI Key,最簡單的方式是使用 API易 apiyi.com 的中轉服務,一個 Key 就能同時訪問 Gemini、Claude、GPT 等全系列模型,避免分別申請多家賬號的麻煩。
1.3 banana-slides 適合哪些用戶
- 學生:快速完成課程作業、畢業答辯 PPT
- 教師:把課件內容轉成圖文並茂的教學幻燈片
- 職場人:商業提案、項目彙報、季度總結
- 開發者:想要私有化部署 AI PPT 工具的團隊
- 設計師:從 AI 生成的版面中獲取靈感
二、banana-slides 核心功能:4 大特性詳解
banana-slides 的功能設計圍繞"降低 PPT 製作門檻"這一核心目標,主要包含 4 個層面的能力。

2.1 多路徑內容生成
banana-slides 支持三種內容輸入方式,適配不同場景:
| 輸入方式 | 使用場景 | 輸出粒度 |
|---|---|---|
| 一句話生成 | 臨時演講、靈感初稿 | AI 自動生成大綱 + 全部頁面 |
| 大綱模式 | 已有清晰結構 | 按大綱自動擴展每頁內容 |
| 頁面描述模式 | 精細控制 | 逐頁指定文字 + 配圖 |
2.2 素材智能解析
banana-slides 可以接受多種格式的素材文件,並自動提取關鍵信息:
- PDF:自動提取文字、圖片、圖表數據
- DOCX:解析章節結構和嵌入圖片
- Markdown:保留 H1/H2 層級關係
- TXT:智能提取關鍵點
這意味着你可以把一篇技術文檔直接拖進 banana-slides,讓 AI 幫你轉成完整的演講稿。
2.3 自然語言"Vibe 編輯"
這是 banana-slides 最有創新性的功能。生成 PPT 後,你可以用自然語言修改任意一頁:
- "把第 3 頁改成案例分析風格"
- "給標題加一個橘色背景"
- "這頁的配圖太複雜,換成簡潔線條風格"
AI 會精準定位修改位置並重新生成,這種交互方式接近真實的"和設計師對話"。
🎯 使用建議:Vibe 編輯會觸發多次 API 調用(每次修改都是一次完整的 prompt + 圖像生成),如果你做的是長 PPT(20 頁以上),建議使用 API易 apiyi.com 的中轉服務,避免官方接口的速率限制問題。
2.4 多格式導出
| 導出格式 | 特點 | 適用場景 |
|---|---|---|
| 可編輯 PPTX | 文字、圖片、形狀均可二次編輯 | 後續需要微調 |
| 圖片版 PPTX | 每頁是高清圖片 | 防止格式錯亂 |
| 跨平臺穩定顯示 | 分發、打印 | |
| MP4 視頻 | 包含 TTS 配音 + 字幕 | 錄播課、自動講解 |
MP4 導出支持中文、英文、日文 TTS 配音,並可選擇多種音色,對教育場景特別友好。
三、Fork 和本地部署 banana-slides:3 步快速上手
3.1 系統環境要求
部署 banana-slides 前請確認本地環境:
| 依賴項 | 版本要求 | 說明 |
|---|---|---|
| Docker | 20.x+ | 推薦 Docker Compose 部署 |
| Python | 3.10+ | 源碼部署需要 |
| Node.js | 16+ | 前端開發需要 |
| LibreOffice | 可選 | 用於 PPTX 上傳解析 |
| Git | 任意 | 用於 Fork 和克隆 |
3.2 第一步:Fork 倉庫到自己的賬號
在瀏覽器打開 GitHub 項目主頁 github.com/Anionex/banana-slides,點擊右上角的 Fork 按鈕,將倉庫 Fork 到你自己的賬號下。Fork 的好處:
- 後續可以提交自己的修改(特別是 API 配置)
- 拉取上游更新時方便衝突處理
- 便於團隊協作部署
Fork 完成後,克隆到本地:
# 替換 YOUR_USERNAME 爲你的 GitHub 用戶名
git clone https://github.com/YOUR_USERNAME/banana-slides.git
cd banana-slides
3.3 第二步:創建配置文件
複製示例配置文件爲正式配置:
cp .env.example .env
.env 文件包含所有 API Key、Base URL、模型選擇等配置項,下一章會詳細講解如何替換爲 API易 中轉。
3.4 第三步:使用 Docker Compose 啓動
最簡單的啓動方式是 Docker Compose:
docker compose -f docker-compose.prod.yml up -d
啓動後訪問:
- 前端界面:
http://localhost:3000 - 後端 API:
http://localhost:5000
如果你想從源碼運行(便於二次開發),可以分別啓動後端和前端:
# 後端
uv sync
uv run alembic upgrade head
uv run python app.py
# 前端(新開一個終端)
cd frontend
npm install
npm run dev
3.5 驗證部署是否成功
打開 http://localhost:3000,應該看到:
- ✅ banana-slides 首頁(黃色香蕉主題)
- ✅ "新建 PPT" 按鈕可點擊
- ✅ 輸入一句話主題後能正常生成
如果生成時報錯"API connection failed",通常是 .env 中的 API Key 或 Base URL 配置錯誤,參考下一章替換爲 API易 中轉可解決。
四、替換 AIHubMix 爲 API易:banana-slides 配置完整指南
banana-slides 的官方文檔默認推薦使用 AIHubMix 作爲 API 代理(參考 docs.bananaslides.online/configuration#aihubmix-recommended-proxy)。但你完全可以將其替換爲 API易 apiyi.com,享受更優惠的價格、不限併發、更穩定的國內中轉線路。

4.1 爲什麼選擇替換爲 API易
雖然 AIHubMix 是 banana-slides 默認推薦的代理,但對於長期使用 banana-slides 的用戶,API易 apiyi.com 有幾個明顯優勢:
| 對比維度 | AIHubMix(默認) | API易 apiyi.com(推薦) |
|---|---|---|
| 支付方式 | 美元 / 國內人民幣 | 國內人民幣(微信/支付寶) |
| 價格優惠 | 標準價 | 充值 100 美金送 10%(≈ 官網 85 折) |
| 併發限制 | 按套餐分級 | 不限併發 |
| API 格式 | 兼容 OpenAI/Gemini | 完全兼容 OpenAI/Gemini/Anthropic 原生格式 |
| 接入難度 | 改 base_url 即可 | 改 base_url 即可(同樣簡單) |
| 故障切換 | 單一通道 | 多機房負載均衡 |
| 技術支持 | 工單 | 中文客服 + 微信羣 |
4.2 修改 .env 文件:Gemini 格式(推薦用於 nano banana pro)
banana-slides 默認使用 Gemini 格式調用 nano banana pro。打開 .env 文件,找到以下配置:
修改前(AIHubMix 默認配置):
AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=your-aihubmix-key
GOOGLE_API_BASE=https://aihubmix.com/gemini
修改後(替換爲 API易 apiyi.com):
AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=sk-your-apiyi-key-here
GOOGLE_API_BASE=https://vip.apiyi.com/gemini
🎯 關鍵說明:API易 apiyi.com 完全兼容 Gemini 原生格式的 base_url 路徑設計,所以只需要把域名
aihubmix.com替換爲vip.apiyi.com,路徑/gemini保持不變即可。
4.3 修改 .env 文件:OpenAI 格式
如果你想用 GPT 系列模型生成 PPT 文本內容,可以切換到 OpenAI 格式:
修改前:
AI_PROVIDER_FORMAT=openai
OPENAI_API_KEY=your-aihubmix-key
OPENAI_API_BASE=https://aihubmix.com/v1
修改後(替換爲 API易):
AI_PROVIDER_FORMAT=openai
OPENAI_API_KEY=sk-your-apiyi-key-here
OPENAI_API_BASE=https://vip.apiyi.com/v1
4.4 修改 .env 文件:Anthropic 格式
如果你希望用 Claude 模型來生成更高質量的 PPT 文本,banana-slides 也支持 Anthropic 格式:
修改後(替換爲 API易):
AI_PROVIDER_FORMAT=anthropic
ANTHROPIC_API_KEY=sk-your-apiyi-key-here
ANTHROPIC_API_BASE=https://vip.apiyi.com
4.5 混合配置:文本 + 圖像分別使用不同模型
banana-slides 支持文本生成和圖像生成使用不同的模型源。例如,用 Claude Sonnet 4.5 生成文本,用 nano banana pro 生成配圖:
# 文本生成 - 用 Anthropic 格式調 Claude
TEXT_MODEL_PROVIDER=anthropic
TEXT_MODEL_NAME=claude-sonnet-4-5
ANTHROPIC_API_KEY=sk-your-apiyi-key-here
ANTHROPIC_API_BASE=https://vip.apiyi.com
# 圖像生成 - 用 Gemini 格式調 nano banana pro
IMAGE_MODEL_PROVIDER=gemini
IMAGE_MODEL_NAME=gemini-2.5-flash-image
GOOGLE_API_KEY=sk-your-apiyi-key-here
GOOGLE_API_BASE=https://vip.apiyi.com/gemini
💡 重要優勢:API易 apiyi.com 的同一個 API Key 可以同時調用 Gemini、OpenAI、Anthropic 三種格式的所有模型,不需要分別申請三家的賬號——這是相比官方直連最大的便利性提升。
4.6 重啓服務並驗證
修改 .env 後,重啓 banana-slides 讓新配置生效:
# Docker Compose 模式
docker compose -f docker-compose.prod.yml down
docker compose -f docker-compose.prod.yml up -d
# 源碼模式
# 重啓 uv run python app.py
在前端創建一個測試 PPT,輸入一句話:"給我做一份關於 AI Agent 的 5 頁 PPT",觀察終端日誌:
- ✅ 看到
Connecting to https://vip.apiyi.com/...表示走 API易中轉 - ✅ 響應時間 < 30 秒(首頁生成)
- ✅ 沒有 429 / 503 錯誤
4.7 提交修改到自己的 Fork(團隊部署)
如果是團隊部署,可以把修改後的 .env.example 提交到自己的 Fork 中(注意不要提交真實的 .env):
# 創建一個 .env.example.apiyi 配置模板
cp .env .env.example.apiyi
# 編輯文件,把真實 API Key 替換爲佔位符
# 然後提交
git add .env.example.apiyi
git commit -m "feat: add API易 (apiyi.com) configuration template"
git push origin main
這樣團隊成員 Clone 你的 Fork 後,可以直接複製這個模板使用,省去重新查找配置的時間。
五、banana-slides 實戰場景:5 大典型應用案例
5.1 場景一:學生快速做課堂展示 PPT
目標:30 分鐘內完成一份 10 頁的課程展示 PPT
操作流程:
- 打開 banana-slides,選擇"一句話生成"模式
- 輸入主題,例如:"關於量子計算原理的入門講解"
- AI 自動生成大綱(約 30 秒)
- 點擊生成全部頁面(約 5-8 分鐘,依賴圖像生成速度)
- 用 Vibe 編輯微調個別頁面
- 導出 PPTX
API 用量預估:10 頁 PPT 約消耗 50-80K tokens(文本)+ 10-15 次圖像生成。建議使用 API易 apiyi.com 中轉避免速率限制。
5.2 場景二:教師把教案轉成教學課件
目標:把現有的 Word 教案轉成圖文並茂的教學 PPT
操作流程:
- 上傳 DOCX 教案文件
- banana-slides 自動解析章節結構
- 選擇"按章節生成頁面"
- AI 爲每個知識點生成對應的配圖
- 導出 MP4(含 TTS 中文配音),可直接作爲錄播課
5.3 場景三:職場人做商業提案
目標:基於一段需求描述,生成專業的商業提案 PPT
操作流程:
- 選擇"頁面描述模式",精細控制每頁內容
- 上傳公司 Logo 和品牌色作爲模板參考
- 用 Vibe 編輯調整每頁配圖風格
- 導出可編輯 PPTX,再做最後的細節微調
5.4 場景四:技術博主做發佈會演示
目標:3 小時內做一份 30 頁的產品發佈會 PPT
操作流程:
- 準備產品功能 Markdown 文檔
- 上傳到 banana-slides,選擇"按 H2/H3 拆頁"
- AI 自動生成對應的可視化配圖
- 用模板圖片確保視覺風格統一
- 導出 PDF + PPTX 雙格式
5.5 場景五:私有化部署給團隊使用
目標:在公司內網部署 banana-slides 給整個團隊使用
操作流程:
- Fork 倉庫到公司 GitHub 組織
- 修改
.env配置爲 API易 apiyi.com 中轉 - 部署到內網服務器(Docker Compose)
- 用 Nginx 配置內部域名
- 團隊成員通過內網訪問
💡 場景共性建議:以上 5 個場景都涉及大量的 API 調用(每個 PPT 都包含多次文本生成 + 多次圖像生成)。我們建議把 banana-slides 接到 API易 apiyi.com 的中轉服務上,享受不限併發的優勢,確保 PPT 生成速度不受官方接口速率限制的影響。
六、banana-slides 常見問題 FAQ
Q1: banana-slides 和市面上的 AI PPT 工具(如 Gamma、MindStudio)有什麼區別?
核心區別在於開源和可定製性。Gamma 等商業工具是雲端 SaaS,按頁或按月訂閱;banana-slides 是開源項目(AGPL-3.0 許可證),可以本地部署、自由修改源碼、對接任意 AI 模型。
如果你只是偶爾做 PPT,可能 Gamma 更省心;但如果你需要:
- 團隊私有化部署
- 控制 API 成本
- 修改生成邏輯
- 用國內可訪問的 API
那 banana-slides 是更好的選擇,配合 API易 apiyi.com 中轉可以做到完全自主可控。
Q2: 我沒有 Google API Key,必須申請 Gemini 才能用 banana-slides 嗎?
不需要。banana-slides 支持三種 API 格式(Gemini / OpenAI / Anthropic),你只需要任意一家的 Key 就能跑起來。
最簡單的方式是直接在 API易 apiyi.com 註冊一個賬號,一個 Key 即可同時調用 Gemini(含 nano banana pro 圖像生成)、GPT 和 Claude,免去分別申請的麻煩。國內人民幣充值,支持微信/支付寶。
Q3: 替換 AIHubMix 爲 API易 後,原有的功能會受影響嗎?
完全不會。banana-slides 通過環境變量 GOOGLE_API_BASE 和 OPENAI_API_BASE 來確定 API 調用地址,只要替換的服務商兼容相應的 API 協議(API易 apiyi.com 完全兼容 Gemini、OpenAI、Anthropic 原生格式),所有功能都正常工作,包括 nano banana pro 圖像生成、TTS 配音、Vibe 編輯等。
Q4: nano banana pro 在 API易 上的模型名是什麼?
API易 apiyi.com 上 nano banana pro 對應的官方模型 ID 是 gemini-2.5-flash-image(Google 官方命名)。在 banana-slides 的 .env 中可以這樣配置:
IMAGE_MODEL_NAME=gemini-2.5-flash-image
GOOGLE_API_BASE=https://vip.apiyi.com/gemini
Q5: 一份 30 頁的 PPT 大概需要多少 API 費用?
預估如下:
- 文本生成(大綱 + 內容):約 100-200K tokens
- 圖像生成(每頁 1-2 張):約 30-60 次調用
- 總成本:使用 API易 apiyi.com 充值贈送 10%(≈ 85 折)後,約 1-3 美元
Q6: 部署到公司服務器後,多人同時使用會卡頓嗎?
主要瓶頸在 API 併發。banana-slides 自身是 Flask + SQLite 架構,單機可承載 10-20 人同時使用。瓶頸通常出現在 API 調用層——如果用官方 API 接口,會被速率限制;用 API易 apiyi.com 中轉可以享受不限併發的優勢,多人同時生成 PPT 也不會被限流。
Q7: 商用 banana-slides 需要付費嗎?
需要。banana-slides 採用 AGPL-3.0 許可證,個人和非商業用途免費;如果是商業部署,需要聯繫作者購買商業授權(聯繫郵箱:[email protected])。但即使是商用授權,API 中轉部分仍然可以使用 API易 apiyi.com,兩者不衝突。
Q8: 如何持續跟上 banana-slides 的更新?
由於你 Fork 了倉庫,可以這樣定期同步上游更新:
# 添加上游倉庫
git remote add upstream https://github.com/Anionex/banana-slides.git
# 拉取上游更新
git fetch upstream
git checkout main
git merge upstream/main
# 推送到自己的 Fork
git push origin main
注意保留你修改的 .env 配置,避免被覆蓋。
七、banana-slides Key Takeaways 核心要點
- ✅ banana-slides 是開源 AI PPT 生成器,基於 nano banana pro 圖像模型,14K+ GitHub Stars
- ✅ 支持多種輸入方式:一句話、大綱、頁面描述、PDF/DOCX/MD/TXT 素材上傳
- ✅ 三種導出格式:可編輯 PPTX、PDF、MP4 視頻(含 TTS 配音)
- ✅ Fork + 部署 3 步完成:Fork → cp .env.example .env → docker compose up
- ✅ 支持 3 種 API 格式:Gemini(默認)、OpenAI、Anthropic
- ✅ 替換 AIHubMix 爲 API易只需改 base_url:從
aihubmix.com改爲vip.apiyi.com即可 - ✅ API易 apiyi.com 優勢:原生格式兼容、不限併發、充值 100 美金送 10%(≈ 85 折)、人民幣充值
- ✅ 一個 API Key 走遍三種格式:Gemini/OpenAI/Anthropic 全部兼容
八、總結
banana-slides 是一個值得長期關注的開源 AI PPT 生成器,它把 nano banana pro 的圖像生成能力和"Vibe 編輯"的交互範式結合在一起,讓普通人也能在 30 分鐘內做出專業級的演示文稿。
對於決定 Fork 部署的開發者來說,配置 API 服務商是最關鍵的一步。官方默認推薦的 AIHubMix 雖然能用,但替換爲 API易 apiyi.com 有幾個明顯的好處:完全兼容 Gemini/OpenAI/Anthropic 三種原生格式(不需要修改任何業務代碼)、不限併發(多人/大型 PPT 不被限流)、充值 100 美金送 10% 的成本優勢(相當於官網 85 折)、國內人民幣充值(微信/支付寶即可)。
替換的過程也極其簡單——只需要把 .env 中的 GOOGLE_API_BASE(或 OPENAI_API_BASE、ANTHROPIC_API_BASE)從 https://aihubmix.com/... 改爲 https://vip.apiyi.com/...,再填入 API易 的 Key 即可。
如果你正在考慮搭建一個團隊級的 AI PPT 生成系統,或者想爲自己/學生提供一個零成本入門的 PPT 工具,banana-slides + API易 apiyi.com 的組合是目前對國內開發者最友好的方案。從今天開始 Fork 項目,1 小時內就能跑起你的第一份 AI 生成的 PPT。
🎯 下一步行動建議:先訪問 API易 apiyi.com 註冊賬號並獲取 API Key,再 Fork
github.com/Anionex/banana-slides到自己的 GitHub,按本文第四章的配置方法修改.env,啓動服務後用一句話 prompt 生成你的第一份 PPT 驗證流程。
參考資料
-
banana-slides GitHub 倉庫:項目主倉庫
- 鏈接:
github.com/Anionex/banana-slides - 說明: 包含完整源碼、Docker Compose 配置、英文 README
- 鏈接:
-
banana-slides 官方文檔:配置和部署指南
- 鏈接:
docs.bananaslides.online/configuration - 說明: 包含 AIHubMix 推薦代理章節,本文教你替換爲 API易
- 鏈接:
-
nano banana pro 模型說明:Google 官方圖像生成模型
- 鏈接:
ai.google.dev/gemini-api/docs/image-generation - 說明: 模型 ID 爲
gemini-2.5-flash-image
- 鏈接:
-
API易官網:Claude / Gemini / OpenAI 中轉服務平臺
- 鏈接:
apiyi.com - 說明: 原生格式兼容、不限併發、人民幣充值、充值 100 美金送 10%
- 鏈接:
作者: 技術團隊
最後更新: 2026-05-01
關於 API易: API易 apiyi.com 是專業的 AI 大模型 API 中轉服務商,提供 Gemini(含 nano banana pro)、Claude Sonnet 4.5、Claude Opus 4.7、GPT 系列等全系列模型的穩定接入,完全兼容原生 Gemini/OpenAI/Anthropic 三種格式,充值 100 美金贈送 10%(相當於官網 85 折),不限併發,技術支持響應快。
