|

banana-slides 完整入門:3 步 Fork 部署開源 AI PPT 生成器(API易配置教程)

作者注:banana-slides 是基於 nano banana pro 的開源 AI PPT 生成應用,本文從新人視角完整介紹 Fork 部署流程,並教你將默認的 AIHubMix 代理替換爲 API易,實現更穩定的中轉調用。

GitHub 上有一款最近爆火的開源 AI PPT 生成器 banana-slides,它基於 Google 最新的 nano banana pro 圖像模型,主打"一句話生成可編輯 PPT、支持視頻導出、自然語言修改任意區域",目前已經收穫 14K+ GitHub Stars。

這不是又一個套殼的 AI PPT 工具,而是一個真正可以本地化部署、源碼完全開放的"Vibe PPT"系統,支持 Gemini、OpenAI、Anthropic、Vertex AI 等多種模型格式,官方文檔默認推薦使用 AIHubMix 作爲代理。

核心價值: 讀完本文,你將學會如何 Fork banana-slides 項目並完成本地部署,更重要的是——掌握將默認的 AIHubMix 代理替換爲 API易 apiyi.com 中轉的完整配置方法,享受不限併發、原生格式、充值 100 美金送 10% 的成本優勢。

banana-slides-fork-tutorial-apiyi-config-zh-hant 图示

一、banana-slides 是什麼:開源 AI PPT 生成器的 3 個核心定位

banana-slides 是由開發者 Anionex 主導的開源項目,定位是 基於 nano banana pro 的原生 AI PPT 生成應用。它的核心理念是"Vibe PPT"——你可以用對話式的語言指揮 AI 生成、修改、迭代任意一頁幻燈片。

1.1 banana-slides 的核心定位

定位維度 banana-slides 的特點 與傳統 AI PPT 工具差異
底層模型 基於 nano banana pro 圖像生成 多數工具用模板拼接
部署模式 完全開源 + 本地化部署 SaaS 產品鎖定雲端
License AGPL-3.0(商用需授權) 閉源訂閱制
修改方式 自然語言"Vibe 編輯" 拖拽手工編輯
輸入素材 PDF/DOCX/MD/TXT 任意格式 僅支持文本/大綱
導出格式 可編輯 PPTX + PDF + MP4(含 TTS 配音) 多數僅 PPTX
API 提供商 支持多家,默認推薦 AIHubMix 通常綁定單一供應商

1.2 爲什麼 banana-slides 值得新人關注

如果你剛接觸 AI PPT 生成這個領域,banana-slides 提供了一個比商業 SaaS 更"自由"的選擇:

  • 代碼完全開源:可以二次開發、私有化部署
  • 圖像質量出衆:依賴 nano banana pro,生成的配圖遠超傳統 PPT 模板
  • 多模型適配:可以用 Gemini、OpenAI、Anthropic 中的任意一家作爲後端
  • 靈活替換 API:默認推薦 AIHubMix,但完全可以替換爲其他兼容服務(如 API易 apiyi.com)

💡 新人建議:如果你沒有 Google API Key 或 OpenAI Key,最簡單的方式是使用 API易 apiyi.com 的中轉服務,一個 Key 就能同時訪問 Gemini、Claude、GPT 等全系列模型,避免分別申請多家賬號的麻煩。

1.3 banana-slides 適合哪些用戶

  • 學生:快速完成課程作業、畢業答辯 PPT
  • 教師:把課件內容轉成圖文並茂的教學幻燈片
  • 職場人:商業提案、項目彙報、季度總結
  • 開發者:想要私有化部署 AI PPT 工具的團隊
  • 設計師:從 AI 生成的版面中獲取靈感

二、banana-slides 核心功能:4 大特性詳解

banana-slides 的功能設計圍繞"降低 PPT 製作門檻"這一核心目標,主要包含 4 個層面的能力。

banana-slides-fork-tutorial-apiyi-config-zh-hant 图示

2.1 多路徑內容生成

banana-slides 支持三種內容輸入方式,適配不同場景:

輸入方式 使用場景 輸出粒度
一句話生成 臨時演講、靈感初稿 AI 自動生成大綱 + 全部頁面
大綱模式 已有清晰結構 按大綱自動擴展每頁內容
頁面描述模式 精細控制 逐頁指定文字 + 配圖

2.2 素材智能解析

banana-slides 可以接受多種格式的素材文件,並自動提取關鍵信息:

  • PDF:自動提取文字、圖片、圖表數據
  • DOCX:解析章節結構和嵌入圖片
  • Markdown:保留 H1/H2 層級關係
  • TXT:智能提取關鍵點

這意味着你可以把一篇技術文檔直接拖進 banana-slides,讓 AI 幫你轉成完整的演講稿。

2.3 自然語言"Vibe 編輯"

這是 banana-slides 最有創新性的功能。生成 PPT 後,你可以用自然語言修改任意一頁:

  • "把第 3 頁改成案例分析風格"
  • "給標題加一個橘色背景"
  • "這頁的配圖太複雜,換成簡潔線條風格"

AI 會精準定位修改位置並重新生成,這種交互方式接近真實的"和設計師對話"。

🎯 使用建議:Vibe 編輯會觸發多次 API 調用(每次修改都是一次完整的 prompt + 圖像生成),如果你做的是長 PPT(20 頁以上),建議使用 API易 apiyi.com 的中轉服務,避免官方接口的速率限制問題。

2.4 多格式導出

導出格式 特點 適用場景
可編輯 PPTX 文字、圖片、形狀均可二次編輯 後續需要微調
圖片版 PPTX 每頁是高清圖片 防止格式錯亂
PDF 跨平臺穩定顯示 分發、打印
MP4 視頻 包含 TTS 配音 + 字幕 錄播課、自動講解

MP4 導出支持中文、英文、日文 TTS 配音,並可選擇多種音色,對教育場景特別友好。


三、Fork 和本地部署 banana-slides:3 步快速上手

3.1 系統環境要求

部署 banana-slides 前請確認本地環境:

依賴項 版本要求 說明
Docker 20.x+ 推薦 Docker Compose 部署
Python 3.10+ 源碼部署需要
Node.js 16+ 前端開發需要
LibreOffice 可選 用於 PPTX 上傳解析
Git 任意 用於 Fork 和克隆

3.2 第一步:Fork 倉庫到自己的賬號

在瀏覽器打開 GitHub 項目主頁 github.com/Anionex/banana-slides,點擊右上角的 Fork 按鈕,將倉庫 Fork 到你自己的賬號下。Fork 的好處:

  • 後續可以提交自己的修改(特別是 API 配置)
  • 拉取上游更新時方便衝突處理
  • 便於團隊協作部署

Fork 完成後,克隆到本地:

# 替換 YOUR_USERNAME 爲你的 GitHub 用戶名
git clone https://github.com/YOUR_USERNAME/banana-slides.git
cd banana-slides

3.3 第二步:創建配置文件

複製示例配置文件爲正式配置:

cp .env.example .env

.env 文件包含所有 API Key、Base URL、模型選擇等配置項,下一章會詳細講解如何替換爲 API易 中轉。

3.4 第三步:使用 Docker Compose 啓動

最簡單的啓動方式是 Docker Compose:

docker compose -f docker-compose.prod.yml up -d

啓動後訪問:

  • 前端界面:http://localhost:3000
  • 後端 API:http://localhost:5000

如果你想從源碼運行(便於二次開發),可以分別啓動後端和前端:

# 後端
uv sync
uv run alembic upgrade head
uv run python app.py

# 前端(新開一個終端)
cd frontend
npm install
npm run dev

3.5 驗證部署是否成功

打開 http://localhost:3000,應該看到:

  • ✅ banana-slides 首頁(黃色香蕉主題)
  • ✅ "新建 PPT" 按鈕可點擊
  • ✅ 輸入一句話主題後能正常生成

如果生成時報錯"API connection failed",通常是 .env 中的 API Key 或 Base URL 配置錯誤,參考下一章替換爲 API易 中轉可解決。


四、替換 AIHubMix 爲 API易:banana-slides 配置完整指南

banana-slides 的官方文檔默認推薦使用 AIHubMix 作爲 API 代理(參考 docs.bananaslides.online/configuration#aihubmix-recommended-proxy)。但你完全可以將其替換爲 API易 apiyi.com,享受更優惠的價格、不限併發、更穩定的國內中轉線路。

banana-slides-fork-tutorial-apiyi-config-zh-hant 图示

4.1 爲什麼選擇替換爲 API易

雖然 AIHubMix 是 banana-slides 默認推薦的代理,但對於長期使用 banana-slides 的用戶,API易 apiyi.com 有幾個明顯優勢:

對比維度 AIHubMix(默認) API易 apiyi.com(推薦)
支付方式 美元 / 國內人民幣 國內人民幣(微信/支付寶)
價格優惠 標準價 充值 100 美金送 10%(≈ 官網 85 折)
併發限制 按套餐分級 不限併發
API 格式 兼容 OpenAI/Gemini 完全兼容 OpenAI/Gemini/Anthropic 原生格式
接入難度 改 base_url 即可 改 base_url 即可(同樣簡單)
故障切換 單一通道 多機房負載均衡
技術支持 工單 中文客服 + 微信羣

4.2 修改 .env 文件:Gemini 格式(推薦用於 nano banana pro)

banana-slides 默認使用 Gemini 格式調用 nano banana pro。打開 .env 文件,找到以下配置:

修改前(AIHubMix 默認配置)

AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=your-aihubmix-key
GOOGLE_API_BASE=https://aihubmix.com/gemini

修改後(替換爲 API易 apiyi.com)

AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=sk-your-apiyi-key-here
GOOGLE_API_BASE=https://vip.apiyi.com/gemini

🎯 關鍵說明:API易 apiyi.com 完全兼容 Gemini 原生格式的 base_url 路徑設計,所以只需要把域名 aihubmix.com 替換爲 vip.apiyi.com,路徑 /gemini 保持不變即可。

4.3 修改 .env 文件:OpenAI 格式

如果你想用 GPT 系列模型生成 PPT 文本內容,可以切換到 OpenAI 格式:

修改前

AI_PROVIDER_FORMAT=openai
OPENAI_API_KEY=your-aihubmix-key
OPENAI_API_BASE=https://aihubmix.com/v1

修改後(替換爲 API易)

AI_PROVIDER_FORMAT=openai
OPENAI_API_KEY=sk-your-apiyi-key-here
OPENAI_API_BASE=https://vip.apiyi.com/v1

4.4 修改 .env 文件:Anthropic 格式

如果你希望用 Claude 模型來生成更高質量的 PPT 文本,banana-slides 也支持 Anthropic 格式:

修改後(替換爲 API易)

AI_PROVIDER_FORMAT=anthropic
ANTHROPIC_API_KEY=sk-your-apiyi-key-here
ANTHROPIC_API_BASE=https://vip.apiyi.com

4.5 混合配置:文本 + 圖像分別使用不同模型

banana-slides 支持文本生成和圖像生成使用不同的模型源。例如,用 Claude Sonnet 4.5 生成文本,用 nano banana pro 生成配圖:

# 文本生成 - 用 Anthropic 格式調 Claude
TEXT_MODEL_PROVIDER=anthropic
TEXT_MODEL_NAME=claude-sonnet-4-5
ANTHROPIC_API_KEY=sk-your-apiyi-key-here
ANTHROPIC_API_BASE=https://vip.apiyi.com

# 圖像生成 - 用 Gemini 格式調 nano banana pro
IMAGE_MODEL_PROVIDER=gemini
IMAGE_MODEL_NAME=gemini-2.5-flash-image
GOOGLE_API_KEY=sk-your-apiyi-key-here
GOOGLE_API_BASE=https://vip.apiyi.com/gemini

💡 重要優勢:API易 apiyi.com 的同一個 API Key 可以同時調用 Gemini、OpenAI、Anthropic 三種格式的所有模型,不需要分別申請三家的賬號——這是相比官方直連最大的便利性提升。

4.6 重啓服務並驗證

修改 .env 後,重啓 banana-slides 讓新配置生效:

# Docker Compose 模式
docker compose -f docker-compose.prod.yml down
docker compose -f docker-compose.prod.yml up -d

# 源碼模式
# 重啓 uv run python app.py

在前端創建一個測試 PPT,輸入一句話:"給我做一份關於 AI Agent 的 5 頁 PPT",觀察終端日誌:

  • ✅ 看到 Connecting to https://vip.apiyi.com/... 表示走 API易中轉
  • ✅ 響應時間 < 30 秒(首頁生成)
  • ✅ 沒有 429 / 503 錯誤

4.7 提交修改到自己的 Fork(團隊部署)

如果是團隊部署,可以把修改後的 .env.example 提交到自己的 Fork 中(注意不要提交真實的 .env):

# 創建一個 .env.example.apiyi 配置模板
cp .env .env.example.apiyi
# 編輯文件,把真實 API Key 替換爲佔位符
# 然後提交
git add .env.example.apiyi
git commit -m "feat: add API易 (apiyi.com) configuration template"
git push origin main

這樣團隊成員 Clone 你的 Fork 後,可以直接複製這個模板使用,省去重新查找配置的時間。


五、banana-slides 實戰場景:5 大典型應用案例

5.1 場景一:學生快速做課堂展示 PPT

目標:30 分鐘內完成一份 10 頁的課程展示 PPT

操作流程

  1. 打開 banana-slides,選擇"一句話生成"模式
  2. 輸入主題,例如:"關於量子計算原理的入門講解"
  3. AI 自動生成大綱(約 30 秒)
  4. 點擊生成全部頁面(約 5-8 分鐘,依賴圖像生成速度)
  5. 用 Vibe 編輯微調個別頁面
  6. 導出 PPTX

API 用量預估:10 頁 PPT 約消耗 50-80K tokens(文本)+ 10-15 次圖像生成。建議使用 API易 apiyi.com 中轉避免速率限制。

5.2 場景二:教師把教案轉成教學課件

目標:把現有的 Word 教案轉成圖文並茂的教學 PPT

操作流程

  1. 上傳 DOCX 教案文件
  2. banana-slides 自動解析章節結構
  3. 選擇"按章節生成頁面"
  4. AI 爲每個知識點生成對應的配圖
  5. 導出 MP4(含 TTS 中文配音),可直接作爲錄播課

5.3 場景三:職場人做商業提案

目標:基於一段需求描述,生成專業的商業提案 PPT

操作流程

  1. 選擇"頁面描述模式",精細控制每頁內容
  2. 上傳公司 Logo 和品牌色作爲模板參考
  3. 用 Vibe 編輯調整每頁配圖風格
  4. 導出可編輯 PPTX,再做最後的細節微調

5.4 場景四:技術博主做發佈會演示

目標:3 小時內做一份 30 頁的產品發佈會 PPT

操作流程

  1. 準備產品功能 Markdown 文檔
  2. 上傳到 banana-slides,選擇"按 H2/H3 拆頁"
  3. AI 自動生成對應的可視化配圖
  4. 用模板圖片確保視覺風格統一
  5. 導出 PDF + PPTX 雙格式

5.5 場景五:私有化部署給團隊使用

目標:在公司內網部署 banana-slides 給整個團隊使用

操作流程

  1. Fork 倉庫到公司 GitHub 組織
  2. 修改 .env 配置爲 API易 apiyi.com 中轉
  3. 部署到內網服務器(Docker Compose)
  4. 用 Nginx 配置內部域名
  5. 團隊成員通過內網訪問

💡 場景共性建議:以上 5 個場景都涉及大量的 API 調用(每個 PPT 都包含多次文本生成 + 多次圖像生成)。我們建議把 banana-slides 接到 API易 apiyi.com 的中轉服務上,享受不限併發的優勢,確保 PPT 生成速度不受官方接口速率限制的影響。


六、banana-slides 常見問題 FAQ

Q1: banana-slides 和市面上的 AI PPT 工具(如 Gamma、MindStudio)有什麼區別?

核心區別在於開源和可定製性。Gamma 等商業工具是雲端 SaaS,按頁或按月訂閱;banana-slides 是開源項目(AGPL-3.0 許可證),可以本地部署、自由修改源碼、對接任意 AI 模型。

如果你只是偶爾做 PPT,可能 Gamma 更省心;但如果你需要:

  • 團隊私有化部署
  • 控制 API 成本
  • 修改生成邏輯
  • 用國內可訪問的 API

那 banana-slides 是更好的選擇,配合 API易 apiyi.com 中轉可以做到完全自主可控。

Q2: 我沒有 Google API Key,必須申請 Gemini 才能用 banana-slides 嗎?

不需要。banana-slides 支持三種 API 格式(Gemini / OpenAI / Anthropic),你只需要任意一家的 Key 就能跑起來。

最簡單的方式是直接在 API易 apiyi.com 註冊一個賬號,一個 Key 即可同時調用 Gemini(含 nano banana pro 圖像生成)、GPT 和 Claude,免去分別申請的麻煩。國內人民幣充值,支持微信/支付寶。

Q3: 替換 AIHubMix 爲 API易 後,原有的功能會受影響嗎?

完全不會。banana-slides 通過環境變量 GOOGLE_API_BASEOPENAI_API_BASE 來確定 API 調用地址,只要替換的服務商兼容相應的 API 協議(API易 apiyi.com 完全兼容 Gemini、OpenAI、Anthropic 原生格式),所有功能都正常工作,包括 nano banana pro 圖像生成、TTS 配音、Vibe 編輯等。

Q4: nano banana pro 在 API易 上的模型名是什麼?

API易 apiyi.com 上 nano banana pro 對應的官方模型 ID 是 gemini-2.5-flash-image(Google 官方命名)。在 banana-slides 的 .env 中可以這樣配置:

IMAGE_MODEL_NAME=gemini-2.5-flash-image
GOOGLE_API_BASE=https://vip.apiyi.com/gemini

Q5: 一份 30 頁的 PPT 大概需要多少 API 費用?

預估如下

  • 文本生成(大綱 + 內容):約 100-200K tokens
  • 圖像生成(每頁 1-2 張):約 30-60 次調用
  • 總成本:使用 API易 apiyi.com 充值贈送 10%(≈ 85 折)後,約 1-3 美元

Q6: 部署到公司服務器後,多人同時使用會卡頓嗎?

主要瓶頸在 API 併發。banana-slides 自身是 Flask + SQLite 架構,單機可承載 10-20 人同時使用。瓶頸通常出現在 API 調用層——如果用官方 API 接口,會被速率限制;用 API易 apiyi.com 中轉可以享受不限併發的優勢,多人同時生成 PPT 也不會被限流。

Q7: 商用 banana-slides 需要付費嗎?

需要。banana-slides 採用 AGPL-3.0 許可證,個人和非商業用途免費;如果是商業部署,需要聯繫作者購買商業授權(聯繫郵箱:[email protected])。但即使是商用授權,API 中轉部分仍然可以使用 API易 apiyi.com,兩者不衝突。

Q8: 如何持續跟上 banana-slides 的更新?

由於你 Fork 了倉庫,可以這樣定期同步上游更新:

# 添加上游倉庫
git remote add upstream https://github.com/Anionex/banana-slides.git

# 拉取上游更新
git fetch upstream
git checkout main
git merge upstream/main

# 推送到自己的 Fork
git push origin main

注意保留你修改的 .env 配置,避免被覆蓋。


七、banana-slides Key Takeaways 核心要點

  • banana-slides 是開源 AI PPT 生成器,基於 nano banana pro 圖像模型,14K+ GitHub Stars
  • 支持多種輸入方式:一句話、大綱、頁面描述、PDF/DOCX/MD/TXT 素材上傳
  • 三種導出格式:可編輯 PPTX、PDF、MP4 視頻(含 TTS 配音)
  • Fork + 部署 3 步完成:Fork → cp .env.example .env → docker compose up
  • 支持 3 種 API 格式:Gemini(默認)、OpenAI、Anthropic
  • 替換 AIHubMix 爲 API易只需改 base_url:從 aihubmix.com 改爲 vip.apiyi.com 即可
  • API易 apiyi.com 優勢:原生格式兼容、不限併發、充值 100 美金送 10%(≈ 85 折)、人民幣充值
  • 一個 API Key 走遍三種格式:Gemini/OpenAI/Anthropic 全部兼容

八、總結

banana-slides 是一個值得長期關注的開源 AI PPT 生成器,它把 nano banana pro 的圖像生成能力和"Vibe 編輯"的交互範式結合在一起,讓普通人也能在 30 分鐘內做出專業級的演示文稿。

對於決定 Fork 部署的開發者來說,配置 API 服務商是最關鍵的一步。官方默認推薦的 AIHubMix 雖然能用,但替換爲 API易 apiyi.com 有幾個明顯的好處:完全兼容 Gemini/OpenAI/Anthropic 三種原生格式(不需要修改任何業務代碼)、不限併發(多人/大型 PPT 不被限流)、充值 100 美金送 10% 的成本優勢(相當於官網 85 折)、國內人民幣充值(微信/支付寶即可)。

替換的過程也極其簡單——只需要把 .env 中的 GOOGLE_API_BASE(或 OPENAI_API_BASEANTHROPIC_API_BASE)從 https://aihubmix.com/... 改爲 https://vip.apiyi.com/...,再填入 API易 的 Key 即可。

如果你正在考慮搭建一個團隊級的 AI PPT 生成系統,或者想爲自己/學生提供一個零成本入門的 PPT 工具,banana-slides + API易 apiyi.com 的組合是目前對國內開發者最友好的方案。從今天開始 Fork 項目,1 小時內就能跑起你的第一份 AI 生成的 PPT。

🎯 下一步行動建議:先訪問 API易 apiyi.com 註冊賬號並獲取 API Key,再 Fork github.com/Anionex/banana-slides 到自己的 GitHub,按本文第四章的配置方法修改 .env,啓動服務後用一句話 prompt 生成你的第一份 PPT 驗證流程。


參考資料

  1. banana-slides GitHub 倉庫:項目主倉庫

    • 鏈接: github.com/Anionex/banana-slides
    • 說明: 包含完整源碼、Docker Compose 配置、英文 README
  2. banana-slides 官方文檔:配置和部署指南

    • 鏈接: docs.bananaslides.online/configuration
    • 說明: 包含 AIHubMix 推薦代理章節,本文教你替換爲 API易
  3. nano banana pro 模型說明:Google 官方圖像生成模型

    • 鏈接: ai.google.dev/gemini-api/docs/image-generation
    • 說明: 模型 ID 爲 gemini-2.5-flash-image
  4. API易官網:Claude / Gemini / OpenAI 中轉服務平臺

    • 鏈接: apiyi.com
    • 說明: 原生格式兼容、不限併發、人民幣充值、充值 100 美金送 10%

作者: 技術團隊
最後更新: 2026-05-01
關於 API易: API易 apiyi.com 是專業的 AI 大模型 API 中轉服務商,提供 Gemini(含 nano banana pro)、Claude Sonnet 4.5、Claude Opus 4.7、GPT 系列等全系列模型的穩定接入,完全兼容原生 Gemini/OpenAI/Anthropic 三種格式,充值 100 美金贈送 10%(相當於官網 85 折),不限併發,技術支持響應快。

Similar Posts