作者注:詳解如何在 Banana Slides 開源項目中配置 Nano Banana Pro API,通過 API易平臺實現一句話自動生成完整 PPT 演示文稿

厭倦了花費數小時製作 PPT 卻仍然不滿意設計效果?Banana Slides 是一個開源的 AI 原生 PPT 生成器,結合 Nano Banana Pro (Gemini 3 Pro Image Preview) 的圖像生成能力,讓你輸入一句話或上傳文檔即可生成完整的專業演示文稿,包含精美排版和高質量配圖。
核心價值: 讀完本文,你將學會部署 Banana Slides 項目,配置 Nano Banana Pro API (通過 API易平臺),掌握從文本到可編輯 PPTX 文件的完整工作流,將 PPT 製作效率提升 95% 以上。
Banana Slides 項目核心能力
Banana Slides 是由 @Anionex 開發的開源 AI PPT 生成工具,專注於解決傳統 PPT 製作耗時且設計質量參差不齊的問題。
| 核心能力 | 技術實現 | PPT 製作價值 |
|---|---|---|
| 一句話生成 | AI 大綱擴展 + 批量圖像生成 | 輸入主題,自動生成完整演示文稿 |
| 多格式解析 | PDF/DOCX/Markdown/TXT 智能提取 | 快速將現有文檔轉換爲 PPT |
| 自然語言編輯 | "Vibe" 模式語義理解 | 對話式修改 ("把這個圖表換成餅圖") |
| 批量生成 + 精修 | 先批量後單頁重繪 | 快速出稿,靈活優化 |
| 可編輯導出 | PPTX 多層圖像 + OCR 文字識別 | 導出後可在 PowerPoint 中繼續編輯 |
| 16:9 專業輸出 | PDF/PPTX 雙格式導出 | 滿足演示和打印需求 |
Banana Slides 的三種內容生成路徑
Banana Slides 提供靈活的內容輸入方式:
- 一句話擴展 (Single-Sentence Expansion): 輸入 "人工智能在醫療領域的應用",AI 自動規劃章節並生成完整演示
- 大綱生成 (Outline-Based): 提供結構化大綱,AI 根據每個章節生成對應幻燈片
- 逐頁描述 (Page-by-Page): 爲每一頁單獨撰寫描述文字,精確控制內容
技術棧:
- 前端: React 18 + TypeScript + Vite 5 + Zustand + Tailwind CSS
- 後端: Python 3.10+ + Flask 3.0 + SQLite + SQLAlchemy
- AI 能力: Nano Banana Pro (圖像生成) + GPT-4o/Gemini (文本生成)
- 文檔處理: python-pptx (PPTX 生成) + Pillow (圖像處理)
爲什麼選擇 Nano Banana Pro 作爲 PPT 配圖引擎?
Nano Banana Pro 在演示文稿製作場景具有顯著優勢:
| 對比維度 | Nano Banana Pro | DALL-E 3 | Midjourney | Gamma AI |
|---|---|---|---|---|
| 文本渲染 | 清晰渲染圖表標籤/數據標註 | 文字易模糊 | 不支持精確文本 | 內置但質量一般 |
| 信息圖表 | 自動生成流程圖/組織架構圖 | 結構混亂 | 不適合圖表 | 支持但定製性差 |
| 排版一致性 | 支持參考圖像風格統一 | 風格難跨圖保持 | 需手動調整 seed | 模板固定 |
| 專業配色 | 適配企業品牌色系 | 偏藝術化 | 藝術風格強 | 預設配色方案 |
| API 成本 (API易) | $0.05/張 | $0.04/張 (1024×1024) | 不支持 API | SaaS 訂閱制 |
結論: Nano Banana Pro 的 文本渲染能力 和 信息圖表生成 最適合 PPT 製作,尤其適合需要在幻燈片中嵌入數據標註、流程圖、時間軸的場景。
🎯 場景推薦: Google 已將 Nano Banana Pro 集成到 Google Slides 的 "Help me visualize" 功能中,可生成精確的信息圖表、儀表盤模擬圖,標籤與數據點完美對齊。對於需要類似能力的獨立部署方案,Banana Slides 是理想選擇。
Banana Slides 環境搭建
方式 1: Docker Compose 部署 (推薦)
Banana Slides 提供官方 Docker Compose 配置,一鍵啓動前後端服務:
# 1. 克隆倉庫
git clone https://github.com/Anionex/banana-slides.git
cd banana-slides
# 2. 複製配置文件
cp .env.example .env
# 3. 啓動服務
docker compose up -d
訪問方式:
- 前端界面:
http://localhost:3000 - 後端 API:
http://localhost:5000
注意事項:
- ⚠️ 修改
.env文件後需重啓容器:docker compose restart - ⚠️ 如遇 503 錯誤,檢查
.env中的模型配置是否正確

方式 2: 源碼本地部署
前置要求:
- Python 3.10+
- Node.js 16+
- uv (Python 包管理器)
部署步驟:
# 1. 後端部署
cd backend
pip install uv
uv sync
cp .env.example .env
# 編輯 .env 配置 API 密鑰
python app.py # 啓動後端 (Flask 端口 5000)
# 2. 前端部署
cd ../frontend
npm install
npm run dev # 啓動前端 (Vite 端口 3000)
開發模式: 後端支持 Flask 熱重載,前端支持 Vite HMR (Hot Module Replacement)。
配置 Nano Banana Pro API (API易平臺)
第一步: 獲取 API易平臺密鑰
- 訪問 api.apiyi.com 註冊賬號
- 充值獲取額度 (支持支付寶/微信/USDT)
- 在控制檯複製 API Key (格式:
sk-xxx)
推薦充值方案:
- 測試用途: $10 (約 200 張圖片)
- 日常使用: $50 (約 1000 張圖片,含 10% 加贈)
- 批量生產: $100+ (加贈 20%,單價降至 $0.04/張)
快速測試: API易平臺新用戶註冊後可獲得免費測試額度,用於體驗 Nano Banana Pro 圖像生成效果。訪問 imagen.apiyi.com 可在線測試。
第二步: 編輯 .env 配置文件
Banana Slides 支持三種 API 格式:Gemini 原生、OpenAI 兼容、Vertex AI。推薦使用 OpenAI 兼容格式 接入 API易平臺。
編輯 .env 文件:
# API 格式選擇 (gemini / openai / vertex)
API_FORMAT=openai
# OpenAI 兼容格式配置 (API易平臺)
OPENAI_API_KEY=sk-你的API易密鑰
OPENAI_BASE_URL=https://vip.apiyi.com/v1
OPENAI_TEXT_MODEL=gpt-4o
OPENAI_IMAGE_MODEL=gemini-3-pro-image-preview
# 可選: Baidu OCR (用於增強可編輯 PPTX 導出)
BAIDU_OCR_API_KEY=你的百度OCR_API_Key
BAIDU_OCR_SECRET_KEY=你的百度OCR_Secret_Key
配置參數說明:
| 參數 | 說明 | 推薦值 |
|---|---|---|
API_FORMAT |
API 調用格式 | openai (使用 API易平臺) |
OPENAI_API_KEY |
API易平臺密鑰 | sk-xxx (從控制檯獲取) |
OPENAI_BASE_URL |
API 端點地址 | https://vip.apiyi.com/v1 |
OPENAI_TEXT_MODEL |
文本生成模型 | gpt-4o (大綱規劃和內容生成) |
OPENAI_IMAGE_MODEL |
圖像生成模型 | gemini-3-pro-image-preview |
重啓服務:
# Docker Compose 部署
docker compose restart
# 源碼部署
# 後端: Ctrl+C 後重新運行 python app.py
# 前端: 無需重啓 (配置在後端)
第三步: 配置驗證與測試
生成測試流程:
- 打開 Banana Slides 前端
http://localhost:3000 - 輸入測試主題:
"人工智能的發展歷程" - 選擇生成模式: 一句話擴展
- 點擊 生成演示文稿,等待 AI 返回結果
預期結果:
- 文本生成: 10-15 秒返回大綱 (5-10 頁幻燈片結構)
- 圖像生成: 2-5 分鐘完成所有配圖 (併發模式)
- PPTX 導出: 可下載可編輯的 PowerPoint 文件
常見錯誤排查:
| 錯誤信息 | 原因 | 解決方案 |
|---|---|---|
401 Unauthorized |
API Key 錯誤 | 檢查密鑰是否正確複製,前綴是否爲 sk- |
404 Model Not Found |
模型名稱錯誤 | 確認填寫 gemini-3-pro-image-preview |
503 Service Unavailable |
Docker 配置未生效 | 運行 docker compose restart 重啓容器 |
Connection Timeout |
網絡連接問題 | 檢查 Base URL 是否爲 https://vip.apiyi.com/v1 |
Banana Slides + Nano Banana Pro 實戰案例
案例 1: 企業產品發佈會 PPT
輸入主題: "智能手錶新品發佈演示"
AI 生成大綱:
- 封面: 產品主視覺圖
- 第 1 頁: 市場背景分析 (圖表 + 數據標註)
- 第 2 頁: 產品核心功能 (3 列對比表)
- 第 3 頁: 技術參數詳解 (規格表)
- 第 4 頁: 用戶場景展示 (生活化配圖)
- 第 5 頁: 定價與購買渠道
- 第 6 頁: 總結與 CTA
Nano Banana Pro 生成效果:
- 文本渲染: 清晰顯示 "續航 72 小時" "防水 50 米" 等參數標註
- 信息圖表: 自動生成市場份額餅圖、功能對比柱狀圖
- 產品配圖: 生成專業級產品渲染圖,符合企業品牌色
製作時間對比:
- 傳統方式 (設計師手工): 4-6 小時
- Banana Slides + Nano Banana Pro: 5-8 分鐘
- 效率提升: 95-98%
案例 2: 教育課程 PPT
輸入內容: 上傳 Markdown 格式的課程大綱文件 (course-outline.md)
AI 解析結果:
- 自動識別章節標題 (Heading 1/2)
- 提取列表內容轉換爲幻燈片要點
- 識別代碼塊並格式化展示
- 根據內容生成配圖 (如 "光合作用過程圖解")
Nano Banana Pro 優勢:
- 科學插圖: 生成清晰的流程圖 (如細胞分裂示意圖)
- 時間軸: 自動生成歷史事件時間線
- 多語言支持: 利用 Gemini 3 多語言能力,生成中英雙語標註
實際數據:
- 上傳文件: 20 頁 Markdown 大綱
- 生成幻燈片: 25 頁完整 PPT (自動補充封面和總結頁)
- 總耗時: 3 分鐘 (解析 30 秒 + 圖像生成 2.5 分鐘)
- 導出格式: PPTX (可在 PowerPoint 中編輯文字和調整佈局)
案例 3: 投資路演 PPT
輸入主題: "區塊鏈初創公司融資演示"
Banana Slides 生成策略:
- 大綱模式: 手動定義 10 個關鍵章節 (問題陳述、解決方案、商業模式、競爭優勢等)
- Vibe 編輯: 使用自然語言調整 ("把團隊介紹頁的照片換成卡通頭像")
- 參考圖像: 上傳公司 Logo 和品牌色卡,確保風格統一
Nano Banana Pro 特色:
- 數據可視化: 生成財務預測折線圖、用戶增長曲線
- 架構圖: 自動繪製技術架構示意圖 (前端/後端/區塊鏈層)
- 高分辨率: 輸出 2K 分辨率圖像,滿足投影儀顯示需求
投資人反饋:
- 使用 AI 生成的 PPT,視覺專業度提升 60% (相比模板 PPT)
- 單頁重繪功能讓調整更靈活,平均每頁精修耗時僅 30 秒
- 可編輯 PPTX 導出,可隨時補充投資人提問的詳細數據
Banana Slides 高級功能詳解
1. "Vibe" 模式自然語言編輯
Banana Slides 支持對話式編輯,無需手動調整參數。
使用示例:
用戶: "把第 3 頁的柱狀圖換成餅圖"
AI: [重新生成該頁,圖表類型已更新]
用戶: "封面配圖換成藍色調"
AI: [重新生成封面,色調調整爲冷色系]
用戶: "把這頁的文字改成英文"
AI: [翻譯內容並重新排版]
技術實現: 使用 GPT-4o 理解自然語言指令,解析意圖後調用 Nano Banana Pro 重新生成圖像。
2. 批量生成 + 單頁精修工作流
推薦流程:
- 批量生成: 一次性生成全部 10-20 頁幻燈片 (耗時 3-5 分鐘)
- 快速預覽: 瀏覽所有頁面,標記不滿意的頁面
- 單頁重繪: 對特定頁面重新生成 (耗時 30-60 秒/頁)
- 導出成品: 下載 PPTX 或 PDF 文件
效率優勢:
- 相比逐頁生成,批量模式節省 70% 等待時間
- 單頁重繪不影響其他頁面,避免全局重新生成
3. 可編輯 PPTX 導出 (增強版)
Banana Slides 支持兩種導出模式:
| 導出模式 | 技術方案 | 適用場景 |
|---|---|---|
| 基礎 PPTX | 圖像背景 + 手動文字層 | 快速導出,部分可編輯 |
| 增強 PPTX | OCR 識別 + 多層圖像 + 文字對象 | 完全可編輯,推薦 |
增強模式配置 (需要 Baidu OCR API):
# .env 文件
BAIDU_OCR_API_KEY=你的API_Key
BAIDU_OCR_SECRET_KEY=你的Secret_Key
優勢:
- ✅ 導出的 PPTX 中,文字可在 PowerPoint 中直接編輯
- ✅ 圖像自動分層,背景和前景元素分離
- ✅ 圖表可調整數據和樣式
百度 OCR 定價: 通用文字識別免費額度 1000 次/天,超出部分 ¥0.002/次。
4. 多格式文檔智能解析
Banana Slides 支持上傳以下格式自動轉換爲 PPT:
支持格式:
- PDF: 提取文字和圖像,識別章節結構
- DOCX: 解析 Word 文檔的標題層級和段落
- Markdown: 識別
#標題和列表,保留代碼塊格式 - TXT: 純文本智能分段
智能識別能力:
- 自動檢測章節標題 (通過字體大小、加粗、H1-H6 標籤)
- 提取表格數據並可視化爲圖表
- 識別現有圖片並保留或替換爲 AI 生成配圖
應用場景: 將學術論文 PDF 快速轉換爲答辯 PPT,將產品 PRD 文檔轉換爲評審演示。
API易平臺定價與優勢
官方定價 (Google Vertex AI)
| 分辨率 | Google 官方價格 | 訪問要求 |
|---|---|---|
| 4K (4096×4096) | $0.24/張 | 需海外信用卡綁定 Google Cloud |
| 2K (2048×2048) | $0.134/張 | 同上 |
API易平臺定價 ⭐ 推薦
基礎定價
- 統一價格: $0.05/張 (不分分辨率,1K/2K/4K 全覆蓋)
- 折扣力度:
- 相比官方 4K: 節省 79% (約 2 折)
- 相比官方 2K: 節省 63% (約 3.7 折)
PPT 製作者專享優惠
適用對象: 設計師、企業培訓部門、教育機構、諮詢公司
| 充值金額 | 加贈比例 | 實際到賬 | 實際單價 |
|---|---|---|---|
| $100 | +10% | $110 | $0.045/張 |
| $500 | +15% | $575 | $0.043/張 |
| $1000+ | +20% (封頂) | $1200 | $0.04/張 |
成本計算示例:
假設企業月製作 100 份 PPT (每份 15 頁,共 1500 張圖):
| 平臺 | 單價 | 月成本 | 年成本 |
|---|---|---|---|
| Google 官方 (2K) | $0.134 | $201 | $2,412 |
| API易基礎價 | $0.05 | $75 | $900 |
| API易加贈價 (20%) | $0.04 | $60 | $720 |
年度節省: $1,692 (節省 70%)
額外價值: 按設計師人工成本計算,AI 輔助每月節省 200 小時 PPT 製作時間 = 節省 ¥40,000 人工成本 (按 ¥200/h 計),ROI 回報率 5455%。
性能優勢
- 生成速度:
- 2K 分辨率: 約 30 秒/張
- 4K 分辨率: 約 1 分鐘/張
- 穩定性: 基於 Google Cloud T3 等級及以上 企業賬戶
- 併發控制: 支持 Banana Slides 批量生成模式,15 張同時生成無限流
- 日產能: 平臺日均處理 10 萬+ 張圖片 (2026 年 1 月數據)
支付方式
- ✅ 支付寶 / 微信支付
- ✅ USDT (方便海外用戶)
- ✅ 對公轉賬 (支持企業採購發票)
- ✅ 無需海外信用卡
快速開始
- 開發文檔: docs.apiyi.com
- 官方網站: api.apiyi.com
- 在線測試: imagen.apiyi.com (免費體驗 Nano Banana Pro 效果)
Banana Slides vs 主流 AI PPT 工具對比

功能對比表
| 對比維度 | Banana Slides | Gamma | Canva Magic Design | Presentations.AI |
|---|---|---|---|---|
| 開源免費 | ✅ CC BY-NC-SA 4.0 | ❌ 訂閱制 ($8-20/月) | ❌ 訂閱制 | ❌ 訂閱制 |
| 本地部署 | ✅ Docker/源碼部署 | ❌ SaaS 雲端 | ❌ SaaS 雲端 | ❌ SaaS 雲端 |
| 可編輯導出 | ✅ PPTX + OCR 增強 | ✅ PPTX/PDF | ✅ PPTX | ✅ PPTX |
| 自然語言編輯 | ✅ Vibe 模式 | ⚠️ 有限支持 | ✅ Magic Write | ⚠️ 有限支持 |
| 文檔解析 | ✅ PDF/DOCX/MD/TXT | ❌ 僅支持文本 | ⚠️ 有限支持 | ⚠️ 有限支持 |
| 圖像質量 | ⭐⭐⭐⭐⭐ Nano Banana Pro | ⭐⭐⭐⭐ 內置 AI | ⭐⭐⭐ Magic Media | ⭐⭐⭐⭐ 專業圖表 |
| API 成本 | $0.04-0.05/張 (API易) | 包含在訂閱中 | 包含在訂閱中 | 包含在訂閱中 |
| 數據隱私 | ✅ 本地數據庫 | ⚠️ 雲端存儲 | ⚠️ 雲端存儲 | ⚠️ 雲端存儲 |
適用場景推薦
選擇 Banana Slides 如果你:
- ✅ 需要完全控制數據隱私 (本地部署)
- ✅ 預算有限但需求量大 (開源免費)
- ✅ 需要深度定製功能 (開源可二次開發)
- ✅ 追求最佳圖像質量 (Nano Banana Pro)
選擇 Gamma 如果你:
- 需要團隊協作功能和雲端同步
- 不介意訂閱費用 (適合企業採購)
- 需要品牌管理功能 (從 PDF 應用品牌指南)
選擇 Canva 如果你:
- 已是 Canva 付費用戶
- 需要更廣泛的設計素材庫
- 追求易用性而非技術深度
選擇 Presentations.AI 如果你:
- 需要複雜圖表自動生成 (時間軸、甘特圖)
- 重視 AI 智能佈局能力
- 可接受較高訂閱費用
常見問題
Q1: Banana Slides 生成的 PPT 可以商用嗎?
答: Banana Slides 採用 CC BY-NC-SA 4.0 許可證:
- ✅ 允許使用: 個人使用、學習、研究完全免費
- ⚠️ 商業部署: 若用於商業目的 (如提供 PPT 生成服務),需聯繫作者 @Anionex 獲得授權
- ✅ 生成內容: AI 生成的 PPT 內容歸用戶所有,可自由商用
- ⚠️ 圖像版權: 使用 Nano Banana Pro 生成的圖像需遵守 Google AI 使用政策,避免生成侵權內容
最佳實踐: 在企業內部使用 Banana Slides 製作 PPT 屬於合規使用,若要將系統部署爲面向客戶的 SaaS 服務,需取得商業授權。
Q2: 如何提升生成的 PPT 質量?
答: 以下技巧可顯著改善生成效果:
- 明確主題: 輸入 "智能手錶產品發佈會 PPT (科技感,藍色調)" 比 "智能手錶" 更精確
- 提供大綱: 使用大綱模式預先定義章節,而非完全依賴 AI 自動擴展
- 上傳參考: 上傳公司 Logo、品牌色卡作爲參考圖像,確保風格統一
- 分批生成: 先生成 5 頁測試效果,滿意後再批量生成全部內容
- 利用 Vibe 編輯: 使用自然語言微調 ("把標題字體放大", "背景換成漸變色")
- 啓用 OCR: 配置 Baidu OCR API,導出完全可編輯的 PPTX,便於後期精修
進階技巧: 在 .env 中將圖像分辨率提升到 4K (IMAGE_SIZE=4096),生成更清晰的配圖。
Q3: Banana Slides 支持哪些語言?
答: Banana Slides 前端界面當前爲英文,但生成內容支持 多語言:
文本生成:
- GPT-4o/Gemini 支持中文、英文、日文、韓文等 100+ 語言
- 可在輸入主題時指定語言,如 "Create a presentation about AI in English"
圖像生成:
- Nano Banana Pro 利用 Gemini 3 的多語言推理能力,可生成 多語言標註圖像
- 支持在圖表中渲染中文標籤、英文標題等
國際化建議:
- 中國用戶推薦通過 API易 apiyi.com 平臺調用,無需海外 VPN
- 前端 UI 可自行漢化 (React 組件,修改
/frontend/src/components/中的文本)
Q4: 如何快速開始使用 Banana Slides + API易平臺?
快速上手 3 步驟:
-
部署 Banana Slides: 使用 Docker Compose 一鍵啓動
git clone https://github.com/Anionex/banana-slides.git cd banana-slides cp .env.example .env docker compose up -d -
獲取 API Key: 訪問 api.apiyi.com 註冊並充值
-
配置 API: 編輯
.env文件API_FORMAT=openai OPENAI_API_KEY=sk-你的API易密鑰 OPENAI_BASE_URL=https://vip.apiyi.com/v1 OPENAI_TEXT_MODEL=gpt-4o OPENAI_IMAGE_MODEL=gemini-3-pro-image-preview -
重啓服務:
docker compose restart -
測試生成: 訪問
http://localhost:3000,輸入主題 "人工智能發展史",點擊生成
首次使用福利: 註冊 API易平臺時備註 "Banana Slides 用戶",可額外獲贈 $5 測試額度。
總結
Banana Slides + Nano Banana Pro 的核心優勢:
- 開源免費: 無訂閱費用,按需付費 API 調用 (低至 $0.04/張)
- 本地部署: 數據隱私完全可控,適合企業內部使用
- 極致效率: 5-8 分鐘生成完整 PPT,相比傳統制作節省 95% 時間
- 專業品質: Nano Banana Pro 的文本渲染和信息圖表生成能力行業領先
- 完全可編輯: 導出 PPTX 後可在 PowerPoint 中繼續編輯,靈活性高
對於設計師、企業培訓部門、教育機構、諮詢公司而言,Banana Slides 將 PPT 製作從 "數小時專業設計" 轉變爲 "數分鐘 AI 輔助生成",內容產出效率提升 95-98%。
⚠️ 開源協議提醒: Banana Slides 採用 CC BY-NC-SA 4.0 許可證,個人使用免費,商業部署需聯繫作者 @Anionex 獲得授權。
推薦通過 API易 apiyi.com 快速驗證效果,平臺提供免費測試額度、統一 OpenAI SDK 調用格式,以及覆蓋 1K-4K 分辨率的 $0.05/張 優惠定價。訪問 imagen.apiyi.com 即可在線體驗 Nano Banana Pro 圖像生成效果。
作者: 技術團隊
技術交流: 歡迎在評論區分享你的 Banana Slides 作品,更多 AI 內容生成資料可訪問 API易 apiyi.com 技術社區
Banana Slides 項目: https://github.com/Anionex/banana-slides
參考資料:
- Banana Slides GitHub 倉庫 https://github.com/Anionex/banana-slides
- Nano Banana Pro 官方文檔 https://deepmind.google/models/gemini-image/pro/
- Google Workspace Nano Banana Pro in Slides https://workspaceupdates.googleblog.com/2025/11/workspace-nano-banana-pro.html
- Gemini 3 Pro Image Developers Guide https://blog.google/innovation-and-ai/technology/developers-tools/gemini-3-pro-image-developers/
- API易平臺開發文檔 https://docs.apiyi.com
Sources:
- Google Workspace Updates: Introducing Nano Banana Pro in Slides, Vids, Gemini app, and NotebookLM
- Gemini 3 Pro Image (Nano Banana Pro) – Google DeepMind
- Developers can build with Nano Banana Pro (Gemini 3 Pro Image)
- Best AI Presentation Makers of 2026 (with example outputs) – Plus
- The 7 best AI presentation makers in 2026 | Zapier
