|

banana-slides 完整入门:3 步 Fork 部署开源 AI PPT 生成器(API易配置教程)

作者注:banana-slides 是基于 nano banana pro 的开源 AI PPT 生成应用,本文从新人视角完整介绍 Fork 部署流程,并教你将默认的 AIHubMix 代理替换为 API易,实现更稳定的中转调用。

GitHub 上有一款最近爆火的开源 AI PPT 生成器 banana-slides,它基于 Google 最新的 nano banana pro 图像模型,主打"一句话生成可编辑 PPT、支持视频导出、自然语言修改任意区域",目前已经收获 14K+ GitHub Stars。

这不是又一个套壳的 AI PPT 工具,而是一个真正可以本地化部署、源码完全开放的"Vibe PPT"系统,支持 Gemini、OpenAI、Anthropic、Vertex AI 等多种模型格式,官方文档默认推荐使用 AIHubMix 作为代理。

核心价值: 读完本文,你将学会如何 Fork banana-slides 项目并完成本地部署,更重要的是——掌握将默认的 AIHubMix 代理替换为 API易 apiyi.com 中转的完整配置方法,享受不限并发、原生格式、充值 100 美金送 10% 的成本优势。

banana-slides-fork-tutorial-apiyi-config 图示

一、banana-slides 是什么:开源 AI PPT 生成器的 3 个核心定位

banana-slides 是由开发者 Anionex 主导的开源项目,定位是 基于 nano banana pro 的原生 AI PPT 生成应用。它的核心理念是"Vibe PPT"——你可以用对话式的语言指挥 AI 生成、修改、迭代任意一页幻灯片。

1.1 banana-slides 的核心定位

定位维度 banana-slides 的特点 与传统 AI PPT 工具差异
底层模型 基于 nano banana pro 图像生成 多数工具用模板拼接
部署模式 完全开源 + 本地化部署 SaaS 产品锁定云端
License AGPL-3.0(商用需授权) 闭源订阅制
修改方式 自然语言"Vibe 编辑" 拖拽手工编辑
输入素材 PDF/DOCX/MD/TXT 任意格式 仅支持文本/大纲
导出格式 可编辑 PPTX + PDF + MP4(含 TTS 配音) 多数仅 PPTX
API 提供商 支持多家,默认推荐 AIHubMix 通常绑定单一供应商

1.2 为什么 banana-slides 值得新人关注

如果你刚接触 AI PPT 生成这个领域,banana-slides 提供了一个比商业 SaaS 更"自由"的选择:

  • 代码完全开源:可以二次开发、私有化部署
  • 图像质量出众:依赖 nano banana pro,生成的配图远超传统 PPT 模板
  • 多模型适配:可以用 Gemini、OpenAI、Anthropic 中的任意一家作为后端
  • 灵活替换 API:默认推荐 AIHubMix,但完全可以替换为其他兼容服务(如 API易 apiyi.com)

💡 新人建议:如果你没有 Google API Key 或 OpenAI Key,最简单的方式是使用 API易 apiyi.com 的中转服务,一个 Key 就能同时访问 Gemini、Claude、GPT 等全系列模型,避免分别申请多家账号的麻烦。

1.3 banana-slides 适合哪些用户

  • 学生:快速完成课程作业、毕业答辩 PPT
  • 教师:把课件内容转成图文并茂的教学幻灯片
  • 职场人:商业提案、项目汇报、季度总结
  • 开发者:想要私有化部署 AI PPT 工具的团队
  • 设计师:从 AI 生成的版面中获取灵感

二、banana-slides 核心功能:4 大特性详解

banana-slides 的功能设计围绕"降低 PPT 制作门槛"这一核心目标,主要包含 4 个层面的能力。

banana-slides-fork-tutorial-apiyi-config 图示

2.1 多路径内容生成

banana-slides 支持三种内容输入方式,适配不同场景:

输入方式 使用场景 输出粒度
一句话生成 临时演讲、灵感初稿 AI 自动生成大纲 + 全部页面
大纲模式 已有清晰结构 按大纲自动扩展每页内容
页面描述模式 精细控制 逐页指定文字 + 配图

2.2 素材智能解析

banana-slides 可以接受多种格式的素材文件,并自动提取关键信息:

  • PDF:自动提取文字、图片、图表数据
  • DOCX:解析章节结构和嵌入图片
  • Markdown:保留 H1/H2 层级关系
  • TXT:智能提取关键点

这意味着你可以把一篇技术文档直接拖进 banana-slides,让 AI 帮你转成完整的演讲稿。

2.3 自然语言"Vibe 编辑"

这是 banana-slides 最有创新性的功能。生成 PPT 后,你可以用自然语言修改任意一页:

  • "把第 3 页改成案例分析风格"
  • "给标题加一个橘色背景"
  • "这页的配图太复杂,换成简洁线条风格"

AI 会精准定位修改位置并重新生成,这种交互方式接近真实的"和设计师对话"。

🎯 使用建议:Vibe 编辑会触发多次 API 调用(每次修改都是一次完整的 prompt + 图像生成),如果你做的是长 PPT(20 页以上),建议使用 API易 apiyi.com 的中转服务,避免官方接口的速率限制问题。

2.4 多格式导出

导出格式 特点 适用场景
可编辑 PPTX 文字、图片、形状均可二次编辑 后续需要微调
图片版 PPTX 每页是高清图片 防止格式错乱
PDF 跨平台稳定显示 分发、打印
MP4 视频 包含 TTS 配音 + 字幕 录播课、自动讲解

MP4 导出支持中文、英文、日文 TTS 配音,并可选择多种音色,对教育场景特别友好。


三、Fork 和本地部署 banana-slides:3 步快速上手

3.1 系统环境要求

部署 banana-slides 前请确认本地环境:

依赖项 版本要求 说明
Docker 20.x+ 推荐 Docker Compose 部署
Python 3.10+ 源码部署需要
Node.js 16+ 前端开发需要
LibreOffice 可选 用于 PPTX 上传解析
Git 任意 用于 Fork 和克隆

3.2 第一步:Fork 仓库到自己的账号

在浏览器打开 GitHub 项目主页 github.com/Anionex/banana-slides,点击右上角的 Fork 按钮,将仓库 Fork 到你自己的账号下。Fork 的好处:

  • 后续可以提交自己的修改(特别是 API 配置)
  • 拉取上游更新时方便冲突处理
  • 便于团队协作部署

Fork 完成后,克隆到本地:

# 替换 YOUR_USERNAME 为你的 GitHub 用户名
git clone https://github.com/YOUR_USERNAME/banana-slides.git
cd banana-slides

3.3 第二步:创建配置文件

复制示例配置文件为正式配置:

cp .env.example .env

.env 文件包含所有 API Key、Base URL、模型选择等配置项,下一章会详细讲解如何替换为 API易 中转。

3.4 第三步:使用 Docker Compose 启动

最简单的启动方式是 Docker Compose:

docker compose -f docker-compose.prod.yml up -d

启动后访问:

  • 前端界面:http://localhost:3000
  • 后端 API:http://localhost:5000

如果你想从源码运行(便于二次开发),可以分别启动后端和前端:

# 后端
uv sync
uv run alembic upgrade head
uv run python app.py

# 前端(新开一个终端)
cd frontend
npm install
npm run dev

3.5 验证部署是否成功

打开 http://localhost:3000,应该看到:

  • ✅ banana-slides 首页(黄色香蕉主题)
  • ✅ "新建 PPT" 按钮可点击
  • ✅ 输入一句话主题后能正常生成

如果生成时报错"API connection failed",通常是 .env 中的 API Key 或 Base URL 配置错误,参考下一章替换为 API易 中转可解决。


四、替换 AIHubMix 为 API易:banana-slides 配置完整指南

banana-slides 的官方文档默认推荐使用 AIHubMix 作为 API 代理(参考 docs.bananaslides.online/configuration#aihubmix-recommended-proxy)。但你完全可以将其替换为 API易 apiyi.com,享受更优惠的价格、不限并发、更稳定的国内中转线路。

banana-slides-fork-tutorial-apiyi-config 图示

4.1 为什么选择替换为 API易

虽然 AIHubMix 是 banana-slides 默认推荐的代理,但对于长期使用 banana-slides 的用户,API易 apiyi.com 有几个明显优势:

对比维度 AIHubMix(默认) API易 apiyi.com(推荐)
支付方式 美元 / 国内人民币 国内人民币(微信/支付宝)
价格优惠 标准价 充值 100 美金送 10%(≈ 官网 85 折)
并发限制 按套餐分级 不限并发
API 格式 兼容 OpenAI/Gemini 完全兼容 OpenAI/Gemini/Anthropic 原生格式
接入难度 改 base_url 即可 改 base_url 即可(同样简单)
故障切换 单一通道 多机房负载均衡
技术支持 工单 中文客服 + 微信群

4.2 修改 .env 文件:Gemini 格式(推荐用于 nano banana pro)

banana-slides 默认使用 Gemini 格式调用 nano banana pro。打开 .env 文件,找到以下配置:

修改前(AIHubMix 默认配置)

AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=your-aihubmix-key
GOOGLE_API_BASE=https://aihubmix.com/gemini

修改后(替换为 API易 apiyi.com)

AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=sk-your-apiyi-key-here
GOOGLE_API_BASE=https://vip.apiyi.com/gemini

🎯 关键说明:API易 apiyi.com 完全兼容 Gemini 原生格式的 base_url 路径设计,所以只需要把域名 aihubmix.com 替换为 vip.apiyi.com,路径 /gemini 保持不变即可。

4.3 修改 .env 文件:OpenAI 格式

如果你想用 GPT 系列模型生成 PPT 文本内容,可以切换到 OpenAI 格式:

修改前

AI_PROVIDER_FORMAT=openai
OPENAI_API_KEY=your-aihubmix-key
OPENAI_API_BASE=https://aihubmix.com/v1

修改后(替换为 API易)

AI_PROVIDER_FORMAT=openai
OPENAI_API_KEY=sk-your-apiyi-key-here
OPENAI_API_BASE=https://vip.apiyi.com/v1

4.4 修改 .env 文件:Anthropic 格式

如果你希望用 Claude 模型来生成更高质量的 PPT 文本,banana-slides 也支持 Anthropic 格式:

修改后(替换为 API易)

AI_PROVIDER_FORMAT=anthropic
ANTHROPIC_API_KEY=sk-your-apiyi-key-here
ANTHROPIC_API_BASE=https://vip.apiyi.com

4.5 混合配置:文本 + 图像分别使用不同模型

banana-slides 支持文本生成和图像生成使用不同的模型源。例如,用 Claude Sonnet 4.5 生成文本,用 nano banana pro 生成配图:

# 文本生成 - 用 Anthropic 格式调 Claude
TEXT_MODEL_PROVIDER=anthropic
TEXT_MODEL_NAME=claude-sonnet-4-5
ANTHROPIC_API_KEY=sk-your-apiyi-key-here
ANTHROPIC_API_BASE=https://vip.apiyi.com

# 图像生成 - 用 Gemini 格式调 nano banana pro
IMAGE_MODEL_PROVIDER=gemini
IMAGE_MODEL_NAME=gemini-2.5-flash-image
GOOGLE_API_KEY=sk-your-apiyi-key-here
GOOGLE_API_BASE=https://vip.apiyi.com/gemini

💡 重要优势:API易 apiyi.com 的同一个 API Key 可以同时调用 Gemini、OpenAI、Anthropic 三种格式的所有模型,不需要分别申请三家的账号——这是相比官方直连最大的便利性提升。

4.6 重启服务并验证

修改 .env 后,重启 banana-slides 让新配置生效:

# Docker Compose 模式
docker compose -f docker-compose.prod.yml down
docker compose -f docker-compose.prod.yml up -d

# 源码模式
# 重启 uv run python app.py

在前端创建一个测试 PPT,输入一句话:"给我做一份关于 AI Agent 的 5 页 PPT",观察终端日志:

  • ✅ 看到 Connecting to https://vip.apiyi.com/... 表示走 API易中转
  • ✅ 响应时间 < 30 秒(首页生成)
  • ✅ 没有 429 / 503 错误

4.7 提交修改到自己的 Fork(团队部署)

如果是团队部署,可以把修改后的 .env.example 提交到自己的 Fork 中(注意不要提交真实的 .env):

# 创建一个 .env.example.apiyi 配置模板
cp .env .env.example.apiyi
# 编辑文件,把真实 API Key 替换为占位符
# 然后提交
git add .env.example.apiyi
git commit -m "feat: add API易 (apiyi.com) configuration template"
git push origin main

这样团队成员 Clone 你的 Fork 后,可以直接复制这个模板使用,省去重新查找配置的时间。


五、banana-slides 实战场景:5 大典型应用案例

5.1 场景一:学生快速做课堂展示 PPT

目标:30 分钟内完成一份 10 页的课程展示 PPT

操作流程

  1. 打开 banana-slides,选择"一句话生成"模式
  2. 输入主题,例如:"关于量子计算原理的入门讲解"
  3. AI 自动生成大纲(约 30 秒)
  4. 点击生成全部页面(约 5-8 分钟,依赖图像生成速度)
  5. 用 Vibe 编辑微调个别页面
  6. 导出 PPTX

API 用量预估:10 页 PPT 约消耗 50-80K tokens(文本)+ 10-15 次图像生成。建议使用 API易 apiyi.com 中转避免速率限制。

5.2 场景二:教师把教案转成教学课件

目标:把现有的 Word 教案转成图文并茂的教学 PPT

操作流程

  1. 上传 DOCX 教案文件
  2. banana-slides 自动解析章节结构
  3. 选择"按章节生成页面"
  4. AI 为每个知识点生成对应的配图
  5. 导出 MP4(含 TTS 中文配音),可直接作为录播课

5.3 场景三:职场人做商业提案

目标:基于一段需求描述,生成专业的商业提案 PPT

操作流程

  1. 选择"页面描述模式",精细控制每页内容
  2. 上传公司 Logo 和品牌色作为模板参考
  3. 用 Vibe 编辑调整每页配图风格
  4. 导出可编辑 PPTX,再做最后的细节微调

5.4 场景四:技术博主做发布会演示

目标:3 小时内做一份 30 页的产品发布会 PPT

操作流程

  1. 准备产品功能 Markdown 文档
  2. 上传到 banana-slides,选择"按 H2/H3 拆页"
  3. AI 自动生成对应的可视化配图
  4. 用模板图片确保视觉风格统一
  5. 导出 PDF + PPTX 双格式

5.5 场景五:私有化部署给团队使用

目标:在公司内网部署 banana-slides 给整个团队使用

操作流程

  1. Fork 仓库到公司 GitHub 组织
  2. 修改 .env 配置为 API易 apiyi.com 中转
  3. 部署到内网服务器(Docker Compose)
  4. 用 Nginx 配置内部域名
  5. 团队成员通过内网访问

💡 场景共性建议:以上 5 个场景都涉及大量的 API 调用(每个 PPT 都包含多次文本生成 + 多次图像生成)。我们建议把 banana-slides 接到 API易 apiyi.com 的中转服务上,享受不限并发的优势,确保 PPT 生成速度不受官方接口速率限制的影响。


六、banana-slides 常见问题 FAQ

Q1: banana-slides 和市面上的 AI PPT 工具(如 Gamma、MindStudio)有什么区别?

核心区别在于开源和可定制性。Gamma 等商业工具是云端 SaaS,按页或按月订阅;banana-slides 是开源项目(AGPL-3.0 许可证),可以本地部署、自由修改源码、对接任意 AI 模型。

如果你只是偶尔做 PPT,可能 Gamma 更省心;但如果你需要:

  • 团队私有化部署
  • 控制 API 成本
  • 修改生成逻辑
  • 用国内可访问的 API

那 banana-slides 是更好的选择,配合 API易 apiyi.com 中转可以做到完全自主可控。

Q2: 我没有 Google API Key,必须申请 Gemini 才能用 banana-slides 吗?

不需要。banana-slides 支持三种 API 格式(Gemini / OpenAI / Anthropic),你只需要任意一家的 Key 就能跑起来。

最简单的方式是直接在 API易 apiyi.com 注册一个账号,一个 Key 即可同时调用 Gemini(含 nano banana pro 图像生成)、GPT 和 Claude,免去分别申请的麻烦。国内人民币充值,支持微信/支付宝。

Q3: 替换 AIHubMix 为 API易 后,原有的功能会受影响吗?

完全不会。banana-slides 通过环境变量 GOOGLE_API_BASEOPENAI_API_BASE 来确定 API 调用地址,只要替换的服务商兼容相应的 API 协议(API易 apiyi.com 完全兼容 Gemini、OpenAI、Anthropic 原生格式),所有功能都正常工作,包括 nano banana pro 图像生成、TTS 配音、Vibe 编辑等。

Q4: nano banana pro 在 API易 上的模型名是什么?

API易 apiyi.com 上 nano banana pro 对应的官方模型 ID 是 gemini-2.5-flash-image(Google 官方命名)。在 banana-slides 的 .env 中可以这样配置:

IMAGE_MODEL_NAME=gemini-2.5-flash-image
GOOGLE_API_BASE=https://vip.apiyi.com/gemini

Q5: 一份 30 页的 PPT 大概需要多少 API 费用?

预估如下

  • 文本生成(大纲 + 内容):约 100-200K tokens
  • 图像生成(每页 1-2 张):约 30-60 次调用
  • 总成本:使用 API易 apiyi.com 充值赠送 10%(≈ 85 折)后,约 1-3 美元

Q6: 部署到公司服务器后,多人同时使用会卡顿吗?

主要瓶颈在 API 并发。banana-slides 自身是 Flask + SQLite 架构,单机可承载 10-20 人同时使用。瓶颈通常出现在 API 调用层——如果用官方 API 接口,会被速率限制;用 API易 apiyi.com 中转可以享受不限并发的优势,多人同时生成 PPT 也不会被限流。

Q7: 商用 banana-slides 需要付费吗?

需要。banana-slides 采用 AGPL-3.0 许可证,个人和非商业用途免费;如果是商业部署,需要联系作者购买商业授权(联系邮箱:[email protected])。但即使是商用授权,API 中转部分仍然可以使用 API易 apiyi.com,两者不冲突。

Q8: 如何持续跟上 banana-slides 的更新?

由于你 Fork 了仓库,可以这样定期同步上游更新:

# 添加上游仓库
git remote add upstream https://github.com/Anionex/banana-slides.git

# 拉取上游更新
git fetch upstream
git checkout main
git merge upstream/main

# 推送到自己的 Fork
git push origin main

注意保留你修改的 .env 配置,避免被覆盖。


七、banana-slides Key Takeaways 核心要点

  • banana-slides 是开源 AI PPT 生成器,基于 nano banana pro 图像模型,14K+ GitHub Stars
  • 支持多种输入方式:一句话、大纲、页面描述、PDF/DOCX/MD/TXT 素材上传
  • 三种导出格式:可编辑 PPTX、PDF、MP4 视频(含 TTS 配音)
  • Fork + 部署 3 步完成:Fork → cp .env.example .env → docker compose up
  • 支持 3 种 API 格式:Gemini(默认)、OpenAI、Anthropic
  • 替换 AIHubMix 为 API易只需改 base_url:从 aihubmix.com 改为 vip.apiyi.com 即可
  • API易 apiyi.com 优势:原生格式兼容、不限并发、充值 100 美金送 10%(≈ 85 折)、人民币充值
  • 一个 API Key 走遍三种格式:Gemini/OpenAI/Anthropic 全部兼容

八、总结

banana-slides 是一个值得长期关注的开源 AI PPT 生成器,它把 nano banana pro 的图像生成能力和"Vibe 编辑"的交互范式结合在一起,让普通人也能在 30 分钟内做出专业级的演示文稿。

对于决定 Fork 部署的开发者来说,配置 API 服务商是最关键的一步。官方默认推荐的 AIHubMix 虽然能用,但替换为 API易 apiyi.com 有几个明显的好处:完全兼容 Gemini/OpenAI/Anthropic 三种原生格式(不需要修改任何业务代码)、不限并发(多人/大型 PPT 不被限流)、充值 100 美金送 10% 的成本优势(相当于官网 85 折)、国内人民币充值(微信/支付宝即可)。

替换的过程也极其简单——只需要把 .env 中的 GOOGLE_API_BASE(或 OPENAI_API_BASEANTHROPIC_API_BASE)从 https://aihubmix.com/... 改为 https://vip.apiyi.com/...,再填入 API易 的 Key 即可。

如果你正在考虑搭建一个团队级的 AI PPT 生成系统,或者想为自己/学生提供一个零成本入门的 PPT 工具,banana-slides + API易 apiyi.com 的组合是目前对国内开发者最友好的方案。从今天开始 Fork 项目,1 小时内就能跑起你的第一份 AI 生成的 PPT。

🎯 下一步行动建议:先访问 API易 apiyi.com 注册账号并获取 API Key,再 Fork github.com/Anionex/banana-slides 到自己的 GitHub,按本文第四章的配置方法修改 .env,启动服务后用一句话 prompt 生成你的第一份 PPT 验证流程。


参考资料

  1. banana-slides GitHub 仓库:项目主仓库

    • 链接: github.com/Anionex/banana-slides
    • 说明: 包含完整源码、Docker Compose 配置、英文 README
  2. banana-slides 官方文档:配置和部署指南

    • 链接: docs.bananaslides.online/configuration
    • 说明: 包含 AIHubMix 推荐代理章节,本文教你替换为 API易
  3. nano banana pro 模型说明:Google 官方图像生成模型

    • 链接: ai.google.dev/gemini-api/docs/image-generation
    • 说明: 模型 ID 为 gemini-2.5-flash-image
  4. API易官网:Claude / Gemini / OpenAI 中转服务平台

    • 链接: apiyi.com
    • 说明: 原生格式兼容、不限并发、人民币充值、充值 100 美金送 10%

作者: 技术团队
最后更新: 2026-05-01
关于 API易: API易 apiyi.com 是专业的 AI 大模型 API 中转服务商,提供 Gemini(含 nano banana pro)、Claude Sonnet 4.5、Claude Opus 4.7、GPT 系列等全系列模型的稳定接入,完全兼容原生 Gemini/OpenAI/Anthropic 三种格式,充值 100 美金赠送 10%(相当于官网 85 折),不限并发,技术支持响应快。

类似文章