作者注:banana-slides 是基于 nano banana pro 的开源 AI PPT 生成应用,本文从新人视角完整介绍 Fork 部署流程,并教你将默认的 AIHubMix 代理替换为 API易,实现更稳定的中转调用。
GitHub 上有一款最近爆火的开源 AI PPT 生成器 banana-slides,它基于 Google 最新的 nano banana pro 图像模型,主打"一句话生成可编辑 PPT、支持视频导出、自然语言修改任意区域",目前已经收获 14K+ GitHub Stars。
这不是又一个套壳的 AI PPT 工具,而是一个真正可以本地化部署、源码完全开放的"Vibe PPT"系统,支持 Gemini、OpenAI、Anthropic、Vertex AI 等多种模型格式,官方文档默认推荐使用 AIHubMix 作为代理。
核心价值: 读完本文,你将学会如何 Fork banana-slides 项目并完成本地部署,更重要的是——掌握将默认的 AIHubMix 代理替换为 API易 apiyi.com 中转的完整配置方法,享受不限并发、原生格式、充值 100 美金送 10% 的成本优势。

一、banana-slides 是什么:开源 AI PPT 生成器的 3 个核心定位
banana-slides 是由开发者 Anionex 主导的开源项目,定位是 基于 nano banana pro 的原生 AI PPT 生成应用。它的核心理念是"Vibe PPT"——你可以用对话式的语言指挥 AI 生成、修改、迭代任意一页幻灯片。
1.1 banana-slides 的核心定位
| 定位维度 | banana-slides 的特点 | 与传统 AI PPT 工具差异 |
|---|---|---|
| 底层模型 | 基于 nano banana pro 图像生成 | 多数工具用模板拼接 |
| 部署模式 | 完全开源 + 本地化部署 | SaaS 产品锁定云端 |
| License | AGPL-3.0(商用需授权) | 闭源订阅制 |
| 修改方式 | 自然语言"Vibe 编辑" | 拖拽手工编辑 |
| 输入素材 | PDF/DOCX/MD/TXT 任意格式 | 仅支持文本/大纲 |
| 导出格式 | 可编辑 PPTX + PDF + MP4(含 TTS 配音) | 多数仅 PPTX |
| API 提供商 | 支持多家,默认推荐 AIHubMix | 通常绑定单一供应商 |
1.2 为什么 banana-slides 值得新人关注
如果你刚接触 AI PPT 生成这个领域,banana-slides 提供了一个比商业 SaaS 更"自由"的选择:
- 代码完全开源:可以二次开发、私有化部署
- 图像质量出众:依赖 nano banana pro,生成的配图远超传统 PPT 模板
- 多模型适配:可以用 Gemini、OpenAI、Anthropic 中的任意一家作为后端
- 灵活替换 API:默认推荐 AIHubMix,但完全可以替换为其他兼容服务(如 API易 apiyi.com)
💡 新人建议:如果你没有 Google API Key 或 OpenAI Key,最简单的方式是使用 API易 apiyi.com 的中转服务,一个 Key 就能同时访问 Gemini、Claude、GPT 等全系列模型,避免分别申请多家账号的麻烦。
1.3 banana-slides 适合哪些用户
- 学生:快速完成课程作业、毕业答辩 PPT
- 教师:把课件内容转成图文并茂的教学幻灯片
- 职场人:商业提案、项目汇报、季度总结
- 开发者:想要私有化部署 AI PPT 工具的团队
- 设计师:从 AI 生成的版面中获取灵感
二、banana-slides 核心功能:4 大特性详解
banana-slides 的功能设计围绕"降低 PPT 制作门槛"这一核心目标,主要包含 4 个层面的能力。

2.1 多路径内容生成
banana-slides 支持三种内容输入方式,适配不同场景:
| 输入方式 | 使用场景 | 输出粒度 |
|---|---|---|
| 一句话生成 | 临时演讲、灵感初稿 | AI 自动生成大纲 + 全部页面 |
| 大纲模式 | 已有清晰结构 | 按大纲自动扩展每页内容 |
| 页面描述模式 | 精细控制 | 逐页指定文字 + 配图 |
2.2 素材智能解析
banana-slides 可以接受多种格式的素材文件,并自动提取关键信息:
- PDF:自动提取文字、图片、图表数据
- DOCX:解析章节结构和嵌入图片
- Markdown:保留 H1/H2 层级关系
- TXT:智能提取关键点
这意味着你可以把一篇技术文档直接拖进 banana-slides,让 AI 帮你转成完整的演讲稿。
2.3 自然语言"Vibe 编辑"
这是 banana-slides 最有创新性的功能。生成 PPT 后,你可以用自然语言修改任意一页:
- "把第 3 页改成案例分析风格"
- "给标题加一个橘色背景"
- "这页的配图太复杂,换成简洁线条风格"
AI 会精准定位修改位置并重新生成,这种交互方式接近真实的"和设计师对话"。
🎯 使用建议:Vibe 编辑会触发多次 API 调用(每次修改都是一次完整的 prompt + 图像生成),如果你做的是长 PPT(20 页以上),建议使用 API易 apiyi.com 的中转服务,避免官方接口的速率限制问题。
2.4 多格式导出
| 导出格式 | 特点 | 适用场景 |
|---|---|---|
| 可编辑 PPTX | 文字、图片、形状均可二次编辑 | 后续需要微调 |
| 图片版 PPTX | 每页是高清图片 | 防止格式错乱 |
| 跨平台稳定显示 | 分发、打印 | |
| MP4 视频 | 包含 TTS 配音 + 字幕 | 录播课、自动讲解 |
MP4 导出支持中文、英文、日文 TTS 配音,并可选择多种音色,对教育场景特别友好。
三、Fork 和本地部署 banana-slides:3 步快速上手
3.1 系统环境要求
部署 banana-slides 前请确认本地环境:
| 依赖项 | 版本要求 | 说明 |
|---|---|---|
| Docker | 20.x+ | 推荐 Docker Compose 部署 |
| Python | 3.10+ | 源码部署需要 |
| Node.js | 16+ | 前端开发需要 |
| LibreOffice | 可选 | 用于 PPTX 上传解析 |
| Git | 任意 | 用于 Fork 和克隆 |
3.2 第一步:Fork 仓库到自己的账号
在浏览器打开 GitHub 项目主页 github.com/Anionex/banana-slides,点击右上角的 Fork 按钮,将仓库 Fork 到你自己的账号下。Fork 的好处:
- 后续可以提交自己的修改(特别是 API 配置)
- 拉取上游更新时方便冲突处理
- 便于团队协作部署
Fork 完成后,克隆到本地:
# 替换 YOUR_USERNAME 为你的 GitHub 用户名
git clone https://github.com/YOUR_USERNAME/banana-slides.git
cd banana-slides
3.3 第二步:创建配置文件
复制示例配置文件为正式配置:
cp .env.example .env
.env 文件包含所有 API Key、Base URL、模型选择等配置项,下一章会详细讲解如何替换为 API易 中转。
3.4 第三步:使用 Docker Compose 启动
最简单的启动方式是 Docker Compose:
docker compose -f docker-compose.prod.yml up -d
启动后访问:
- 前端界面:
http://localhost:3000 - 后端 API:
http://localhost:5000
如果你想从源码运行(便于二次开发),可以分别启动后端和前端:
# 后端
uv sync
uv run alembic upgrade head
uv run python app.py
# 前端(新开一个终端)
cd frontend
npm install
npm run dev
3.5 验证部署是否成功
打开 http://localhost:3000,应该看到:
- ✅ banana-slides 首页(黄色香蕉主题)
- ✅ "新建 PPT" 按钮可点击
- ✅ 输入一句话主题后能正常生成
如果生成时报错"API connection failed",通常是 .env 中的 API Key 或 Base URL 配置错误,参考下一章替换为 API易 中转可解决。
四、替换 AIHubMix 为 API易:banana-slides 配置完整指南
banana-slides 的官方文档默认推荐使用 AIHubMix 作为 API 代理(参考 docs.bananaslides.online/configuration#aihubmix-recommended-proxy)。但你完全可以将其替换为 API易 apiyi.com,享受更优惠的价格、不限并发、更稳定的国内中转线路。

4.1 为什么选择替换为 API易
虽然 AIHubMix 是 banana-slides 默认推荐的代理,但对于长期使用 banana-slides 的用户,API易 apiyi.com 有几个明显优势:
| 对比维度 | AIHubMix(默认) | API易 apiyi.com(推荐) |
|---|---|---|
| 支付方式 | 美元 / 国内人民币 | 国内人民币(微信/支付宝) |
| 价格优惠 | 标准价 | 充值 100 美金送 10%(≈ 官网 85 折) |
| 并发限制 | 按套餐分级 | 不限并发 |
| API 格式 | 兼容 OpenAI/Gemini | 完全兼容 OpenAI/Gemini/Anthropic 原生格式 |
| 接入难度 | 改 base_url 即可 | 改 base_url 即可(同样简单) |
| 故障切换 | 单一通道 | 多机房负载均衡 |
| 技术支持 | 工单 | 中文客服 + 微信群 |
4.2 修改 .env 文件:Gemini 格式(推荐用于 nano banana pro)
banana-slides 默认使用 Gemini 格式调用 nano banana pro。打开 .env 文件,找到以下配置:
修改前(AIHubMix 默认配置):
AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=your-aihubmix-key
GOOGLE_API_BASE=https://aihubmix.com/gemini
修改后(替换为 API易 apiyi.com):
AI_PROVIDER_FORMAT=gemini
GOOGLE_API_KEY=sk-your-apiyi-key-here
GOOGLE_API_BASE=https://vip.apiyi.com/gemini
🎯 关键说明:API易 apiyi.com 完全兼容 Gemini 原生格式的 base_url 路径设计,所以只需要把域名
aihubmix.com替换为vip.apiyi.com,路径/gemini保持不变即可。
4.3 修改 .env 文件:OpenAI 格式
如果你想用 GPT 系列模型生成 PPT 文本内容,可以切换到 OpenAI 格式:
修改前:
AI_PROVIDER_FORMAT=openai
OPENAI_API_KEY=your-aihubmix-key
OPENAI_API_BASE=https://aihubmix.com/v1
修改后(替换为 API易):
AI_PROVIDER_FORMAT=openai
OPENAI_API_KEY=sk-your-apiyi-key-here
OPENAI_API_BASE=https://vip.apiyi.com/v1
4.4 修改 .env 文件:Anthropic 格式
如果你希望用 Claude 模型来生成更高质量的 PPT 文本,banana-slides 也支持 Anthropic 格式:
修改后(替换为 API易):
AI_PROVIDER_FORMAT=anthropic
ANTHROPIC_API_KEY=sk-your-apiyi-key-here
ANTHROPIC_API_BASE=https://vip.apiyi.com
4.5 混合配置:文本 + 图像分别使用不同模型
banana-slides 支持文本生成和图像生成使用不同的模型源。例如,用 Claude Sonnet 4.5 生成文本,用 nano banana pro 生成配图:
# 文本生成 - 用 Anthropic 格式调 Claude
TEXT_MODEL_PROVIDER=anthropic
TEXT_MODEL_NAME=claude-sonnet-4-5
ANTHROPIC_API_KEY=sk-your-apiyi-key-here
ANTHROPIC_API_BASE=https://vip.apiyi.com
# 图像生成 - 用 Gemini 格式调 nano banana pro
IMAGE_MODEL_PROVIDER=gemini
IMAGE_MODEL_NAME=gemini-2.5-flash-image
GOOGLE_API_KEY=sk-your-apiyi-key-here
GOOGLE_API_BASE=https://vip.apiyi.com/gemini
💡 重要优势:API易 apiyi.com 的同一个 API Key 可以同时调用 Gemini、OpenAI、Anthropic 三种格式的所有模型,不需要分别申请三家的账号——这是相比官方直连最大的便利性提升。
4.6 重启服务并验证
修改 .env 后,重启 banana-slides 让新配置生效:
# Docker Compose 模式
docker compose -f docker-compose.prod.yml down
docker compose -f docker-compose.prod.yml up -d
# 源码模式
# 重启 uv run python app.py
在前端创建一个测试 PPT,输入一句话:"给我做一份关于 AI Agent 的 5 页 PPT",观察终端日志:
- ✅ 看到
Connecting to https://vip.apiyi.com/...表示走 API易中转 - ✅ 响应时间 < 30 秒(首页生成)
- ✅ 没有 429 / 503 错误
4.7 提交修改到自己的 Fork(团队部署)
如果是团队部署,可以把修改后的 .env.example 提交到自己的 Fork 中(注意不要提交真实的 .env):
# 创建一个 .env.example.apiyi 配置模板
cp .env .env.example.apiyi
# 编辑文件,把真实 API Key 替换为占位符
# 然后提交
git add .env.example.apiyi
git commit -m "feat: add API易 (apiyi.com) configuration template"
git push origin main
这样团队成员 Clone 你的 Fork 后,可以直接复制这个模板使用,省去重新查找配置的时间。
五、banana-slides 实战场景:5 大典型应用案例
5.1 场景一:学生快速做课堂展示 PPT
目标:30 分钟内完成一份 10 页的课程展示 PPT
操作流程:
- 打开 banana-slides,选择"一句话生成"模式
- 输入主题,例如:"关于量子计算原理的入门讲解"
- AI 自动生成大纲(约 30 秒)
- 点击生成全部页面(约 5-8 分钟,依赖图像生成速度)
- 用 Vibe 编辑微调个别页面
- 导出 PPTX
API 用量预估:10 页 PPT 约消耗 50-80K tokens(文本)+ 10-15 次图像生成。建议使用 API易 apiyi.com 中转避免速率限制。
5.2 场景二:教师把教案转成教学课件
目标:把现有的 Word 教案转成图文并茂的教学 PPT
操作流程:
- 上传 DOCX 教案文件
- banana-slides 自动解析章节结构
- 选择"按章节生成页面"
- AI 为每个知识点生成对应的配图
- 导出 MP4(含 TTS 中文配音),可直接作为录播课
5.3 场景三:职场人做商业提案
目标:基于一段需求描述,生成专业的商业提案 PPT
操作流程:
- 选择"页面描述模式",精细控制每页内容
- 上传公司 Logo 和品牌色作为模板参考
- 用 Vibe 编辑调整每页配图风格
- 导出可编辑 PPTX,再做最后的细节微调
5.4 场景四:技术博主做发布会演示
目标:3 小时内做一份 30 页的产品发布会 PPT
操作流程:
- 准备产品功能 Markdown 文档
- 上传到 banana-slides,选择"按 H2/H3 拆页"
- AI 自动生成对应的可视化配图
- 用模板图片确保视觉风格统一
- 导出 PDF + PPTX 双格式
5.5 场景五:私有化部署给团队使用
目标:在公司内网部署 banana-slides 给整个团队使用
操作流程:
- Fork 仓库到公司 GitHub 组织
- 修改
.env配置为 API易 apiyi.com 中转 - 部署到内网服务器(Docker Compose)
- 用 Nginx 配置内部域名
- 团队成员通过内网访问
💡 场景共性建议:以上 5 个场景都涉及大量的 API 调用(每个 PPT 都包含多次文本生成 + 多次图像生成)。我们建议把 banana-slides 接到 API易 apiyi.com 的中转服务上,享受不限并发的优势,确保 PPT 生成速度不受官方接口速率限制的影响。
六、banana-slides 常见问题 FAQ
Q1: banana-slides 和市面上的 AI PPT 工具(如 Gamma、MindStudio)有什么区别?
核心区别在于开源和可定制性。Gamma 等商业工具是云端 SaaS,按页或按月订阅;banana-slides 是开源项目(AGPL-3.0 许可证),可以本地部署、自由修改源码、对接任意 AI 模型。
如果你只是偶尔做 PPT,可能 Gamma 更省心;但如果你需要:
- 团队私有化部署
- 控制 API 成本
- 修改生成逻辑
- 用国内可访问的 API
那 banana-slides 是更好的选择,配合 API易 apiyi.com 中转可以做到完全自主可控。
Q2: 我没有 Google API Key,必须申请 Gemini 才能用 banana-slides 吗?
不需要。banana-slides 支持三种 API 格式(Gemini / OpenAI / Anthropic),你只需要任意一家的 Key 就能跑起来。
最简单的方式是直接在 API易 apiyi.com 注册一个账号,一个 Key 即可同时调用 Gemini(含 nano banana pro 图像生成)、GPT 和 Claude,免去分别申请的麻烦。国内人民币充值,支持微信/支付宝。
Q3: 替换 AIHubMix 为 API易 后,原有的功能会受影响吗?
完全不会。banana-slides 通过环境变量 GOOGLE_API_BASE 和 OPENAI_API_BASE 来确定 API 调用地址,只要替换的服务商兼容相应的 API 协议(API易 apiyi.com 完全兼容 Gemini、OpenAI、Anthropic 原生格式),所有功能都正常工作,包括 nano banana pro 图像生成、TTS 配音、Vibe 编辑等。
Q4: nano banana pro 在 API易 上的模型名是什么?
API易 apiyi.com 上 nano banana pro 对应的官方模型 ID 是 gemini-2.5-flash-image(Google 官方命名)。在 banana-slides 的 .env 中可以这样配置:
IMAGE_MODEL_NAME=gemini-2.5-flash-image
GOOGLE_API_BASE=https://vip.apiyi.com/gemini
Q5: 一份 30 页的 PPT 大概需要多少 API 费用?
预估如下:
- 文本生成(大纲 + 内容):约 100-200K tokens
- 图像生成(每页 1-2 张):约 30-60 次调用
- 总成本:使用 API易 apiyi.com 充值赠送 10%(≈ 85 折)后,约 1-3 美元
Q6: 部署到公司服务器后,多人同时使用会卡顿吗?
主要瓶颈在 API 并发。banana-slides 自身是 Flask + SQLite 架构,单机可承载 10-20 人同时使用。瓶颈通常出现在 API 调用层——如果用官方 API 接口,会被速率限制;用 API易 apiyi.com 中转可以享受不限并发的优势,多人同时生成 PPT 也不会被限流。
Q7: 商用 banana-slides 需要付费吗?
需要。banana-slides 采用 AGPL-3.0 许可证,个人和非商业用途免费;如果是商业部署,需要联系作者购买商业授权(联系邮箱:[email protected])。但即使是商用授权,API 中转部分仍然可以使用 API易 apiyi.com,两者不冲突。
Q8: 如何持续跟上 banana-slides 的更新?
由于你 Fork 了仓库,可以这样定期同步上游更新:
# 添加上游仓库
git remote add upstream https://github.com/Anionex/banana-slides.git
# 拉取上游更新
git fetch upstream
git checkout main
git merge upstream/main
# 推送到自己的 Fork
git push origin main
注意保留你修改的 .env 配置,避免被覆盖。
七、banana-slides Key Takeaways 核心要点
- ✅ banana-slides 是开源 AI PPT 生成器,基于 nano banana pro 图像模型,14K+ GitHub Stars
- ✅ 支持多种输入方式:一句话、大纲、页面描述、PDF/DOCX/MD/TXT 素材上传
- ✅ 三种导出格式:可编辑 PPTX、PDF、MP4 视频(含 TTS 配音)
- ✅ Fork + 部署 3 步完成:Fork → cp .env.example .env → docker compose up
- ✅ 支持 3 种 API 格式:Gemini(默认)、OpenAI、Anthropic
- ✅ 替换 AIHubMix 为 API易只需改 base_url:从
aihubmix.com改为vip.apiyi.com即可 - ✅ API易 apiyi.com 优势:原生格式兼容、不限并发、充值 100 美金送 10%(≈ 85 折)、人民币充值
- ✅ 一个 API Key 走遍三种格式:Gemini/OpenAI/Anthropic 全部兼容
八、总结
banana-slides 是一个值得长期关注的开源 AI PPT 生成器,它把 nano banana pro 的图像生成能力和"Vibe 编辑"的交互范式结合在一起,让普通人也能在 30 分钟内做出专业级的演示文稿。
对于决定 Fork 部署的开发者来说,配置 API 服务商是最关键的一步。官方默认推荐的 AIHubMix 虽然能用,但替换为 API易 apiyi.com 有几个明显的好处:完全兼容 Gemini/OpenAI/Anthropic 三种原生格式(不需要修改任何业务代码)、不限并发(多人/大型 PPT 不被限流)、充值 100 美金送 10% 的成本优势(相当于官网 85 折)、国内人民币充值(微信/支付宝即可)。
替换的过程也极其简单——只需要把 .env 中的 GOOGLE_API_BASE(或 OPENAI_API_BASE、ANTHROPIC_API_BASE)从 https://aihubmix.com/... 改为 https://vip.apiyi.com/...,再填入 API易 的 Key 即可。
如果你正在考虑搭建一个团队级的 AI PPT 生成系统,或者想为自己/学生提供一个零成本入门的 PPT 工具,banana-slides + API易 apiyi.com 的组合是目前对国内开发者最友好的方案。从今天开始 Fork 项目,1 小时内就能跑起你的第一份 AI 生成的 PPT。
🎯 下一步行动建议:先访问 API易 apiyi.com 注册账号并获取 API Key,再 Fork
github.com/Anionex/banana-slides到自己的 GitHub,按本文第四章的配置方法修改.env,启动服务后用一句话 prompt 生成你的第一份 PPT 验证流程。
参考资料
-
banana-slides GitHub 仓库:项目主仓库
- 链接:
github.com/Anionex/banana-slides - 说明: 包含完整源码、Docker Compose 配置、英文 README
- 链接:
-
banana-slides 官方文档:配置和部署指南
- 链接:
docs.bananaslides.online/configuration - 说明: 包含 AIHubMix 推荐代理章节,本文教你替换为 API易
- 链接:
-
nano banana pro 模型说明:Google 官方图像生成模型
- 链接:
ai.google.dev/gemini-api/docs/image-generation - 说明: 模型 ID 为
gemini-2.5-flash-image
- 链接:
-
API易官网:Claude / Gemini / OpenAI 中转服务平台
- 链接:
apiyi.com - 说明: 原生格式兼容、不限并发、人民币充值、充值 100 美金送 10%
- 链接:
作者: 技术团队
最后更新: 2026-05-01
关于 API易: API易 apiyi.com 是专业的 AI 大模型 API 中转服务商,提供 Gemini(含 nano banana pro)、Claude Sonnet 4.5、Claude Opus 4.7、GPT 系列等全系列模型的稳定接入,完全兼容原生 Gemini/OpenAI/Anthropic 三种格式,充值 100 美金赠送 10%(相当于官网 85 折),不限并发,技术支持响应快。
