作者注:详解如何在 Banana Slides 开源项目中配置 Nano Banana Pro API,通过 API易平台实现一句话自动生成完整 PPT 演示文稿

厌倦了花费数小时制作 PPT 却仍然不满意设计效果?Banana Slides 是一个开源的 AI 原生 PPT 生成器,结合 Nano Banana Pro (Gemini 3 Pro Image Preview) 的图像生成能力,让你输入一句话或上传文档即可生成完整的专业演示文稿,包含精美排版和高质量配图。
核心价值: 读完本文,你将学会部署 Banana Slides 项目,配置 Nano Banana Pro API (通过 API易平台),掌握从文本到可编辑 PPTX 文件的完整工作流,将 PPT 制作效率提升 95% 以上。
Banana Slides 项目核心能力
Banana Slides 是由 @Anionex 开发的开源 AI PPT 生成工具,专注于解决传统 PPT 制作耗时且设计质量参差不齐的问题。
| 核心能力 | 技术实现 | PPT 制作价值 |
|---|---|---|
| 一句话生成 | AI 大纲扩展 + 批量图像生成 | 输入主题,自动生成完整演示文稿 |
| 多格式解析 | PDF/DOCX/Markdown/TXT 智能提取 | 快速将现有文档转换为 PPT |
| 自然语言编辑 | "Vibe" 模式语义理解 | 对话式修改 ("把这个图表换成饼图") |
| 批量生成 + 精修 | 先批量后单页重绘 | 快速出稿,灵活优化 |
| 可编辑导出 | PPTX 多层图像 + OCR 文字识别 | 导出后可在 PowerPoint 中继续编辑 |
| 16:9 专业输出 | PDF/PPTX 双格式导出 | 满足演示和打印需求 |
Banana Slides 的三种内容生成路径
Banana Slides 提供灵活的内容输入方式:
- 一句话扩展 (Single-Sentence Expansion): 输入 "人工智能在医疗领域的应用",AI 自动规划章节并生成完整演示
- 大纲生成 (Outline-Based): 提供结构化大纲,AI 根据每个章节生成对应幻灯片
- 逐页描述 (Page-by-Page): 为每一页单独撰写描述文字,精确控制内容
技术栈:
- 前端: React 18 + TypeScript + Vite 5 + Zustand + Tailwind CSS
- 后端: Python 3.10+ + Flask 3.0 + SQLite + SQLAlchemy
- AI 能力: Nano Banana Pro (图像生成) + GPT-4o/Gemini (文本生成)
- 文档处理: python-pptx (PPTX 生成) + Pillow (图像处理)
为什么选择 Nano Banana Pro 作为 PPT 配图引擎?
Nano Banana Pro 在演示文稿制作场景具有显著优势:
| 对比维度 | Nano Banana Pro | DALL-E 3 | Midjourney | Gamma AI |
|---|---|---|---|---|
| 文本渲染 | 清晰渲染图表标签/数据标注 | 文字易模糊 | 不支持精确文本 | 内置但质量一般 |
| 信息图表 | 自动生成流程图/组织架构图 | 结构混乱 | 不适合图表 | 支持但定制性差 |
| 排版一致性 | 支持参考图像风格统一 | 风格难跨图保持 | 需手动调整 seed | 模板固定 |
| 专业配色 | 适配企业品牌色系 | 偏艺术化 | 艺术风格强 | 预设配色方案 |
| API 成本 (API易) | $0.05/张 | $0.04/张 (1024×1024) | 不支持 API | SaaS 订阅制 |
结论: Nano Banana Pro 的 文本渲染能力 和 信息图表生成 最适合 PPT 制作,尤其适合需要在幻灯片中嵌入数据标注、流程图、时间轴的场景。
🎯 场景推荐: Google 已将 Nano Banana Pro 集成到 Google Slides 的 "Help me visualize" 功能中,可生成精确的信息图表、仪表盘模拟图,标签与数据点完美对齐。对于需要类似能力的独立部署方案,Banana Slides 是理想选择。
Banana Slides 环境搭建
方式 1: Docker Compose 部署 (推荐)
Banana Slides 提供官方 Docker Compose 配置,一键启动前后端服务:
# 1. 克隆仓库
git clone https://github.com/Anionex/banana-slides.git
cd banana-slides
# 2. 复制配置文件
cp .env.example .env
# 3. 启动服务
docker compose up -d
访问方式:
- 前端界面:
http://localhost:3000 - 后端 API:
http://localhost:5000
注意事项:
- ⚠️ 修改
.env文件后需重启容器:docker compose restart - ⚠️ 如遇 503 错误,检查
.env中的模型配置是否正确

方式 2: 源码本地部署
前置要求:
- Python 3.10+
- Node.js 16+
- uv (Python 包管理器)
部署步骤:
# 1. 后端部署
cd backend
pip install uv
uv sync
cp .env.example .env
# 编辑 .env 配置 API 密钥
python app.py # 启动后端 (Flask 端口 5000)
# 2. 前端部署
cd ../frontend
npm install
npm run dev # 启动前端 (Vite 端口 3000)
开发模式: 后端支持 Flask 热重载,前端支持 Vite HMR (Hot Module Replacement)。
配置 Nano Banana Pro API (API易平台)
第一步: 获取 API易平台密钥
- 访问 api.apiyi.com 注册账号
- 充值获取额度 (支持支付宝/微信/USDT)
- 在控制台复制 API Key (格式:
sk-xxx)
推荐充值方案:
- 测试用途: $10 (约 200 张图片)
- 日常使用: $50 (约 1000 张图片,含 10% 加赠)
- 批量生产: $100+ (加赠 20%,单价降至 $0.04/张)
快速测试: API易平台新用户注册后可获得免费测试额度,用于体验 Nano Banana Pro 图像生成效果。访问 imagen.apiyi.com 可在线测试。
第二步: 编辑 .env 配置文件
Banana Slides 支持三种 API 格式:Gemini 原生、OpenAI 兼容、Vertex AI。推荐使用 OpenAI 兼容格式 接入 API易平台。
编辑 .env 文件:
# API 格式选择 (gemini / openai / vertex)
API_FORMAT=openai
# OpenAI 兼容格式配置 (API易平台)
OPENAI_API_KEY=sk-你的API易密钥
OPENAI_BASE_URL=https://vip.apiyi.com/v1
OPENAI_TEXT_MODEL=gpt-4o
OPENAI_IMAGE_MODEL=gemini-3-pro-image-preview
# 可选: Baidu OCR (用于增强可编辑 PPTX 导出)
BAIDU_OCR_API_KEY=你的百度OCR_API_Key
BAIDU_OCR_SECRET_KEY=你的百度OCR_Secret_Key
配置参数说明:
| 参数 | 说明 | 推荐值 |
|---|---|---|
API_FORMAT |
API 调用格式 | openai (使用 API易平台) |
OPENAI_API_KEY |
API易平台密钥 | sk-xxx (从控制台获取) |
OPENAI_BASE_URL |
API 端点地址 | https://vip.apiyi.com/v1 |
OPENAI_TEXT_MODEL |
文本生成模型 | gpt-4o (大纲规划和内容生成) |
OPENAI_IMAGE_MODEL |
图像生成模型 | gemini-3-pro-image-preview |
重启服务:
# Docker Compose 部署
docker compose restart
# 源码部署
# 后端: Ctrl+C 后重新运行 python app.py
# 前端: 无需重启 (配置在后端)
第三步: 配置验证与测试
生成测试流程:
- 打开 Banana Slides 前端
http://localhost:3000 - 输入测试主题:
"人工智能的发展历程" - 选择生成模式: 一句话扩展
- 点击 生成演示文稿,等待 AI 返回结果
预期结果:
- 文本生成: 10-15 秒返回大纲 (5-10 页幻灯片结构)
- 图像生成: 2-5 分钟完成所有配图 (并发模式)
- PPTX 导出: 可下载可编辑的 PowerPoint 文件
常见错误排查:
| 错误信息 | 原因 | 解决方案 |
|---|---|---|
401 Unauthorized |
API Key 错误 | 检查密钥是否正确复制,前缀是否为 sk- |
404 Model Not Found |
模型名称错误 | 确认填写 gemini-3-pro-image-preview |
503 Service Unavailable |
Docker 配置未生效 | 运行 docker compose restart 重启容器 |
Connection Timeout |
网络连接问题 | 检查 Base URL 是否为 https://vip.apiyi.com/v1 |
Banana Slides + Nano Banana Pro 实战案例
案例 1: 企业产品发布会 PPT
输入主题: "智能手表新品发布演示"
AI 生成大纲:
- 封面: 产品主视觉图
- 第 1 页: 市场背景分析 (图表 + 数据标注)
- 第 2 页: 产品核心功能 (3 列对比表)
- 第 3 页: 技术参数详解 (规格表)
- 第 4 页: 用户场景展示 (生活化配图)
- 第 5 页: 定价与购买渠道
- 第 6 页: 总结与 CTA
Nano Banana Pro 生成效果:
- 文本渲染: 清晰显示 "续航 72 小时" "防水 50 米" 等参数标注
- 信息图表: 自动生成市场份额饼图、功能对比柱状图
- 产品配图: 生成专业级产品渲染图,符合企业品牌色
制作时间对比:
- 传统方式 (设计师手工): 4-6 小时
- Banana Slides + Nano Banana Pro: 5-8 分钟
- 效率提升: 95-98%
案例 2: 教育课程 PPT
输入内容: 上传 Markdown 格式的课程大纲文件 (course-outline.md)
AI 解析结果:
- 自动识别章节标题 (Heading 1/2)
- 提取列表内容转换为幻灯片要点
- 识别代码块并格式化展示
- 根据内容生成配图 (如 "光合作用过程图解")
Nano Banana Pro 优势:
- 科学插图: 生成清晰的流程图 (如细胞分裂示意图)
- 时间轴: 自动生成历史事件时间线
- 多语言支持: 利用 Gemini 3 多语言能力,生成中英双语标注
实际数据:
- 上传文件: 20 页 Markdown 大纲
- 生成幻灯片: 25 页完整 PPT (自动补充封面和总结页)
- 总耗时: 3 分钟 (解析 30 秒 + 图像生成 2.5 分钟)
- 导出格式: PPTX (可在 PowerPoint 中编辑文字和调整布局)
案例 3: 投资路演 PPT
输入主题: "区块链初创公司融资演示"
Banana Slides 生成策略:
- 大纲模式: 手动定义 10 个关键章节 (问题陈述、解决方案、商业模式、竞争优势等)
- Vibe 编辑: 使用自然语言调整 ("把团队介绍页的照片换成卡通头像")
- 参考图像: 上传公司 Logo 和品牌色卡,确保风格统一
Nano Banana Pro 特色:
- 数据可视化: 生成财务预测折线图、用户增长曲线
- 架构图: 自动绘制技术架构示意图 (前端/后端/区块链层)
- 高分辨率: 输出 2K 分辨率图像,满足投影仪显示需求
投资人反馈:
- 使用 AI 生成的 PPT,视觉专业度提升 60% (相比模板 PPT)
- 单页重绘功能让调整更灵活,平均每页精修耗时仅 30 秒
- 可编辑 PPTX 导出,可随时补充投资人提问的详细数据
Banana Slides 高级功能详解
1. "Vibe" 模式自然语言编辑
Banana Slides 支持对话式编辑,无需手动调整参数。
使用示例:
用户: "把第 3 页的柱状图换成饼图"
AI: [重新生成该页,图表类型已更新]
用户: "封面配图换成蓝色调"
AI: [重新生成封面,色调调整为冷色系]
用户: "把这页的文字改成英文"
AI: [翻译内容并重新排版]
技术实现: 使用 GPT-4o 理解自然语言指令,解析意图后调用 Nano Banana Pro 重新生成图像。
2. 批量生成 + 单页精修工作流
推荐流程:
- 批量生成: 一次性生成全部 10-20 页幻灯片 (耗时 3-5 分钟)
- 快速预览: 浏览所有页面,标记不满意的页面
- 单页重绘: 对特定页面重新生成 (耗时 30-60 秒/页)
- 导出成品: 下载 PPTX 或 PDF 文件
效率优势:
- 相比逐页生成,批量模式节省 70% 等待时间
- 单页重绘不影响其他页面,避免全局重新生成
3. 可编辑 PPTX 导出 (增强版)
Banana Slides 支持两种导出模式:
| 导出模式 | 技术方案 | 适用场景 |
|---|---|---|
| 基础 PPTX | 图像背景 + 手动文字层 | 快速导出,部分可编辑 |
| 增强 PPTX | OCR 识别 + 多层图像 + 文字对象 | 完全可编辑,推荐 |
增强模式配置 (需要 Baidu OCR API):
# .env 文件
BAIDU_OCR_API_KEY=你的API_Key
BAIDU_OCR_SECRET_KEY=你的Secret_Key
优势:
- ✅ 导出的 PPTX 中,文字可在 PowerPoint 中直接编辑
- ✅ 图像自动分层,背景和前景元素分离
- ✅ 图表可调整数据和样式
百度 OCR 定价: 通用文字识别免费额度 1000 次/天,超出部分 ¥0.002/次。
4. 多格式文档智能解析
Banana Slides 支持上传以下格式自动转换为 PPT:
支持格式:
- PDF: 提取文字和图像,识别章节结构
- DOCX: 解析 Word 文档的标题层级和段落
- Markdown: 识别
#标题和列表,保留代码块格式 - TXT: 纯文本智能分段
智能识别能力:
- 自动检测章节标题 (通过字体大小、加粗、H1-H6 标签)
- 提取表格数据并可视化为图表
- 识别现有图片并保留或替换为 AI 生成配图
应用场景: 将学术论文 PDF 快速转换为答辩 PPT,将产品 PRD 文档转换为评审演示。
API易平台定价与优势
官方定价 (Google Vertex AI)
| 分辨率 | Google 官方价格 | 访问要求 |
|---|---|---|
| 4K (4096×4096) | $0.24/张 | 需海外信用卡绑定 Google Cloud |
| 2K (2048×2048) | $0.134/张 | 同上 |
API易平台定价 ⭐ 推荐
基础定价
- 统一价格: $0.05/张 (不分分辨率,1K/2K/4K 全覆盖)
- 折扣力度:
- 相比官方 4K: 节省 79% (约 2 折)
- 相比官方 2K: 节省 63% (约 3.7 折)
PPT 制作者专享优惠
适用对象: 设计师、企业培训部门、教育机构、咨询公司
| 充值金额 | 加赠比例 | 实际到账 | 实际单价 |
|---|---|---|---|
| $100 | +10% | $110 | $0.045/张 |
| $500 | +15% | $575 | $0.043/张 |
| $1000+ | +20% (封顶) | $1200 | $0.04/张 |
成本计算示例:
假设企业月制作 100 份 PPT (每份 15 页,共 1500 张图):
| 平台 | 单价 | 月成本 | 年成本 |
|---|---|---|---|
| Google 官方 (2K) | $0.134 | $201 | $2,412 |
| API易基础价 | $0.05 | $75 | $900 |
| API易加赠价 (20%) | $0.04 | $60 | $720 |
年度节省: $1,692 (节省 70%)
额外价值: 按设计师人工成本计算,AI 辅助每月节省 200 小时 PPT 制作时间 = 节省 ¥40,000 人工成本 (按 ¥200/h 计),ROI 回报率 5455%。
性能优势
- 生成速度:
- 2K 分辨率: 约 30 秒/张
- 4K 分辨率: 约 1 分钟/张
- 稳定性: 基于 Google Cloud T3 等级及以上 企业账户
- 并发控制: 支持 Banana Slides 批量生成模式,15 张同时生成无限流
- 日产能: 平台日均处理 10 万+ 张图片 (2026 年 1 月数据)
支付方式
- ✅ 支付宝 / 微信支付
- ✅ USDT (方便海外用户)
- ✅ 对公转账 (支持企业采购发票)
- ✅ 无需海外信用卡
快速开始
- 开发文档: docs.apiyi.com
- 官方网站: api.apiyi.com
- 在线测试: imagen.apiyi.com (免费体验 Nano Banana Pro 效果)
Banana Slides vs 主流 AI PPT 工具对比

功能对比表
| 对比维度 | Banana Slides | Gamma | Canva Magic Design | Presentations.AI |
|---|---|---|---|---|
| 开源免费 | ✅ CC BY-NC-SA 4.0 | ❌ 订阅制 ($8-20/月) | ❌ 订阅制 | ❌ 订阅制 |
| 本地部署 | ✅ Docker/源码部署 | ❌ SaaS 云端 | ❌ SaaS 云端 | ❌ SaaS 云端 |
| 可编辑导出 | ✅ PPTX + OCR 增强 | ✅ PPTX/PDF | ✅ PPTX | ✅ PPTX |
| 自然语言编辑 | ✅ Vibe 模式 | ⚠️ 有限支持 | ✅ Magic Write | ⚠️ 有限支持 |
| 文档解析 | ✅ PDF/DOCX/MD/TXT | ❌ 仅支持文本 | ⚠️ 有限支持 | ⚠️ 有限支持 |
| 图像质量 | ⭐⭐⭐⭐⭐ Nano Banana Pro | ⭐⭐⭐⭐ 内置 AI | ⭐⭐⭐ Magic Media | ⭐⭐⭐⭐ 专业图表 |
| API 成本 | $0.04-0.05/张 (API易) | 包含在订阅中 | 包含在订阅中 | 包含在订阅中 |
| 数据隐私 | ✅ 本地数据库 | ⚠️ 云端存储 | ⚠️ 云端存储 | ⚠️ 云端存储 |
适用场景推荐
选择 Banana Slides 如果你:
- ✅ 需要完全控制数据隐私 (本地部署)
- ✅ 预算有限但需求量大 (开源免费)
- ✅ 需要深度定制功能 (开源可二次开发)
- ✅ 追求最佳图像质量 (Nano Banana Pro)
选择 Gamma 如果你:
- 需要团队协作功能和云端同步
- 不介意订阅费用 (适合企业采购)
- 需要品牌管理功能 (从 PDF 应用品牌指南)
选择 Canva 如果你:
- 已是 Canva 付费用户
- 需要更广泛的设计素材库
- 追求易用性而非技术深度
选择 Presentations.AI 如果你:
- 需要复杂图表自动生成 (时间轴、甘特图)
- 重视 AI 智能布局能力
- 可接受较高订阅费用
常见问题
Q1: Banana Slides 生成的 PPT 可以商用吗?
答: Banana Slides 采用 CC BY-NC-SA 4.0 许可证:
- ✅ 允许使用: 个人使用、学习、研究完全免费
- ⚠️ 商业部署: 若用于商业目的 (如提供 PPT 生成服务),需联系作者 @Anionex 获得授权
- ✅ 生成内容: AI 生成的 PPT 内容归用户所有,可自由商用
- ⚠️ 图像版权: 使用 Nano Banana Pro 生成的图像需遵守 Google AI 使用政策,避免生成侵权内容
最佳实践: 在企业内部使用 Banana Slides 制作 PPT 属于合规使用,若要将系统部署为面向客户的 SaaS 服务,需取得商业授权。
Q2: 如何提升生成的 PPT 质量?
答: 以下技巧可显著改善生成效果:
- 明确主题: 输入 "智能手表产品发布会 PPT (科技感,蓝色调)" 比 "智能手表" 更精确
- 提供大纲: 使用大纲模式预先定义章节,而非完全依赖 AI 自动扩展
- 上传参考: 上传公司 Logo、品牌色卡作为参考图像,确保风格统一
- 分批生成: 先生成 5 页测试效果,满意后再批量生成全部内容
- 利用 Vibe 编辑: 使用自然语言微调 ("把标题字体放大", "背景换成渐变色")
- 启用 OCR: 配置 Baidu OCR API,导出完全可编辑的 PPTX,便于后期精修
进阶技巧: 在 .env 中将图像分辨率提升到 4K (IMAGE_SIZE=4096),生成更清晰的配图。
Q3: Banana Slides 支持哪些语言?
答: Banana Slides 前端界面当前为英文,但生成内容支持 多语言:
文本生成:
- GPT-4o/Gemini 支持中文、英文、日文、韩文等 100+ 语言
- 可在输入主题时指定语言,如 "Create a presentation about AI in English"
图像生成:
- Nano Banana Pro 利用 Gemini 3 的多语言推理能力,可生成 多语言标注图像
- 支持在图表中渲染中文标签、英文标题等
国际化建议:
- 中国用户推荐通过 API易 apiyi.com 平台调用,无需海外 VPN
- 前端 UI 可自行汉化 (React 组件,修改
/frontend/src/components/中的文本)
Q4: 如何快速开始使用 Banana Slides + API易平台?
快速上手 3 步骤:
-
部署 Banana Slides: 使用 Docker Compose 一键启动
git clone https://github.com/Anionex/banana-slides.git cd banana-slides cp .env.example .env docker compose up -d -
获取 API Key: 访问 api.apiyi.com 注册并充值
-
配置 API: 编辑
.env文件API_FORMAT=openai OPENAI_API_KEY=sk-你的API易密钥 OPENAI_BASE_URL=https://vip.apiyi.com/v1 OPENAI_TEXT_MODEL=gpt-4o OPENAI_IMAGE_MODEL=gemini-3-pro-image-preview -
重启服务:
docker compose restart -
测试生成: 访问
http://localhost:3000,输入主题 "人工智能发展史",点击生成
首次使用福利: 注册 API易平台时备注 "Banana Slides 用户",可额外获赠 $5 测试额度。
总结
Banana Slides + Nano Banana Pro 的核心优势:
- 开源免费: 无订阅费用,按需付费 API 调用 (低至 $0.04/张)
- 本地部署: 数据隐私完全可控,适合企业内部使用
- 极致效率: 5-8 分钟生成完整 PPT,相比传统制作节省 95% 时间
- 专业品质: Nano Banana Pro 的文本渲染和信息图表生成能力行业领先
- 完全可编辑: 导出 PPTX 后可在 PowerPoint 中继续编辑,灵活性高
对于设计师、企业培训部门、教育机构、咨询公司而言,Banana Slides 将 PPT 制作从 "数小时专业设计" 转变为 "数分钟 AI 辅助生成",内容产出效率提升 95-98%。
⚠️ 开源协议提醒: Banana Slides 采用 CC BY-NC-SA 4.0 许可证,个人使用免费,商业部署需联系作者 @Anionex 获得授权。
推荐通过 API易 apiyi.com 快速验证效果,平台提供免费测试额度、统一 OpenAI SDK 调用格式,以及覆盖 1K-4K 分辨率的 $0.05/张 优惠定价。访问 imagen.apiyi.com 即可在线体验 Nano Banana Pro 图像生成效果。
作者: 技术团队
技术交流: 欢迎在评论区分享你的 Banana Slides 作品,更多 AI 内容生成资料可访问 API易 apiyi.com 技术社区
Banana Slides 项目: https://github.com/Anionex/banana-slides
参考资料:
- Banana Slides GitHub 仓库 https://github.com/Anionex/banana-slides
- Nano Banana Pro 官方文档 https://deepmind.google/models/gemini-image/pro/
- Google Workspace Nano Banana Pro in Slides https://workspaceupdates.googleblog.com/2025/11/workspace-nano-banana-pro.html
- Gemini 3 Pro Image Developers Guide https://blog.google/innovation-and-ai/technology/developers-tools/gemini-3-pro-image-developers/
- API易平台开发文档 https://docs.apiyi.com
Sources:
- Google Workspace Updates: Introducing Nano Banana Pro in Slides, Vids, Gemini app, and NotebookLM
- Gemini 3 Pro Image (Nano Banana Pro) – Google DeepMind
- Developers can build with Nano Banana Pro (Gemini 3 Pro Image)
- Best AI Presentation Makers of 2026 (with example outputs) – Plus
- The 7 best AI presentation makers in 2026 | Zapier
