
AI 短剧赛道正在爆发。从网文 IP 改编到短视频平台分发,能快速将文字内容转化为可视化短剧的工具,已经成为内容创作者的刚需。
Toonflow 是一款开源的 AI 短剧 / 漫剧自动化制作工具,由 HBAI Ltd 开发并在 GitHub 上开源(AGPL-3.0 协议)。它的核心能力是将小说或剧本文本,通过 AI 自动完成角色提取、剧本生成、分镜绘制和视频合成的全流程。
Toonflow 本身不内置 AI 模型,而是作为 AI Agent 编排引擎,协调 3 类外部 AI 服务来完成工作:
| AI 服务类型 | 用途 | 推荐模型 |
|---|---|---|
| 大语言模型(LLM) | 角色分析、剧本生成、分镜提示词 | GPT-4o、Claude 4 Sonnet 等 |
| 图片生成模型 | 角色形象、场景插图、分镜画面 | Nano Banana Pro |
| 视频生成模型 | 分镜画面转视频片段 | Sora、豆包视频 |
🚀 快速开始:Toonflow 所需的 LLM、图片生成、视频生成 3 类 API 服务,均可通过 API易 apiyi.com 一站式获取,无需分别注册多个平台,5 分钟完成全部配置。
本文将从 Toonflow 的核心功能介绍、安装部署、API 服务配置 3 个维度,帮你快速上手这款 AI 短剧制作工具。
Toonflow AI 短剧工具的 4 大核心功能
Toonflow 将小说转短剧的流程拆解为 4 个自动化阶段,每个阶段都由对应的 AI 服务驱动:
功能一:AI 角色自动提取与生成
Toonflow 会调用大语言模型对输入的小说文本进行深度分析,自动识别并提取角色信息:
| 提取维度 | 说明 | 示例 |
|---|---|---|
| 外貌特征 | 角色的外表描述,用于生成角色立绘 | 黑色长发、蓝色眼眸、白色长裙 |
| 性格特质 | 角色的行为模式和心理特征 | 果断冷静、内向敏感 |
| 身份背景 | 角色的社会关系和故事定位 | 公司 CEO、女主闺蜜 |
| 角色卡片 | 综合以上信息生成的视觉化角色卡 | 包含立绘 + 文字介绍 |
角色提取的质量直接决定后续分镜画面的角色一致性。Toonflow 通过结构化的提示词模板,确保 LLM 输出的角色描述可以直接作为图片生成的 prompt。
功能二:智能剧本与分镜生成
用户选择需要改编的章节后,Toonflow 会自动:
- 将小说段落转化为结构化剧本(包含对白、场景描述、舞台指示)
- 为每个场景生成分镜提示词(包含前景、中景、背景构图、角色动态、道具、镜头角度)
这一步完全由 LLM 完成,生成的分镜提示词会直接传递给图片生成模型。
功能三:AI 图片生成与分镜绘制
Toonflow 将分镜提示词发送到图片生成 API,自动生成每一帧分镜画面。目前支持的图片生成后端包括:
- Nano Banana Pro:支持 4K 分辨率输出,角色一致性好,支持多语言文字渲染
- 火山引擎:豆包旗下的图片生成服务

功能四:AI 视频合成与在线编辑
最后一步,Toonflow 将分镜图片通过视频生成 API 转化为动态视频片段,并提供在线编辑功能,支持用户对生成结果进行个性化调整。
支持的视频生成服务包括 Sora(OpenAI)和豆包视频生成 API。
Toonflow 安装部署:3 种方式按需选择
Toonflow 提供 Windows 桌面应用、Docker 部署和手动部署 3 种安装方式。
Toonflow 系统要求
| 项目 | 最低要求 |
|---|---|
| Node.js | v23.11.1 或更高 |
| 内存 | 2GB+ |
| 操作系统 | Windows(桌面版)/ Linux(服务器部署) |
| 网络 | 需要访问外部 AI API 服务 |
方式一:Windows 桌面应用(推荐新手)
直接从 GitHub Releases 下载 Electron 桌面安装包:
- GitHub 项目地址:
github.com/HBAI-Ltd/Toonflow-app - 默认登录账号:
admin - 默认登录密码:
admin123
下载安装后即可运行,桌面版内置了后端服务,无需额外配置运行环境。
方式二:Docker 部署(推荐服务器)
# 克隆项目
git clone https://github.com/HBAI-Ltd/Toonflow-app.git
cd Toonflow-app
# 使用 Docker Compose 一键启动
docker-compose -f docker/docker-compose.yml up -d --build
启动后访问 http://localhost:60000 进入管理界面。
方式三:手动部署(适合开发者)
# 安装依赖
yarn install
# 开发模式启动(仅后端,端口 60000)
yarn dev
# 桌面应用 + 后端同时启动
yarn dev:gui
# 生产构建
yarn build
手动部署时建议使用 PM2 进行进程管理,确保服务稳定运行。
Toonflow API 服务配置:3 类 AI 接口完整对接教程
Toonflow 安装完成后,需要配置 3 类 AI 服务的 API 接口才能正常使用。这是整个配置过程中最关键的一步。
🎯 配置建议:推荐使用 API易 apiyi.com 作为统一的 API 服务提供商。该平台同时提供 LLM、图片生成、视频生成 3 类 API 的统一接口,使用相同的 base_url 和认证方式,大幅简化 Toonflow 的配置工作。

配置一:大语言模型(LLM)API 接入
Toonflow 的角色分析、剧本生成、分镜提示词生成功能均依赖 LLM。配置时需要提供 OpenAI 兼容格式的 API 接口。
推荐模型选择:
| 模型 | 适用场景 | 特点 |
|---|---|---|
| GPT-4o | 通用场景,剧本质量高 | 理解力强,输出稳定 |
| Claude 4 Sonnet | 长篇小说分析 | 长上下文优势明显 |
| DeepSeek V3 | 成本敏感场景 | 性价比高 |
| Gemini 2.5 Pro | 多模态分析 | 支持图文混合输入 |
配置参数示例:
在 Toonflow 设置页面填入以下信息:
接口地址(base_url): https://api.apiyi.com/v1
API Key: 你的 API Key
模型名称: gpt-4o(或其他支持的模型)
💡 提示:配置完成后,可以点击 Toonflow 设置页面中的「模型检测」按钮,验证 API 连通性是否正常。这个功能在 v1.0.2 版本中新增。
配置二:Nano Banana Pro 图片生成 API 接入
Nano Banana Pro 是 Toonflow 推荐的图片生成模型,支持文生图(text-to-image)和图生图(image-to-image)两种模式,最高支持 4K 分辨率输出。
Nano Banana Pro 核心参数:
| 参数 | 说明 | 推荐值 |
|---|---|---|
| 模型名称 | API 调用时的 model 参数 | nano-banana-pro |
| 分辨率 | 输出图片分辨率 | 2K(分镜用)或 4K(封面用) |
| 图片比例 | 宽高比 | 16:9(横版短剧)或 9:16(竖版短剧) |
| 风格控制 | 通过提示词控制画风 | 动漫风、写实风、水彩风等 |
配置参数示例:
接口地址(base_url): https://api.apiyi.com/v1
API Key: 你的 API Key
图片模型: nano-banana-pro
Nano Banana Pro 的角色一致性表现优秀,特别适合需要在多个分镜中保持同一角色形象的短剧制作场景。
配置三:Sora / 豆包视频生成 API 接入
视频生成是 Toonflow 工作流的最后一步。将分镜图片转化为动态视频片段。
支持的视频生成服务:
| 服务 | 特点 | 单次生成时长 |
|---|---|---|
| Sora(OpenAI) | 画质优秀,运动自然 | 约 5-20 秒 |
| 豆包视频 | 中文场景优化好 | 约 5-15 秒 |
配置参数示例:
接口地址(base_url): https://api.apiyi.com/v1
API Key: 你的 API Key
视频模型: sora(或对应的豆包模型名称)
💰 成本提示:视频生成是整个流程中成本最高的环节。建议先用图片生成确认分镜效果满意后,再批量生成视频。通过 API易 apiyi.com 平台调用可以获得更灵活的计费方式,适合控制短剧制作成本。
Toonflow 完整工作流实战:从小说到短剧的 5 步操作
配置完成后,以下是使用 Toonflow 制作一部 AI 短剧的完整操作流程:
第 1 步:创建项目并导入小说
在 Toonflow 管理界面创建新项目,将小说文本(TXT 格式)导入系统。支持按章节自动分割。
第 2 步:AI 角色提取
点击「角色生成」,系统自动调用 LLM 分析全文,提取主要角色信息并生成角色卡片。可以手动调整角色描述以优化后续画面生成效果。
第 3 步:选章生成剧本
选择要制作的章节,点击「剧本生成」。LLM 会将小说段落转化为带有对白和场景指示的结构化剧本。
第 4 步:分镜图片生成
系统根据剧本自动生成分镜提示词,并调用 Nano Banana Pro 生成每帧画面。这一步可以逐帧预览和调整。
第 5 步:视频合成与编辑
确认分镜效果后,调用 Sora 或豆包视频 API 将静态画面转化为动态视频。Toonflow 提供在线编辑器进行最终调整。
Toonflow 技术架构与开发信息
| 技术栈 | 具体实现 |
|---|---|
| 后端框架 | Node.js + Express + TypeScript |
| 数据库 | SQLite3(better-sqlite3) |
| AI SDK | Vercel AI SDK、Aigne 中间件 |
| 图片处理 | Sharp |
| 桌面应用 | Electron |
| HTTP 客户端 | Axios |
| 参数校验 | Zod |
| 进程管理 | PM2(生产环境) |
| 容器化 | Docker + Docker Compose |
Toonflow 项目采用 AGPL-3.0 开源协议,个人和非商业使用免费。商业使用需要联系 HBAI Ltd 获取商业授权(联系邮箱: [email protected])。
Toonflow 常见问题 FAQ
Q1:Toonflow 需要本地 GPU 吗?
不需要。Toonflow 本身只是一个编排工具,所有 AI 推理任务都通过远程 API 完成。你的电脑只需要能运行 Node.js 和浏览器即可。通过 API易 apiyi.com 接入 API 服务后,无需关心 GPU 资源。
Q2:Toonflow 支持哪些图片生成模型?
目前主要支持 Nano Banana Pro 和火山引擎图片生成。其中 Nano Banana Pro 支持最高 4K 分辨率,角色一致性表现优秀,是短剧分镜绘制的首选。在 API易 apiyi.com 平台可以直接调用 Nano Banana Pro 模型。
Q3:制作一集短剧的 API 成本大约多少?
成本取决于章节长度和分镜数量。一般来说:
- LLM 调用(角色分析 + 剧本 + 分镜提示词):约 $0.5-2
- 图片生成(20-50 张分镜):约 $1-5
- 视频生成(20-50 个片段):约 $10-50
视频生成是主要成本。建议通过 API易 apiyi.com 的灵活计费方式优化支出。
Q4:Toonflow 有路线图吗?
项目规划了以下功能:
- Prompt 精修 Agent(智能视频提示词优化)
- 多格式文本支持(漫画脚本、游戏对话等)
- 角色服装和道具管理(长篇一致性)
- 批量处理任务队列
- 一键风格转换模板
Toonflow AI 短剧工具总结
Toonflow 为 AI 短剧制作提供了一套完整的自动化解决方案,将小说转短剧的流程从人工操作简化为 AI 流水线。它的核心价值在于:
- 全流程自动化:角色提取 → 剧本生成 → 分镜绘制 → 视频合成,一站式完成
- 开源免费:AGPL-3.0 协议,个人使用零成本
- 灵活的 AI 后端:支持多种 LLM、图片和视频生成模型,不锁定特定供应商
- 多种部署方式:桌面应用、Docker、手动部署,适配不同使用场景
推荐通过 API易 apiyi.com 一站式获取 Toonflow 所需的全部 AI API 服务,统一接口、统一计费,快速完成配置开始创作。
参考资料
-
Toonflow GitHub 仓库: 官方开源项目
- 链接:
github.com/HBAI-Ltd/Toonflow-app - 说明: 包含源码、安装文档和版本发布
- 链接:
-
Toonflow Gitee 镜像: 国内访问加速
- 链接:
gitee.com/HBAI-Ltd/Toonflow-app - 说明: 适合国内网络环境
- 链接:
-
API易官方文档: AI API 服务接入指南
- 链接:
help.apiyi.com - 说明: LLM、图片生成、视频生成 API 使用教程
- 链接:
本文由 APIYI 技术团队撰写,关注 AI 大模型应用与开发实践。更多技术教程请访问 API易 apiyi.com。
