用 Toonflow 实现 AI 短剧自动化制作：3 步完成小说转视频全流程配置

AI 短剧赛道正在爆发。从网文 IP 改编到短视频平台分发，能快速将文字内容转化为可视化短剧的工具，已经成为内容创作者的刚需。

Toonflow 是一款开源的 AI 短剧 / 漫剧自动化制作工具，由 HBAI Ltd 开发并在 GitHub 上开源（AGPL-3.0 协议）。它的核心能力是将小说或剧本文本，通过 AI 自动完成角色提取、剧本生成、分镜绘制和视频合成的全流程。

Toonflow 本身不内置 AI 模型，而是作为 AI Agent 编排引擎，协调 3 类外部 AI 服务来完成工作：

AI 服务类型	用途	推荐模型
大语言模型（LLM）	角色分析、剧本生成、分镜提示词	GPT-4o、Claude 4 Sonnet 等
图片生成模型	角色形象、场景插图、分镜画面	Nano Banana Pro
视频生成模型	分镜画面转视频片段	Sora、豆包视频

🚀 快速开始：Toonflow 所需的 LLM、图片生成、视频生成 3 类 API 服务，均可通过 API易 apiyi.com 一站式获取，无需分别注册多个平台，5 分钟完成全部配置。

本文将从 Toonflow 的核心功能介绍、安装部署、API 服务配置 3 个维度，帮你快速上手这款 AI 短剧制作工具。

Toonflow AI 短剧工具的 4 大核心功能

Toonflow 将小说转短剧的流程拆解为 4 个自动化阶段，每个阶段都由对应的 AI 服务驱动：

功能一：AI 角色自动提取与生成

Toonflow 会调用大语言模型对输入的小说文本进行深度分析，自动识别并提取角色信息：

提取维度	说明	示例
外貌特征	角色的外表描述，用于生成角色立绘	黑色长发、蓝色眼眸、白色长裙
性格特质	角色的行为模式和心理特征	果断冷静、内向敏感
身份背景	角色的社会关系和故事定位	公司 CEO、女主闺蜜
角色卡片	综合以上信息生成的视觉化角色卡	包含立绘 + 文字介绍

角色提取的质量直接决定后续分镜画面的角色一致性。Toonflow 通过结构化的提示词模板，确保 LLM 输出的角色描述可以直接作为图片生成的 prompt。

功能二：智能剧本与分镜生成

用户选择需要改编的章节后，Toonflow 会自动：

将小说段落转化为结构化剧本（包含对白、场景描述、舞台指示）
为每个场景生成分镜提示词（包含前景、中景、背景构图、角色动态、道具、镜头角度）

这一步完全由 LLM 完成，生成的分镜提示词会直接传递给图片生成模型。

功能三：AI 图片生成与分镜绘制

Toonflow 将分镜提示词发送到图片生成 API，自动生成每一帧分镜画面。目前支持的图片生成后端包括：

Nano Banana Pro：支持 4K 分辨率输出，角色一致性好，支持多语言文字渲染
火山引擎：豆包旗下的图片生成服务

功能四：AI 视频合成与在线编辑

最后一步，Toonflow 将分镜图片通过视频生成 API 转化为动态视频片段，并提供在线编辑功能，支持用户对生成结果进行个性化调整。

支持的视频生成服务包括 Sora（OpenAI）和豆包视频生成 API。

Toonflow 安装部署：3 种方式按需选择

Toonflow 提供 Windows 桌面应用、Docker 部署和手动部署 3 种安装方式。

Toonflow 系统要求

项目	最低要求
Node.js	v23.11.1 或更高
内存	2GB+
操作系统	Windows（桌面版）/ Linux（服务器部署）
网络	需要访问外部 AI API 服务

方式一：Windows 桌面应用（推荐新手）

直接从 GitHub Releases 下载 Electron 桌面安装包：

GitHub 项目地址: github.com/HBAI-Ltd/Toonflow-app
默认登录账号: admin
默认登录密码: admin123

下载安装后即可运行，桌面版内置了后端服务，无需额外配置运行环境。

方式二：Docker 部署（推荐服务器）

# 克隆项目
git clone https://github.com/HBAI-Ltd/Toonflow-app.git
cd Toonflow-app

# 使用 Docker Compose 一键启动
docker-compose -f docker/docker-compose.yml up -d --build

启动后访问 http://localhost:60000 进入管理界面。

方式三：手动部署（适合开发者）

# 安装依赖
yarn install

# 开发模式启动（仅后端，端口 60000）
yarn dev

# 桌面应用 + 后端同时启动
yarn dev:gui

# 生产构建
yarn build

手动部署时建议使用 PM2 进行进程管理，确保服务稳定运行。

Toonflow API 服务配置：3 类 AI 接口完整对接教程

Toonflow 安装完成后，需要配置 3 类 AI 服务的 API 接口才能正常使用。这是整个配置过程中最关键的一步。

🎯 配置建议：推荐使用 API易 apiyi.com 作为统一的 API 服务提供商。该平台同时提供 LLM、图片生成、视频生成 3 类 API 的统一接口，使用相同的 base_url 和认证方式，大幅简化 Toonflow 的配置工作。

配置一：大语言模型（LLM）API 接入

Toonflow 的角色分析、剧本生成、分镜提示词生成功能均依赖 LLM。配置时需要提供 OpenAI 兼容格式的 API 接口。

推荐模型选择：

模型	适用场景	特点
GPT-4o	通用场景，剧本质量高	理解力强，输出稳定
Claude 4 Sonnet	长篇小说分析	长上下文优势明显
DeepSeek V3	成本敏感场景	性价比高
Gemini 2.5 Pro	多模态分析	支持图文混合输入

配置参数示例：

在 Toonflow 设置页面填入以下信息：

接口地址（base_url）: https://api.apiyi.com/v1
API Key: 你的 API Key
模型名称: gpt-4o（或其他支持的模型）

💡 提示：配置完成后，可以点击 Toonflow 设置页面中的「模型检测」按钮，验证 API 连通性是否正常。这个功能在 v1.0.2 版本中新增。

配置二：Nano Banana Pro 图片生成 API 接入

Nano Banana Pro 是 Toonflow 推荐的图片生成模型，支持文生图（text-to-image）和图生图（image-to-image）两种模式，最高支持 4K 分辨率输出。

Nano Banana Pro 核心参数：

参数	说明	推荐值
模型名称	API 调用时的 model 参数	`nano-banana-pro`
分辨率	输出图片分辨率	2K（分镜用）或 4K（封面用）
图片比例	宽高比	16:9（横版短剧）或 9:16（竖版短剧）
风格控制	通过提示词控制画风	动漫风、写实风、水彩风等

配置参数示例：

接口地址（base_url）: https://api.apiyi.com/v1
API Key: 你的 API Key
图片模型: nano-banana-pro

Nano Banana Pro 的角色一致性表现优秀，特别适合需要在多个分镜中保持同一角色形象的短剧制作场景。

配置三：Sora / 豆包视频生成 API 接入

视频生成是 Toonflow 工作流的最后一步。将分镜图片转化为动态视频片段。

支持的视频生成服务：

服务	特点	单次生成时长
Sora（OpenAI）	画质优秀，运动自然	约 5-20 秒
豆包视频	中文场景优化好	约 5-15 秒

配置参数示例：

接口地址（base_url）: https://api.apiyi.com/v1
API Key: 你的 API Key
视频模型: sora（或对应的豆包模型名称）

💰 成本提示：视频生成是整个流程中成本最高的环节。建议先用图片生成确认分镜效果满意后，再批量生成视频。通过 API易 apiyi.com 平台调用可以获得更灵活的计费方式，适合控制短剧制作成本。

Toonflow 完整工作流实战：从小说到短剧的 5 步操作

配置完成后，以下是使用 Toonflow 制作一部 AI 短剧的完整操作流程：

第 1 步：创建项目并导入小说

在 Toonflow 管理界面创建新项目，将小说文本（TXT 格式）导入系统。支持按章节自动分割。

第 2 步：AI 角色提取

点击「角色生成」，系统自动调用 LLM 分析全文，提取主要角色信息并生成角色卡片。可以手动调整角色描述以优化后续画面生成效果。

第 3 步：选章生成剧本

选择要制作的章节，点击「剧本生成」。LLM 会将小说段落转化为带有对白和场景指示的结构化剧本。

第 4 步：分镜图片生成

系统根据剧本自动生成分镜提示词，并调用 Nano Banana Pro 生成每帧画面。这一步可以逐帧预览和调整。

第 5 步：视频合成与编辑

确认分镜效果后，调用 Sora 或豆包视频 API 将静态画面转化为动态视频。Toonflow 提供在线编辑器进行最终调整。

Toonflow 技术架构与开发信息

技术栈	具体实现
后端框架	Node.js + Express + TypeScript
数据库	SQLite3（better-sqlite3）
AI SDK	Vercel AI SDK、Aigne 中间件
图片处理	Sharp
桌面应用	Electron
HTTP 客户端	Axios
参数校验	Zod
进程管理	PM2（生产环境）
容器化	Docker + Docker Compose

Toonflow 项目采用 AGPL-3.0 开源协议，个人和非商业使用免费。商业使用需要联系 HBAI Ltd 获取商业授权（联系邮箱: [email protected]）。

Toonflow 常见问题 FAQ

Q1：Toonflow 需要本地 GPU 吗？

不需要。Toonflow 本身只是一个编排工具，所有 AI 推理任务都通过远程 API 完成。你的电脑只需要能运行 Node.js 和浏览器即可。通过 API易 apiyi.com 接入 API 服务后，无需关心 GPU 资源。

Q2：Toonflow 支持哪些图片生成模型？

目前主要支持 Nano Banana Pro 和火山引擎图片生成。其中 Nano Banana Pro 支持最高 4K 分辨率，角色一致性表现优秀，是短剧分镜绘制的首选。在 API易 apiyi.com 平台可以直接调用 Nano Banana Pro 模型。

Q3：制作一集短剧的 API 成本大约多少？

成本取决于章节长度和分镜数量。一般来说：

LLM 调用（角色分析 + 剧本 + 分镜提示词）：约 $0.5-2
图片生成（20-50 张分镜）：约 $1-5
视频生成（20-50 个片段）：约 $10-50

视频生成是主要成本。建议通过 API易 apiyi.com 的灵活计费方式优化支出。

Q4：Toonflow 有路线图吗？

项目规划了以下功能：

Prompt 精修 Agent（智能视频提示词优化）
多格式文本支持（漫画脚本、游戏对话等）
角色服装和道具管理（长篇一致性）
批量处理任务队列
一键风格转换模板

Toonflow AI 短剧工具总结

Toonflow 为 AI 短剧制作提供了一套完整的自动化解决方案，将小说转短剧的流程从人工操作简化为 AI 流水线。它的核心价值在于：

全流程自动化：角色提取 → 剧本生成 → 分镜绘制 → 视频合成，一站式完成
开源免费：AGPL-3.0 协议，个人使用零成本
灵活的 AI 后端：支持多种 LLM、图片和视频生成模型，不锁定特定供应商
多种部署方式：桌面应用、Docker、手动部署，适配不同使用场景

推荐通过 API易 apiyi.com 一站式获取 Toonflow 所需的全部 AI API 服务，统一接口、统一计费，快速完成配置开始创作。

参考资料

Toonflow GitHub 仓库: 官方开源项目
- 链接: github.com/HBAI-Ltd/Toonflow-app
- 说明: 包含源码、安装文档和版本发布
Toonflow Gitee 镜像: 国内访问加速
- 链接: gitee.com/HBAI-Ltd/Toonflow-app
- 说明: 适合国内网络环境
API易官方文档: AI API 服务接入指南
- 链接: help.apiyi.com
- 说明: LLM、图片生成、视频生成 API 使用教程

本文由 APIYI 技术团队撰写，关注 AI 大模型应用与开发实践。更多技术教程请访问 API易 apiyi.com。

用 Toonflow 实现 AI 短剧自动化制作：3 步完成小说转视频全流程配置

Toonflow AI 短剧工具的 4 大核心功能

功能一：AI 角色自动提取与生成

功能二：智能剧本与分镜生成

功能三：AI 图片生成与分镜绘制

功能四：AI 视频合成与在线编辑

Toonflow 安装部署：3 种方式按需选择

Toonflow 系统要求

方式一：Windows 桌面应用（推荐新手）

方式二：Docker 部署（推荐服务器）

方式三：手动部署（适合开发者）

Toonflow API 服务配置：3 类 AI 接口完整对接教程

配置一：大语言模型（LLM）API 接入

配置二：Nano Banana Pro 图片生成 API 接入

配置三：Sora / 豆包视频生成 API 接入

Toonflow 完整工作流实战：从小说到短剧的 5 步操作

Toonflow 技术架构与开发信息

Toonflow 常见问题 FAQ

Q1：Toonflow 需要本地 GPU 吗？

Q2：Toonflow 支持哪些图片生成模型？

Q3：制作一集短剧的 API 成本大约多少？

Q4：Toonflow 有路线图吗？

Toonflow AI 短剧工具总结

参考资料

Nano Banana Pro Chinese Prompt Complete Guide: Make AI Accurately Render Chinese Text

Sora 2 邀请码激活攻略:新账号无邀请码的 3 种解决方案

Sora 报错 We’re under heavy load 怎么办？3种方法稳定使用 Sora 2 视频生成

深度解析 Nano Banana Pro/2 出图失败的 8 大安全机制：从 IMAGE_SAFETY 到 blockReason OTHER 的完整排查指南

Cursor 使用 Claude API 完全指南：性能分析、接入方式与使用限制详解

Gemini 2.5 Pro 接入 Cursor IDE 完全教程：省会员费的顶级编程体验

Toonflow AI 短剧工具的 4 大核心功能

功能一：AI 角色自动提取与生成

功能二：智能剧本与分镜生成

功能三：AI 图片生成与分镜绘制

功能四：AI 视频合成与在线编辑

Toonflow 安装部署：3 种方式按需选择

Toonflow 系统要求

方式一：Windows 桌面应用（推荐新手）

方式二：Docker 部署（推荐服务器）

方式三：手动部署（适合开发者）

Toonflow API 服务配置：3 类 AI 接口完整对接教程

配置一：大语言模型（LLM）API 接入

配置二：Nano Banana Pro 图片生成 API 接入

配置三：Sora / 豆包视频生成 API 接入

Toonflow 完整工作流实战：从小说到短剧的 5 步操作

Toonflow 技术架构与开发信息

Toonflow 常见问题 FAQ

Q1：Toonflow 需要本地 GPU 吗？

Q2：Toonflow 支持哪些图片生成模型？

Q3：制作一集短剧的 API 成本大约多少？

Q4：Toonflow 有路线图吗？

Toonflow AI 短剧工具总结

参考资料

类似文章