|

用 Toonflow 实现 AI 短剧自动化制作:3 步完成小说转视频全流程配置

toonflow-ai-short-drama-comic-tool-api-guide 图示

AI 短剧赛道正在爆发。从网文 IP 改编到短视频平台分发,能快速将文字内容转化为可视化短剧的工具,已经成为内容创作者的刚需。

Toonflow 是一款开源的 AI 短剧 / 漫剧自动化制作工具,由 HBAI Ltd 开发并在 GitHub 上开源(AGPL-3.0 协议)。它的核心能力是将小说或剧本文本,通过 AI 自动完成角色提取、剧本生成、分镜绘制和视频合成的全流程。

Toonflow 本身不内置 AI 模型,而是作为 AI Agent 编排引擎,协调 3 类外部 AI 服务来完成工作:

AI 服务类型 用途 推荐模型
大语言模型(LLM) 角色分析、剧本生成、分镜提示词 GPT-4o、Claude 4 Sonnet 等
图片生成模型 角色形象、场景插图、分镜画面 Nano Banana Pro
视频生成模型 分镜画面转视频片段 Sora、豆包视频

🚀 快速开始:Toonflow 所需的 LLM、图片生成、视频生成 3 类 API 服务,均可通过 API易 apiyi.com 一站式获取,无需分别注册多个平台,5 分钟完成全部配置。

本文将从 Toonflow 的核心功能介绍、安装部署、API 服务配置 3 个维度,帮你快速上手这款 AI 短剧制作工具。


Toonflow AI 短剧工具的 4 大核心功能

Toonflow 将小说转短剧的流程拆解为 4 个自动化阶段,每个阶段都由对应的 AI 服务驱动:

功能一:AI 角色自动提取与生成

Toonflow 会调用大语言模型对输入的小说文本进行深度分析,自动识别并提取角色信息:

提取维度 说明 示例
外貌特征 角色的外表描述,用于生成角色立绘 黑色长发、蓝色眼眸、白色长裙
性格特质 角色的行为模式和心理特征 果断冷静、内向敏感
身份背景 角色的社会关系和故事定位 公司 CEO、女主闺蜜
角色卡片 综合以上信息生成的视觉化角色卡 包含立绘 + 文字介绍

角色提取的质量直接决定后续分镜画面的角色一致性。Toonflow 通过结构化的提示词模板,确保 LLM 输出的角色描述可以直接作为图片生成的 prompt。

功能二:智能剧本与分镜生成

用户选择需要改编的章节后,Toonflow 会自动:

  1. 将小说段落转化为结构化剧本(包含对白、场景描述、舞台指示)
  2. 为每个场景生成分镜提示词(包含前景、中景、背景构图、角色动态、道具、镜头角度)

这一步完全由 LLM 完成,生成的分镜提示词会直接传递给图片生成模型。

功能三:AI 图片生成与分镜绘制

Toonflow 将分镜提示词发送到图片生成 API,自动生成每一帧分镜画面。目前支持的图片生成后端包括:

  • Nano Banana Pro:支持 4K 分辨率输出,角色一致性好,支持多语言文字渲染
  • 火山引擎:豆包旗下的图片生成服务

toonflow-ai-short-drama-comic-tool-api-guide 图示

功能四:AI 视频合成与在线编辑

最后一步,Toonflow 将分镜图片通过视频生成 API 转化为动态视频片段,并提供在线编辑功能,支持用户对生成结果进行个性化调整。

支持的视频生成服务包括 Sora(OpenAI)和豆包视频生成 API。


Toonflow 安装部署:3 种方式按需选择

Toonflow 提供 Windows 桌面应用、Docker 部署和手动部署 3 种安装方式。

Toonflow 系统要求

项目 最低要求
Node.js v23.11.1 或更高
内存 2GB+
操作系统 Windows(桌面版)/ Linux(服务器部署)
网络 需要访问外部 AI API 服务

方式一:Windows 桌面应用(推荐新手)

直接从 GitHub Releases 下载 Electron 桌面安装包:

  • GitHub 项目地址: github.com/HBAI-Ltd/Toonflow-app
  • 默认登录账号: admin
  • 默认登录密码: admin123

下载安装后即可运行,桌面版内置了后端服务,无需额外配置运行环境。

方式二:Docker 部署(推荐服务器)

# 克隆项目
git clone https://github.com/HBAI-Ltd/Toonflow-app.git
cd Toonflow-app

# 使用 Docker Compose 一键启动
docker-compose -f docker/docker-compose.yml up -d --build

启动后访问 http://localhost:60000 进入管理界面。

方式三:手动部署(适合开发者)

# 安装依赖
yarn install

# 开发模式启动(仅后端,端口 60000)
yarn dev

# 桌面应用 + 后端同时启动
yarn dev:gui

# 生产构建
yarn build

手动部署时建议使用 PM2 进行进程管理,确保服务稳定运行。


Toonflow API 服务配置:3 类 AI 接口完整对接教程

Toonflow 安装完成后,需要配置 3 类 AI 服务的 API 接口才能正常使用。这是整个配置过程中最关键的一步。

🎯 配置建议:推荐使用 API易 apiyi.com 作为统一的 API 服务提供商。该平台同时提供 LLM、图片生成、视频生成 3 类 API 的统一接口,使用相同的 base_url 和认证方式,大幅简化 Toonflow 的配置工作。

toonflow-ai-short-drama-comic-tool-api-guide 图示

配置一:大语言模型(LLM)API 接入

Toonflow 的角色分析、剧本生成、分镜提示词生成功能均依赖 LLM。配置时需要提供 OpenAI 兼容格式的 API 接口。

推荐模型选择

模型 适用场景 特点
GPT-4o 通用场景,剧本质量高 理解力强,输出稳定
Claude 4 Sonnet 长篇小说分析 长上下文优势明显
DeepSeek V3 成本敏感场景 性价比高
Gemini 2.5 Pro 多模态分析 支持图文混合输入

配置参数示例

在 Toonflow 设置页面填入以下信息:

接口地址(base_url): https://api.apiyi.com/v1
API Key: 你的 API Key
模型名称: gpt-4o(或其他支持的模型)

💡 提示:配置完成后,可以点击 Toonflow 设置页面中的「模型检测」按钮,验证 API 连通性是否正常。这个功能在 v1.0.2 版本中新增。

配置二:Nano Banana Pro 图片生成 API 接入

Nano Banana Pro 是 Toonflow 推荐的图片生成模型,支持文生图(text-to-image)和图生图(image-to-image)两种模式,最高支持 4K 分辨率输出。

Nano Banana Pro 核心参数

参数 说明 推荐值
模型名称 API 调用时的 model 参数 nano-banana-pro
分辨率 输出图片分辨率 2K(分镜用)或 4K(封面用)
图片比例 宽高比 16:9(横版短剧)或 9:16(竖版短剧)
风格控制 通过提示词控制画风 动漫风、写实风、水彩风等

配置参数示例

接口地址(base_url): https://api.apiyi.com/v1
API Key: 你的 API Key
图片模型: nano-banana-pro

Nano Banana Pro 的角色一致性表现优秀,特别适合需要在多个分镜中保持同一角色形象的短剧制作场景。

配置三:Sora / 豆包视频生成 API 接入

视频生成是 Toonflow 工作流的最后一步。将分镜图片转化为动态视频片段。

支持的视频生成服务

服务 特点 单次生成时长
Sora(OpenAI) 画质优秀,运动自然 约 5-20 秒
豆包视频 中文场景优化好 约 5-15 秒

配置参数示例

接口地址(base_url): https://api.apiyi.com/v1
API Key: 你的 API Key
视频模型: sora(或对应的豆包模型名称)

💰 成本提示:视频生成是整个流程中成本最高的环节。建议先用图片生成确认分镜效果满意后,再批量生成视频。通过 API易 apiyi.com 平台调用可以获得更灵活的计费方式,适合控制短剧制作成本。


Toonflow 完整工作流实战:从小说到短剧的 5 步操作

配置完成后,以下是使用 Toonflow 制作一部 AI 短剧的完整操作流程:

第 1 步:创建项目并导入小说

在 Toonflow 管理界面创建新项目,将小说文本(TXT 格式)导入系统。支持按章节自动分割。

第 2 步:AI 角色提取

点击「角色生成」,系统自动调用 LLM 分析全文,提取主要角色信息并生成角色卡片。可以手动调整角色描述以优化后续画面生成效果。

第 3 步:选章生成剧本

选择要制作的章节,点击「剧本生成」。LLM 会将小说段落转化为带有对白和场景指示的结构化剧本。

第 4 步:分镜图片生成

系统根据剧本自动生成分镜提示词,并调用 Nano Banana Pro 生成每帧画面。这一步可以逐帧预览和调整。

第 5 步:视频合成与编辑

确认分镜效果后,调用 Sora 或豆包视频 API 将静态画面转化为动态视频。Toonflow 提供在线编辑器进行最终调整。


Toonflow 技术架构与开发信息

技术栈 具体实现
后端框架 Node.js + Express + TypeScript
数据库 SQLite3(better-sqlite3)
AI SDK Vercel AI SDK、Aigne 中间件
图片处理 Sharp
桌面应用 Electron
HTTP 客户端 Axios
参数校验 Zod
进程管理 PM2(生产环境)
容器化 Docker + Docker Compose

Toonflow 项目采用 AGPL-3.0 开源协议,个人和非商业使用免费。商业使用需要联系 HBAI Ltd 获取商业授权(联系邮箱: [email protected])。


Toonflow 常见问题 FAQ

Q1:Toonflow 需要本地 GPU 吗?

不需要。Toonflow 本身只是一个编排工具,所有 AI 推理任务都通过远程 API 完成。你的电脑只需要能运行 Node.js 和浏览器即可。通过 API易 apiyi.com 接入 API 服务后,无需关心 GPU 资源。

Q2:Toonflow 支持哪些图片生成模型?

目前主要支持 Nano Banana Pro 和火山引擎图片生成。其中 Nano Banana Pro 支持最高 4K 分辨率,角色一致性表现优秀,是短剧分镜绘制的首选。在 API易 apiyi.com 平台可以直接调用 Nano Banana Pro 模型。

Q3:制作一集短剧的 API 成本大约多少?

成本取决于章节长度和分镜数量。一般来说:

  • LLM 调用(角色分析 + 剧本 + 分镜提示词):约 $0.5-2
  • 图片生成(20-50 张分镜):约 $1-5
  • 视频生成(20-50 个片段):约 $10-50

视频生成是主要成本。建议通过 API易 apiyi.com 的灵活计费方式优化支出。

Q4:Toonflow 有路线图吗?

项目规划了以下功能:

  • Prompt 精修 Agent(智能视频提示词优化)
  • 多格式文本支持(漫画脚本、游戏对话等)
  • 角色服装和道具管理(长篇一致性)
  • 批量处理任务队列
  • 一键风格转换模板

Toonflow AI 短剧工具总结

Toonflow 为 AI 短剧制作提供了一套完整的自动化解决方案,将小说转短剧的流程从人工操作简化为 AI 流水线。它的核心价值在于:

  1. 全流程自动化:角色提取 → 剧本生成 → 分镜绘制 → 视频合成,一站式完成
  2. 开源免费:AGPL-3.0 协议,个人使用零成本
  3. 灵活的 AI 后端:支持多种 LLM、图片和视频生成模型,不锁定特定供应商
  4. 多种部署方式:桌面应用、Docker、手动部署,适配不同使用场景

推荐通过 API易 apiyi.com 一站式获取 Toonflow 所需的全部 AI API 服务,统一接口、统一计费,快速完成配置开始创作。


参考资料

  1. Toonflow GitHub 仓库: 官方开源项目

    • 链接: github.com/HBAI-Ltd/Toonflow-app
    • 说明: 包含源码、安装文档和版本发布
  2. Toonflow Gitee 镜像: 国内访问加速

    • 链接: gitee.com/HBAI-Ltd/Toonflow-app
    • 说明: 适合国内网络环境
  3. API易官方文档: AI API 服务接入指南

    • 链接: help.apiyi.com
    • 说明: LLM、图片生成、视频生成 API 使用教程

本文由 APIYI 技术团队撰写,关注 AI 大模型应用与开发实践。更多技术教程请访问 API易 apiyi.com。

类似文章