
El sector de los dramas cortos con IA está explotando. Desde la adaptación de novelas web hasta la distribución en plataformas de video corto, las herramientas que pueden transformar rápidamente el texto en contenido visual se han convertido en una necesidad básica para los creadores de contenido.
Toonflow es una herramienta de automatización de dramas y cómics cortos con IA de código abierto, desarrollada por HBAI Ltd y disponible en GitHub (bajo la licencia AGPL-3.0). Su capacidad principal es tomar el texto de una novela o guion y completar automáticamente, mediante IA, todo el proceso de extracción de personajes, generación de guiones, dibujo de storyboards y síntesis de video.
Toonflow no incluye modelos de IA integrados, sino que actúa como un motor de orquestación de agentes de IA, coordinando tres tipos de servicios externos de IA para realizar el trabajo:
| Tipo de servicio de IA | Uso | Modelo recomendado |
|---|---|---|
| Modelo de Lenguaje Grande (LLM) | Análisis de personajes, generación de guiones, indicaciones de storyboard | GPT-4o, Claude 3.5 Sonnet, etc. |
| Modelo de generación de imágenes | Imagen de personajes, ilustración de escenas, cuadros de storyboard | Nano Banana Pro |
| Modelo de generación de video | Conversión de cuadros de storyboard a clips de video | Sora, Doubao Video |
🚀 Inicio rápido: Los tres tipos de servicios de API (LLM, generación de imágenes y generación de video) que requiere Toonflow se pueden obtener de forma centralizada a través de APIYI (apiyi.com). No es necesario registrarse en múltiples plataformas; completa toda la configuración en solo 5 minutos.
Este artículo te ayudará a dar tus primeros pasos con esta herramienta de producción de dramas cortos con IA desde tres dimensiones: introducción a las funciones principales, instalación y despliegue, y configuración de servicios de API.
Las 4 funciones principales de Toonflow AI para la creación de dramas cortos
Toonflow desglosa el proceso de convertir una novela en un drama corto en 4 etapas automatizadas, cada una impulsada por su correspondiente servicio de IA:
Función 1: Extracción y generación automática de personajes con IA
Toonflow utiliza un Modelo de Lenguaje Grande para realizar un análisis profundo del texto de la novela, identificando y extrayendo automáticamente la información de los personajes:
| Dimensión de extracción | Descripción | Ejemplo |
|---|---|---|
| Características físicas | Descripción de la apariencia del personaje, utilizada para generar su ilustración | Cabello largo negro, ojos azules, vestido largo blanco |
| Rasgos de personalidad | Patrones de comportamiento y características psicológicas del personaje | Decidido y calmado, introvertido y sensible |
| Trasfondo e identidad | Relaciones sociales y rol dentro de la historia | CEO de la empresa, mejor amiga de la protagonista |
| Tarjeta de personaje | Tarjeta visual generada con la información anterior | Incluye la ilustración + descripción textual |
La calidad de la extracción de personajes determina directamente la consistencia facial en las escenas posteriores. Toonflow utiliza plantillas de indicación estructuradas para asegurar que las descripciones generadas por el LLM puedan usarse directamente como prompts para la generación de imágenes.
Función 2: Generación inteligente de guiones y guiones gráficos
Una vez que el usuario selecciona los capítulos que desea adaptar, Toonflow realiza automáticamente lo siguiente:
- Convierte los párrafos de la novela en un guion estructurado (que incluye diálogos, descripción de escenas y acotaciones escénicas).
- Genera una indicación de guion gráfico para cada escena (incluyendo composición de primer plano, plano medio y fondo, dinámica de los personajes, accesorios y ángulos de cámara).
Este paso es realizado íntegramente por el LLM, y las indicaciones de guion gráfico generadas se envían directamente al modelo de generación de imágenes.
Función 3: Generación de imágenes con IA y dibujo de guiones gráficos
Toonflow envía las indicaciones de guion gráfico a la API de generación de imágenes para crear automáticamente cada fotograma del storyboard. Actualmente, los backends de generación de imágenes compatibles incluyen:
- Nano Banana Pro: Soporta salida en resolución 4K, ofrece una excelente consistencia facial y permite el renderizado de texto en múltiples idiomas.
- Volcengine: El servicio de generación de imágenes de Doubao.

Función 4: Síntesis de video con IA y edición en línea
En el último paso, Toonflow convierte las imágenes del guion gráfico en fragmentos de video dinámicos a través de una API de generación de video. Además, ofrece funciones de edición en línea para que los usuarios puedan realizar ajustes personalizados en los resultados generados.
Los servicios de generación de video compatibles incluyen Sora (OpenAI) y la API de generación de video de Doubao.
Instalación y despliegue de Toonflow: 3 métodos según tus necesidades
Toonflow ofrece tres formas de instalación: aplicación de escritorio para Windows, despliegue con Docker y despliegue manual.
Requisitos del sistema de Toonflow
| Elemento | Requisito mínimo |
|---|---|
| Node.js | v23.11.1 o superior |
| Memoria RAM | 2GB+ |
| Sistema Operativo | Windows (versión de escritorio) / Linux (despliegue en servidor) |
| Red | Requiere acceso a servicios externos de API de IA |
Método 1: Aplicación de escritorio para Windows (Recomendado para principiantes)
Descarga directamente el paquete de instalación de Electron desde las versiones (Releases) de GitHub:
- Dirección del proyecto en GitHub:
github.com/HBAI-Ltd/Toonflow-app - Cuenta de inicio de sesión predeterminada:
admin - Contraseña de inicio de sesión predeterminada:
admin123
Solo tienes que descargar e instalar para empezar a usarlo. La versión de escritorio incluye el servicio backend integrado, por lo que no necesitas configurar un entorno de ejecución adicional.
Método 2: Despliegue con Docker (Recomendado para servidores)
# Clonar el proyecto
git clone https://github.com/HBAI-Ltd/Toonflow-app.git
cd Toonflow-app
# Iniciar con un solo clic usando Docker Compose
docker-compose -f docker/docker-compose.yml up -d --build
Tras el inicio, accede a http://localhost:60000 para entrar en la interfaz de administración.
Método 3: Despliegue manual (Ideal para desarrolladores)
# Instalar dependencias
yarn install
# Iniciar en modo desarrollo (solo backend, puerto 60000)
yarn dev
# Iniciar aplicación de escritorio + backend simultáneamente
yarn dev:gui
# Construcción para producción
yarn build
Para el despliegue manual, se recomienda usar PM2 para la gestión de procesos y asegurar que el servicio funcione de manera estable.
Configuración del servicio API de Toonflow: Tutorial completo para conectar 3 tipos de interfaces de IA
Una vez instalado Toonflow, es necesario configurar las interfaces API de tres tipos de servicios de IA para que funcione correctamente. Este es el paso más crítico de todo el proceso.
🎯 Sugerencia de configuración: Se recomienda utilizar APIYI (apiyi.com) como proveedor unificado de servicios API. Esta plataforma ofrece una interfaz única para los tres tipos de API (LLM, generación de imágenes y generación de video), utilizando la misma base_url y método de autenticación, lo que simplifica enormemente la configuración de Toonflow.

Configuración 1: Acceso a la API del Modelo de Lenguaje Grande (LLM)
Las funciones de análisis de personajes, generación de guiones y generación de indicaciones para guiones gráficos de Toonflow dependen de un LLM. Al configurar, debes proporcionar una interfaz API compatible con el formato de OpenAI.
Selección de modelos recomendados:
| Modelo | Escenario de uso | Características |
|---|---|---|
| GPT-4o | Escenarios generales, alta calidad de guion | Gran capacidad de comprensión, salida estable |
| Claude 3.5 Sonnet | Análisis de novelas largas | Ventaja notable en ventana de contexto larga |
| DeepSeek V3 | Escenarios sensibles al costo | Alta relación calidad-precio |
| Gemini 1.5 Pro | Análisis multimodal | Soporta entrada mixta de imagen y texto |
Ejemplo de parámetros de configuración:
En la página de ajustes de Toonflow, rellena la siguiente información:
Dirección de la interfaz (base_url): https://api.apiyi.com/v1
Clave API: Tu clave API
Nombre del modelo: gpt-4o (u otro modelo compatible)
💡 Consejo: Una vez configurado, puedes hacer clic en el botón "Detección de modelo" en la página de ajustes de Toonflow para verificar la conectividad de la API. Esta función se añadió en la versión v1.0.2.
Configuración 2: Acceso a la API de generación de imágenes Nano Banana Pro
Nano Banana Pro es el modelo de generación de imágenes recomendado para Toonflow. Soporta los modos texto a imagen e imagen a imagen, con una salida de resolución de hasta 4K.
Parámetros principales de Nano Banana Pro:
| Parámetro | Descripción | Valor recomendado |
|---|---|---|
| Nombre del modelo | Parámetro model en la llamada a la API |
nano-banana-pro |
| Resolución | Resolución de la imagen de salida | 2K (para guiones gráficos) o 4K (para portadas) |
| Proporción de imagen | Relación de aspecto | 16:9 (horizontal) o 9:16 (vertical) |
| Control de estilo | Control del estilo artístico mediante indicaciones | Estilo anime, realista, acuarela, etc. |
Ejemplo de parámetros de configuración:
Dirección de la interfaz (base_url): https://api.apiyi.com/v1
Clave API: Tu clave API
Modelo de imagen: nano-banana-pro
Nano Banana Pro destaca por su excelente consistencia facial, lo que lo hace ideal para la producción de series cortas donde es necesario mantener la misma imagen del personaje en múltiples escenas.
Configuración 3: Acceso a la API de generación de video Sora / Doubao
La generación de video es el último paso en el flujo de trabajo de Toonflow. Convierte las imágenes de los guiones gráficos en fragmentos de video dinámicos.
Servicios de generación de video compatibles:
| Servicio | Características | Duración por generación |
|---|---|---|
| Sora (OpenAI) | Calidad de imagen excelente, movimiento natural | Aprox. 5-20 segundos |
| Doubao Video | Buena optimización para escenarios en chino | Aprox. 5-15 segundos |
Ejemplo de parámetros de configuración:
Dirección de la interfaz (base_url): https://api.apiyi.com/v1
Clave API: Tu clave API
Modelo de video: sora (o el nombre del modelo Doubao correspondiente)
💰 Nota sobre costos: La generación de video es la etapa más costosa de todo el proceso. Se recomienda confirmar primero que el efecto del guion gráfico es satisfactorio mediante la generación de imágenes antes de generar videos en lote. Realizar las llamadas a través de la plataforma APIYI (apiyi.com) permite obtener métodos de facturación más flexibles, ideales para controlar los costos de producción.
Guía práctica del flujo de trabajo de Toonflow: 5 pasos de la novela al cortometraje
Una vez completada la configuración, este es el proceso operativo completo para crear un cortometraje con IA utilizando Toonflow:
Paso 1: Crear el proyecto e importar la novela
En la interfaz de gestión de Toonflow, crea un nuevo proyecto e importa el texto de la novela (en formato TXT). El sistema permite la división automática por capítulos.
Paso 2: Extracción de personajes mediante IA
Haz clic en "Generación de personajes" y el sistema realizará automáticamente una invocación del modelo (LLM) para analizar todo el texto, extraer la información de los personajes principales y generar fichas de personajes. Puedes ajustar manualmente las descripciones de los personajes para optimizar la generación de imágenes posterior.
Paso 3: Selección de capítulos y generación del guion
Selecciona los capítulos que deseas producir y haz clic en "Generación de guion". El LLM transformará los párrafos de la novela en un guion estructurado que incluye diálogos e indicaciones de escena.
Paso 4: Generación de imágenes del guion gráfico (storyboard)
El sistema genera automáticamente una indicación para cada escena basándose en el guion e invoca a Nano Banana Pro para generar cada fotograma. En este paso, puedes previsualizar y ajustar las imágenes cuadro por cuadro.
Paso 5: Síntesis y edición de video
Tras confirmar el efecto del guion gráfico, se invocan las API de video de Sora o Doubao para transformar las imágenes estáticas en video dinámico. Toonflow proporciona un editor en línea para realizar los ajustes finales.
Arquitectura técnica e información de desarrollo de Toonflow
| Pila tecnológica | Implementación específica |
|---|---|
| Framework de backend | Node.js + Express + TypeScript |
| Base de datos | SQLite3 (better-sqlite3) |
| SDK de IA | Vercel AI SDK, middleware de Aigne |
| Procesamiento de imágenes | Sharp |
| Aplicación de escritorio | Electron |
| Cliente HTTP | Axios |
| Validación de parámetros | Zod |
| Gestión de procesos | PM2 (entorno de producción) |
| Containerización | Docker + Docker Compose |
El proyecto Toonflow utiliza la licencia de código abierto AGPL-3.0, por lo que es gratuito para uso personal y no comercial. Para uso comercial, es necesario ponerse en contacto con HBAI Ltd para obtener la autorización correspondiente (correo de contacto: [email protected]).
Preguntas frecuentes (FAQ) de Toonflow
Q1: ¿Necesita Toonflow una GPU local?
No. Toonflow es simplemente una herramienta de orquestación; todas las tareas de inferencia de IA se realizan a través de APIs remotas. Tu computadora solo necesita poder ejecutar Node.js y un navegador. Al integrar los servicios a través de APIYI (apiyi.com), no tienes que preocuparte por los recursos de la GPU.
Q2: ¿Qué modelos de generación de imágenes admite Toonflow?
Actualmente, admite principalmente Nano Banana Pro y la generación de imágenes de Volcengine. Entre ellos, Nano Banana Pro admite una resolución de hasta 4K y ofrece un excelente rendimiento en la consistencia de personajes, lo que lo convierte en la opción preferida para dibujar los guiones gráficos (storyboards) de miniseries. Puedes realizar la invocación del modelo Nano Banana Pro directamente en la plataforma APIYI (apiyi.com).
Q3: ¿Cuál es el costo aproximado de API para producir un episodio de una miniserie?
El costo depende de la duración del capítulo y de la cantidad de escenas. En términos generales:
- Invocación del modelo de lenguaje grande (análisis de personajes + guion + indicaciones de guion gráfico): entre $0.5 y $2 USD aproximadamente.
- Generación de imágenes (20-50 escenas): entre $1 y $5 USD aproximadamente.
- Generación de video (20-50 clips): entre $10 y $50 USD aproximadamente.
La generación de video representa el costo principal. Se recomienda optimizar los gastos utilizando los métodos de facturación flexibles de APIYI (apiyi.com).
Q4: ¿Tiene Toonflow una hoja de ruta (roadmap)?
El proyecto tiene planeadas las siguientes funciones:
- Agente de refinamiento de indicaciones (optimización inteligente de indicaciones de video).
- Soporte para múltiples formatos de texto (guiones de cómics, diálogos de juegos, etc.).
- Gestión de vestuario y accesorios de personajes (consistencia a largo plazo).
- Cola de tareas para procesamiento por lotes.
- Plantillas de conversión de estilo con un solo clic.
Resumen de Toonflow: Herramienta de IA para miniseries
Toonflow ofrece una solución de automatización completa para la producción de miniseries con IA, simplificando el proceso de convertir una novela en una miniserie mediante un flujo de trabajo de IA. Sus valores fundamentales son:
- Automatización de todo el proceso: Extracción de personajes → generación de guiones → dibujo de guiones gráficos → síntesis de video, todo en un solo lugar.
- Código abierto y gratuito: Bajo la licencia AGPL-3.0, con costo cero para uso personal.
- Backend de IA flexible: Admite diversos modelos de lenguaje grande (LLM), generación de imágenes y video, sin depender de un proveedor específico.
- Múltiples métodos de despliegue: Aplicación de escritorio, Docker o despliegue manual, adaptándose a diferentes escenarios de uso.
Se recomienda utilizar APIYI (apiyi.com) para obtener todos los servicios de API de IA necesarios para Toonflow en un solo lugar, con una interfaz y facturación unificadas, para completar la configuración rápidamente y comenzar a crear.
Referencias
-
Repositorio de GitHub de Toonflow: Proyecto oficial de código abierto
- Enlace:
github.com/HBAI-Ltd/Toonflow-app - Descripción: Contiene el código fuente, documentación de instalación y versiones publicadas.
- Enlace:
-
Mirror de Gitee de Toonflow: Acceso acelerado para China
- Enlace:
gitee.com/HBAI-Ltd/Toonflow-app - Descripción: Adecuado para entornos de red específicos o con restricciones de acceso internacional.
- Enlace:
-
Documentación oficial de APIYI: Guía de acceso a servicios de API de IA
- Enlace:
help.apiyi.com - Descripción: Tutoriales de uso de APIs para Modelo de Lenguaje Grande (LLM), generación de imágenes y generación de video.
- Enlace:
Este artículo ha sido redactado por el equipo técnico de APIYI, enfocado en las aplicaciones de Modelo de Lenguaje Grande y prácticas de desarrollo de IA. Para más tutoriales técnicos, visita APIYI en apiyi.com.
