Nodos de Voz IA
Los Nodos de Voz IA convierten texto en voz (TTS), clonan voces a partir de muestras de audio y transforman el habla entre voces distintas (STS — Speech-to-Speech). Admiten tres tipos de entrada: un guion (texto), una voz de referencia (audio para clonacion) y una actuacion (audio/video para transformacion vocal y doblaje).
Entradas y Salidas
| Puerto | Direccion | Tipo | Descripcion |
|---|---|---|---|
| input | Entrada | Texto | Guion/texto del Nodo de Texto — las palabras a pronunciar |
| reference | Entrada | Audio | Muestra de voz del Nodo de Audio — la voz a clonar |
| performance | Entrada | Audio/Video | Audio o video fuente para la transformacion Speech-to-Speech o el doblaje |
| output | Salida | Audio | Audio de voz generado |
Controles del Inspector
- Seleccion de Voz — Menu desplegable para elegir entre voces predefinidas o usar una voz clonada (cuando un Nodo de Audio esta conectado como referencia).
- Modo de Generacion — TTS (Text-to-Speech desde guion) o STS (Speech-to-Speech desde audio de actuacion).
- Idioma — Idioma de destino para la generacion.
- Velocidad — Ajusta la velocidad del habla (mas lenta para narracion, mas rapida para contenido energico).
Modos de Generacion
Text-to-Speech (TTS)
Conecta un Nodo de Texto con el guion. El Nodo de Voz IA genera voz usando la voz seleccionada o la voz clonada.
- Ideal para: narracion, voiceover, audiolibros, accesibilidad
Speech-to-Speech (STS)
Conecta un Nodo de Audio o Video como actuacion. El Nodo de Voz IA transforma el habla en una voz diferente.
- Ideal para: doblaje, actuacion de voz, traduccion de contenido hablado
Voice Cloning
Conecta un Nodo de Audio como referencia (muestra de voz) + Nodo de Texto como guion. El Nodo de Voz IA genera voz con la voz clonada.
- Ideal para: voces de marca, consistencia de personajes, contenido personalizado
Como Usar
- Agrega un Nodo de Voz IA al canvas
- Conecta un Nodo de Texto (tu guion) al puerto
input - (Opcional) Conecta un Nodo de Audio al puerto
referencepara voice cloning - (Opcional) Conecta un Nodo de Audio/Video al puerto
performancepara STS - Selecciona una voz o deja que use la referencia clonada
- Haz clic en Generar
- Descarga el archivo de audio resultante
Ejemplos de Workflow
Video Narrado: Nodo de Texto (“Bienvenidos a nuestro documental sobre la vida marina…“) → Nodo de Voz IA (genera narracion) + Nodo de Texto → Nodo de Escena (genera visuales con audio habilitado)
Doblaje de Video: Nodo de Escena (video original en ingles) → Nodo de Voz IA (puerto performance — transforma el habla al frances)
Voz de Personaje: Nodo de Audio (muestra de 10s de una voz) → Nodo de Voz IA (puerto reference) + Nodo de Texto (dialogo del personaje) → genera dialogo con la voz clonada
Consejos
- Para voice cloning, proporciona 10-30 segundos de habla limpia — sin ruido de fondo, musica ni multiples hablantes
- La calidad de STS depende de la calidad del audio de entrada — una fuente clara y bien grabada produce mejores resultados
- Usa TTS cuando tengas un guion, STS cuando tengas audio existente para transformar
- Para doblaje de video, conecta el video al puerto performance — la IA sincroniza los movimientos labiales
- Mantén los guiones por debajo de 500 palabras por generacion para la mejor calidad
- Prueba con muestras cortas antes de generar narraciones largas
Solucion de Problemas
- Calidad de voz deficiente: Verifica que la muestra de audio de referencia sea limpia (sin ruido, un solo hablante, 10-30s).
- Idioma incorrecto: Asegurate de que la configuracion de Idioma coincida con tu guion. Algunas voces pueden no admitir todos los idiomas.
- Generacion demasiado lenta: Los guiones largos tardan mas. Divide en segmentos mas cortos si es necesario.
- Corte de audio: Reduce la configuracion de velocidad o divide el texto en parrafos mas cortos.
Ver Tambien
- Nodos de Audio — Graba o sube audio para voice cloning
- Nodos de Texto — Genera guiones para la generacion de voz
- Escenas — Crea videos con narracion generada por IA