Nodos de Voz IA

Los Nodos de Voz IA convierten texto en voz (TTS), clonan voces a partir de muestras de audio y transforman el habla entre voces distintas (STS — Speech-to-Speech). Admiten tres tipos de entrada: un guion (texto), una voz de referencia (audio para clonacion) y una actuacion (audio/video para transformacion vocal y doblaje).

Entradas y Salidas

PuertoDireccionTipoDescripcion
inputEntradaTextoGuion/texto del Nodo de Texto — las palabras a pronunciar
referenceEntradaAudioMuestra de voz del Nodo de Audio — la voz a clonar
performanceEntradaAudio/VideoAudio o video fuente para la transformacion Speech-to-Speech o el doblaje
outputSalidaAudioAudio de voz generado

Controles del Inspector

  1. Seleccion de Voz — Menu desplegable para elegir entre voces predefinidas o usar una voz clonada (cuando un Nodo de Audio esta conectado como referencia).
  2. Modo de Generacion — TTS (Text-to-Speech desde guion) o STS (Speech-to-Speech desde audio de actuacion).
  3. Idioma — Idioma de destino para la generacion.
  4. Velocidad — Ajusta la velocidad del habla (mas lenta para narracion, mas rapida para contenido energico).

Modos de Generacion

Text-to-Speech (TTS)

Conecta un Nodo de Texto con el guion. El Nodo de Voz IA genera voz usando la voz seleccionada o la voz clonada.

  • Ideal para: narracion, voiceover, audiolibros, accesibilidad

Speech-to-Speech (STS)

Conecta un Nodo de Audio o Video como actuacion. El Nodo de Voz IA transforma el habla en una voz diferente.

  • Ideal para: doblaje, actuacion de voz, traduccion de contenido hablado

Voice Cloning

Conecta un Nodo de Audio como referencia (muestra de voz) + Nodo de Texto como guion. El Nodo de Voz IA genera voz con la voz clonada.

  • Ideal para: voces de marca, consistencia de personajes, contenido personalizado

Como Usar

  1. Agrega un Nodo de Voz IA al canvas
  2. Conecta un Nodo de Texto (tu guion) al puerto input
  3. (Opcional) Conecta un Nodo de Audio al puerto reference para voice cloning
  4. (Opcional) Conecta un Nodo de Audio/Video al puerto performance para STS
  5. Selecciona una voz o deja que use la referencia clonada
  6. Haz clic en Generar
  7. Descarga el archivo de audio resultante

Ejemplos de Workflow

Video Narrado: Nodo de Texto (“Bienvenidos a nuestro documental sobre la vida marina…“) → Nodo de Voz IA (genera narracion) + Nodo de Texto → Nodo de Escena (genera visuales con audio habilitado)

Doblaje de Video: Nodo de Escena (video original en ingles) → Nodo de Voz IA (puerto performance — transforma el habla al frances)

Voz de Personaje: Nodo de Audio (muestra de 10s de una voz) → Nodo de Voz IA (puerto reference) + Nodo de Texto (dialogo del personaje) → genera dialogo con la voz clonada

Consejos

  • Para voice cloning, proporciona 10-30 segundos de habla limpia — sin ruido de fondo, musica ni multiples hablantes
  • La calidad de STS depende de la calidad del audio de entrada — una fuente clara y bien grabada produce mejores resultados
  • Usa TTS cuando tengas un guion, STS cuando tengas audio existente para transformar
  • Para doblaje de video, conecta el video al puerto performance — la IA sincroniza los movimientos labiales
  • Mantén los guiones por debajo de 500 palabras por generacion para la mejor calidad
  • Prueba con muestras cortas antes de generar narraciones largas

Solucion de Problemas

  • Calidad de voz deficiente: Verifica que la muestra de audio de referencia sea limpia (sin ruido, un solo hablante, 10-30s).
  • Idioma incorrecto: Asegurate de que la configuracion de Idioma coincida con tu guion. Algunas voces pueden no admitir todos los idiomas.
  • Generacion demasiado lenta: Los guiones largos tardan mas. Divide en segmentos mas cortos si es necesario.
  • Corte de audio: Reduce la configuracion de velocidad o divide el texto en parrafos mas cortos.

Ver Tambien