Nodos de Audio
Los Nodos de Audio capturan o suben contenido de audio para el procesamiento multimodal de IA. Conectan el mundo de la voz con el texto: conecta un Nodo de Audio a un Nodo de Texto y la IA podra transcribir, resumir o analizar el contenido de audio. Los Nodos de Audio tambien sirven como referencias de voz para los Nodos AI Voice, habilitando la clonacion de voz.
Que es un Nodo de Audio?
Un Nodo de Audio es la capa de entrada de voz de tu workflow. Te permite subir un archivo de audio o grabar directamente desde tu microfono, y luego enviar ese audio a los nodos posteriores para su procesamiento. Conectalo a un Nodo de Texto y la IA “escuchara” el audio, transcribiendo el habla, resumiendo reuniones o analizando el contenido hablado. Conectalo a un Nodo AI Voice y se convierte en una referencia de voz para la clonacion.
Entradas y Salidas
| Puerto | Direccion | Tipo | Descripcion |
|---|---|---|---|
| (ninguno) | Entrada | — | Sin conexiones de entrada — el audio se sube o graba directamente |
| Output | Salida | Audio | Se conecta a Nodo de Texto (transcripcion/analisis), Nodo AI Voice (referencia de clonacion de voz), AI If/Else, Canvas |
Controles del Inspector
Subir Audio
Haz clic para subir un archivo de audio desde tu computadora. Formatos soportados: MP3, WAV, WEBM, OGG, M4A. El archivo se sube al almacenamiento en la nube y aparece una visualizacion de forma de onda en el inspector.
Grabar Mic
Graba audio directamente desde el microfono de tu navegador. Haz clic en el boton, otorga permisos de microfono cuando se te solicite, habla, y luego haz clic en Stop cuando termines. La grabacion se guarda automaticamente.
Reproduccion de Audio
Una visualizacion de forma de onda con controles de reproduccion/pausa. Revisa tu audio antes de conectarlo a otros nodos.
Eliminar Audio
Elimina el audio actual y comienza de nuevo. Haz clic en el boton de eliminar para borrar el audio subido o grabado.
Formatos Soportados
| Formato | Extension | Notas |
|---|---|---|
| MP3 | .mp3 | Mas comun, buena compresion |
| WAV | .wav | Sin comprimir, maxima calidad |
| WebM | .webm | Formato nativo web |
| OGG | .ogg | Formato de codigo abierto |
| M4A | .m4a | Formato Apple, buena calidad |
Como Usarlo
- Agrega un Nodo de Audio al lienzo haciendo clic derecho y seleccionando “Nodo de Audio” del menu contextual, o arrastandolo desde la barra lateral.
- Sube un archivo de audio o graba desde tu microfono usando los controles del inspector.
- Previsualiza el audio usando el reproductor de forma de onda para verificar que se capturo correctamente.
- Conecta la salida a un Nodo de Texto para transcripcion o analisis, o a un Nodo AI Voice para clonacion de voz.
- Escribe un prompt en el Nodo de Texto conectado describiendo lo que quieres (por ejemplo, “Transcribe este audio” o “Resume los puntos clave”).
- Genera — la IA escucha el audio y responde segun tu prompt de texto.
Ejemplos de Workflow
Resumen de Reuniones
Nodo de Audio (subir grabacion de reunion) conectado a un Nodo de Texto con el prompt “Resume los puntos clave y las acciones a seguir de esta reunion.” La IA escucha la grabacion completa y genera un resumen estructurado con acciones a seguir.
Pipeline de Voz a Video
Nodo de Audio (grabar narracion) conectado a un Nodo de Texto con el prompt “Escribe una descripcion visual de la escena basada en esta narracion.” La salida del Nodo de Texto se conecta luego a un Nodo de Escena, que genera un video que coincide con la narracion.
Referencia de Clonacion de Voz
Nodo de Audio (subir muestra de voz) conectado a un Nodo AI Voice. El Nodo AI Voice usa el audio como referencia de voz para la clonacion — cualquier texto enviado al Nodo AI Voice se pronunciara con la misma voz que la muestra.
Consejos y Mejores Practicas
- Para transcripcion, manten el prompt simple: “Transcribe este audio palabra por palabra.”
- Para analisis, se especifico: “Lista los argumentos principales de este segmento de podcast” o “Identifica a los hablantes y resume las contribuciones de cada persona.”
- La calidad de la grabacion importa — usa un ambiente tranquilo, habla con claridad y minimiza el ruido de fondo para obtener los mejores resultados.
- Para clonacion de voz con Nodos AI Voice, proporciona 10-30 segundos de habla limpia. Evita ruido de fondo, musica o multiples hablantes en la muestra.
- Los archivos de audio deben ser de menos de 25MB para un procesamiento confiable.
- La IA procesa el audio completo — no es necesario recortarlo con precision antes de subirlo.
Solucion de Problemas
El microfono no funciona
Verifica los permisos del navegador en Configuracion, luego Privacidad, luego Microfono. Asegurate de haber otorgado acceso al microfono para el sitio. Intenta recargar la pagina despues de otorgar los permisos.
La subida falla
Verifica que el formato del archivo sea compatible (MP3, WAV, WEBM, OGG, M4A). Comprueba que el tamano del archivo sea menor a 25MB. Intenta convertir el archivo a MP3 si el formato no se reconoce.
Transcripcion imprecisa
La calidad del audio es el factor principal. El ruido de fondo, multiples hablantes superpuestos o el volumen bajo causan problemas. Vuelve a grabar en un ambiente silencioso o usa un archivo de audio de mayor calidad.
Sin reproduccion de audio
Prueba con un navegador diferente (se recomienda Chrome). Algunos formatos de audio pueden no reproducirse nativamente en todos los navegadores. Convertir a MP3 generalmente resuelve los problemas de reproduccion.
Ver Tambien
- Nodos de Texto — Analiza o transcribe contenido de audio
- Nodos AI Voice — Usa el audio como referencia de clonacion de voz
- Escenas — Crea videos a partir de workflows basados en audio