Nodos de Audio

Los Nodos de Audio capturan o suben contenido de audio para el procesamiento multimodal de IA. Conectan el mundo de la voz con el texto: conecta un Nodo de Audio a un Nodo de Texto y la IA podra transcribir, resumir o analizar el contenido de audio. Los Nodos de Audio tambien sirven como referencias de voz para los Nodos AI Voice, habilitando la clonacion de voz.

Que es un Nodo de Audio?

Un Nodo de Audio es la capa de entrada de voz de tu workflow. Te permite subir un archivo de audio o grabar directamente desde tu microfono, y luego enviar ese audio a los nodos posteriores para su procesamiento. Conectalo a un Nodo de Texto y la IA “escuchara” el audio, transcribiendo el habla, resumiendo reuniones o analizando el contenido hablado. Conectalo a un Nodo AI Voice y se convierte en una referencia de voz para la clonacion.

Entradas y Salidas

PuertoDireccionTipoDescripcion
(ninguno)EntradaSin conexiones de entrada — el audio se sube o graba directamente
OutputSalidaAudioSe conecta a Nodo de Texto (transcripcion/analisis), Nodo AI Voice (referencia de clonacion de voz), AI If/Else, Canvas

Controles del Inspector

Subir Audio

Haz clic para subir un archivo de audio desde tu computadora. Formatos soportados: MP3, WAV, WEBM, OGG, M4A. El archivo se sube al almacenamiento en la nube y aparece una visualizacion de forma de onda en el inspector.

Grabar Mic

Graba audio directamente desde el microfono de tu navegador. Haz clic en el boton, otorga permisos de microfono cuando se te solicite, habla, y luego haz clic en Stop cuando termines. La grabacion se guarda automaticamente.

Reproduccion de Audio

Una visualizacion de forma de onda con controles de reproduccion/pausa. Revisa tu audio antes de conectarlo a otros nodos.

Eliminar Audio

Elimina el audio actual y comienza de nuevo. Haz clic en el boton de eliminar para borrar el audio subido o grabado.

Formatos Soportados

FormatoExtensionNotas
MP3.mp3Mas comun, buena compresion
WAV.wavSin comprimir, maxima calidad
WebM.webmFormato nativo web
OGG.oggFormato de codigo abierto
M4A.m4aFormato Apple, buena calidad

Como Usarlo

  1. Agrega un Nodo de Audio al lienzo haciendo clic derecho y seleccionando “Nodo de Audio” del menu contextual, o arrastandolo desde la barra lateral.
  2. Sube un archivo de audio o graba desde tu microfono usando los controles del inspector.
  3. Previsualiza el audio usando el reproductor de forma de onda para verificar que se capturo correctamente.
  4. Conecta la salida a un Nodo de Texto para transcripcion o analisis, o a un Nodo AI Voice para clonacion de voz.
  5. Escribe un prompt en el Nodo de Texto conectado describiendo lo que quieres (por ejemplo, “Transcribe este audio” o “Resume los puntos clave”).
  6. Genera — la IA escucha el audio y responde segun tu prompt de texto.

Ejemplos de Workflow

Resumen de Reuniones

Nodo de Audio (subir grabacion de reunion) conectado a un Nodo de Texto con el prompt “Resume los puntos clave y las acciones a seguir de esta reunion.” La IA escucha la grabacion completa y genera un resumen estructurado con acciones a seguir.

Pipeline de Voz a Video

Nodo de Audio (grabar narracion) conectado a un Nodo de Texto con el prompt “Escribe una descripcion visual de la escena basada en esta narracion.” La salida del Nodo de Texto se conecta luego a un Nodo de Escena, que genera un video que coincide con la narracion.

Referencia de Clonacion de Voz

Nodo de Audio (subir muestra de voz) conectado a un Nodo AI Voice. El Nodo AI Voice usa el audio como referencia de voz para la clonacion — cualquier texto enviado al Nodo AI Voice se pronunciara con la misma voz que la muestra.

Consejos y Mejores Practicas

  • Para transcripcion, manten el prompt simple: “Transcribe este audio palabra por palabra.”
  • Para analisis, se especifico: “Lista los argumentos principales de este segmento de podcast” o “Identifica a los hablantes y resume las contribuciones de cada persona.”
  • La calidad de la grabacion importa — usa un ambiente tranquilo, habla con claridad y minimiza el ruido de fondo para obtener los mejores resultados.
  • Para clonacion de voz con Nodos AI Voice, proporciona 10-30 segundos de habla limpia. Evita ruido de fondo, musica o multiples hablantes en la muestra.
  • Los archivos de audio deben ser de menos de 25MB para un procesamiento confiable.
  • La IA procesa el audio completo — no es necesario recortarlo con precision antes de subirlo.

Solucion de Problemas

El microfono no funciona

Verifica los permisos del navegador en Configuracion, luego Privacidad, luego Microfono. Asegurate de haber otorgado acceso al microfono para el sitio. Intenta recargar la pagina despues de otorgar los permisos.

La subida falla

Verifica que el formato del archivo sea compatible (MP3, WAV, WEBM, OGG, M4A). Comprueba que el tamano del archivo sea menor a 25MB. Intenta convertir el archivo a MP3 si el formato no se reconoce.

Transcripcion imprecisa

La calidad del audio es el factor principal. El ruido de fondo, multiples hablantes superpuestos o el volumen bajo causan problemas. Vuelve a grabar en un ambiente silencioso o usa un archivo de audio de mayor calidad.

Sin reproduccion de audio

Prueba con un navegador diferente (se recomienda Chrome). Algunos formatos de audio pueden no reproducirse nativamente en todos los navegadores. Convertir a MP3 generalmente resuelve los problemas de reproduccion.

Ver Tambien

  • Nodos de Texto — Analiza o transcribe contenido de audio
  • Nodos AI Voice — Usa el audio como referencia de clonacion de voz
  • Escenas — Crea videos a partir de workflows basados en audio