Nodi Audio

I Nodi Audio catturano o caricano contenuti audio per l’elaborazione AI multimodale. Collegano il mondo della voce a quello del testo: connetti un Nodo Audio a un Nodo Testo e l’AI potra trascrivere, riassumere o analizzare il contenuto audio. I Nodi Audio servono anche come riferimenti vocali per i Nodi AI Voice, abilitando la clonazione della voce.

Cos’e un Nodo Audio?

Un Nodo Audio e il livello di input vocale del tuo workflow. Ti permette di caricare un file audio o registrare direttamente dal microfono, per poi inviare quell’audio ai nodi successivi per l’elaborazione. Collegalo a un Nodo Testo e l’AI “ascoltera” l’audio, trascrivendo il parlato, riassumendo riunioni o analizzando il contenuto vocale. Collegalo a un Nodo AI Voice e diventera un riferimento vocale per la clonazione.

Input e Output

PortaDirezioneTipoDescrizione
(nessuno)Input—Nessuna connessione in ingresso — l’audio viene caricato o registrato direttamente
OutputOutputAudioSi collega a Nodo Testo (trascrizione/analisi), Nodo AI Voice (riferimento per clonazione vocale), AI If/Else, Canvas

Controlli dell’Inspector

Carica Audio

Clicca per caricare un file audio dal tuo computer. Formati supportati: MP3, WAV, WEBM, OGG, M4A. Il file viene caricato nel cloud storage e una visualizzazione della forma d’onda appare nell’inspector.

Registra Mic

Registra audio direttamente dal microfono del tuo browser. Clicca il pulsante, concedi i permessi per il microfono quando richiesto, parla, poi clicca Stop quando hai finito. La registrazione viene salvata automaticamente.

Riproduzione Audio

Una visualizzazione della forma d’onda con controlli play/pausa. Controlla il tuo audio prima di collegarlo ad altri nodi.

Elimina Audio

Rimuovi l’audio corrente e ricomincia da zero. Clicca il pulsante elimina per cancellare l’audio caricato o registrato.

Formati Supportati

FormatoEstensioneNote
MP3.mp3Piu comune, buona compressione
WAV.wavNon compresso, qualita massima
WebM.webmFormato nativo per il web
OGG.oggFormato open source
M4A.m4aFormato Apple, buona qualita

Come Usarlo

  1. Aggiungi un Nodo Audio al canvas cliccando con il tasto destro e selezionando “Nodo Audio” dal menu contestuale, oppure trascinandolo dalla barra laterale.
  2. Carica un file audio o registra dal microfono usando i controlli dell’inspector.
  3. Anteprima dell’audio usando il player della forma d’onda per verificare che sia stato catturato correttamente.
  4. Collega l’output a un Nodo Testo per trascrizione o analisi, oppure a un Nodo AI Voice per la clonazione vocale.
  5. Scrivi un prompt nel Nodo Testo collegato descrivendo cosa vuoi (es. “Trascrivi questo audio” o “Riassumi i punti chiave”).
  6. Genera — l’AI ascolta l’audio e risponde in base al tuo prompt testuale.

Esempi di Workflow

Riassunto di Riunioni

Nodo Audio (carica la registrazione della riunione) collegato a un Nodo Testo con il prompt “Riassumi i punti chiave e le azioni da intraprendere di questa riunione.” L’AI ascolta l’intera registrazione e genera un riassunto strutturato con le azioni da intraprendere.

Pipeline Voce-Video

Nodo Audio (registra narrazione) collegato a un Nodo Testo con il prompt “Scrivi una descrizione visiva della scena basata su questa narrazione.” L’output del Nodo Testo si collega poi a un Nodo Scena, che genera un video che corrisponde alla narrazione.

Riferimento per Clonazione Vocale

Nodo Audio (carica campione vocale) collegato a un Nodo AI Voice. Il Nodo AI Voice usa l’audio come riferimento vocale per la clonazione — qualsiasi testo inviato al Nodo AI Voice verra pronunciato con la stessa voce del campione.

Suggerimenti e Best Practice

  • Per la trascrizione, mantieni il prompt semplice: “Trascrivi questo audio parola per parola.”
  • Per l’analisi, sii specifico: “Elenca gli argomenti principali di questo segmento di podcast” o “Identifica i relatori e riassumi i contributi di ciascuno.”
  • La qualita della registrazione conta — usa un ambiente silenzioso, parla chiaramente e riduci al minimo il rumore di fondo per ottenere i migliori risultati.
  • Per la clonazione vocale con i Nodi AI Voice, fornisci 10-30 secondi di parlato pulito. Evita rumore di fondo, musica o piu parlanti nel campione.
  • I file audio dovrebbero essere sotto i 25MB per un’elaborazione affidabile.
  • L’AI elabora l’audio completo — non e necessario tagliarlo con precisione prima del caricamento.

Risoluzione dei Problemi

Il microfono non funziona

Controlla i permessi del browser in Impostazioni poi Privacy poi Microfono. Assicurati di aver concesso l’accesso al microfono per il sito. Prova a ricaricare la pagina dopo aver concesso i permessi.

Il caricamento fallisce

Verifica che il formato del file sia supportato (MP3, WAV, WEBM, OGG, M4A). Controlla che la dimensione del file sia sotto i 25MB. Prova a convertire il file in MP3 se il formato non viene riconosciuto.

Trascrizione imprecisa

La qualita dell’audio e il fattore principale. Rumore di fondo, piu parlanti sovrapposti o volume basso causano problemi. Registra nuovamente in un ambiente silenzioso o usa un file audio di qualita superiore.

Nessuna riproduzione audio

Prova un browser diverso (Chrome e consigliato). Alcuni formati audio potrebbero non essere riprodotti nativamente in tutti i browser. Convertire in MP3 di solito risolve i problemi di riproduzione.

Vedi Anche

  • Nodi Testo — Analizza o trascrivi contenuti audio
  • Nodi AI Voice — Usa l’audio come riferimento per la clonazione vocale
  • Scene — Crea video da workflow guidati dall’audio