Nodi Audio
I Nodi Audio catturano o caricano contenuti audio per l’elaborazione AI multimodale. Collegano il mondo della voce a quello del testo: connetti un Nodo Audio a un Nodo Testo e l’AI potra trascrivere, riassumere o analizzare il contenuto audio. I Nodi Audio servono anche come riferimenti vocali per i Nodi AI Voice, abilitando la clonazione della voce.
Cos’e un Nodo Audio?
Un Nodo Audio e il livello di input vocale del tuo workflow. Ti permette di caricare un file audio o registrare direttamente dal microfono, per poi inviare quell’audio ai nodi successivi per l’elaborazione. Collegalo a un Nodo Testo e l’AI “ascoltera” l’audio, trascrivendo il parlato, riassumendo riunioni o analizzando il contenuto vocale. Collegalo a un Nodo AI Voice e diventera un riferimento vocale per la clonazione.
Input e Output
| Porta | Direzione | Tipo | Descrizione |
|---|---|---|---|
| (nessuno) | Input | — | Nessuna connessione in ingresso — l’audio viene caricato o registrato direttamente |
| Output | Output | Audio | Si collega a Nodo Testo (trascrizione/analisi), Nodo AI Voice (riferimento per clonazione vocale), AI If/Else, Canvas |
Controlli dell’Inspector
Carica Audio
Clicca per caricare un file audio dal tuo computer. Formati supportati: MP3, WAV, WEBM, OGG, M4A. Il file viene caricato nel cloud storage e una visualizzazione della forma d’onda appare nell’inspector.
Registra Mic
Registra audio direttamente dal microfono del tuo browser. Clicca il pulsante, concedi i permessi per il microfono quando richiesto, parla, poi clicca Stop quando hai finito. La registrazione viene salvata automaticamente.
Riproduzione Audio
Una visualizzazione della forma d’onda con controlli play/pausa. Controlla il tuo audio prima di collegarlo ad altri nodi.
Elimina Audio
Rimuovi l’audio corrente e ricomincia da zero. Clicca il pulsante elimina per cancellare l’audio caricato o registrato.
Formati Supportati
| Formato | Estensione | Note |
|---|---|---|
| MP3 | .mp3 | Piu comune, buona compressione |
| WAV | .wav | Non compresso, qualita massima |
| WebM | .webm | Formato nativo per il web |
| OGG | .ogg | Formato open source |
| M4A | .m4a | Formato Apple, buona qualita |
Come Usarlo
- Aggiungi un Nodo Audio al canvas cliccando con il tasto destro e selezionando “Nodo Audio” dal menu contestuale, oppure trascinandolo dalla barra laterale.
- Carica un file audio o registra dal microfono usando i controlli dell’inspector.
- Anteprima dell’audio usando il player della forma d’onda per verificare che sia stato catturato correttamente.
- Collega l’output a un Nodo Testo per trascrizione o analisi, oppure a un Nodo AI Voice per la clonazione vocale.
- Scrivi un prompt nel Nodo Testo collegato descrivendo cosa vuoi (es. “Trascrivi questo audio” o “Riassumi i punti chiave”).
- Genera — l’AI ascolta l’audio e risponde in base al tuo prompt testuale.
Esempi di Workflow
Riassunto di Riunioni
Nodo Audio (carica la registrazione della riunione) collegato a un Nodo Testo con il prompt “Riassumi i punti chiave e le azioni da intraprendere di questa riunione.” L’AI ascolta l’intera registrazione e genera un riassunto strutturato con le azioni da intraprendere.
Pipeline Voce-Video
Nodo Audio (registra narrazione) collegato a un Nodo Testo con il prompt “Scrivi una descrizione visiva della scena basata su questa narrazione.” L’output del Nodo Testo si collega poi a un Nodo Scena, che genera un video che corrisponde alla narrazione.
Riferimento per Clonazione Vocale
Nodo Audio (carica campione vocale) collegato a un Nodo AI Voice. Il Nodo AI Voice usa l’audio come riferimento vocale per la clonazione — qualsiasi testo inviato al Nodo AI Voice verra pronunciato con la stessa voce del campione.
Suggerimenti e Best Practice
- Per la trascrizione, mantieni il prompt semplice: “Trascrivi questo audio parola per parola.”
- Per l’analisi, sii specifico: “Elenca gli argomenti principali di questo segmento di podcast” o “Identifica i relatori e riassumi i contributi di ciascuno.”
- La qualita della registrazione conta — usa un ambiente silenzioso, parla chiaramente e riduci al minimo il rumore di fondo per ottenere i migliori risultati.
- Per la clonazione vocale con i Nodi AI Voice, fornisci 10-30 secondi di parlato pulito. Evita rumore di fondo, musica o piu parlanti nel campione.
- I file audio dovrebbero essere sotto i 25MB per un’elaborazione affidabile.
- L’AI elabora l’audio completo — non e necessario tagliarlo con precisione prima del caricamento.
Risoluzione dei Problemi
Il microfono non funziona
Controlla i permessi del browser in Impostazioni poi Privacy poi Microfono. Assicurati di aver concesso l’accesso al microfono per il sito. Prova a ricaricare la pagina dopo aver concesso i permessi.
Il caricamento fallisce
Verifica che il formato del file sia supportato (MP3, WAV, WEBM, OGG, M4A). Controlla che la dimensione del file sia sotto i 25MB. Prova a convertire il file in MP3 se il formato non viene riconosciuto.
Trascrizione imprecisa
La qualita dell’audio e il fattore principale. Rumore di fondo, piu parlanti sovrapposti o volume basso causano problemi. Registra nuovamente in un ambiente silenzioso o usa un file audio di qualita superiore.
Nessuna riproduzione audio
Prova un browser diverso (Chrome e consigliato). Alcuni formati audio potrebbero non essere riprodotti nativamente in tutti i browser. Convertire in MP3 di solito risolve i problemi di riproduzione.
Vedi Anche
- Nodi Testo — Analizza o trascrivi contenuti audio
- Nodi AI Voice — Usa l’audio come riferimento per la clonazione vocale
- Scene — Crea video da workflow guidati dall’audio