No de Audio
O No de Audio e o ponto de entrada unico para todo o audio no Dal Nulla. Seu comportamento muda de acordo com o contexto: envie ou grave audio quando vazio, gere voz/musica/SFX quando um No de Texto esta conectado, ou transforme a fala quando um audio/video de performance esta conectado.
Visao Geral — Comportamento Contextual
| Contexto | O que acontece |
|---|---|
| Sem conexoes | Envie um arquivo de audio ou grave do microfone |
| No de Texto conectado | Gere audio a partir de texto — escolha o modo Voz (TTS), Musica ou Efeitos Sonoros |
| Audio/video de performance conectado | Speech-to-Speech (STS) — transforme a fala fonte em uma voz diferente |
| Audio de referencia conectado | Voice cloning — use a amostra como voz alvo para a geracao TTS |
Entradas e Saidas
| Porta | Direcao | Tipo | Descricao |
|---|---|---|---|
| input | Entrada | Texto | Roteiro/texto do No de Texto — as palavras a serem faladas, ou um prompt para musica/SFX |
| reference | Entrada | Audio | Amostra vocal do No de Audio — a voz a ser clonada |
| performance | Entrada | Audio/Video | Audio ou video fonte para a transformacao Speech-to-Speech ou dublagem |
| output | Saida | Audio | Audio gerado ou enviado |
Envio e Gravacao (Sem Conexoes)
Quando nenhum No de Texto ou de performance esta conectado, o No de Audio funciona como ferramenta de captura de audio:
- Enviar — Clique para enviar um arquivo de audio (MP3, WAV, WEBM, OGG, M4A, ate 25MB)
- Gravar — Grave do microfone do navegador. Clique em Gravar, fale, clique em Parar. A gravacao e salva automaticamente.
- Reproducao — Visualizacao de forma de onda com controles de reproducao/pausa
- Excluir — Remova o audio atual e comece do zero
O audio enviado ou gravado pode ser conectado a Nos de Texto (para transcricao/analise), outros Nos de Audio (como referencia vocal) ou Nos de Cena.
Geracao de Voz (TTS)
Conecte um No de Texto com seu roteiro. Selecione o modo Voz no inspetor. O No de Audio gera a fala usando a voz selecionada ou uma voz clonada.
Controles do Inspetor (Voz)
- Selecao de Voz — Menu suspenso para escolher entre vozes predefinidas ou usar uma voz clonada (quando uma referencia de audio esta conectada).
- Idioma — Idioma alvo para a geracao.
- Velocidade — Ajusta a velocidade da fala (mais lenta para narracao, mais rapida para conteudo energetico).
- Ideal para: narracao, locucao, audiolivros, acessibilidade, roteiros publicitarios
Geracao de Musica
Conecte um No de Texto com um prompt musical. Selecione o modo Musica no inspetor. O No de Audio gera uma faixa musical a partir da descricao textual.
Controles do Inspetor (Musica)
- Duracao — Comprimento da faixa gerada, de 3 segundos a 10 minutos.
- Instrumental — Ative para produzir musica apenas instrumental (sem vocais).
Dicas para Prompts (Musica)
Descreva o genero, clima, tempo e instrumentos: “Beat lo-fi eletronico animado, 120 BPM, sintetizadores suaves e estalos de vinil”
Mencione o caso de uso para melhores resultados: “Musica de fundo para um video demo de produto, corporativa e moderna”
Mantenha os prompts concisos — uma ou duas frases funcionam melhor
Ideal para: musica de fundo para anuncios, videos de redes sociais, demos de produto, intros de podcast
Geracao de Efeitos Sonoros
Conecte um No de Texto com um prompt de SFX. Selecione o modo Efeitos Sonoros no inspetor. O No de Audio gera um efeito sonoro a partir da descricao textual.
Controles do Inspetor (Efeitos Sonoros)
- Duracao — Comprimento do som gerado, de 0.5 segundos a 30 segundos.
- Influencia do Prompt — Slider que controla o quanto a saida segue o prompt (mais alto = mais literal, mais baixo = mais criativo).
- Loop Continuo — Ative para produzir um efeito sonoro em loop continuo sem interrupcoes (util para fundos ambientais).
Dicas para Prompts (Efeitos Sonoros)
Seja especifico sobre o som: “Garrafa de vidro quebrando em um piso de azulejos”
Inclua detalhes do ambiente: “Trovao retumbando ao longe com chuva leve”
Para sons de UI, descreva a sensacao: “Chime de notificacao curto e brilhante, digital e limpo”
Ideal para: design de som para video, audio UI/UX, clips para redes sociais, transicoes de podcast
Speech-to-Speech (STS)
Conecte um No de Audio ou Video como performance. O No de Audio transforma a fala em uma voz diferente preservando o ritmo e a emocao.
- Ideal para: dublagem, atuacao vocal, traducao de conteudo falado
Voice Cloning
Conecte um No de Audio como referencia (amostra vocal) + No de Texto como roteiro. O No de Audio gera a fala com a voz clonada.
- Ideal para: vozes de marca, consistencia de personagens, conteudo personalizado
Como Usar
- Adicione um No de Audio ao canvas
- Para envio/gravacao: use os controles do inspetor diretamente — nenhuma conexao necessaria
- Para geracao de voz: conecte um No de Texto (seu roteiro) a porta
input, selecione o modo Voz - Para musica: conecte um No de Texto (seu prompt) a porta
input, selecione o modo Musica, defina a duracao - Para efeitos sonoros: conecte um No de Texto (seu prompt) a porta
input, selecione o modo Efeitos Sonoros - (Opcional) Conecte um No de Audio a porta
referencepara voice cloning - (Opcional) Conecte um No de Audio/Video a porta
performancepara STS - Clique em Gerar
- Baixe o arquivo de audio resultante
Exemplos de Workflow
Locucao Publicitaria: No de Texto (“Descubra a nova forma de fazer compras…“) → No de Audio (modo Voz — gera narracao) → No de Cena (video com locucao)
Musica de Fundo para Demo de Produto: No de Texto (“Musica de fundo corporativa animada, moderna e limpa”) → No de Audio (modo Musica, duracao 60s, instrumental ativado) → usar na timeline do editor de video
Design de Som para Video: No de Texto (“Som de transicao whoosh, cinematografico”) → No de Audio (modo Efeitos Sonoros, duracao 1s) → adicionar a timeline do video
Dublagem de Video: No de Cena (video original em ingles) → No de Audio (porta performance — transforma a fala para frances)
Voz de Personagem: No de Audio (amostra de 10s de uma voz) → No de Audio (porta reference) + No de Texto (dialogo do personagem) → gera dialogo com a voz clonada
Dicas
- Para voice cloning, forneca 10-30 segundos de fala limpa — sem ruido de fundo, musica ou multiplos falantes
- A qualidade do STS depende da qualidade do audio de entrada — uma fonte clara e bem gravada produz melhores resultados
- Use o modo Voz quando tiver um roteiro, STS quando tiver audio existente para transformar
- Para dublagem de video, conecte o video a porta performance — a IA sincroniza os movimentos labiais
- Mantenha os roteiros de voz abaixo de 500 palavras por geracao para a melhor qualidade
- Para musica, duracoes mais longas (30s+) tendem a produzir composicoes mais desenvolvidas
- Para efeitos sonoros, ative o loop continuo para sons ambientais que voce quer repetir continuamente
- Teste com amostras curtas antes de gerar narracoes ou faixas musicais longas
Solucao de Problemas
- Qualidade vocal ruim: Verifique se a amostra de audio de referencia esta limpa (sem ruido, falante unico, 10-30s).
- Idioma errado: Certifique-se de que a configuracao de Idioma corresponde ao seu roteiro. Algumas vozes podem nao suportar todos os idiomas.
- Geracao muito lenta: Roteiros longos e musica de longa duracao demoram mais. Divida em segmentos mais curtos se necessario.
- Corte de audio: Reduza a configuracao de velocidade ou divida o texto em paragrafos mais curtos.
- Musica soa generica: Adicione mais detalhes ao prompt — especifique genero, instrumentos, tempo e clima.
- SFX nao corresponde ao prompt: Aumente o slider de Influencia do Prompt para uma saida mais literal.
- Microfone nao funciona: Verifique as permissoes do navegador em Configuracoes > Privacidade > Microfone. Conceda acesso e atualize.
- Envio falha: Verifique se o formato e suportado (MP3, WAV, WEBM, OGG, M4A) e menor que 25MB.
Veja Tambem
- Nos de Audio — No de Audio standalone legacy (obsoleto)
- Nos de Texto — Gere roteiros e prompts para a geracao de audio
- Cenas — Crie videos com narracao e musica gerada por IA