No de Audio

O No de Audio e o ponto de entrada unico para todo o audio no Dal Nulla. Seu comportamento muda de acordo com o contexto: envie ou grave audio quando vazio, gere voz/musica/SFX quando um No de Texto esta conectado, ou transforme a fala quando um audio/video de performance esta conectado.

Visao Geral — Comportamento Contextual

ContextoO que acontece
Sem conexoesEnvie um arquivo de audio ou grave do microfone
No de Texto conectadoGere audio a partir de texto — escolha o modo Voz (TTS), Musica ou Efeitos Sonoros
Audio/video de performance conectadoSpeech-to-Speech (STS) — transforme a fala fonte em uma voz diferente
Audio de referencia conectadoVoice cloning — use a amostra como voz alvo para a geracao TTS

Entradas e Saidas

PortaDirecaoTipoDescricao
inputEntradaTextoRoteiro/texto do No de Texto — as palavras a serem faladas, ou um prompt para musica/SFX
referenceEntradaAudioAmostra vocal do No de Audio — a voz a ser clonada
performanceEntradaAudio/VideoAudio ou video fonte para a transformacao Speech-to-Speech ou dublagem
outputSaidaAudioAudio gerado ou enviado

Envio e Gravacao (Sem Conexoes)

Quando nenhum No de Texto ou de performance esta conectado, o No de Audio funciona como ferramenta de captura de audio:

  • Enviar — Clique para enviar um arquivo de audio (MP3, WAV, WEBM, OGG, M4A, ate 25MB)
  • Gravar — Grave do microfone do navegador. Clique em Gravar, fale, clique em Parar. A gravacao e salva automaticamente.
  • Reproducao — Visualizacao de forma de onda com controles de reproducao/pausa
  • Excluir — Remova o audio atual e comece do zero

O audio enviado ou gravado pode ser conectado a Nos de Texto (para transcricao/analise), outros Nos de Audio (como referencia vocal) ou Nos de Cena.

Geracao de Voz (TTS)

Conecte um No de Texto com seu roteiro. Selecione o modo Voz no inspetor. O No de Audio gera a fala usando a voz selecionada ou uma voz clonada.

Controles do Inspetor (Voz)

  1. Selecao de Voz — Menu suspenso para escolher entre vozes predefinidas ou usar uma voz clonada (quando uma referencia de audio esta conectada).
  2. Idioma — Idioma alvo para a geracao.
  3. Velocidade — Ajusta a velocidade da fala (mais lenta para narracao, mais rapida para conteudo energetico).
  • Ideal para: narracao, locucao, audiolivros, acessibilidade, roteiros publicitarios

Geracao de Musica

Conecte um No de Texto com um prompt musical. Selecione o modo Musica no inspetor. O No de Audio gera uma faixa musical a partir da descricao textual.

Controles do Inspetor (Musica)

  1. Duracao — Comprimento da faixa gerada, de 3 segundos a 10 minutos.
  2. Instrumental — Ative para produzir musica apenas instrumental (sem vocais).

Dicas para Prompts (Musica)

  • Descreva o genero, clima, tempo e instrumentos: “Beat lo-fi eletronico animado, 120 BPM, sintetizadores suaves e estalos de vinil”

  • Mencione o caso de uso para melhores resultados: “Musica de fundo para um video demo de produto, corporativa e moderna”

  • Mantenha os prompts concisos — uma ou duas frases funcionam melhor

  • Ideal para: musica de fundo para anuncios, videos de redes sociais, demos de produto, intros de podcast

Geracao de Efeitos Sonoros

Conecte um No de Texto com um prompt de SFX. Selecione o modo Efeitos Sonoros no inspetor. O No de Audio gera um efeito sonoro a partir da descricao textual.

Controles do Inspetor (Efeitos Sonoros)

  1. Duracao — Comprimento do som gerado, de 0.5 segundos a 30 segundos.
  2. Influencia do Prompt — Slider que controla o quanto a saida segue o prompt (mais alto = mais literal, mais baixo = mais criativo).
  3. Loop Continuo — Ative para produzir um efeito sonoro em loop continuo sem interrupcoes (util para fundos ambientais).

Dicas para Prompts (Efeitos Sonoros)

  • Seja especifico sobre o som: “Garrafa de vidro quebrando em um piso de azulejos”

  • Inclua detalhes do ambiente: “Trovao retumbando ao longe com chuva leve”

  • Para sons de UI, descreva a sensacao: “Chime de notificacao curto e brilhante, digital e limpo”

  • Ideal para: design de som para video, audio UI/UX, clips para redes sociais, transicoes de podcast

Speech-to-Speech (STS)

Conecte um No de Audio ou Video como performance. O No de Audio transforma a fala em uma voz diferente preservando o ritmo e a emocao.

  • Ideal para: dublagem, atuacao vocal, traducao de conteudo falado

Voice Cloning

Conecte um No de Audio como referencia (amostra vocal) + No de Texto como roteiro. O No de Audio gera a fala com a voz clonada.

  • Ideal para: vozes de marca, consistencia de personagens, conteudo personalizado

Como Usar

  1. Adicione um No de Audio ao canvas
  2. Para envio/gravacao: use os controles do inspetor diretamente — nenhuma conexao necessaria
  3. Para geracao de voz: conecte um No de Texto (seu roteiro) a porta input, selecione o modo Voz
  4. Para musica: conecte um No de Texto (seu prompt) a porta input, selecione o modo Musica, defina a duracao
  5. Para efeitos sonoros: conecte um No de Texto (seu prompt) a porta input, selecione o modo Efeitos Sonoros
  6. (Opcional) Conecte um No de Audio a porta reference para voice cloning
  7. (Opcional) Conecte um No de Audio/Video a porta performance para STS
  8. Clique em Gerar
  9. Baixe o arquivo de audio resultante

Exemplos de Workflow

Locucao Publicitaria: No de Texto (“Descubra a nova forma de fazer compras…“) → No de Audio (modo Voz — gera narracao) → No de Cena (video com locucao)

Musica de Fundo para Demo de Produto: No de Texto (“Musica de fundo corporativa animada, moderna e limpa”) → No de Audio (modo Musica, duracao 60s, instrumental ativado) → usar na timeline do editor de video

Design de Som para Video: No de Texto (“Som de transicao whoosh, cinematografico”) → No de Audio (modo Efeitos Sonoros, duracao 1s) → adicionar a timeline do video

Dublagem de Video: No de Cena (video original em ingles) → No de Audio (porta performance — transforma a fala para frances)

Voz de Personagem: No de Audio (amostra de 10s de uma voz) → No de Audio (porta reference) + No de Texto (dialogo do personagem) → gera dialogo com a voz clonada

Dicas

  • Para voice cloning, forneca 10-30 segundos de fala limpa — sem ruido de fundo, musica ou multiplos falantes
  • A qualidade do STS depende da qualidade do audio de entrada — uma fonte clara e bem gravada produz melhores resultados
  • Use o modo Voz quando tiver um roteiro, STS quando tiver audio existente para transformar
  • Para dublagem de video, conecte o video a porta performance — a IA sincroniza os movimentos labiais
  • Mantenha os roteiros de voz abaixo de 500 palavras por geracao para a melhor qualidade
  • Para musica, duracoes mais longas (30s+) tendem a produzir composicoes mais desenvolvidas
  • Para efeitos sonoros, ative o loop continuo para sons ambientais que voce quer repetir continuamente
  • Teste com amostras curtas antes de gerar narracoes ou faixas musicais longas

Solucao de Problemas

  • Qualidade vocal ruim: Verifique se a amostra de audio de referencia esta limpa (sem ruido, falante unico, 10-30s).
  • Idioma errado: Certifique-se de que a configuracao de Idioma corresponde ao seu roteiro. Algumas vozes podem nao suportar todos os idiomas.
  • Geracao muito lenta: Roteiros longos e musica de longa duracao demoram mais. Divida em segmentos mais curtos se necessario.
  • Corte de audio: Reduza a configuracao de velocidade ou divida o texto em paragrafos mais curtos.
  • Musica soa generica: Adicione mais detalhes ao prompt — especifique genero, instrumentos, tempo e clima.
  • SFX nao corresponde ao prompt: Aumente o slider de Influencia do Prompt para uma saida mais literal.
  • Microfone nao funciona: Verifique as permissoes do navegador em Configuracoes > Privacidade > Microfone. Conceda acesso e atualize.
  • Envio falha: Verifique se o formato e suportado (MP3, WAV, WEBM, OGG, M4A) e menor que 25MB.

Veja Tambem

  • Nos de Audio — No de Audio standalone legacy (obsoleto)
  • Nos de Texto — Gere roteiros e prompts para a geracao de audio
  • Cenas — Crie videos com narracao e musica gerada por IA