KI-Sprach-Knoten

KI-Sprach-Knoten wandeln Text in Sprache um (TTS), klonen Stimmen aus Audiobeispielen und transformieren Sprache zwischen verschiedenen Stimmen (STS — Speech-to-Speech). Sie unterstuetzen drei Eingabetypen: ein Skript (Text), eine Referenzstimme (Audio zum Klonen) und eine Performance (Audio/Video fuer Sprachtransformation und Synchronisation).

Eingaenge und Ausgaenge

PortRichtungTypBeschreibung
inputEinTextSkript/Text vom Textknoten — die zu sprechenden Worte
referenceEinAudioStimmprobe vom Audioknoten — die zu klonende Stimme
performanceEinAudio/VideoQuell-Audio oder -Video fuer Speech-to-Speech-Transformation oder Synchronisation
outputAusAudioGeneriertes Sprach-Audio

Inspector-Steuerungen

  1. Stimmauswahl — Dropdown zur Auswahl aus voreingestellten Stimmen oder Verwendung einer geklonten Stimme (wenn ein Audioknoten als Referenz verbunden ist).
  2. Generierungsmodus — TTS (Text-to-Speech aus Skript) oder STS (Speech-to-Speech aus Performance-Audio).
  3. Sprache — Zielsprache fuer die Generierung.
  4. Geschwindigkeit — Sprechgeschwindigkeit anpassen (langsamer fuer Erzaehlung, schneller fuer dynamische Inhalte).

Generierungsmodi

Text-to-Speech (TTS)

Verbinden Sie einen Textknoten mit dem Skript. Der KI-Sprach-Knoten generiert Sprache mit der ausgewaehlten oder geklonten Stimme.

  • Ideal fuer: Erzaehlung, Voiceover, Hoerbuecher, Barrierefreiheit

Speech-to-Speech (STS)

Verbinden Sie einen Audio- oder Videoknoten als Performance. Der KI-Sprach-Knoten transformiert die Sprache in eine andere Stimme.

  • Ideal fuer: Synchronisation, Sprechkunst, Uebersetzung gesprochener Inhalte

Voice Cloning

Verbinden Sie einen Audioknoten als Referenz (Stimmprobe) + Textknoten als Skript. Der KI-Sprach-Knoten generiert Sprache in der geklonten Stimme.

  • Ideal fuer: Markenstimmen, Charakterkonsistenz, personalisierte Inhalte

Verwendung

  1. Fuegen Sie einen KI-Sprach-Knoten zum Canvas hinzu
  2. Verbinden Sie einen Textknoten (Ihr Skript) mit dem input-Port
  3. (Optional) Verbinden Sie einen Audioknoten mit dem reference-Port fuer Voice Cloning
  4. (Optional) Verbinden Sie einen Audio-/Videoknoten mit dem performance-Port fuer STS
  5. Waehlen Sie eine Stimme oder lassen Sie die geklonte Referenz verwenden
  6. Klicken Sie auf Generieren
  7. Laden Sie die resultierende Audiodatei herunter

Workflow-Beispiele

Erzaehltes Video: Textknoten (“Willkommen zu unserer Dokumentation ueber das Leben im Ozean…“) → KI-Sprach-Knoten (generiert Erzaehlung) + Textknoten → Szenenknoten (generiert passende Bilder mit aktiviertem Audio)

Video-Synchronisation: Szenenknoten (Originalvideo auf Englisch) → KI-Sprach-Knoten (Performance-Port — transformiert Sprache ins Franzoesische)

Charakterstimme: Audioknoten (10s Stimmprobe) → KI-Sprach-Knoten (Reference-Port) + Textknoten (Charakterdialog) → generiert Dialog in der geklonten Stimme

Tipps

  • Fuer Voice Cloning stellen Sie 10-30 Sekunden saubere Sprache bereit — kein Hintergrundrauschen, keine Musik, keine mehreren Sprecher
  • Die STS-Qualitaet haengt von der Qualitaet des Eingangsaudios ab — eine klare, gut aufgenommene Quelle liefert bessere Ergebnisse
  • Verwenden Sie TTS, wenn Sie ein Skript haben, STS, wenn Sie vorhandenes Audio transformieren moechten
  • Fuer Video-Synchronisation verbinden Sie das Video mit dem Performance-Port — die KI passt sich den Lippenbewegungen an
  • Halten Sie Skripte unter 500 Woertern pro Generierung fuer beste Qualitaet
  • Testen Sie mit kurzen Beispielen, bevor Sie lange Erzaehlungen generieren

Fehlerbehebung

  • Schlechte Stimmqualitaet: Ueberpruefen Sie, ob die Referenz-Audioprobe sauber ist (kein Rauschen, einzelner Sprecher, 10-30s).
  • Falsche Sprache: Stellen Sie sicher, dass die Spracheinstellung mit Ihrem Skript uebereinstimmt. Einige Stimmen unterstuetzen moeglicherweise nicht alle Sprachen.
  • Generierung zu langsam: Lange Skripte brauchen laenger. Teilen Sie bei Bedarf in kuerzere Segmente auf.
  • Audio-Clipping: Reduzieren Sie die Geschwindigkeitseinstellung oder teilen Sie den Text in kuerzere Absaetze auf.

Siehe Auch

  • Audioknoten — Nehmen Sie Audio auf oder laden Sie es hoch fuer Voice Cloning
  • Textknoten — Generieren Sie Skripte fuer die Sprachgenerierung
  • Szenen — Erstellen Sie Videos mit KI-generierter Erzaehlung