KI-Sprach-Knoten
KI-Sprach-Knoten wandeln Text in Sprache um (TTS), klonen Stimmen aus Audiobeispielen und transformieren Sprache zwischen verschiedenen Stimmen (STS — Speech-to-Speech). Sie unterstuetzen drei Eingabetypen: ein Skript (Text), eine Referenzstimme (Audio zum Klonen) und eine Performance (Audio/Video fuer Sprachtransformation und Synchronisation).
Eingaenge und Ausgaenge
| Port | Richtung | Typ | Beschreibung |
|---|---|---|---|
| input | Ein | Text | Skript/Text vom Textknoten — die zu sprechenden Worte |
| reference | Ein | Audio | Stimmprobe vom Audioknoten — die zu klonende Stimme |
| performance | Ein | Audio/Video | Quell-Audio oder -Video fuer Speech-to-Speech-Transformation oder Synchronisation |
| output | Aus | Audio | Generiertes Sprach-Audio |
Inspector-Steuerungen
- Stimmauswahl — Dropdown zur Auswahl aus voreingestellten Stimmen oder Verwendung einer geklonten Stimme (wenn ein Audioknoten als Referenz verbunden ist).
- Generierungsmodus — TTS (Text-to-Speech aus Skript) oder STS (Speech-to-Speech aus Performance-Audio).
- Sprache — Zielsprache fuer die Generierung.
- Geschwindigkeit — Sprechgeschwindigkeit anpassen (langsamer fuer Erzaehlung, schneller fuer dynamische Inhalte).
Generierungsmodi
Text-to-Speech (TTS)
Verbinden Sie einen Textknoten mit dem Skript. Der KI-Sprach-Knoten generiert Sprache mit der ausgewaehlten oder geklonten Stimme.
- Ideal fuer: Erzaehlung, Voiceover, Hoerbuecher, Barrierefreiheit
Speech-to-Speech (STS)
Verbinden Sie einen Audio- oder Videoknoten als Performance. Der KI-Sprach-Knoten transformiert die Sprache in eine andere Stimme.
- Ideal fuer: Synchronisation, Sprechkunst, Uebersetzung gesprochener Inhalte
Voice Cloning
Verbinden Sie einen Audioknoten als Referenz (Stimmprobe) + Textknoten als Skript. Der KI-Sprach-Knoten generiert Sprache in der geklonten Stimme.
- Ideal fuer: Markenstimmen, Charakterkonsistenz, personalisierte Inhalte
Verwendung
- Fuegen Sie einen KI-Sprach-Knoten zum Canvas hinzu
- Verbinden Sie einen Textknoten (Ihr Skript) mit dem
input-Port - (Optional) Verbinden Sie einen Audioknoten mit dem
reference-Port fuer Voice Cloning - (Optional) Verbinden Sie einen Audio-/Videoknoten mit dem
performance-Port fuer STS - Waehlen Sie eine Stimme oder lassen Sie die geklonte Referenz verwenden
- Klicken Sie auf Generieren
- Laden Sie die resultierende Audiodatei herunter
Workflow-Beispiele
Erzaehltes Video: Textknoten (“Willkommen zu unserer Dokumentation ueber das Leben im Ozean…“) → KI-Sprach-Knoten (generiert Erzaehlung) + Textknoten → Szenenknoten (generiert passende Bilder mit aktiviertem Audio)
Video-Synchronisation: Szenenknoten (Originalvideo auf Englisch) → KI-Sprach-Knoten (Performance-Port — transformiert Sprache ins Franzoesische)
Charakterstimme: Audioknoten (10s Stimmprobe) → KI-Sprach-Knoten (Reference-Port) + Textknoten (Charakterdialog) → generiert Dialog in der geklonten Stimme
Tipps
- Fuer Voice Cloning stellen Sie 10-30 Sekunden saubere Sprache bereit — kein Hintergrundrauschen, keine Musik, keine mehreren Sprecher
- Die STS-Qualitaet haengt von der Qualitaet des Eingangsaudios ab — eine klare, gut aufgenommene Quelle liefert bessere Ergebnisse
- Verwenden Sie TTS, wenn Sie ein Skript haben, STS, wenn Sie vorhandenes Audio transformieren moechten
- Fuer Video-Synchronisation verbinden Sie das Video mit dem Performance-Port — die KI passt sich den Lippenbewegungen an
- Halten Sie Skripte unter 500 Woertern pro Generierung fuer beste Qualitaet
- Testen Sie mit kurzen Beispielen, bevor Sie lange Erzaehlungen generieren
Fehlerbehebung
- Schlechte Stimmqualitaet: Ueberpruefen Sie, ob die Referenz-Audioprobe sauber ist (kein Rauschen, einzelner Sprecher, 10-30s).
- Falsche Sprache: Stellen Sie sicher, dass die Spracheinstellung mit Ihrem Skript uebereinstimmt. Einige Stimmen unterstuetzen moeglicherweise nicht alle Sprachen.
- Generierung zu langsam: Lange Skripte brauchen laenger. Teilen Sie bei Bedarf in kuerzere Segmente auf.
- Audio-Clipping: Reduzieren Sie die Geschwindigkeitseinstellung oder teilen Sie den Text in kuerzere Absaetze auf.
Siehe Auch
- Audioknoten — Nehmen Sie Audio auf oder laden Sie es hoch fuer Voice Cloning
- Textknoten — Generieren Sie Skripte fuer die Sprachgenerierung
- Szenen — Erstellen Sie Videos mit KI-generierter Erzaehlung