Audio-Knoten
Audio-Knoten erfassen oder laden Audioinhalte fur die multimodale KI-Verarbeitung hoch. Sie verbinden Sprache mit Text — verbinden Sie einen Audio-Knoten mit einem Text-Knoten, und die KI kann den Audioinhalt transkribieren, zusammenfassen oder analysieren. Audio-Knoten dienen auch als Stimmreferenzen fur AI Voice-Knoten und ermoglichen so das Stimmklonen.
Was ist ein Audio-Knoten?
Ein Audio-Knoten ist die Spracheingabeschicht Ihres Workflows. Er ermoglicht es Ihnen, eine Audiodatei hochzuladen oder direkt uber Ihr Mikrofon aufzunehmen und dieses Audio dann an nachfolgende Knoten zur Verarbeitung weiterzuleiten. Verbinden Sie ihn mit einem Text-Knoten, und die KI wird das Audio „horen” — Sprache transkribieren, Meetings zusammenfassen oder gesprochene Inhalte analysieren. Verbinden Sie ihn mit einem AI Voice-Knoten, und er wird zur Stimmreferenz fur das Klonen.
Eingange und Ausgange
| Port | Richtung | Typ | Beschreibung |
|---|---|---|---|
| (keiner) | Eingang | — | Keine Eingangsverbindungen — Audio wird direkt hochgeladen oder aufgenommen |
| Output | Ausgang | Audio | Verbindet sich mit Text-Knoten (Transkription/Analyse), AI Voice-Knoten (Stimmklonen-Referenz), AI If/Else, Canvas |
Inspector-Steuerungen
Audio hochladen
Klicken Sie, um eine Audiodatei von Ihrem Computer hochzuladen. Unterstutzte Formate: MP3, WAV, WEBM, OGG, M4A. Die Datei wird in den Cloud-Speicher hochgeladen und eine Wellenform-Visualisierung erscheint im Inspector.
Mikrofon aufnehmen
Nehmen Sie Audio direkt uber das Mikrofon Ihres Browsers auf. Klicken Sie auf die Schaltflache, gewahren Sie Mikrofonberechtigungen, wenn Sie dazu aufgefordert werden, sprechen Sie, und klicken Sie dann auf Stop, wenn Sie fertig sind. Die Aufnahme wird automatisch gespeichert.
Audio-Wiedergabe
Eine Wellenform-Visualisierung mit Play/Pause-Steuerung. Uberprufen Sie Ihr Audio, bevor Sie es mit anderen Knoten verbinden.
Audio loschen
Entfernen Sie das aktuelle Audio und beginnen Sie von vorn. Klicken Sie auf die Loschen-Schaltflache, um das hochgeladene oder aufgenommene Audio zu entfernen.
Unterstutzte Formate
| Format | Erweiterung | Hinweise |
|---|---|---|
| MP3 | .mp3 | Am weitesten verbreitet, gute Kompression |
| WAV | .wav | Unkomprimiert, hochste Qualitat |
| WebM | .webm | Web-natives Format |
| OGG | .ogg | Open-Source-Format |
| M4A | .m4a | Apple-Format, gute Qualitat |
Verwendung
- Fugen Sie einen Audio-Knoten hinzu, indem Sie mit der rechten Maustaste auf die Leinwand klicken und „Audio-Knoten” aus dem Kontextmenu wahlen, oder indem Sie ihn aus der Seitenleiste ziehen.
- Laden Sie eine Audiodatei hoch oder nehmen Sie uber Ihr Mikrofon auf mit den Inspector-Steuerungen.
- Vorschau des Audios uber den Wellenform-Player, um zu uberprufen, ob es korrekt aufgenommen wurde.
- Verbinden Sie den Ausgang mit einem Text-Knoten fur Transkription oder Analyse, oder mit einem AI Voice-Knoten fur Stimmklonen.
- Schreiben Sie einen Prompt im verbundenen Text-Knoten, der beschreibt, was Sie mochten (z. B. „Transkribiere dieses Audio” oder „Fasse die wichtigsten Punkte zusammen”).
- Generieren — die KI hort das Audio und antwortet basierend auf Ihrem Text-Prompt.
Workflow-Beispiele
Meeting-Zusammenfassung
Audio-Knoten (Meeting-Aufnahme hochladen) verbunden mit einem Text-Knoten mit dem Prompt „Fasse die wichtigsten Punkte und Aufgaben aus diesem Meeting zusammen.” Die KI hort die gesamte Aufnahme und erstellt eine strukturierte Zusammenfassung mit Aufgaben.
Sprache-zu-Video-Pipeline
Audio-Knoten (Narration aufnehmen) verbunden mit einem Text-Knoten mit dem Prompt „Schreibe eine visuelle Szenenbeschreibung basierend auf dieser Narration.” Die Ausgabe des Text-Knotens verbindet sich dann mit einem Szenen-Knoten, der ein zur Narration passendes Video generiert.
Referenz fur Stimmklonen
Audio-Knoten (Stimmprobe hochladen) verbunden mit einem AI Voice-Knoten. Der AI Voice-Knoten verwendet das Audio als Stimmreferenz fur das Klonen — jeder Text, der an den AI Voice-Knoten gesendet wird, wird in der gleichen Stimme wie die Probe gesprochen.
Tipps und Best Practices
- Fur Transkription halten Sie den Prompt einfach: „Transkribiere dieses Audio Wort fur Wort.”
- Fur Analyse seien Sie spezifisch: „Liste die Hauptargumente in diesem Podcast-Segment auf” oder „Identifiziere die Sprecher und fasse die Beitrage jeder Person zusammen.”
- Aufnahmequalitat ist wichtig — verwenden Sie eine ruhige Umgebung, sprechen Sie deutlich und minimieren Sie Hintergrundgerausche fur beste Ergebnisse.
- Fur Stimmklonen mit AI Voice-Knoten stellen Sie 10-30 Sekunden saubere Sprache bereit. Vermeiden Sie Hintergrundgerausche, Musik oder mehrere Sprecher in der Probe.
- Audiodateien sollten unter 25MB sein fur eine zuverlassige Verarbeitung.
- Die KI verarbeitet das gesamte Audio — es ist nicht notig, es vor dem Hochladen prazise zu schneiden.
Fehlerbehebung
Mikrofon funktioniert nicht
Uberprufen Sie die Browser-Berechtigungen unter Einstellungen, dann Datenschutz, dann Mikrofon. Stellen Sie sicher, dass Sie der Website Mikrofonzugriff gewahrt haben. Versuchen Sie, die Seite nach Erteilung der Berechtigungen neu zu laden.
Hochladen schlagt fehl
Uberprufen Sie, ob das Dateiformat unterstutzt wird (MP3, WAV, WEBM, OGG, M4A). Prufen Sie, ob die Dateigrosse unter 25MB liegt. Versuchen Sie, die Datei in MP3 zu konvertieren, wenn das Format nicht erkannt wird.
Transkription ungenau
Audioqualitat ist der Hauptfaktor. Hintergrundgerausche, mehrere sich uberlappende Sprecher oder geringe Lautstarke verursachen Probleme. Nehmen Sie in einer ruhigen Umgebung erneut auf oder verwenden Sie eine Audiodatei hoherer Qualitat.
Keine Audio-Wiedergabe
Versuchen Sie einen anderen Browser (Chrome wird empfohlen). Einige Audioformate werden moglicherweise nicht nativ in allen Browsern wiedergegeben. Eine Konvertierung in MP3 behebt normalerweise Wiedergabeprobleme.
Siehe auch
- Text-Knoten — Audio-Inhalte analysieren oder transkribieren
- AI Voice-Knoten — Audio als Stimmklonen-Referenz verwenden
- Szenen — Videos aus audiogesteuerten Workflows erstellen