Audio-Knoten

Audio-Knoten erfassen oder laden Audioinhalte fur die multimodale KI-Verarbeitung hoch. Sie verbinden Sprache mit Text — verbinden Sie einen Audio-Knoten mit einem Text-Knoten, und die KI kann den Audioinhalt transkribieren, zusammenfassen oder analysieren. Audio-Knoten dienen auch als Stimmreferenzen fur AI Voice-Knoten und ermoglichen so das Stimmklonen.

Was ist ein Audio-Knoten?

Ein Audio-Knoten ist die Spracheingabeschicht Ihres Workflows. Er ermoglicht es Ihnen, eine Audiodatei hochzuladen oder direkt uber Ihr Mikrofon aufzunehmen und dieses Audio dann an nachfolgende Knoten zur Verarbeitung weiterzuleiten. Verbinden Sie ihn mit einem Text-Knoten, und die KI wird das Audio „horen” — Sprache transkribieren, Meetings zusammenfassen oder gesprochene Inhalte analysieren. Verbinden Sie ihn mit einem AI Voice-Knoten, und er wird zur Stimmreferenz fur das Klonen.

Eingange und Ausgange

PortRichtungTypBeschreibung
(keiner)EingangKeine Eingangsverbindungen — Audio wird direkt hochgeladen oder aufgenommen
OutputAusgangAudioVerbindet sich mit Text-Knoten (Transkription/Analyse), AI Voice-Knoten (Stimmklonen-Referenz), AI If/Else, Canvas

Inspector-Steuerungen

Audio hochladen

Klicken Sie, um eine Audiodatei von Ihrem Computer hochzuladen. Unterstutzte Formate: MP3, WAV, WEBM, OGG, M4A. Die Datei wird in den Cloud-Speicher hochgeladen und eine Wellenform-Visualisierung erscheint im Inspector.

Mikrofon aufnehmen

Nehmen Sie Audio direkt uber das Mikrofon Ihres Browsers auf. Klicken Sie auf die Schaltflache, gewahren Sie Mikrofonberechtigungen, wenn Sie dazu aufgefordert werden, sprechen Sie, und klicken Sie dann auf Stop, wenn Sie fertig sind. Die Aufnahme wird automatisch gespeichert.

Audio-Wiedergabe

Eine Wellenform-Visualisierung mit Play/Pause-Steuerung. Uberprufen Sie Ihr Audio, bevor Sie es mit anderen Knoten verbinden.

Audio loschen

Entfernen Sie das aktuelle Audio und beginnen Sie von vorn. Klicken Sie auf die Loschen-Schaltflache, um das hochgeladene oder aufgenommene Audio zu entfernen.

Unterstutzte Formate

FormatErweiterungHinweise
MP3.mp3Am weitesten verbreitet, gute Kompression
WAV.wavUnkomprimiert, hochste Qualitat
WebM.webmWeb-natives Format
OGG.oggOpen-Source-Format
M4A.m4aApple-Format, gute Qualitat

Verwendung

  1. Fugen Sie einen Audio-Knoten hinzu, indem Sie mit der rechten Maustaste auf die Leinwand klicken und „Audio-Knoten” aus dem Kontextmenu wahlen, oder indem Sie ihn aus der Seitenleiste ziehen.
  2. Laden Sie eine Audiodatei hoch oder nehmen Sie uber Ihr Mikrofon auf mit den Inspector-Steuerungen.
  3. Vorschau des Audios uber den Wellenform-Player, um zu uberprufen, ob es korrekt aufgenommen wurde.
  4. Verbinden Sie den Ausgang mit einem Text-Knoten fur Transkription oder Analyse, oder mit einem AI Voice-Knoten fur Stimmklonen.
  5. Schreiben Sie einen Prompt im verbundenen Text-Knoten, der beschreibt, was Sie mochten (z. B. „Transkribiere dieses Audio” oder „Fasse die wichtigsten Punkte zusammen”).
  6. Generieren — die KI hort das Audio und antwortet basierend auf Ihrem Text-Prompt.

Workflow-Beispiele

Meeting-Zusammenfassung

Audio-Knoten (Meeting-Aufnahme hochladen) verbunden mit einem Text-Knoten mit dem Prompt „Fasse die wichtigsten Punkte und Aufgaben aus diesem Meeting zusammen.” Die KI hort die gesamte Aufnahme und erstellt eine strukturierte Zusammenfassung mit Aufgaben.

Sprache-zu-Video-Pipeline

Audio-Knoten (Narration aufnehmen) verbunden mit einem Text-Knoten mit dem Prompt „Schreibe eine visuelle Szenenbeschreibung basierend auf dieser Narration.” Die Ausgabe des Text-Knotens verbindet sich dann mit einem Szenen-Knoten, der ein zur Narration passendes Video generiert.

Referenz fur Stimmklonen

Audio-Knoten (Stimmprobe hochladen) verbunden mit einem AI Voice-Knoten. Der AI Voice-Knoten verwendet das Audio als Stimmreferenz fur das Klonen — jeder Text, der an den AI Voice-Knoten gesendet wird, wird in der gleichen Stimme wie die Probe gesprochen.

Tipps und Best Practices

  • Fur Transkription halten Sie den Prompt einfach: „Transkribiere dieses Audio Wort fur Wort.”
  • Fur Analyse seien Sie spezifisch: „Liste die Hauptargumente in diesem Podcast-Segment auf” oder „Identifiziere die Sprecher und fasse die Beitrage jeder Person zusammen.”
  • Aufnahmequalitat ist wichtig — verwenden Sie eine ruhige Umgebung, sprechen Sie deutlich und minimieren Sie Hintergrundgerausche fur beste Ergebnisse.
  • Fur Stimmklonen mit AI Voice-Knoten stellen Sie 10-30 Sekunden saubere Sprache bereit. Vermeiden Sie Hintergrundgerausche, Musik oder mehrere Sprecher in der Probe.
  • Audiodateien sollten unter 25MB sein fur eine zuverlassige Verarbeitung.
  • Die KI verarbeitet das gesamte Audio — es ist nicht notig, es vor dem Hochladen prazise zu schneiden.

Fehlerbehebung

Mikrofon funktioniert nicht

Uberprufen Sie die Browser-Berechtigungen unter Einstellungen, dann Datenschutz, dann Mikrofon. Stellen Sie sicher, dass Sie der Website Mikrofonzugriff gewahrt haben. Versuchen Sie, die Seite nach Erteilung der Berechtigungen neu zu laden.

Hochladen schlagt fehl

Uberprufen Sie, ob das Dateiformat unterstutzt wird (MP3, WAV, WEBM, OGG, M4A). Prufen Sie, ob die Dateigrosse unter 25MB liegt. Versuchen Sie, die Datei in MP3 zu konvertieren, wenn das Format nicht erkannt wird.

Transkription ungenau

Audioqualitat ist der Hauptfaktor. Hintergrundgerausche, mehrere sich uberlappende Sprecher oder geringe Lautstarke verursachen Probleme. Nehmen Sie in einer ruhigen Umgebung erneut auf oder verwenden Sie eine Audiodatei hoherer Qualitat.

Keine Audio-Wiedergabe

Versuchen Sie einen anderen Browser (Chrome wird empfohlen). Einige Audioformate werden moglicherweise nicht nativ in allen Browsern wiedergegeben. Eine Konvertierung in MP3 behebt normalerweise Wiedergabeprobleme.

Siehe auch

  • Text-Knoten — Audio-Inhalte analysieren oder transkribieren
  • AI Voice-Knoten — Audio als Stimmklonen-Referenz verwenden
  • Szenen — Videos aus audiogesteuerten Workflows erstellen