Sie wissen, wie Youtube „automatische“ Untertitel basierend auf dem Ton eines Videos erstellt? (Ton-zu-Text)
Ich habe eine MP4-Datei auf meinem Computer. Wie erstelle ich kostenlos „automatische“ Untertitel basierend auf dem Ton des Videos? (Sound-to-Text) Ich möchte die Untertitel nicht von Hand eintippen, ich möchte, dass Sound-to-Text sie automatisch erstellt.
Ich sehe nicht, wie diese Seite für automatische Untertitel hilfreich ist.
Als letzte Anmerkung verwende ich einen Mac, Version 10.9.
Dies ist einer der Träume vieler Menschen und derzeit ist eine perfekte Lösung nicht öffentlich verfügbar . Es kann jedoch immer noch mit ein wenig unordentlicher Arbeit erledigt werden. Eine Methode, die funktioniert, wenn a) das Video für ein paar Minuten öffentlich sein darf und b) die automatische Untertitelung von Youtube funktioniert, besteht darin, auf Youtube hochzuladen , Youtube zur automatischen Untertitelung zu bringen und dann die KeepSubs -Web-App zum Herunterladen zu verwenden Untertitel, dann Video löschen.
Dann ist es eine einfache Sache, den Untertitel-Editor mit den Funktionen zu finden, die Sie benötigen/wünschen. AegisSub ist ein qualitativ hochwertiger Untertiteleditor/-applikator, der für Ihre Anforderungen funktionieren sollte.
Dieses Python 2-Skript verwendet die Google Web Speech API und FFmpeg, um Untertitel zu generieren: https://github.com/agermanidis/autosub
Es gibt auch eine andere Option, aber es ist noch mehr Arbeit für Sie.
Das verwendet die Sprach->Text-Engine und ein 3,5-mm-Audiokabel mit zwei Steckern, um Ihren Lautsprecherausgang zu Ihrem Mikrofoneingang zu leiten. Die Qualität basiert auf der Qualität der Text-Sprach-Engine. Die beste Engine, die ich kenne, die auf Macs funktioniert, ist Dragon Dictate (ich habe die Windows-Version - Dragon Naturally Speaking - anstelle der Mac-Version verwendet).
Dann ist es eine einfache Sache, den Untertitel-Editor mit den Funktionen zu finden, die Sie benötigen/wünschen. AegisSub ist ein qualitativ hochwertiger Untertiteleditor/-applikator, der für Ihre Anforderungen funktionieren sollte.
Dann kommen wieder mehr Werke; Sie müssen das Timing einstellen (über den Untertitel-Editor) und auf Fehler überprüfen.
Zusammenfassend ist es eine hässliche Menge an Arbeit und nicht sehr automatisiert, aber etwas besser als die manuelle Eingabe normalerweise - wenn die Audioqualität schlecht ist, können Sie möglicherweise weniger Zeit damit verbringen, alles manuell zu erledigen, anstatt schrecklich ungenaue Sprach-> Text-Engine-Ergebnisse zu bearbeiten .
Gaupol 0.19.2 (Python) verwendet GStreamer 0.10 (mit Plugin PocketSphinx 0.7), um Sprache zu erkennen und automatische Timings zu erstellen. Neuere Versionen habe ich nicht getestet.
https://wiki.gnome.org/Apps/Gaupol/SpeechRecognition
Ich verwende Linux, aber vielleicht ist es möglich, sie auch unter OS X auszuführen.
unoder
Mein Name
aparente001