Konvertieren Sie die FFMPEG-Wellenform zurück in Audio

Ich versuche, eine Audiodatei in eine FFMPEG-Wellenform zu konvertieren, sie in HyperGAN zu trainieren und eine Bilddatei zu erzeugen, die in eine Audiodatei konvertiert werden kann. Was ich frage, ist, ob es eine Möglichkeit gibt, ein Wellenformbild ohne Qualitätsverlust wieder in eine Audiodatei zu konvertieren (im Grunde wäre es der gleiche Hash, wenn Sie das Original und das konvertierte hashen würden) und ob FFMPEG das richtige Tool ist. Derzeit habe ich ein Batch-Skript, um alle meine Audiodateien zu durchsuchen und sie in Bilder zu konvertieren (ffmpeg.exe -i %1 -lavfi showwavespic=s=1024x800:colors=0971CE %1.png), aber ich kann sie nicht konvertieren zurück zu Audiodateien, was den Zweck dessen, was ich tue, zunichte macht.

BEARBEITEN: FFMPEG konvertiert eine 5-MB-Audiodatei in ein 32-KB-Bild, daher glaube ich nicht, dass es zurückkonvertiert wird. Kann man es irgendwie detaillierter machen?

Antworten (2)

FFmpeg kann das nicht.

Sogar theoretisch scheint die Methode ungesund zu sein (kein Wortspiel beabsichtigt). Audios werden normalerweise mit 40K+ Hz pro Sekunde abgetastet. Die maximale Bildgröße in ffmpeg beträgt 65 KB. Selbst bei dieser Größe kann man also kaum 1,5 Sekunden Audio bei voller Abtastauflösung darstellen. Sobald Sie tiefer gehen und sich auf die Interpolation verlassen, wird Ihre Ausgabequalität schlechter, wenn Ihre Rekonstruktion gröber wird.

Danke für die Antwort, aber kennen Sie (oder jemand anderes) ein Programm, das dies tun könnte?
Klingt so , als könnte Photosounder dazu in der Lage sein.
Photosounder könnte funktionieren, obwohl es nicht kostenlos ist und Sie es nicht automatisieren können.

Siehe Spectrumsynth-Filter-Dokumentation. Sie müssen stattdessen den Showspectrum-Filter verwenden. Und auch Phasenvideo zu haben. Es ist nicht möglich, nur showspectrumpic zu verwenden, da es die Zeitauflösung drastisch verringert.

Ich denke, das OP möchte ein Zeitbereichs-Amplitudendiagramm extern manipulieren und es wieder in Audio umwandeln.
Ah, das, ja, du hast recht. Das ist nicht einmal möglich, Sie verlieren die Auflösung auf beide Arten: Zeit- und Amplitudenbereich.