Ich versuche, eine Audiodatei in eine FFMPEG-Wellenform zu konvertieren, sie in HyperGAN zu trainieren und eine Bilddatei zu erzeugen, die in eine Audiodatei konvertiert werden kann. Was ich frage, ist, ob es eine Möglichkeit gibt, ein Wellenformbild ohne Qualitätsverlust wieder in eine Audiodatei zu konvertieren (im Grunde wäre es der gleiche Hash, wenn Sie das Original und das konvertierte hashen würden) und ob FFMPEG das richtige Tool ist. Derzeit habe ich ein Batch-Skript, um alle meine Audiodateien zu durchsuchen und sie in Bilder zu konvertieren (ffmpeg.exe -i %1 -lavfi showwavespic=s=1024x800:colors=0971CE %1.png), aber ich kann sie nicht konvertieren zurück zu Audiodateien, was den Zweck dessen, was ich tue, zunichte macht.
BEARBEITEN: FFMPEG konvertiert eine 5-MB-Audiodatei in ein 32-KB-Bild, daher glaube ich nicht, dass es zurückkonvertiert wird. Kann man es irgendwie detaillierter machen?
FFmpeg kann das nicht.
Sogar theoretisch scheint die Methode ungesund zu sein (kein Wortspiel beabsichtigt). Audios werden normalerweise mit 40K+ Hz pro Sekunde abgetastet. Die maximale Bildgröße in ffmpeg beträgt 65 KB. Selbst bei dieser Größe kann man also kaum 1,5 Sekunden Audio bei voller Abtastauflösung darstellen. Sobald Sie tiefer gehen und sich auf die Interpolation verlassen, wird Ihre Ausgabequalität schlechter, wenn Ihre Rekonstruktion gröber wird.
Siehe Spectrumsynth-Filter-Dokumentation. Sie müssen stattdessen den Showspectrum-Filter verwenden. Und auch Phasenvideo zu haben. Es ist nicht möglich, nur showspectrumpic zu verwenden, da es die Zeitauflösung drastisch verringert.
PintsizedSix40
Gyan
PintsizedSix40