Automatische Korrektur einer leicht abweichenden Aufnahme?

Angenommen, ich habe eine Aufzeichnung eines Live-Konzerts einer bekannten Band. Wir können davon ausgehen, dass das Konzert mit gestimmten Instrumenten in Standardstimmung gespielt wurde. Das war in den 1990er Jahren, also wurde das Konzert auf einer analogen Kassette (oder einem DAT-Master) aufgezeichnet und dann über Tape Trading an Sammler verteilt. Das bedeutet, dass bis zu dem Zeitpunkt, an dem eine Aufnahme mich erreicht, sie mehrere Generationen lang von einem Kassettendeck auf ein anderes kopiert wurde (das Überspielen auf einem Doppeldecker war normalerweise verpönt) und es keine Garantie dafür gibt, dass beide Kassettendecks liefen genau die gleiche Geschwindigkeit beim Kopieren - ganz im Gegenteil war das oft der Fall - und der Fehler konnte sich mit jeder Generation häufen. Dies bedeutet, dass das Band in meinen Händen mit ziemlicher Sicherheit um einen bestimmten Grad von der Tonhöhe abweicht. Nachdem ich das Band nun in eine digitale Datei konvertiert habe, möchte ich den Fehler beheben.

Meine typische Methode, dies zu tun, besteht darin, einen Song zu finden, den ich spielen kann, ein gestimmtes Instrument zu nehmen und mitzuspielen und die Wiedergabegeschwindigkeit zu optimieren, bis der Song zu meinem Instrument passt. Wenn ich das richtige Geschwindigkeitsänderungsverhältnis gefunden habe, wende ich es auf die Audiodatei an und speichere das Ergebnis.

Das ist großartig, um ein oder zwei Aufnahmen zu reparieren, nicht so sehr, wenn ich hundert davon habe.

Ich denke, es ist theoretisch möglich, dass ein Algorithmus eine Aufnahme analysiert und feststellt, ob sie von der Tonhöhe abweicht, vorausgesetzt, es wird eine Standardstimmung vorausgesetzt. Angenommen, meine Aufnahme ist um 0,2 Halbtöne zu scharf, der Algorithmus sollte in der Lage sein, eine Korrektur von -1,2/-0,2/+0,8/+1,8 vorzuschlagen (offensichtlich kann er nicht erraten, welche Richtung richtig ist oder wie weit wir von der ursprünglichen Tonhöhe entfernt sind ). Das Googeln nach Software zur Tonhöhenkorrektur führt mich unweigerlich zu Autokorrektur-Plugins für Gesangsspuren, was wirklich nicht das ist, wonach ich suche.

Unter Verwendung meines ziemlich starken C++, aber sehr begrenzten Verständnisses der Mathematik der digitalen Signalverarbeitung, versuchte ich, ein Programm zu schreiben, das die Ausgabe von analysiert (das sox song.wav -n stat -freqeine DFT auf dem Audio durchführt und die Ergebnisse ausgibt), die dominanten Frequenzen findet und überprüft, ob sie die Frequenzen für Standardnoten anpassen oder in einem festen Verhältnis davon abweichen, aber ich konnte keine aussagekräftigen Ergebnisse extrahieren - vielleicht, weil die Ausgabe von soxziemlich grob ist. Hier frage ich also, ob es ein Tool gibt, das einen solchen Algorithmus bereits implementiert, oder ob es Tipps gibt, dies selbst zu tun (muss ich die DFT mit einer Softwarebibliothek durchführen oder reichen die Daten aus? usw.), oder ob dies ein soxist viel komplexeres Problem, als ich mir vorstelle, nicht lösbar mit einfachen Heuristiken.

Wenn Sie immer noch alle separaten Tracks ungemischt hätten, gäbe es eine Chance, aber bei einer ganzen Aufnahme, insbesondere einer, die mehrere Generationen umfasst, ist das eine große Frage.
Warum willst du? Verschiedene Interpreten und verschiedene Genres usw. können ohnehin leicht unterschiedliche Originaltonhöhen wählen. Was versprechen Sie sich davon? Sie sind viel besser dran, wenn Sie entweder die Stimmung Ihres Instruments anpassen oder Tonhöhenverschiebungssoftware wie Audacity digitalisieren und verwenden.

Antworten (1)

Dies ist keine vollständige Antwort. Es ist vielleicht eine Frame-Herausforderung, aber es ist auch nur ein „Gesprächsthema“, das schließlich zu einer Antwort auf eine noch nicht geäußerte Frage führen kann … haben Sie Geduld …

Sogar bevor wir dazu kommen, den Pitch auf einer digitalen Kopie zu fixieren, müsste ich zuerst einige Probleme ansprechen … Generationsverlust ist absolut nicht auf Geschwindigkeit beschränkt; Der Azimutverlust wird massiv sein, ebenso wie die multiplizierten und geteilten EQ-'Änderungen'.

Wenn Sie also nur eine Multi-Gen-Kopie haben, sollten Sie als Erstes einen guten Kassettenrekorder für die Sache „opfern“.

Sie benötigen ein Kassettendeck, von dem Sie die Vorderseite abschneiden können, damit Sie die Azimutschraube während der Wiedergabe erreichen können. Sie kaufen dann einen massearmen Tweaker, um dies zu tun. Mit einem Metallschraubendreher geht das nicht.
Passen Sie den Azimut nach Gehör an, während Sie die Kassette abspielen.
Dies ist keine perfekte Lösung - aber wir sind an diesem Punkt so weit über perfekte Lösungen hinaus.

Der nächste Schritt besteht darin, das Gehäuse vom Kassettendeck zu nehmen, den Motor zu finden und den Widerstand über den darin enthaltenen "Geschwindigkeitspotentiometer" zu messen - diese haben immer ein winziges manuelles Poti zum Einstellen der Geschwindigkeit, oft direkt im Motorgehäuse selbst . Es handelt sich um biegsame Metallklammern, sodass die eigentliche Demontage nicht viel Technik erfordert.
Sie können dies mit nur einem Multimeter, Schraubendreher und Lötkolben tun.

Messen Sie den Widerstand über den gesamten Topf, dann bei der aktuellen Geschwindigkeit. Schätzen Sie Werte, die Ihnen irgendwo innerhalb dieses Bereichs eine bessere Streuung geben. Sie können den Pot und
diese Streuung puffern.
Sie können mit dem ursprünglichen Poti herumspielen, um zu sehen, welche Änderung einen Ton oder zwei erzeugt ... berücksichtigen Sie dies. Kaufen Sie einen neuen 20-Ω-Pot mit hoher Spezifikation und Widerstände von 60 Ω und 120 Ω [Sie müssen möglicherweise in Reihe schalten, um Ihre endgültigen Werte zu erreichen].

Ersetzen Sie Ihren Topf durch den neuen - attraktiv verdrahtet mit der Rückwand, und puffern Sie ihn dann mit Ihren Make-up-Gewinn.
Sie haben jetzt ungefähr ein oder zwei Töne mit hohem Vertrauen und besserer Stabilität.

Spielen Sie das Band ab, fixieren Sie den Azimut und optimieren Sie die Geschwindigkeit, bevor Sie es überhaupt aufnehmen.

Wenn Sie jetzt denken, das ist völlig verrückt, ich habe ein 'Blue Peter'-Kassettendeck genau wie dieses für ein sehr, sehr ähnliches Projekt.
Wusstest du auch, dass die Vari-Speed ​​der Buggers etwa die erste Stunde konstanter Wiedergabe dauert? Nun, jetzt tust du es :P Beginne jede Session, indem du alle beiden Seiten einer 60-Minuten-„Abfall“-Kassette abspielst, bis sie sich beruhigt hat… dann säubere die Köpfe [erneut].

Ich habe dafür ein NAD und ein Nakamichi geopfert. Der Nakamichi war insgesamt eine bessere Maschine, aber der NAD verhielt sich nach den Mods besser.

oh… & schalte Dolby aus. Sie sind so weit davon entfernt, der Genauigkeit zu helfen, dass Sie einfach das gesamte High-End, das Sie bekommen können, von der Quelle nehmen sollten.

Übrigens, es gibt eine Software, die diese Aufgabe erheblich vereinfacht … sie kostet 4000 US-Dollar … ja. Celemony [von Melodyne] Capstan

Alternativ… überprüfen Sie, ob die Plattenfirma die Bootlegs nicht nur offiziell veröffentlicht hat – so viele von ihnen haben es jetzt getan; Sie meinen, sie könnten es genauso gut offiziell machen und ihren Anteil nehmen.
Es wäre ziemlich traurig, sich all diese Mühe zu machen und dann zu entdecken, dass es bereits auf iTunes ist, in weitaus besserer Qualität. [ref: die meisten alten Bowie-Bootlegs aus den 1970er Jahren]

Eigentlich haben Sie mir eine vollständige und ziemlich interessante Antwort gegeben. Das heißt, wenn meine Frage gewesen wäre "wie optimiere ich ein Kassettendeck für die bestmöglichen Wiedergabeergebnisse". Das Ändern des Azimuts des Tonkopfs würde bestenfalls einen schlecht abgestimmten Tonkopf der neuesten Generation kompensieren (dh das Deck, mit dem ein bestimmtes Band aufgenommen wurde). Dadurch könnte ein Band besser klingen, aber meine Bänder stammen aus vielen Quellen, sodass der Vorgang für jedes Band wiederholt werden müsste. Da will ich wirklich nicht hin. Und die Geschwindigkeit meines Decks anzupassen, war genau das, was ich nicht tun wollte. Celemony Capstan ist interessant, danke.
Was Sie versuchen, ist wirklich einer dieser "Sie wollen nicht von hier aus anfangen"-Jobs. Das Festlegen von Azimut und Grundgeschwindigkeit ist bei weitem die beste Lösung. Izotope hat ein Azimutmodul , aber Software kann keine Wunder vollbringen. Das menschliche Ohr ist das beste Erste-Vermutungs-Tool für solche Aufgaben. Das letzte Mal, dass ich diese Aufgabe gemacht habe, war vor ein paar Jahren – ich hatte fast 40 Kassetten zu erledigen, also fühle ich Ihren Schmerz. Ich hatte auch 30 ¼"-Masterbänder, um sie zuerst zu backen und dann auf die gleiche Weise zu retten. Insgesamt dauerte es 6 Monate.
Ich habe mir allerdings ein paar wirklich hochwertige Geräte von der BBC geschnappt, um das zu tun, einen Revox und einige großartige Vorverstärker. ;)