Wie können wir die breiten Merkmale dieses Gitarren-Spektrogramms erklären?

Dies ist inspiriert von dieser music.SE- Frage, auf die ich versucht habe, eine Antwort zu geben , aber je mehr ich darüber nachdenke, bin ich mir immer noch ziemlich unsicher.

Geben Sie hier die Bildbeschreibung ein

Als Physiker versuchen wir oft, Merkmale experimenteller Daten zu beschreiben, indem wir minimale Modelle verwenden, um die wesentlichen Details des Systems zu erfassen. Ich hoffe, einen Einblick zu bekommen, welche minimalen physikalischen Mechanismen verwendet werden können, um die grundlegenden Merkmale in dieser Handlung zu erklären. Der Autor dieser Frage sagt, dass sie die E-Saite der Gitarre (82 Hz) gezupft haben, und im Spektrogramm sehen wir Spitzen bei allen ganzzahligen Vielfachen dieser Frequenz. Hier ist, was ich glaube, erklären zu können:

  1. Die rote Linie zeigt eine heuristische Anpassung für die abnehmenden Spitzenamplituden F 4 , was Sinn macht: Wie in dieser Antwort von Physics.SE gezeigt, wird erwartet, dass die Spitzenamplituden der Fourier-Komponenten abnehmen F 2 , also geht die Leistung (Amplitude im Quadrat) als F 4 . Dies wird durch die rote Linie demonstriert und ergibt eine vernünftige Anpassung an die Amplituden für die dritte und höhere Harmonische.

  2. Die Verbreiterung von Spektrallinien tritt häufig aufgrund von nichtlinearen Streueffekten auf, z. B. wenn berücksichtigt wird, dass die Saitenspannung eine Funktion von Amplitude und Frequenz ist.

  3. Die kleinen Spitzen, die zwischen den größeren Spitzen erscheinen, sind wahrscheinlich Resonanzen der anderen Saiten der Gitarre, zum Beispiel scheint direkt nach der zweiten Harmonischen die erste Spitze die G-Saite (196 Hz) zu sein.

Funktionen, die ich nicht verstehe

  1. Sollten diese Peaks lorentzsch oder gaußsch sein? Bei dem Versuch, ein ähnliches Spielzeugdiagramm zu erstellen, stellte ich fest, dass ich sowohl einen Gaußschen als auch einen Lorentzschen Teil jedes Peaks benötigte, um ein ungefähr ähnlich aussehendes Diagramm zu erhalten. Welche Physik würde zu diesen beiden unterschiedlichen Kanälen beitragen? Die Spitzen scheinen Gaussian zu sein (die Lorentzians sind zu scharf, während diese nahe der Spitze abgerundet sind), während der Hintergrund eine Art Lorentzian-Schwanz sein könnte, aber jetzt denke ich, dass es vielleicht eine andere Erklärung hat.

  2. Wie erklären wir das „breite Kontinuum“ bei niedrigen Frequenzen? Warum scheint dieses breite Kontinuum zu verfallen? 1 / F 2 (siehe die schwarze Linie)? Mein Spielzeugmodell mit Lorentz-Schwänzen reproduziert dieses Verhalten nicht.

  3. Zuletzt die ursprüngliche Frage aus dem music.SE-Post, warum werden die erste und zweite Harmonische in der Intensität reduziert? In meiner Antwort auf diese Frage finden Sie meine Spekulationen. Jetzt, nachdem ich eine Weile nachgedacht habe, glaube ich, dass ich am meisten von der Idee überzeugt bin, dass die Saite außermittig gezupft wurde, zusammen mit möglichen Resonanzen, die einige der höheren Spitzen, zB die 2. und 3., verstärken könnten.

Als Beispiel dafür, was ich mit Lorentzian und Gaußian meine, sieht es so aus:

Geben Sie hier die Bildbeschreibung ein

Links zeige ich sowohl das Guassische als auch das Lorentzsche Profil, während ich rechts ihre Summe zeige. Es ist ein bisschen schwer zu sehen, aber die Lorenzianer sind in der Nähe des Maximums scharf spitz, während die Guassianer einen schönen runden Peak liefern, wie wir im Spektrogramm sehen. Ganz klar die 1 / F 2 Das Verhalten des Hintergrunds mit niedriger Amplitude wird nicht durch die Summe der Lorentz-Schwänze (schwarze Linie) reproduziert.

Bonuspunkte, wenn jemand eine nette Quasi-Teilchen-Analogie hat.

Antworten (1)

Ihre Interpretationen machen alle zwei grundlegende Fehler. Sie gehen davon aus, dass die aufgezeichneten Daten mathematisch korrekt waren und der verwendete FFT-Algorithmus irgendwie "exakte" Ergebnisse liefert.

Ein Teil des "breiten Spektrums" bei niedrigen Frequenzen ist höchstwahrscheinlich nur Umgebungshintergrundrauschen. Das Signal-Rausch-Verhältnis im Vergleich zur Spitzenamplitude liegt bei etwa 40 dB, was so gut ist, wie Sie es wahrscheinlich erreichen werden, es sei denn, Sie machen die Aufnahme mit professioneller Ausrüstung und/oder in einem schalltoten Raum.

Die A/D-Wandlung führt auch Quantisierungsrauschen ein. Nur weil ein Signal in "CD-Qualität" aus 16-Bit-Daten besteht, bedeutet das nicht, dass alle 16 Bits für jedes Sample genau sind.

Der FFT-Algorithmus verwendet ein Datenfenster endlicher Größe (wahrscheinlich mit der Anzahl der Punkte eine Potenz von 2 wie 8192) und verwendet eine "Fensterfunktion", um den Fehler zu beseitigen, der durch die Tatsache verursacht wird, dass die Frequenzen in den aufgezeichneten Daten sind nicht exakte Vielfache der Länge des Datenfensters. Dadurch wird die Breite der FFT-Spitzen verschmiert und die Lücken zwischen den Spitzen mit Nicht-Null-Daten gefüllt, selbst wenn das Signal selbst aus "perfekten" Sinuswellen synthetisiert wurde.

Der Klang einer Gitarre klingt mit der Zeit ab, aber der FFT-Algorithmus geht davon aus, dass dies nicht der Fall ist, und das Sample endlicher Länge kann unbegrenzt wiederholt werden. Daher ist das Erstellen einer FFT ein Kompromiss: Wenn das Datenfenster kurz ist, ist die Zerfallsmenge gering, aber die Auflösung der FFT ist niedrig, und wenn das Datenfenster lang ist, ist die FFT-Auflösung hoch, aber die zerfallenden Daten enthalten nicht "scharfe" Spektrallinien wegen der abklingenden Signalamplitude.

Es gibt wahrscheinlich noch ein paar weitere ähnliche Faktoren, die ich vergessen habe zu erwähnen, aber da wir nicht genau wissen, wie der Ton aufgenommen wurde, ist es nicht möglich, über allgemeine Ideen hinauszugehen und in spezifische Details zu gehen, um alles zu erklären, was auf der Handlung gezeigt wird.

Es ist sinnvoll, eine physikalische Erklärung für die 4-dB/Dekade-Abklingrate zu geben. Wenn Sie die ursprünglich deformierte Form der Saite als Dreieck mit der Spitzenverschiebung am Zupfpunkt betrachten, können Sie dies erklären, indem Sie die FFT der dreieckig verschobenen Form betrachten.

Der Abfall des „Rauschens“ um 2 dB/Dekade ist wahrscheinlich nur ein Artefakt des FFT-Algorithmus. Bei einer bestimmten Wahl der Datenfensterlänge und des Fensteralgorithmus befinden sich die Artefakte auf beiden Seiten einer Spitze auf einem konstanten Pegel unterhalb der Spitze (typischerweise um 40 dB). Die Bandbreite der Artefakte um die Spitze herum ist ein festes Verhältnis der Spitzenfrequenz, aber da die Spitzenfrequenzen eine konstante Frequenzdifferenz voneinander entfernt sind, überlappen sich die Artefakte und summieren sich für höhere Frequenzen mehr als für niedrigere. Das Endergebnis ist die scheinbare "Steigung" des Rauschens, die etwa die Hälfte der Steigung der Spitzen beträgt.

Faszinierend, ich hatte das nicht bedacht, sicherlich würde eine richtige Analyse hochwertige Aufnahmegeräte, geringes Hintergrundrauschen und eine angemessene Hintergrundsubtraktion erfordern. Gibt es einen Einblick, ob wir ein Gauß-/Lorentz-Verhalten der Peaks erwarten könnten oder warum der Grundpeak signifikant reduziert zu sein scheint?
Das Dämpfungsverhältnis ist für verschiedene Modi unterschiedlich. (Wenn es keine Dämpfung gäbe, würde die Saite keinen Ton erzeugen, oder genauer gesagt, die Vibration des gesamten Gitarrenkörpers für eine Akustikgitarre!) Übrigens, wenn Sie qualitativ bessere Daten für die Frequenzspitzen (und die Dämpfung) erzeugen möchten Verhältnisse) Fourier-Analyse ist das falsche Werkzeug. Methoden, die auf Autokorrelationsfunktionen basieren, benötigen keine Fensterfunktion, können sowohl die Frequenz als auch die Dämpfung für jeden Modus messen und Dinge wie die Änderung der Modalfrequenz mit der Amplitude für ein echtes vibrierendes System verfolgen.
Für das "Gaußsche/Lorentzsche Verhalten der Peaks" müssen Sie ein Buch über praktische Signalverarbeitung und Themen wie "Systemidentifikation" in der Kontrolltheorie oder experimentelle Modalanalyse lesen - das sind ganz andere Themen als "theoretische Verwendung von Fourier-Transformationen in Physik".