Bedeutung der Phase bei der Fourier-Transformation des Audiosignals

Ich betrachte die Fourier-Transformation (eigentlich eine gleitende DFT), um die Frequenzkomponenten eines Tons im Laufe der Zeit (visuell und intuitiv) zu analysieren. Aber die DFT erzeugt komplexe Zahlen, und ich bin mir nicht sicher, wie oder ob ich sie visualisieren soll.

Soll ich einfach die Größe des Ergebnisses grafisch darstellen?

Ich habe versucht, das Argument / die Phase der resultierenden Zahl den Farbton des Diagramms beeinflussen zu lassen, aber es sieht einfach mehr oder weniger aus wie eine Regenbogen-Ölpest. Es scheint mir nicht zu helfen, irgendetwas über den Klang zu verstehen.

Oder würde das Weglassen des Imaginärteils genauso viel aussagen?

Beachten Sie für zukünftige Referenzzwecke, dass dsp.stackexchange.com jetzt nicht mehr in der Beta-Phase ist und wahrscheinlich besser für diese Art von Fragen geeignet ist.

Antworten (2)

Die zwei Zahlen, die Sie pro Frequenz erhalten, sind der Real- und Imaginärteil dieser Frequenzkomponente im Originalsignal. Diese beiden zusammen werden manchmal als Phaser bezeichnet .

Sie können dies visualisieren, indem Sie sie in einem Diagramm darstellen, wobei die reale Komponente die X-Achse und die imaginäre Komponente die Y-Achse ist. Sie können die beiden Komponenten addieren und das Ergebnis als Vektor zeichnen, beginnend am Ursprung. Stellen Sie sich nun vor, dass sich der Vektor gegen den Uhrzeigersinn dreht und am Ursprung bei der bestimmten Frequenz des Samples schwenkt. Die Projektion auf die reale Achse wäre eine Sinusfunktion über die Zeit, was der Beitrag dieser Frequenz in Ihrem ursprünglichen Sample ist. Die bestimmte Position, die Ihr Algorithmus für den sich drehenden Vektor angegeben hat, war genau dort, wo das Signal zum Zeitpunkt = 0 war.

Daraus können Sie hoffentlich erkennen, dass das, was Sie wollen, die Größe dieses sich drehenden Vektors ist. Um das zu bekommen, quadrierst du die beiden Komponenten, addierst sie und ziehst dann die Quadratwurzel aus dem Ergebnis, genau wie PaulR sagte. Seine Antwort ist richtig, aber ich habe versucht, Ihnen ein Gefühl dafür zu vermitteln, woher sie kam.

Ja, verwenden Sie einfach die Größe des FFT-Ausgangs ( R e 2 + ich m 2 ) - dies gibt Ihnen eine Schätzung des Leistungsspektrums . Phaseninformationen sind in diesem Zusammenhang im Allgemeinen von geringem Interesse.