Wie kann man weibliche und männliche Stimmen per Fourier-Analyse unterscheiden?

Was macht es möglich, ohne hinzusehen, das Geschlecht des Sprechers als männlich oder weiblich zu identifizieren?

Ich meine, wenn wir die Stimme von Männern und Frauen Fourier-analysiert haben, wie unterscheiden sich die beiden Spektren, die für diese Unterscheidung in Klängen verantwortlich sind?

Ist das Thema für uns? Ich kann definitiv eine Frage zu den physikalischen Gründen für diese Unterschiede sehen, die hier zum Thema sind, aber ich bin mir nicht sicher, ob ich nur fragen soll, was der Unterschied ist. Wenn dies hier nicht zum Thema gehört, könnte es zur Signalverarbeitung migriert werden .
@DavidZaslavsky Es ist eine allgemeine physikalische Frage, die in einem Kurs über mathematische Physik auftauchte. Ich bin kein Experte, daher ist es sinnlos, dies in einem ganz separaten Stackexchange-Zweig zu fragen.
Mögliche Duplikate: physical.stackexchange.com/q/15385/2451 und Link darin.

Antworten (2)

Dies wurde ausgiebig in Linguistik und Akustik untersucht. Menschen und andere Primaten sagen das Sprechergeschlecht durch eine Kombination von Grundfrequenzen voraus F 0 ("Pitch") und Vocal-Tract-Length-Schätzungen ( v T L ), die ein Proxy für die Körpergröße sind.

Manchmal wird dafür "Formant-Dispersion" verwendet v T L . Es wird normalerweise definiert als

ich = 1 N ( F ich + 1 F ich ) N 1
Wo F ich ist der ich te Formantfrequenz und N ist die Anzahl der gemessenen Formanten. Dieses Maß ist jedoch problematisch und erfasst keine Informationen über Formanten im mittleren Bereich oder über die Positionierung von Formanten. Vgl. Männliche Stimmen signalisieren männliches Bedrohungspotential in Sammler- und Industriegesellschaften

Eine Alternative v T L Takt ist 'Formant-Position', definiert als:

ich = 1 N F ich ' N
Wo F ich ' ist der ich te Formant standardisiert über die gemessene Grundgesamtheit.

Die übliche Erkenntnis ist jedoch, dass eine Kombination aus Tonhöhe und Schätzungen der Länge des Stimmtrakts uns Informationen über das Geschlecht und die Geschlechtsreife des Sprechers gibt. Wenn man sich männliche vs. weibliche Spektren ansieht, sieht man im Durchschnitt männliche Stimmen mit tieferen und eng beieinander liegenden Formanten.

Akustische Korrelate des Sprechergeschlechts und der individuellen Sprecheridentität sind in einem kurzen Vokalsegment vorhanden, das in laufender Sprache erzeugt wird

Vocal Tract Length Perception und die Evolution der Sprache

Die Länge des Stimmtrakts und die Streuung der Formantfrequenz korrelieren mit der Körpergröße bei Rhesusaffen , aber siehe Formantfrequenzen und Körpergröße des Sprechers: eine schwache Beziehung bei erwachsenen Menschen

Können Spektralanalysen der Stimme Stimmprobleme und Krankheiten diagnostizieren? Ich kenne mich mit Fourier-Reihen und Fourier-Transformationen im Allgemeinen aus, leider kenne ich mich mit "Formatdispersion" nicht aus
" Formantendispersion " ist ein Fachbegriff aus dem Bereich der Hörakustik/Linguistik. Formanten sind dort ein Schlüsselbegriff. Formanten sind die spektralen Spitzen des Stimmklangs, siehe en.wikipedia.org/wiki/Formant . In der Linguistik werden sie verwendet, um Vokale und andere Fortsetzungslaute zu charakterisieren und zu unterscheiden und um Konsonanten anhand ihres Einflusses auf benachbarte Formanten zu analysieren.
Ja, sie werden auch ausgiebig bei der Suche nach Stimmstörungen eingesetzt. eine Google-Suche nach „Formants Vocal Dysfunction“ ist ziemlich aufschlussreich!
Beachten Sie, dass das menschliche Ohr mittels einer im Wesentlichen mechanisch durchgeführten Spektralanalyse über so etwas wie eine kontinuierliche Wavelet-Transformation arbeitet. Habe dazu mal eine Arbeit für Neurolinguistik gemacht :)
Tolle Informationen. Vielen Dank. Wenn ich nach der Art der Forschung suchen möchte, die in diesem Bereich oder verwandten Bereichen betrieben wird, welche Schlüsselwörter sollte ich verwenden?

Mein Eindruck wäre, dass die niedrigeren Frequenzen im männlichen Spektrum stärker ausgeprägt sind als im weiblichen Spektrum.

Wenn Sie einen guten Test erstellen möchten, wäre mein Ansatz, ein durchschnittliches männliches und durchschnittliches weibliches Spektrum zu bestimmen. Dann können Sie sehen, welches Ihrer durchschnittlichen oder häufigsten Spektren am besten mit der Testperson korreliert.

Allerdings sollte man sich über das Rauschen in den gemessenen Spektren Gedanken machen

Vielleicht möchten Sie untersuchen, ob die Tatsache, dass Sie normalerweise erkennen können, wann eine männliche Stimme im Falsett spricht, durch bestimmte Unterschiede im Spektrum einer weiblichen Sprecherin erklärt werden kann.