Andere Emotionen im Vergleich zu wütenden/glücklichen Grundemotionen

Nach meiner Laienerfahrung bin ich mir vage bewusst, dass es vier grundlegende Emotionen gibt: glücklich, traurig, ängstlich/überrascht und wütend/angewidert . 1

Etwas Hintergrund: Wir trainieren eine KI, um den Unterschied zwischen fröhlichen und wütenden Stimmen zu lernen. Wir hatten einigen Erfolg, indem wir ihm 200 wütende Audioclips, 200 fröhliche Audioclips und 200 neutrale . Es kann jetzt einigermaßen erkennen, ob wir freundlich oder konfrontativ miteinander sprechen … aber die Genauigkeit könnte besser sein.

Unser gesamter Trainingsdatensatz besteht aus diesen Audioclips: Fröhlich, wütend, neutral, ruhig, traurig, ängstlich, angewidert und überrascht . Ich denke, wir können genauer sein, wenn wir diese Emotionen einbeziehen.

Aber das ist das Problem:

Glücklich/wütend/neutral überspannen entgegengesetzte Enden eines Spektrums; wie binär. Es ist leicht zu sagen:

Happy     1
Neutral   0
Angry    -1

Das ist die Form der Daten, die wir brauchen, um ein neuronales Netzwerk darauf zu trainieren, „Happy“ zu erkennen.

Die Frage wäre also, gibt es eine „richtige Antwort“ auf das Ausfüllen dieser Lücken? Ich habe unten meine besten Vermutungen abgegeben, aber ich hoffe auf etwas Wissenschaftlicheres ...

Happy     1
Angry    -1
Neutral   0
Calm      X  (0.5?)
Sad       X  (-1?)
Fearful   X  (-0.5?)
Disgust   X  (-0.75?)
Surprised X  (0.75?)

1: http://www.theatlantic.com/health/archive/2014/02/new-research-says-there-are-only-four-emotions/283560/

Ich glaube, das ist eher eine StackOverflow-Frage, aber Sie könnten 8 verschiedene Ausgabeknoten in der Ausgabeschicht haben, die entweder 0 oder 1 sein können. Mit einigen Sigmoid-Funktionen in der verborgenen Schicht und überwachtem Lernen glaube ich, dass dies der beste Weg ist . Sie könnten auch eine Wahrscheinlichkeit (0 bis 1) für jede Emotion ausgeben. Dann können Sie den mit dem höchsten Wert auswählen. Ich würde nicht empfehlen, Ihren Ansatz zu verwenden, da er wahrscheinlich oft Überraschung mit Freude verwechselt, z. B. angesichts ihrer Nähe. Ich glaube nämlich nicht, dass man diese Emotionen so linear anordnen kann.
Was ist der Beweis (oder die Argumentation) dafür, warum sich glücklich und wütend an entgegengesetzten Enden eines Spektrums erstrecken? Welches Spektrum?
Zur weiteren Verdeutlichung: Die von Ihnen aufgelisteten Emotionen können sich in mehreren Dimensionen, einschließlich Wertigkeit, Erregung und konzeptionellem Inhalt, entweder unterscheiden oder überschneiden. Was Sie in Ihrem glücklichen vs. neutralen vs. wütenden Paradigma möglicherweise unterscheiden, sind nicht die Emotionen an sich, sondern ihre Wertigkeit oder Erregung.
@mrt Das Spektrum ist die Kundenzufriedenheit, also scheint unzufrieden sich in wütend und zufrieden in glücklich zu übersetzen, wenn Sie damit einverstanden sind? Wir erfassen auch die Bedeutung/Empfindung der gesagten Wörter für den Kontext, aber das ist ein separater Prozess.
@RobinKramer Wir verwenden pyAudioAnalysis für unsere Blackbox. Nicht viel Ahnung, wie es das Audio wissenschaftlich macht. Unsere Hypothese ist nicht unbedingt, eine genaue Emotion zu lokalisieren, sondern in der Lage zu sein, eine „gute Laune“ von einer „schlechten Stimmung“ zu unterscheiden – indem wir Merkmale von negativ und positiv geladenen Emotionen identifizieren

Antworten (1)

Wie ich in den Kommentaren erwähnt habe, ist das Tool, das wir verwenden, pyAudioAnalysis . Der Autor des Tools, Theodoros Giannakopoulos, schrieb auch eine frühere Abhandlung „ Ein dimensionaler Ansatz zur Emotionserkennung von Sprache aus Filmen “ .

Dieses "Emotionsrad" aus diesem Papier scheint genau das zu sein, wonach ich gesucht habe:Geben Sie hier die Bildbeschreibung ein

Es ist vielleicht auch erwähnenswert, dass dieses spätere Papier alle spezifischen Eigenschaften zu beschreiben scheint, die pyAudioAnalysis analysiert: "Signalenergie, Energieentropie, Nulldurchgangsrate, spektraler Schwerpunkt, spektraler Fluss, Mel-Frequenz-Cepstra-Koeffizienten, Chroma-basierte Merkmale, etc."

Übrigens wird das Emotionsrad als Zirkumplexmodell des Affekts bezeichnet (siehe James Russell und Lisa Feldman Barrett). Affekt ist nur ein Merkmal von Emotionen (z. B. erfasst das Rad keinen konzeptuellen Inhalt). In der Tat "erkennt" man Emotionen nicht wirklich, indem man Valenz und Erregung erkennt. Du erkennst Affekte. Zum Beispiel ist hohe Erregung + positive Wertigkeit nicht gleich Aufregung, aber die Emotion „Aufregung“ (typischerweise, aber nicht immer) beinhaltet hohe Erregung und positive Wertigkeit.