Wie misst man Stress quantitativ?

Ich frage mich, was der einfachste Weg ist, um das Stressniveau objektiv und quantitativ * und insbesondere die kognitive Belastung zu messen . Ich bin offen für Vorschläge, aber ich verstehe, dass Pupillenerweiterung und erhöhte Hautleitfähigkeit gute objektive und quantifizierbare Maße für Stress sind.

Meine Frage ist nun - gibt es eine etablierte Meinung, welche der beiden die bevorzugte Methode ist?

Die Sache ist, dass die Hautleitfähigkeit relativ einfach ist. Eine Elektrode oder zwei genügen - zu einfach. Andererseits erfordert die Pupillometrie entweder eine umständliche Brille oder ein am Kopf befestigtes Gerät oder alternativ ein Tischgerät, bei dem das Objekt auf ein eingeschränktes Sichtfeld fokussiert werden muss (andernfalls verliert die Kamera die Pupille).

Angesichts der Tatsache, dass wir erwägen, Kinder zu messen, wäre eine Elektrode intuitiv besser, da sie fest an einem Finger befestigt werden kann, einfache Anweisungen ermöglicht – „nicht berühren“ und angesichts der Puil-Aufnahmen relativ robust gegenüber Artefakten ist unter Augenzwinkern leiden.

Sollten wir nur praktische Erwägungen berücksichtigen und den Hautleitwert wählen, oder gibt es zwingende Gründe, stattdessen einen Eyetracker zu verwenden **?

*: Fragebögen wollen wir aus Zeitgründen vermeiden
**: für beides haben wir kein Geld :-)

Auf der diesjährigen CHI-Konferenz gab es eine Sitzung zum Thema Benutzerfreundlichkeit und Benutzerlast mit einigen Papieren, die es wert sein könnten, näher betrachtet zu werden: „Developing and Validating the User Burden Scale: A Tool for Assessing User Burden in Computing Systems“ und „Understanding the Relationship zwischen Frustration und der Schwere von Usability-Problemen: Was können uns psychophysiologische Daten (nicht) sagen?" besonders vielversprechend erscheinen.
Ich habe Die Beziehung zwischen Frustration und der Schwere von Usability-Problemen verstehen: Was können uns psychophysiologische Daten (nicht) sagen? kurz überflogen und halte es für höchst relevant für diese Frage. Ich habe keine Zeit, ausführlich darüber zu berichten, aber ich halte eine zusammenfassende Abfassung dieses Papiers für eine geeignete Antwort auf diese Frage.
@StevenJeuris - nochmals vielen Dank - ich werde es mir ansehen!

Antworten (1)

Wenn es Ihr Ziel ist, eine Option gegenüber der anderen zu messen

Im Rahmen einer Studie zur Mensch-Computer-Interaktion (HCI) musste ich auch die kognitive Belastung messen, um zu beurteilen, ob eine bestimmte Benutzeroberfläche die wahrgenommene kognitive Belastung (im Vergleich zu einer Kontrollgruppe) reduzieren könnte. Aus praktischen Gründen (und um nicht zu sehr in die „normale“ Computernutzung einzugreifen) habe ich mich entschieden, mich an die allgemein verwendete NASA-TLX-Skala zu halten ( Hart, 2006). Ich habe jedoch den Eindruck, dass Sie bei kleinen Studien (meine mit nur 16 Teilnehmern) genauso gut dran ist, nur um qualitatives Feedback zu bitten. Natürlich können Sie keine Statistiken darüber erstellen, aber die Interpretation der Effektgröße bei so kleinen Stichprobenumfängen ist wohl so oder so bedeutungslos. Sie könnten die Teilnehmer also einfach fragen, welche Option in Bezug auf die wahrgenommene kognitive Belastung bevorzugt wird, und dies als „signifikantes“ Ergebnis angeben. Natürlich kann ich nicht garantieren, ob Rezensenten zustimmen würden. :) Für den Fall, dass Sie geeignete vorhandene NASA-TLX-Maßnahmen zum Vergleich haben, bleibt dies immer noch eine lohnende Option.

Wie Sie jedoch sagen, besteht ein großer Nachteil eines solchen skalenbasierten Tests darin, dass er nur an wenigen Punkten während der Studie durchgeführt werden kann, da das Ausfüllen von Skalen zeitintensiv ist.

Für umfangreiche oder kontinuierliche quantitative Studien

Hautleitfähigkeit, Blutvolumen und Pulsfrequenz scheinen recht vielversprechend und werden in HCI verwendet ( Janssen et al., 2015 ; Mark et al., 2012 ), die auf Erregung hinweisen . Diese können heutzutage leichter in einem einfachen Formfaktor (z. B. einer Uhr) gemessen werden. Es ist jedoch wichtig zu erwähnen, dass Erregung nicht auf Wertigkeit hinweist– die Angenehmheit oder Unannehmlichkeit von Reizen. Auch die Verwendung solcher Geräte ist nicht einfach. Das Erstellen einer Baseline für die Teilnehmer erfordert einen erheblichen Arbeitsaufwand und es muss darauf geachtet werden, es richtig zu machen (wenn man die Ergebnisse mit anderen Teilnehmern vergleichen möchte). Messungen am Handgelenk (wie von einer Uhr gemessen) sind schwächer als an den Handflächen. Bei manchen Menschen wird überhaupt kein passendes Signal gemessen. Umweltfaktoren wie Temperaturänderungen und Bewegung (in Bezug auf die Hautleitfähigkeit) und Änderungen der Beleuchtung (Pupillenerweiterung) müssen kontrolliert werden.

Um eine Ihrer Fragen zu beantworten, ich glaube nicht, dass es eine etablierte Meinung oder eine bevorzugte Methode gibt, und sie hängt immer noch stark davon ab, was im gegebenen Kontext gemessen werden kann und was zu erwarten ist (z keine positive Wertigkeit?). Je nach Studie könnte man immer noch das eine dem anderen vorziehen (beinhaltet die Aufgabe Bewegung?), und qualitative Maßnahmen würde ich definitiv nicht ausschließen.

Studien zum Vergleich verschiedener Maßnahmen

Als ich nach Informationen suchte, stieß ich auf einige Quellen, die verschiedene Maßnahmen vergleichen. Ich kann sie jedoch nicht auswendig zusammenfassen, hoffe aber, dass die aktuell genannten Themen und Quellen Sie bereits in die richtige Richtung weisen können.

Hart, SG (2006, Oktober). NASA-Task Load Index (NASA-TLX); 20 Jahre später. In Proceedings of the Human Factors and Ergonomie Society Annual Meeting (Bd. 50, Nr. 9, S. 904-908). Sage-Veröffentlichungen.
Janssen, CP, Gould, SJ, Li, SY, Brumby, DP, & Cox, AL (2015). Integration von Wissen über Multitasking und Unterbrechungen über verschiedene Perspektiven und Forschungsmethoden hinweg. International Journal of Human-Computer Studies, 79, 1-5.
Mark, G., Voida, S., & Cardello, A. (2012, Mai). Ein Tempo, das nicht von Elektronen diktiert wird: eine empirische Studie zur Arbeit ohne E-Mail. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems (S. 555-564). ACM.
Forne, M. (2012).Physiologie als Werkzeug für UX- und Usability-Tests. Fakultät für Informatik und Kommunikation, Master. Königlich Technische Hochschule, Stockholm.
Haapalainen, E., Kim, S., Forlizzi, JF, & Dey, AK (2010, September). Psychophysiologische Maße zur Erfassung der kognitiven Belastung. In Proceedings of the 12th ACM International Conference on Ubiquitous Computing (S. 301-310). ACM.

Weiß nicht, ob dies relevant ist: Kleine Nebenaufgaben, die entlang einer Hauptaufgabe ausgeführt werden, können auch zur Messung der kognitiven Belastung (wie bei verminderter Leistung) verwendet werden. ZB ein Stroop-Test: Verwendung einer Stroop-Aufgabe zur Beurteilung der kognitiven Belastung .
Wow, danke für dieses +1 - ich habe es nur überflogen und werde es nach einer guten Nachtruhe gründlicher lesen. Danke noch einmal.
@Christian. Gern geschehen. Vielleicht ein bisschen Kontext in Bezug auf diese Antwort. Ich habe ein wenig nachgelesen und damit experimentiert, da ich auch nach einem „objektiveren“ und zeitlich sensibleren Maß für die kognitive Belastung suchte. Am Ende habe ich jedoch nichts mit den aufgezeichneten Daten gemacht, da es schwierig war, sie zu interpretieren. :) Es lohnt sich jedoch auf jeden Fall weiterzumachen, wenn es eine der Hauptmaßnahmen darstellt, nach denen Sie suchen, was in meinem Fall nicht die Hauptintention meiner Studie war.
Wissen Sie zufällig, ob die Haapalainen et al. (2010) ist eine verlässliche Quelle? Ich bin mit Ubicomp und den Autoren nicht vertraut. Genau so eine Recherche habe ich gesucht! Danke noch einmal.
@Christiaan, UbiComp ist eine erstklassige (begutachtete) Konferenz in HCI (und Konferenzen sind im Vergleich zu anderen Bereichen genauso wichtig wie Zeitschriften, wenn nicht sogar wichtiger). Es ist jedoch ein multidisziplinäres Gebiet, das lediglich daran interessiert ist, die kognitive Belastung als Teil seiner breiteren Forschungsagenda zu messen, daher würde ich Papiere aus einem stärker fokussierten Bereich mehr schätzen, da ich erwarte, dass sie mehr Erfahrung mit dem Thema haben. Mit anderen Worten, es sollte eine gute Qualität haben, aber ich würde auch auf die bisherigen Erfahrungen der Autoren schauen.