Sollten Rohdaten zur Reaktionszeit transformiert werden?

Ich bin Statistiker und beschäftige mich mit Datenanalysen in den Kognitionswissenschaften. Mir ist aufgefallen, dass die Verteilung der Reaktionszeit (RT) Chisq-Quadrat-ähnlich ist, und ich möchte eine Box-Cox-Transformation durchführen, damit sie normal verteilt aussieht. Da ich vorher nicht viel über diese Transformation nachgedacht habe, ist meine Frage:

  • Muss eine Box-Cox-Transformation auf Reaktionszeiten angewendet werden?
  • Wenn ja, was bedeuten die Ergebnisse?
  • Wird das Ergebnis für t-Test, ANOVA und andere Tests für die ursprünglichen Reaktionszeitdaten gültig sein?
  • Wenn nicht, sollten wir die Daten transformieren, da die Analyse dieser Daten auf der Normalitätshypothese basiert?
Willkommen bei CogSci! Ihre Frage ist hier zum Thema, aber falls Sie im Laufe der Zeit keine passende Antwort erhalten, können Sie eine Migration zu CrossValidated beantragen , einer SE-Website, die sich auf Statistiken spezialisiert hat.

Antworten (4)

Dieser Artikel von Whelan (2010) ist eine der besten Einführungen, die ich zu diesem Thema gefunden habe. Die Normalisierung wird ziemlich klar und umfassend behandelt, einschließlich der Vorbehalte und "Fallstricke".

Verweise

  • Whelan, R. (2010). Effektive Analyse von Reaktionszeitdaten. The Psychological Record, 58(3), 9.

Sie können RT transformieren, dh durch log(1/RT). Dies macht die Verteilung ungefähr normal. Das Problem ist, dass Sie die ANOVA normalerweise nicht mit den bei jedem Versuch gesammelten RT-Werten ausführen, sondern mit dem Durchschnitt für jeden Teilnehmer. Die Verteilung auf die Teilnehmer muss also normal sein. Ein Trick besteht darin, die einzelnen RT-Werte zu transformieren, den Mittelwert für jeden Teilnehmer und jede Bedingung zu berechnen und den Wert dann mit dem Kehrwert zurück zu transformieren.

Alternativ können Sie ANOVAs ohne Korrekturen ausführen, wenn Sie die entsprechende verwenden (dh Normalität nicht angenommen ... dies führt zu einem seltsam aussehenden DOF mit Dezimalwerten).

Mein Eindruck ist, dass sich kürzlich ein Konsens darüber zu bilden begann, dass RTs transformiert werden sollten, um Modellannahmen zu erfüllen. Dies gilt insbesondere, wenn Daten mit gemischten Modellen anstelle von ANOVAs analysiert werden.

In Bezug auf die Stabilität von Effekten bei verschiedenen Transformationen finden Sie möglicherweise dieses Papier interessant: http://web.uvic.ca/psyc/masson/KMR10.pdf

[Mir ist klar, dass ich 7 Jahre zu spät bin, aber ich denke trotzdem, dass es sich lohnt, darauf zu antworten, falls jemand in Zukunft darauf stößt]

Nein. Wie Max Di Luca betonte, führen wir unsere Analysen an den mittleren (oder mittleren) RTs durch, nicht an den zugrunde liegenden Verteilungen der Daten jedes Einzelnen (es sei denn, Sie machen linear gemischte Effekte). Darüber hinaus wirft ihre Umwandlung Informationen weg. Was ist, wenn der zugrunde liegende Effekt darauf zurückzuführen ist, dass der Effekt nur bei 10 % der Studien auftritt? Wenn der Effekt die RTs verlängert, erhöht er den Mittelwert, aber durch die Transformation der RTs (z. B. 1/RT) haben Sie den rechten Schwanz effektiv komprimiert und den Einfluss dieser Versuche verringert. Aber es könnten genau diese Prüfungen sein, die den Effekt überhaupt erst antreiben!

Für Ausreißer verwende ich eine robuste Methode wie MAD (z. B. +/- 3 MAD sds).

Transformationen, die wie eine logarithmische Transformation invertiert werden, verursachen keinen Informationsverlust, aber die Mittelwert- oder Medianwertbildung einer Verteilung tut dies sicherlich. Wenn die Information über den Effekt im Schwanz steht, dann müssen Sie die gesamte Verteilung analysieren, damit sie nicht im Mittel verloren geht.