Ich bin Statistiker und beschäftige mich mit Datenanalysen in den Kognitionswissenschaften. Mir ist aufgefallen, dass die Verteilung der Reaktionszeit (RT) Chisq-Quadrat-ähnlich ist, und ich möchte eine Box-Cox-Transformation durchführen, damit sie normal verteilt aussieht. Da ich vorher nicht viel über diese Transformation nachgedacht habe, ist meine Frage:
Dieser Artikel von Whelan (2010) ist eine der besten Einführungen, die ich zu diesem Thema gefunden habe. Die Normalisierung wird ziemlich klar und umfassend behandelt, einschließlich der Vorbehalte und "Fallstricke".
Sie können RT transformieren, dh durch log(1/RT). Dies macht die Verteilung ungefähr normal. Das Problem ist, dass Sie die ANOVA normalerweise nicht mit den bei jedem Versuch gesammelten RT-Werten ausführen, sondern mit dem Durchschnitt für jeden Teilnehmer. Die Verteilung auf die Teilnehmer muss also normal sein. Ein Trick besteht darin, die einzelnen RT-Werte zu transformieren, den Mittelwert für jeden Teilnehmer und jede Bedingung zu berechnen und den Wert dann mit dem Kehrwert zurück zu transformieren.
Alternativ können Sie ANOVAs ohne Korrekturen ausführen, wenn Sie die entsprechende verwenden (dh Normalität nicht angenommen ... dies führt zu einem seltsam aussehenden DOF mit Dezimalwerten).
Mein Eindruck ist, dass sich kürzlich ein Konsens darüber zu bilden begann, dass RTs transformiert werden sollten, um Modellannahmen zu erfüllen. Dies gilt insbesondere, wenn Daten mit gemischten Modellen anstelle von ANOVAs analysiert werden.
In Bezug auf die Stabilität von Effekten bei verschiedenen Transformationen finden Sie möglicherweise dieses Papier interessant: http://web.uvic.ca/psyc/masson/KMR10.pdf
[Mir ist klar, dass ich 7 Jahre zu spät bin, aber ich denke trotzdem, dass es sich lohnt, darauf zu antworten, falls jemand in Zukunft darauf stößt]
Nein. Wie Max Di Luca betonte, führen wir unsere Analysen an den mittleren (oder mittleren) RTs durch, nicht an den zugrunde liegenden Verteilungen der Daten jedes Einzelnen (es sei denn, Sie machen linear gemischte Effekte). Darüber hinaus wirft ihre Umwandlung Informationen weg. Was ist, wenn der zugrunde liegende Effekt darauf zurückzuführen ist, dass der Effekt nur bei 10 % der Studien auftritt? Wenn der Effekt die RTs verlängert, erhöht er den Mittelwert, aber durch die Transformation der RTs (z. B. 1/RT) haben Sie den rechten Schwanz effektiv komprimiert und den Einfluss dieser Versuche verringert. Aber es könnten genau diese Prüfungen sein, die den Effekt überhaupt erst antreiben!
Für Ausreißer verwende ich eine robuste Methode wie MAD (z. B. +/- 3 MAD sds).
Steven Jeuris