Ich versuche, Korrelationen zwischen Zufallsvariablen (zweidimensional) mit einer definierten linearen Beziehung (in der Sinn), aber mit unterschiedlichen visuellen Mustern beim Plotten. Ich versuche, eine Aufgabe zum Erraten der Korrelation zu erstellen, bei der ich systematisch die Schwierigkeit für einen Beobachter manipulieren kann, die lineare Beziehung zu erraten.
Was ich jetzt tue, ist eine Korrelation gegeben Ich erzeuge den ersten und zweiten Wert, und , mit Stichproben aus der Standardnormalverteilung. Dann mache ich von dort aus eine Linearkombination aus beiden
Dann:
Und nun und Zusammenhang haben .
Zur Manipulation der Schwierigkeit habe ich mit den Parametern der Verteilung gespielt und , jedoch bin ich mit den Ergebnissen nicht zufrieden.
Haben Sie eine Idee, wie Sie die Schwierigkeit der Aufgabe systematisch erhöhen können? (zB Hinzufügen von Ausreißern usw.).
Hinweis: Die Schwierigkeit ist eher eine kognitive/psychologische als eine statistische Frage. Ich beabsichtige, den Begriff der Schwierigkeit empirisch zu testen (dh unter bestimmten Parameterkombinationen schneiden Menschen tendenziell schlechter ab). Die Idee besteht darin, Diagramme mit variierenden Parametern für einen bestimmten Korrelationswert zu erstellen (dh Änderung der Anzahl der Punkte, der Varianz, des Ausreißers, der funktionalen Form usw.). Was sind die Parameter und was wäre ein systematischer Weg, sie zu manipulieren?
Wahrscheinlich müssen Sie Pilotversuche durchführen, um die Schwierigkeit einer gegebenen Korrelationsaufgabe zu ermitteln.
Aus Pilottests müssten Sie die Schwierigkeit der Aufgabe quantifizieren. Eine Möglichkeit wäre die mittlere Abweichung zwischen tatsächlicher und prognostizierter Korrelation. Es gäbe jedoch andere Metriken sowohl für den Grad des Fehlers als auch für den Schwierigkeitsgrad.
Ich würde die Hypothese aufstellen, dass die anhand von Streudiagrammen am einfachsten zu erratenden Korrelationen starke lineare Beziehungen mit bivariaten Normalverteilungen und vielen Daten (z. B. n > 1000) wären.
Es gibt eine ganze Reihe von Dingen, die Sie ausprobieren könnten, um die Aufgabe schwieriger zu machen. Folgendes fällt mir dazu ein:
Ganz allgemein denke ich, dass auch Übungs- und Rückkopplungseffekte relevant sein werden. D. h., es kann relevant sein festzustellen, ob die Unterschiede im Schwierigkeitsgrad bei Anfängern auch den relativen Unterschieden im Schwierigkeitsgrad bei Teilnehmern entsprechen, die der gesamten Bandbreite der von Ihnen generierten Items ausgesetzt waren.
Robin Kramer-ten Have
Jerome Anglim
Schiene
Robin Kramer-ten Have