Was ist der optimale Mittelwert für ein Multiple-Choice-Testelement, um die Messung individueller Unterschiede zu maximieren?
Mein Verständnis ist, dass im Allgemeinen ein richtiger Prozentsatz von 50 % optimal ist, wenn kein Spielraum für Vermutungen besteht. Bei Multiple-Choice-Tests gibt es jedoch eine gewisse Anzahl von Antwortmöglichkeiten. Die Wahrscheinlichkeit, die richtige Antwort zu erhalten, wenn man nichts weiß, ist also eins über der Anzahl der Antwortmöglichkeiten.
In diesem Fall glaube ich, dass das Optimum ist:
wobei k die Anzahl der Antwortmöglichkeiten ist.
Das Optimum für verschiedene Werte von k wäre also:
Trotzdem würde ich gerne die klassischen Referenzen finden, aus denen ich diese Ideen erhalten habe. Und ich kann mir vorstellen, dass die Item-Response-Theorie dazu etwas mehr zu sagen hat, insbesondere in Bezug auf die allgemeine Empfehlung, das richtige Verhältnis über einen Bereich zu variieren.
Darüber hinaus geht keine der oben genannten Empfehlungen auf das Problem ein, dass es für einige Testteilnehmer einschüchternd sein kann, den Schwierigkeitsgrad für die meisten Items auf das oben genannte Niveau zu setzen.
Robin Kramer-ten Have
Jerome Anglim
Robin Kramer-ten Have
Jerome Anglim