Wie kann ein Meinungsforscher das Ergebnis einer Wahl in einer großen, demografisch vielfältigen Bevölkerung mit relativ kleinen Stichprobengrößen (ein- oder zweitausend Personen) modellieren oder vorhersagen? Sind Menschen statistisch gesehen so vorhersehbar?
Im Wesentlichen kommt es darauf an, eine gute Zufallsstichprobe auszuwählen. Im Allgemeinen ist die Stichprobe auf die Hälfte der Quadratwurzel der Anzahl der befragten Personen genau. Angesichts der Standardzahl von 1000 Personen bedeutet dies, dass die Zahl auf etwa 17 Personen genau sein sollte. Teilen Sie durch die ursprünglichen 1000 Personen in zwei Hälften und nehmen Sie 17/500, und Sie haben die traditionelle Fehlergrenze von 3,4 %, die normalerweise für Umfragedaten angegeben wird.
Insbesondere das Folgende ist der Schlüssel zu einer guten Umfrage:
Unter der Annahme, dass diese wahr sind, fallen wir in den Bereich der Stichprobenstatistik . Die allgemeine Formel lautet sqrt((pp^2)/n). Unter der Annahme, dass das Rennen fast geteilt ist, ergibt dies sqrt(0,25/n) oder 1/(2*sqrt(n)). Auch für die Zufallsstichprobe von 1000 lässt Sie dies wissen, wie genau ein Teil der Zahlen ist. Teilt man ihn durch die Hälfte des ganzen Körpers, erhält man 3,4 %.
Wenn diese nicht wahr sind, könnte ein Korrekturfaktor auf die Umfrage angewendet werden. Hier wird es schwierig. Die meisten Umfragen werden telefonisch durchgeführt. Für diejenigen, die keinen Zugang zu Telefonen haben, werden die Daten dadurch verzerrt. Um diese zu korrigieren, werden in der Regel zusätzliche Informationen über die befragte Person gesammelt und die Gesamtdaten korrigiert, damit sie besser zu dem Modell passen, wer tatsächlich abstimmt.
Ähnlich dem Geschmack einer gut gemixten Suppe. Sie müssen nicht den größten Teil der Suppe einnehmen, um herauszufinden, ob sie mehr gewürzt werden muss.
Aus einfachen Stichproben errechnete Anteile sind unverzerrte Schätzer des Bevölkerungsanteils.
Das erlaubt Ihnen, Dinge zu sagen wie „ungefähr 95 % der Stichprobenanteile, die aus einfachen Zufallsstichproben der Größe 1.000 berechnet werden, liegen innerhalb von 3,6 Prozentpunkten des wahren Anteils derjenigen, die Kandidat A unterstützen.“
Wenn Sie außerdem vermuten, dass die Unterstützung für Kandidat A bei 51 % liegt, können Sie die Wahrscheinlichkeit berechnen, eine einfache Zufallsstichprobe der Größe 523 zu erhalten, bei der 250 oder mehr Befragte Kandidat A unterstützen usw.
Eine einzelne Umfrage kann Ihnen nicht wirklich viel sagen. Eine Reihe von Umfragen kann Ihnen jedoch viel sagen, solange die Befragten zufällig ausgewählt werden.
Selbst wenn einzelne Meinungsforschungsinstitute gegenüber dem einen oder anderen Kandidaten voreingenommen sind, können Sie diese Vorurteile auf ähnliche Weise kontrollieren, wie es Nate Silver tut.
Das einzige wirkliche Problem tritt auf, wenn Umfragen systematisch bestimmte Personen übersehen.
Achtung: Die Begriffe „Fehlermarge“ und „Konfidenzintervall“ sind häufig missbräuchlich verwendete Begriffe.
NB: Vor einiger Zeit habe ich eine extrem vereinfachte Notiz zu diesem Thema zusammengestellt.
Sven Clemens
PearsonArtPhoto
Sven Clemens
PearsonArtPhoto