Historische Daten darüber, wie die Zuverlässigkeit von Umfragedaten von der verbleibenden Zeit bis zu einer US-Präsidentschaftswahl abhängt

Nur zur Unterhaltung habe ich ein Programm geschrieben, das die US-Präsidentschaftswahlen von 2020 simuliert. (Mich interessierte zum Beispiel, ob die relativ geringe Wahrscheinlichkeit, dass Biden die Wahl gewinnt, mit der relativ hohen Wahrscheinlichkeit, dass er Pennsylvania gewinnt, in Einklang gebracht werden kann. ) Das Programm geht davon aus, dass sich die Stimmabgabe in jedem Staat bis zum Wahltag um einen gewissen Betrag ändern wird. Diese Änderung wird als Summe zweier normaler (gaußscher) Zufallsvariablen modelliert, von denen eine landesweit und die andere pro Bundesstaat gilt. Bei dieser Frage geht es darum, wie groß die Standardabweichung der ersten Variablen sein soll, die ich als A notiere.

Ich habe Daten gefunden, die zeigen , dass staatliche Umfragen ein oder zwei Wochen vor dem Wahltag einen mittleren absoluten Fehler von etwa 5 % bei der Vorhersage der nationalen Volksabstimmung haben, was ziemlich klein ist. Allerdings ist jetzt erst Juli, und traditionell hätten die meisten Wähler einer Präsidentschaftswahl so früh in einem Wahljahr überhaupt nicht viel Aufmerksamkeit geschenkt. Daher würden Sie erwarten, dass der korrekte Wert von A viel höher ist. Das heißt, es gibt genügend Zeit für Ereignisse und für Menschen, sich zu entscheiden oder ihre Meinung zu ändern.

Kann mir jemand historische Daten darüber nennen, wie groß diese Schwankungen wahrscheinlich sein werden, wenn x Zeit bis zum Wahltag verbleibt? (Die Wahl 2020 mag anders sein, weil Trump so polarisiert und so viele Menschen sich bereits über ihn entschieden haben, aber das wäre ein anderes Thema. Im Moment suche ich nur nach historischen Daten.)

Hast du mal auf fivethirtyeight.com geschaut ? Sie machen umfangreiche Modellierungen dieser Art für jede Wahl...
@jeffronicus: Fragen Sie, ob ich mir ihre Vorhersagen angesehen habe oder ob ich mir eine Beschreibung der mathematischen Interna ihrer Modellierung angesehen habe? Wenn ersteres, dann glaube ich nicht, dass sie Vorhersagen der in der Frage beschriebenen Art veröffentlichen, wie zum Beispiel die bedingte Wahrscheinlichkeit, dass Biden verliert, wenn er in Pennsylvania gewinnt. Wenn letzteres, dann nein, und es wäre hilfreich, wenn Sie mich auf eine solche Beschreibung hinweisen könnten.
@jeffronicus: Ihr Kommentar veranlasste mich, nachzuschlagen, wie das Modell von fivethirtyeight funktioniert. Ich habe hier eine Beschreibung gefunden: election.princeton.edu/2012/11/04/… Es scheint eine völlig andere Art von Modell zu sein und daher nicht wirklich auf das anwendbar, was ich versuche.
Es gibt viele Websites mit Grafiken und Tabellen von Umfragen auf Bundesstaatsebene im Laufe der Zeit. Alles, was Sie tun müssen, ist die durchschnittliche Abweichung x Tage zu berechnen.

Antworten (1)

Ich habe noch mehr im Internet gesucht und einige Informationen gefunden, die meine eigene Frage zu beantworten scheinen.

Diese Seite hat Umfragefehler bei der Volksabstimmung bei den letzten 10 Präsidentschaftswahlen. Nach zwölf Monaten liegt der durchschnittliche absolute Fehler bei etwa 12 %, nach vier Monaten bei 9 % und im letzten Monat bei 2,5 %.

Beschränkt man die Aufmerksamkeit nur auf neuere Wahlen (1996-2016), ergibt sich ein ganz anderes Bild. Der durchschnittliche absolute Fehler liegt bei etwa 5 % und nimmt nicht viel ab, außer wenn Sie der Wahl sehr nahe kommen. Warum das so ist, kommentieren sie nicht. Es könnte sein, dass die Parteilichkeit stärker geworden ist oder dass die Meinungsforscher in ihrer Arbeit besser geworden sind, oder es könnte nur ein Zufall sein, dass sich die letzten 6 Wahlen so verhalten haben. Wenn der Fehler nur 5 % beträgt, messen Sie hauptsächlich Umfragefehler, nicht echte Verschiebungen in den Meinungen der Wähler.

Ich interessiere mich eigentlich für die staatliche Abstimmung, nicht für die Volksabstimmung, also ist das nicht genau das, was ich brauchte. Es erscheint jedoch vernünftig, diese Zahlen für staatliche Umfragen ungefähr zu verdoppeln, da, wie im Link in der Frage beschrieben, die staatlichen Umfragefehler im letzten Monat typischerweise etwa 5% betragen (kleiner für Staaten, die gut befragt wurden).

Wie rechnet man %? Wenn eine frühe Umfrage 48 % bis 42 % sagt und das Ergebnis 53 % bis 47 % lautet, ist das wirklich ein Fehler?
@dandavis: Ich denke, sie arbeiten mit Unterschieden, also sagte die Umfrage in Ihrem Beispiel +6 und das Ergebnis war +6.