Hilfe bei der Interpretation des "Five-Sigma"-Standards?

Also, ich komme aus einem Mathe/Statistik-Hintergrund. Ich habe mich nur abstrakt darüber gewundert und versucht, herumzugoogeln, und bin auf diesen Artikel gestoßen , der Folgendes über einige Experimente sagt, die am CERN durchgeführt wurden:

Es ist die Wahrscheinlichkeit, dass, wenn das Teilchen nicht existiert, die Daten, die CERN-Wissenschaftler in Genf in der Schweiz gesammelt haben, mindestens so extrem wären wie das, was sie beobachtet haben.

Aber "existiert nicht" scheint mir keine sehr gut definierte Hypothese zu sein, die es zu testen gilt:

Nach meinem Verständnis frequentistischer Hypothesentests werden Tests immer mit der Absicht entwickelt, Beweise gegen eine bestimmte Hypothese zu liefern, in einer sehr popperschen Erkenntnistheorie. Es ist einfach so, dass in vielen Spielzeugbeispielen, die im Statistikunterricht verwendet werden, und auch in vielen Fällen aus dem wirklichen Leben, die Negation der Hypothese, die man als falsch beweisen will, selbst eine interessante Hypothese ist. Beispielsweise geht ACME corp davon aus, dass ihr Vogelfutter der Marke ACME > 90 % der Roadrunner anzieht, die innerhalb von 5 m an einer Kiste vorbeikommen. WE Coyote stellt die Negation auf. Beide können sich daran machen, Daten zu sammeln, um Beweise gegen die Hypothese des anderen zu liefern, und da die Hypothesen logische Negationen voneinander sind, sind Beweise gegen ACME Beweise für WEC und umgekehrt.

Im obigen Zitat versuchen sie, eine Hypothese als "ja, Higgs-Boson" und ihre Negation als "kein Higgs-Boson" zu formulieren. Es scheint, dass, wenn die Absicht darin besteht, Beweise für "ja, Higgs-Boson" zu liefern, man in der normalen frequentistischen Methodik Beweise gegen "kein Higgs-Boson" sammelt und diese Beweise in einen p-Wert oder nur eine Anzahl von Standards quantifizieren kann Fehler jeglicher Größe, die von der Theorie vorhergesagt werden, die wir zufällig untersuchen. Aber das scheint mir albern zu sein, da die Negation des physikalischen Modells, das das Higgs-Modell enthält, ein unendlicher Raum von Modellen ist. OTOH, dies ist der einzige Kontext, in dem das "Fünf-Sigma"-p-Wert-Surrogat Sinn zu machen scheint.

Tatsächlich war dies mein ursprünglicher Gedanke, als ich mit dem Googeln begann: Der Fünf-Sigma-Standard impliziert, dass wir Beweise gegen etwas sammeln, aber moderne physikalische Theorien scheinen eine solche Breite zu umfassen und dennoch so spezifisch zu sein, dass das Sammeln von Beweisen gegen ihre bloßen Verneinung ist Unsinn.

Was fehlt mir hier? Was bedeutet „Fünf-Sigma“-Beweis für die Higgs-Hypothese (oder andere physikalische Hypothesen) in diesem Zusammenhang?

Ich vermute, dass die Worte direkt vor der Stelle, an der Sie mit dem Zitieren begonnen haben, kritisch sind. Ohne den Artikel zu lesen, wissen wir nicht genau, was „es“ ist.
@Brick """Kurz gesagt entspricht Fünf-Sigma einem p-Wert oder einer Wahrscheinlichkeit von 3x10-7 oder etwa 1 zu 3,5 Millionen. Dies ist nicht die Wahrscheinlichkeit, dass das Higgs-Boson existiert oder nicht existiert; eher , es ist die Wahrscheinlichkeit, dass, wenn das Teilchen nicht existiert, die Daten, die CERN-Wissenschaftler in Genf, Schweiz, gesammelt haben, mindestens so extrem wären wie das, was sie beobachtet haben."""
"es" ist der Fünf-Sigma-Standard, der im normalen Frequentisten-Jargon meiner Meinung nach eher mit "Alpha" als mit einem p-Wert verwandt ist, aber mit /shrug.
Ich denke, es ist erwähnenswert, dass nicht alle Datenanalysen in der Teilchenphysik frequentistisch sind. Wenn Sie bereits mit Statistik vertraut sind und sich schnell damit vertraut machen möchten, was insbesondere Teilchenphysiker tun, empfehle ich die Teilchendatengruppe , die viele Rezensionen enthält.
@Him: Eigentlich nein, das "es" am Anfang des Zitats bezieht sich auf einen p-Wert. Schlagen Sie vor, dass Sie die Frage so bearbeiten, dass sie das vollständige Zitat enthält.
@DanielRCollins Sicher, aber der Journalist wollte sich vermutlich darauf beziehen a und nicht P , Und a ist lediglich eine andere Einheitenskala für fünf Sigma. Ich habe das Zitat so eingefügt, wie ich es getan habe, weil ich kein Gespräch über die Umrechnung von Einheiten oder über schlechte wissenschaftliche Berichterstattung führen wollte.

Antworten (4)

Das Higgs-Entdeckungsexperiment ist ein Teilchenzählexperiment. Viele Teilchen werden durch Kollisionen im Beschleuniger erzeugt und erscheinen in seinen verschiedenen Detektoren. Informationen über diese Teilchen werden für später gespeichert: wann sie aufgetaucht sind, in welche Richtung sie sich bewegt haben, ihre kinetische Energie, ihre Ladung, welche anderen Teilchen gleichzeitig an anderer Stelle im Detektor erschienen sind. Dann können Sie „Ereignisse“ rekonstruieren, sie auf unterschiedliche Weise gruppieren und sie in einem Histogramm wie diesem betrachten:

Higgs-Discovery-Histogramm

[Mea culpa: Ich erinnere mich an dieses Bild und andere ähnliche Bilder aus der Higgs-Entdeckungsankündigung, aber ich habe es bei einer Bildsuche gefunden und habe keinen richtigen Quellenlink.]

Dies sind gleichzeitige Detektionen von zwei Photonen („Diphotonen“), gruppiert nach der „äquivalenten Masse“. M γ γ des Paares. Es gibt Tonnen und Tonnen und Tonnen von Photonen, die um diese Kollisionen rasseln, und die Richtungsverfolgung für Photonen ist nicht sehr gut, also sind die meisten dieser „Paare“ nur zufällige Zufälle, nicht verwandte Photonen, die zufällig verschiedene Teile des Detektors gleichzeitig erreichen Zeit. Da jede Kollision unabhängig von allen anderen ist, unterliegt das Füllen jedes kleinen Behälters der Poisson-Statistik : ein Behälter mit N Ereignisse darin haben eine intrinsische statistische „Ein-Sigma“-Unsicherheit von ± N . Sie können die Fehlerbalken im Gesamt-Minus-Anpassungsdiagramm im unteren Bereich sehen: auf der linken Seite, wo N 6000 Ereignisse pro Intervall in der oberen Abbildung sind die Fehlerbalken ungefähr 6000 80 Veranstaltungen; auf der rechten Seite, wo weniger Signal vorhanden ist, sind die Fehlerbalken entsprechend kleiner.

Die „Ein-Sigma“-Vertrauensgrenze liegt bei 68 %. Wenn diese Daten wirklich unabhängig von einem Poissonschen Prozess generiert würden, dessen durchschnittliches Verhalten durch die Anpassungslinie beschrieben würde, würden Sie also erwarten, dass die Datenpunkte gleichmäßig über und unter der Anpassung verteilt sind, wobei etwa 68 % der Fehlerbalken die Anpassung kreuzen Linie. Das andere Terz-ish wird die Fit-Linie verfehlen, nur durch gewöhnliches Rauschen. In diesem Diagramm haben wir dreißig Punkte, und etwa zehn davon haben Fehlerbalken, die die Anpassungslinie nicht kreuzen: völlig vernünftig. Im Durchschnitt sollte jeder zwanzigste Punkt zufällig zwei oder mehr Fehlerbalken von der Vorhersage entfernt sein (oder „zwei Sigma“ entspricht einer Konfidenzgrenze von 95 %).

Es gibt zwei bemerkenswerte Bins in diesem Histogramm, zentriert auf 125 GeV und 127 GeV, die sich ungefähr von dem Hintergrund unterscheiden, der durch (Ablesen mit dem Auge) passt 180 ± 60 Und 260 ± 60 Veranstaltungen. Die „Nullhypothese“ besagt, dass diese beiden Unterschiede grob sind 3 σ Und 4 σ , sind beides statistische Zufallstreffer, genau wie der niedrige Bin bei 143 GeV wahrscheinlich ein statistischer Zufallstreffer ist. Sie können sehen, dass diese Nullhypothese im Vergleich zu der Hypothese, dass „bei einigen Kollisionen ein Objekt mit einer Masse nahe 125 GeV in zwei Photonen zerfällt“, stark abgelehnt wird.

Dieses Diphotonendiagramm allein bringt Sie nicht zu einer Fünf-Sigma-Entdeckung: Dazu waren Daten in mehreren verschiedenen Higgs-Zerfallskanälen erforderlich, die aus beiden großen CERN-Experimenten kombiniert wurden, was eine Menge statistischer Raffinesse erforderte. Ein wichtiger Teil der Entdeckung bestand darin, die Daten aus allen Kanälen zu kombinieren, um die beste Schätzung für Masse, Ladung und Spin des Higgs zu bestimmen. Ein weiteres wichtiges Ergebnis der Entdeckung waren die relativen Intensitäten der verschiedenen Zerfallsmodi. Wie eine andere Antwort sagt, hat es sehr geholfen, dass wir bereits eine Vorhersage hatten, dass es ein Teilchen mit dieser Masse geben könnte. Aber ich denke, dieser Datensatz zeigt die Nullhypothese gut: Die meisten Photonenpaare von ATLAS stammen aus einem wohldefinierten Kontinuumshintergrund zufälliger Koinzidenzen,

Gute Antwort; Ich habe eine Frage zu der roten Linie in der Grafik. Erstens denke ich, dass es angebracht wäre, die Daten ohne eine solche Kurve zu präsentieren, um nicht vorwegzunehmen, ob es bei 126 GeV einen signifikanten Stoß gibt oder nicht. Aber wenn wir weitermachen und einen Peak anpassen, wie kommt es dann, dass der gezeigte etwas links von den Daten liegt? Es ist auch ein bisschen zu breit, denke ich (im Vergleich zu einer besten Anpassung nach der Methode der kleinsten Quadrate).
@AndrewSteane Ich denke, die kurze Antwort auf Ihre Frage lautet, dass die am besten geeignete Masse und Zerfallsbreite für das Higgs nicht nur zu diesen Diphotonendaten passen, sondern gleichzeitig zu anderen Higgs-Zerfallskanälen. (Die lange Antwort lautet wahrscheinlich „Lesen Sie die Entdeckungspapiere“.) Ich stimme Ihnen zu, dass eine beste Anpassung für diese Daten allein wahrscheinlich den Peak etwas schmaler und mit etwas höherer Masse hätte. Aber im Sinne dieser Antwort auf die Nullhypothese würden Sie meiner Meinung nach auch zustimmen, dass die rote Kurve keineswegs ausgeschlossen ist.

Ich denke, diese Frage kann sich aus einem Unterschied zwischen etwas groben, laienhaften Präsentationen und den sorgfältigeren Statistiken ergeben, die in den tatsächlichen Labors durchgeführt werden. Aber selbst nachdem eine bestimmte Datenmenge zu Tode analysiert wurde, gibt es keinen formalen Weg, um die Beweise, die dem Wachstum des physikalischen Wissens zugrunde liegen, vollständig zu erfassen. Die Beweise rund um den Higgs-Mechanismus wären beispielsweise nicht annähernd so überzeugend, wenn der Higgs-Mechanismus selbst nicht eine elegante Kombination von Ideen wäre, die bereits ihren Platz in einem kohärenten Ganzen finden.

Die Hypothese, gegen die man Beweise sammelt, ist immer die Hypothese, dass wir uns darüber irren, wie eine bestimmte Datenmenge (z. B. ein Peak in einem Spektrum) zustande gekommen ist. Der Fehler könnte ganz einfach sein, beispielsweise wenn die zugrunde liegende Verteilung tatsächlich flach ist und die Spitze ein Artefakt aus zufälligem Rauschen ist. Aber normalerweise muss man die Möglichkeit in Betracht ziehen, dass der Peak zwar vorhanden ist, aber auf etwas anderes als den untersuchten Mechanismus zurückzuführen ist. Die Hypothese, die man im strengen Sinne testet – das Gefühl, auf einem gewissen Vertrauensniveau auszuschließen – ist die Menge aller anderen Möglichkeiten, die wir uns bisher überlegt haben, wie die Daten entstehen könnten. Bei dieser Reihe von Wegen müssen wir nur Wege berücksichtigen, die bekannte Physik und bekannte Mengen an Rauschen usw. in der Vorrichtung widerspiegeln.

Ich denke, was die Gemeinschaft der Physiker tut, ist ein bisschen wie Sherlock Holmes: Wir versuchen, uns plausible andere Wege auszudenken, auf denen die Daten entstehen könnten, und geben dann Gründe an, warum diese anderen Wege ausgeschlossen werden können. Der letzte Schritt, in dem wir zu der Behauptung übergehen, dass die führende Kandidatenerklärung das ist, was wirklich passiert ist, ist kein Schritt, der durch irgendein statistisches Maß quantifiziert werden kann. Dies liegt daran, dass es sich nicht nur auf einen bestimmten Datensatz stützt, sondern auch auf ein Urteil über die Qualität der betrachteten Theorie.

Die Nullhypothese hier ist, dass die Daten von der Physik erzeugt wurden, die der effektiven Feldtheorie gehorcht, die alle Standardmodell-Teilchen mit Ausnahme der Higgs beschreibt. Dieses Modell hat normalerweise keinen Namen, könnte aber vernünftigerweise als „Standardmodell ohne Higgs“ bezeichnet werden. Es ist eine vollkommen gute effektive Feldtheorie. Seine Vorhersagen unterscheiden sich kaum vom üblichen Standardmodell (mit Higgs).

Die Forderung nach einer 5-Sigma-Ablehnung der Nullhypothese bedeutet in diesem Fall, viele Daten zu sammeln, die mit dem "Standardmodell ohne Higgs" nicht kompatibel sind. Genügend Daten, damit ein paar experimentelle 1-Sigma-Fehler das Ergebnis nicht ruinieren.

Und natürlich ist die Alternativhypothese, dass die Daten von der Physik erzeugt wurden, die der effektiven Feldtheorie gehorcht, die wir das Standardmodell nennen.
"kaum anders" Ich denke, dass vielleicht etwas an dieser Aussage tatsächlich der springende Punkt ist. Diese Theorie ist zu 99,99999 % „kaum anders“, aber in dieser einen bestimmten Vorhersage, die wir zu messen beschlossen haben, ist sie „ sehr anders“. Die Diskussion mit @RogerVadim lässt mich denken, dass die Implikation darin besteht, dass das „Standardmodell mit Higgs“ auf diese besondere Weise als „ sehr unterschiedlich“ angesehen wird von allen sinnvollen Erweiterungen des „Standardmodells ohne Higgs“, die vernünftigerweise als tatsächlich anders angesehen werden könnten Theorien aus dem „Standardmodell mit Higgs“
@Him Ich fürchte, ich kann Ihren letzten Satz nicht analysieren.
Mein Punkt hier ist, dass "die Theorie des effektiven Feldes, die alle Standardmodell-Teilchen außer dem Higgs beschreibt", keine Theorie ist. Es ist eine Reihe von Theorien. Es gibt viele mögliche Erweiterungen des Standardmodells, die eine Spitze in der Partikelereignisfrequenz bei einer gegebenen Energie beinhalten können. Nicht alle davon sind sinnvolle Erweiterungen. Zum Beispiel das "Standardmodell mit 7TeV magischem Nano-Zauberer". Nicht alle unterscheiden sich wirklich vom "Standardmodell mit Higgs". Zum Beispiel das "Standardmodell mit Biggs-Teilchen, das genau wie Higgs ist, aber mit einem "B""
In diesem Sinne sagen wir, obwohl „Standardmodell ohne Higgs“ eine unendliche Menge von Modellen ist, dass wir „Fünf-Sigma“-Beweise gegen sie alle haben, weil wir „Fünf-Sigma“-Beweise gegen die Teilmenge von haben diejenigen Hypothesen, die wir uns bisher ausgedacht haben und die nach unserem derzeitigen Verständnis der Physik vernünftig sind und nicht im Wesentlichen dem "Standardmodell mit Higgs" entsprechen
Ich denke, dass die Erklärung von @AndrewSteane eine gute Paraphrase davon ist.

Auffrischung zum Hypothesentesten
Beim (frequentistischen) Hypothesentesten hat man immer (mindestens) zwei Hypothesen: die Nullhypothese und die Alternativhypothese . Dann ist der p-Wert die Wahrscheinlichkeit, einen bestimmten Datensatz zu beobachten, vorausgesetzt, dass die Nullhypothese wahr ist, während die Teststärke die Wahrscheinlichkeit ist, dass die alternative Hypothese angesichts der beobachteten Daten wahr ist.

Ist der p-Wert kleiner als ein vordefinierter Schwellenwert ( Signifikanzniveau ), verwirft man die Nullhypothese als unwahrscheinlich. In dem im OP angegebenen Beispiel sollen die Daten der Gaußschen / Normalverteilung folgen, und fünf Sigma bestimmt das Signifikanzniveau in Bezug auf diese Verteilung (eine ziemlich strenge).

Was hat das mit Popper zu tun?
Aus statistischer Sicht bedeutet die Poppersche Erkenntnistheorie einfach, dass das Entwerfen eines Tests zum Zurückweisen einer Hypothese und das Berechnen ihres p-Werts normalerweise einfacher ist als das Berechnen der Teststärke (was normalerweise einige Ad-hoc-Annahmen über die zugrunde liegenden Wahrscheinlichkeitsverteilungen erfordert). Mit anderen Worten, es ist einfacher, die Nullhypothese zu widerlegen, als zu beweisen, dass die Alternativhypothese richtig ist. Man wählt dann die Nullhypothese so, dass sie widerlegt werden kann, anstatt zu versuchen, sie zu beweisen. Die Entscheidung, ob das Teilchen als Nullhypothese existiert und das Teilchen als Alternative nicht existiert oder umgekehrt, hängt nicht von der philosophischen Bedeutung einer der beiden Aussagen ab, sondern von unserer Fähigkeit, sie zu widerlegen.

Anmerkung
Meiner Meinung nach ist das von der Partciel Data Group herausgegebene Kapitel über statistisches Testen einer der besten Statistik-Crashkurse für Physiker.

Mein Punkt ist, dass "Partikel existiert nicht" kein physikalisches Modell ist, das eine Vorhersage macht, die widerlegt werden kann. Wie kann man möglicherweise Beweise gegen diese Aussage liefern?
@Him Wir sprechen hier über die experimentellen Messungen: Wir beobachten bestimmte Ergebnisse und erklären sie mit einer Theorie, die davon ausgeht, dass das Teilchen nicht existiert. B. zwei Teilchen kollidieren, und man kann annehmen, dass sie sich vernichten ODER sich zu einem neuen Teilchen verbinden. In manchen Fällen ist es einfacher, eine Theorie für die Vernichtung zweier Teilchen aufzuschreiben und zu testen, als eine Beschreibung für ein völlig unbekanntes Teilchen zu entwerfen.
Die „Fünf-Sigma“-Interpretation ist also die normale, und die bereitgestellten Beweise stehen tatsächlich im Gegensatz zu einem anderen wohldefinierten Modell, das eine messbare Vorhersage macht. Ich nehme an, dass dies als starker Beweis für die Higgs-Theorie angesehen wird, weil es die einzige bekannte konkurrierende Theorie ist und es derzeit keine Beweise gegen die Higgs-Theorie gibt?
Man kann die Higgs-Theorie nicht beweisen ... aber man könnte die Theorie widerlegen, die davon ausgeht, dass es kein Higgs-Teilchen gibt. Und die Wahrscheinlichkeit, dass wir uns irren (p-Wert), ist so gering, dass sie für alle praktischen Zwecke vernachlässigbar ist.
Mein Punkt ist, dass "die Theorie, die davon ausgeht, dass es kein Higgs-Teilchen gibt", nicht einfach die Ergänzung von "der Theorie ist, die davon ausgeht, dass es ein Higgs-Teilchen gibt". Die Theorie, die davon ausgeht, dass es ein Higgs-Teilchen gibt, macht quantitative Vorhersagen, die wir messen können. Die Ergänzung dieser Theorie ist in der Tat ein unendlicher Satz von Theorien, die jeweils ihre eigenen verschiedenen Vorhersagen treffen können. Man kann also eine Theorie widerlegen, die zufällig nicht die Higgs-Theorie ist.
Ich denke, dass Ihre Kommentare hier die Dinge etwas klarer machen. Sie sagen, dass wir „fünf Sigma“ meinen wie in: „Die Higgs-Theorie macht eine messbare Vorhersage X. Wir sind uns ziemlich sicher, dass alle vernünftigen Modelle, die gleichzeitig mit anderen etablierten Theorien übereinstimmen und auch genug von der Higgs-Theorie abweichen, beschrieben werden können da verschiedene Theorien eine messbare Vorhersage von etwas machen, das sehr nahe an Y liegt, das wir mit X vergleichen können. Wir machen eine Stichprobe von Messungen und erhalten etwas, das fünf Standardfehler von Y entfernt ist, aber nicht so weit von X entfernt ist.
@Him: Die Nullhypothese war, dass es kein Teilchen mit der ungefähren Masse gab. Dies wurde auf 5-Sigma-Vertrauen zurückgewiesen. Die anfängliche Entdeckung betraf ein solches Teilchen mit einer solchen Masse; Weitere Argumente wurden verwendet, um zu argumentieren, dass das Teilchen das Higgs war. Dieser Artikel spricht irgendwie darüber.