Berücksichtigt das jüngste „3-Sigma“-Ergebnis am LHCb die Anzahl der verschiedenen Tests, die über die Standard-Modellphysik hinaus durchgeführt wurden?

Kürzlich gab es ziemlich viel Medieninteresse, das durch eine gemeldete Beobachtung von Physik jenseits des Standardmodells am LHC mit einem "Drei-Sigma"-Grad an statistischer Signifikanz hervorgerufen wurde.

Mein Verständnis (korrigieren Sie mich, wenn dies falsch ist) bedeutet, dass dies in einer Welt, in der es keine Physik jenseits des Standardmodells gibt, eine Chance von ~1/1000 gibt, dass dieses Experiment den Grad des Unterschieds zu erkennen würde Standardmodellvorhersage, die es sieht.

Das klingt überzeugend, aber andererseits gehe ich davon aus, dass eine große Anzahl verschiedener Tests mit LHC-Daten durchgeführt wurden, die über die Standard-Modellphysik hinausgingen. Ich wäre überrascht, wenn diese Zahl im Laufe der Lebensdauer des LHC nicht leicht größer als 1000 sein würde (bitte korrigieren Sie mich erneut, wenn dies falsch ist). Vor diesem Hintergrund erscheint es nicht verwunderlich, dass man gelegentlich solche Abweichungen vom Standardmodell in den Daten sehen kann, auch ohne tatsächlich neue Physik.

Mir ist bekannt, dass es möglich ist, bei der Berechnung der statistischen Signifikanz eines Ergebnisses mehrere Tests zu korrigieren, aber aus den Berichten in den Medien geht für mich nicht klar hervor, ob dies getan wurde. Meine Frage ist also: Erklärt die behauptete Signifikanz des LHCb-Ergebnisses die zahlreichen Tests für über die Standardmodellphysik hinausgehende Physik, die an LHC-Daten durchgeführt wurden?

Antworten (2)

Look-otherwhere-Effekt ist der Name dafür, oder ein Name dafür. Manchmal sehen Sie zwei unterschiedliche Signifikanzmaße, die für einen Effekt angegeben werden, eines mit einer „Woanders suchen“-Korrektur und eines ohne.

Der LHCb-Bericht ist arXiv:2103.11769 . Auf den ersten Blick sehe ich keinen Beweis dafür, dass sie den Look-Woanders-Effekt in Betracht gezogen haben. Das ist in Ordnung: Ergebnisse wie dieses sind nützlich, wenn sie richtig interpretiert werden. Die richtige Interpretation ist nicht, dass der Effekt existiert, sondern dass es sich lohnt, zusätzliche Ressourcen für seine Untersuchung aufzuwenden. Drei-Sigma-Effekte verschwinden normalerweise mit zusätzlichen Daten, aber man weiß nie.

Tommaso Dorigo, der Teil der CMS-Kollaboration ist, sagt in einem Blogbeitrag: „Die Wahrscheinlichkeit, dass dies stattdessen nur ein Zufall ist, ist sehr, sehr hoch“.

Andererseits haben BaBar und Belle Beweise für eine ähnliche Anomalie gesehen, zumindest laut Wikipedia (letzter Absatz des Abschnitts). Das mag Anlass zu Optimismus geben.

Nehmen wir "3 Sigma" als drei Standardabweichungen und betrachten wir ein paar Wahrscheinlichkeiten.

Wenn ein Datum zufällig aus einer gemäß einer Gaußschen Verteilung verteilten Stichprobe entnommen wird, dann ist die Wahrscheinlichkeit, dass das Datum innerhalb von 3 Standardabweichungen vom Mittelwert liegt

1 2 π 3 3 e X 2 / 2 D X 0,9973
Die Wahrscheinlichkeit, dass ein Datum außerhalb dieses Bereichs fällt, beträgt also ungefähr 0,0027 oder 1 von 370.

In der Praxis ist es jedoch selten, eine reine Gaußsche Statistik zu erhalten. Üblicherweise sind die Flügel der Verteilung aufgrund verschiedener Ursachen höher als die einer Gaußschen Funktion. Lassen Sie uns dies grob modellieren, indem wir annehmen, dass die zugrunde liegende Verteilung wirklich eine Kombination aus einer Gaußschen Verteilung mit einer bestimmten Breite ist, mit einer kleinen (z. B. 2 Prozent) Hinzufügung eines breiteren „Sockels“, den wir auch annehmen werden Gaussian, aber mit 5-facher Breite. Dann ist die Verteilungsfunktion

F ( X ) = 0,98 N ( X , 1 ) + 0,02 N ( X , 5 )
Wo N ( X , σ ) = exp ( X 2 / 2 σ 2 ) / σ 2 π . Das Integral dieser Verteilung zwischen ± 3 Ist 0,986 also jetzt die fallwahrscheinlichkeit bei 3 σ oder mehr ist ungefähr 0,014 oder einer von 73. Dies ist nur ein grobes Bild, um ein Gefühl für die Zahlen zu bekommen.

Beachten Sie, dass ich mich nicht darum gekümmert habe, die Standardabweichung dieser zweiten Verteilung zu verwenden, die ist 1.16 , da die beiden Verteilungen gleich aussehen, wenn sie auf einer linearen Skala aufgetragen werden, und mit der Art der verfügbaren begrenzten Datenstichprobe bezweifle ich, dass es möglich ist, anhand der Daten allein zu sagen, ob sie als zweite oder erste Verteilung verteilt sind, oder eine andere Verteilung.

Wenn das Team in der ersten Berechnung ungefähr 370 Mal dasselbe Experiment durchführen würde, würde es das Ergebnis mit ziemlicher Wahrscheinlichkeit als zufällige Schwankung ansehen, und im zweiten Fall müsste es dasselbe Experiment nur etwa 73 Mal durchführen. Ich weiß nicht, in welcher Situation sich das Team befindet, aber sie werden sich all dessen bewusst sein, also wird ihr nächster Schritt darin bestehen, sich erneut anzusehen, was sie bereits getan haben, und, was noch wichtiger ist, weitere Daten zu sammeln, wenn dies möglich ist .

Ich hatte (beim Lesen dieses Artikels ) den Eindruck, dass Teilchenphysik-Experimente, die in Standardabweichungen berichten, tatsächlich eine Wahrscheinlichkeit gemäß einer bekannten Verteilung berechnen und diese dann künstlich wieder in Gaußsche Standardabweichungen umwandeln, ist das nicht wahr?
@ jacob1729 Das kann bei einigen Experimenten der Fall sein; diese Art der Transformation würde in den Einzelheiten eines entsprechenden technischen Dokuments erläutert werden. Ich habe Experimente durchgeführt, bei denen wir anhand der Daten festgestellt haben, dass eine Gaußsche Verteilung angemessen ist, und ich habe Experimente durchgeführt, bei denen wir anhand der Daten festgestellt haben, dass nicht-Gaußsche Korrekturen erforderlich sind.