Bei dieser Frage geht es eher um das Auftreten einer Kurve, die beim Analysieren meiner Daten auftritt, als um eine tatsächliche physikalische Frage, aber ich denke, sie ist relevant.
Ich habe einige Daten aus einem EDM-Experiment analysiert und soll untersuchen, ob die Daten einer Gaußschen Verteilung folgen oder nicht. Ich habe benutzt und das Excel-Solver-Add-In, um diesen Wert zu minimieren und die resultierende Funktion über meine Daten anzupassen.
Wenn ich jedoch meine Anpassung der Kurve (hier in Oragne gezeigt) zeichne, ist sie nicht symmetrisch. Es ist ziemlich nah, aber nicht ganz. Ist das ein Problem? Und wenn es Ihnen nichts ausmacht, warum oder warum nicht?
So interpretiere ich, was passiert ist:
Sie haben Excel verwendet, um die Koeffizienten der Gaußschen Funktion zu berechnen, die die Daten am besten beschreiben: Mittelwert , Standardabweichung , und Größe für eine Kurve
Dann haben Sie diese Funktion bei einer Reihe von X-Werten ausgewertet. Da die X-Werte nicht symmetrisch zum berechneten Mittel sind, sehen Sie nicht denselben Wert an entsprechenden Punkten auf beiden Seiten des Ursprungs.
Wenn Sie sicher wissen, dass die Gaußsche Anpassung in Excel symmetrisch zu X = 0 sein soll, würde es ausreichen, Solver nur die Berechnung zu erlauben Und , und einstellen .
Es ist ziemlich unwahrscheinlich, dass der angepasste Mittelwert verrauschter Daten genau Null ist: Normalerweise ist es wichtiger zu testen, ob er Null sein könnte : Es gibt verschiedene statistische Tests, um festzustellen, ob ein bestimmter Satz von Beobachtungen mit einer bestimmten Nullhypothese konsistent ist ( In diesem Fall könnte die Nullhypothese "Daten stammen aus einer Verteilung mit Mittelwert = 0" lauten, und es sieht nicht so aus, als würden Ihre Daten ausreichen, um diese Hypothese zu zerstreuen).
Nach Kommentaren zu Wolphram Jonnys Antwort fragen Sie, ob Sie daraus schließen können, dass die Daten Gauß-verteilt sind. Die Antwort lautet: "Nein, das kannst du nicht". Es ist sehr schwer (manche sagen, unmöglich) zu beweisen, dass etwas wahr ist. Sie können nur hoffen zu zeigen, dass Sie nicht beweisen können, dass es falsch ist.
In Ihrem Beispiel wäre die Nullhypothese "die Daten folgen einer Gaußschen Verteilung". Ihr Test wäre, a zu tun Testen Sie auf die Passform, und sehen Sie, ob der Wert von ausreichend klein ist, dass Sie nicht ausschließen können, dass es sich um eine Gaußsche Funktion handelt. Dazu sehen Sie sich den p-Wert an - wenn er kleiner als ein bestimmter Grenzwert ist (normalerweise 0,05), können Sie sagen (mit einem Hut auf @Henry, der eine genauere Formulierung vorgeschlagen hat):
„Wenn diese Kurve tatsächlich Gaußsch ist und ich diese Methode anwende, werde ich fälschlicherweise behaupten, dass sie nicht gaußsch ist (diese Hypothese ablehnen) in weniger als 5% (was auch immer p verwendet wird) der Zeit, in der ich sie nicht ablehnen sollte.“
Der Grund für die verschlungene Formulierung ist, dass eine Zufallsstichprobe aus einer Gaußschen Verteilung zu einer Verteilung führt, die etwa 1 von 20 Mal "nicht gaußisch aussieht", wenn Sie diesen Grenzwert verwenden - mit anderen Worten, der p-Wert sagt tatsächlich "Sie werden bekommen dieses Ergebnis etwa p% der Zeit, wenn die Verteilung Gauß ist".
Es kann am Anfang etwas verwirrend sein. Fazit – Ihre Passform sieht gut aus, machen Sie sich keine Sorgen über die Asymmetrie, fahren Sie mit Ihrem Chi-Quadrat-Test fort.
Zu meiner eigenen Unterhaltung habe ich die obige Anpassung (mit einigen erfundenen Daten) mit den folgenden Ergebnissen durchgeführt:
Dies ist die "normale" Ansicht. Sie können sehen, dass ich X- und Y-Werte eingegeben habe und eine "fit"-Spalte erstellt habe, die von drei Zellen abhängt (die ich mu, sigma und A genannt habe); Schließlich habe ich eine Fehlermetrik erstellt {=SUMSQ(B2:B12-C2:C12)}
- beachten Sie die geschweiften Klammern, die Sie erhalten, wenn Sie sie als "Array-Formel" eingeben (Strg-Umschalt-Eingabe auf dem PC oder cmd-Umschalt-Eingabe auf dem Mac). Auf diese Weise können Sie das Ganze in einer Zelle berechnen, ohne eine separate Spalte mit den Fehlerwerten zu erstellen. Ich habe dann die Fehlerzelle ausgewählt und den Solver ausgeführt, wobei ich die Zelle minimiert habe, F6
während ich die Zellen geändert habe F2:F4
:
Ein genauerer Blick auf die Formeln (verwenden Sie Strg-Backtick, um Formeln in Excel zu erweitern - aber beachten Sie, dass es nicht die {}
der Array-Formel anzeigt ... einer von vielen Fehlern, da bin ich mir sicher):
Sie können hier sehen, dass es eine eingebaute Funktion gibt, =CHITEST
um die Anpassungsgüte zwischen den Daten und der Gaußschen Anpassung zu testen - und sie gibt einen p-Wert an, der weit über 0,05 liegt, sodass Sie nicht sagen können, dass diese Daten nicht normalverteilt sind.
Eine Gaußsche Anpassung ist per Definition symmetrisch, weil sie eine Gaußsche ist. Ihre orangefarbene Passform sieht nicht aus wie eine Gaußsche, sie ist nicht einmal glatt. Ich glaube nicht, dass Excel eine Gaußsche Anpassungsfunktion hatte (aber ich verwende Excel nicht, kann es also nicht sicher sagen. Sie können andere Software wie Matlab oder wahrscheinlich kostenlose im Internet verwenden. Oder verwenden Sie einfach diese Daten, um die Parameter zu berechnen von die am besten passende Gaußsche und zeichne sie in Excel. Update: Ich kann nicht sagen, was Ihr Professor will, aber ich habe die Felder, die ich bearbeitet habe, wenn Sie eine Gaußsche passen, passen Sie sie mit einer kontinuierlichen (die einzige "echte" Gaußsche) . Die Daten können nicht symmetrisch sein, aber die Gaußsche wird es. Die eigentliche Quelle der Daten kann symmetrisch sein, aber nur durch Zufall und Fehler sind Ihre Daten möglicherweise nicht symmetrisch. Jetzt, nachdem Sie sie mit einer Gaußschen Funktion angepasst haben, Es gibt Tests, die Ihnen sagen, ob die Anpassung gut ist und Sie die Asymmetrie dem Zufall zuschreiben können, oder ob Ihre Daten nicht wirklich gut von einer Gauß-Funktion beschrieben werden. Aber ich denke, das wird für das, was Ihr Professor will, ziemlich weit fortgeschritten sein. Ich würde (nur mit dem Auge) sagen, dass Ihre Daten eine Gaußsche akzeptabel gut darstellen
Innerhalb der Spezifikation kann ich aus der Frage entnehmen - hier ist, was ich tun würde.
(i) Finden Sie den am besten geeigneten Gaußschen - was ich annehme, ist das, was Sie getan haben.
(ii) Ihre beste Anpassung sollte einen Chi-Quadrat-Wert zurückgeben
Sie sollten den Chi-Quadrat-Wert mit kritischen Werten der Chi-Quadrat-Verteilung für die entsprechende Anzahl von Freiheitsgraden der Anpassung vergleichen. Hier würde ich davon ausgehen, dass Sie 3 Modellparameter für Ihren Gaußschen (Höhe / Normalisierung, Breite / Sigma und Mittelwert / Mitte), 14 Datenpunkte und daher haben Freiheitsgrade.
zB Für 11 dof können Sie die Gaußsche Hypothese mit 99%iger Sicherheit ablehnen, wenn der Chi-Quadrat-Wert 24,725 übersteigt.
Tabellen mit kritischen Werten unter: http://www.medcalc.org/manual/chi-square-table.php
(iii) Untersuchen Sie, ob die Residuen von der Anpassung abhängen . Wenn es einen Trend in den Residuen gibt, erhalten Sie zwar möglicherweise ein akzeptables Chi-Quadrat, aber der Trend sagt Ihnen, dass es eine gewisse Asymmetrie gibt, die von einem Gaußschen Wert nicht gut angepasst wird.
Wenn man sich Ihre Daten ansieht, scheint dies nicht der Fall zu sein.
dmckee --- Ex-Moderator-Kätzchen
dmckee --- Ex-Moderator-Kätzchen
jm22b
QMechaniker
jm22b
ProfRob
dmckee --- Ex-Moderator-Kätzchen
paisanco
dmckee --- Ex-Moderator-Kätzchen
ProfRob
dmckee --- Ex-Moderator-Kätzchen