Sollte eine Gaußsche Kurve immer symmetrisch gezeichnet werden?

Bei dieser Frage geht es eher um das Auftreten einer Kurve, die beim Analysieren meiner Daten auftritt, als um eine tatsächliche physikalische Frage, aber ich denke, sie ist relevant.

Ich habe einige Daten aus einem EDM-Experiment analysiert und soll untersuchen, ob die Daten einer Gaußschen Verteilung folgen oder nicht. Ich habe benutzt χ 2 und das Excel-Solver-Add-In, um diesen Wert zu minimieren und die resultierende Funktion über meine Daten anzupassen.

Wenn ich jedoch meine Anpassung der Kurve (hier in Oragne gezeigt) zeichne, ist sie nicht symmetrisch. Es ist ziemlich nah, aber nicht ganz. Ist das ein Problem? Und wenn es Ihnen nichts ausmacht, warum oder warum nicht?

Nicht symmetrische Gaußsche Anpassung

Möglicherweise müssen Sie die Frage genauer spezifizieren. Eine Gaußsche Funktion ist symmetrisch zu ihrem Mittelwert durch Konstruktion. Es kann nichts dafür. Also, was ist die Asymmetrie, die Sie stört? Dass der Mittelwert nicht ganz Null ist? Dass der Fit möglicherweise einen Schwanz unterschätzt und den anderen überschätzt. Dass die Daten einfach etwas Streuung haben?
Wohlgemerkt, bei der Menge an Daten, die Sie haben, sind all diese Dinge zu erwarten.
Ehrlich gesagt bin ich mir nicht sicher, worüber ich mir Sorgen machen muss ... Es hört sich so an, als würden Sie sagen, dass meine Daten in einer realen Situation keiner Gaußschen Funktion folgen werden, also wird es nicht passen genau eine Gaußsche. Ist dies eine Folge davon, diskrete Werte gegen etwas zu zeichnen, das eine kontinuierliche Funktion sein sollte?
Wäre Cross Validated ein besseres Zuhause für diese Frage?
Gaußsche Funktionen sind per Definition symmetrisch. Als ich meine berechneten Werte in die Funktion eingegeben und gezeichnet habe, ist das Ergebnis nicht symmetrisch. Bedeutet das einfach, dass meine Daten keiner Gaußschen Verteilung folgen (aber offensichtlich etwas ähnlich sind)? dh geben bestimmte Werte, wenn sie in die Gaußsche Funktion eingegeben werden, keine symmetrische Funktion zurück? Nun, Excel ist das Programm, das ich verwenden muss, und das Solver-Add-In ist das, was mein Laborskript mir sagt, also werde ich mir darüber keine allzu großen Sorgen machen.
Was ist der Chi-Quadrat-Wert und wie wurde er berechnet, wenn Sie keine Unsicherheiten bei den Daten haben? Ist es tatsächlich eine Anpassung nach der Methode der kleinsten Quadrate?
Angenommen, Floris hat Ihre Beschwerde auf den Punkt gebracht, Sie wollten so etwas fragen wie: "Die orangefarbene Linie ist nicht symmetrisch, wie sie gezeichnet ist, aber sie soll eine symmetrische Funktion (eine Gaußsche Funktion) darstellen. Wie kann das richtig sein?" Es ist wichtig, unsere Aufmerksamkeit auf die richtigen Merkmale der Figur zu richten. Da Sie nach der "Anpassung" gefragt haben, haben sich einige von uns die Beziehung zwischen Ihren Daten und der Anpassungsfunktion angesehen und versucht herauszufinden, was Sie stört.
@Qmechanic Bei CrossValidated würde das OP möglicherweise eine statistisch strengere Antwort erhalten, jedoch möglicherweise auf Kosten der physischen Intuition. Ist dies der seltene Fall, in dem die Frage auf beide Seiten gehört?
Unter der Annahme, dass Floris die eigentliche Frage des OP beantwortet hat, geht es überhaupt nicht um Statistiken . Es geht um ein Feature der grafischen Darstellung von Funktionen. Nicht wirklich Fleisch für beide Seiten, aber ein Nebenproblem, auf das viele Studenten irgendwann stoßen.
Wenn Sie es an die Statistiker schicken, erhalten Sie nichts als Bayes'sches Geschwätz und Argumente über die vorherige Auswahl ;)
@Jacobadtr Ich habe Ihren Beitrag bearbeitet, um das widerzuspiegeln, was ich als Ihre eigentliche Frage wahrnehme (hauptsächlich basierend auf Ihrer Akzeptanz der Antwort von Floris). Wenn ich einen Fehler gemacht habe, setzen Sie ihn bitte zurück (oder besser, bearbeiten Sie ihn erneut, um ihn zu verdeutlichen). Das Bearbeiten von Posts wie diesem ist ein wichtiges Merkmal von Stack-Exchange-Sites, da diese Frage zukünftigen Besuchern helfen und Sie auf den Punkt bringen soll. Und die Tatsache, dass mehrere Personen fragen und erraten mussten, was Sie meinten, deutet auf eine Unklarheit im Originaltext hin.

Antworten (3)

So interpretiere ich, was passiert ist:

Sie haben Excel verwendet, um die Koeffizienten der Gaußschen Funktion zu berechnen, die die Daten am besten beschreiben: Mittelwert μ , Standardabweichung σ , und Größe A für eine Kurve

Y = A e ( X μ ) 2 / 2 σ 2

Dann haben Sie diese Funktion bei einer Reihe von X-Werten ausgewertet. Da die X-Werte nicht symmetrisch zum berechneten Mittel sind, sehen Sie nicht denselben Wert an entsprechenden Punkten auf beiden Seiten des Ursprungs.

Wenn Sie sicher wissen, dass die Gaußsche Anpassung in Excel symmetrisch zu X = 0 sein soll, würde es ausreichen, Solver nur die Berechnung zu erlauben σ Und A , und einstellen μ = 0 .

Es ist ziemlich unwahrscheinlich, dass der angepasste Mittelwert verrauschter Daten genau Null ist: Normalerweise ist es wichtiger zu testen, ob er Null sein könnte : Es gibt verschiedene statistische Tests, um festzustellen, ob ein bestimmter Satz von Beobachtungen mit einer bestimmten Nullhypothese konsistent ist ( In diesem Fall könnte die Nullhypothese "Daten stammen aus einer Verteilung mit Mittelwert = 0" lauten, und es sieht nicht so aus, als würden Ihre Daten ausreichen, um diese Hypothese zu zerstreuen).

Nach Kommentaren zu Wolphram Jonnys Antwort fragen Sie, ob Sie daraus schließen können, dass die Daten Gauß-verteilt sind. Die Antwort lautet: "Nein, das kannst du nicht". Es ist sehr schwer (manche sagen, unmöglich) zu beweisen, dass etwas wahr ist. Sie können nur hoffen zu zeigen, dass Sie nicht beweisen können, dass es falsch ist.

In Ihrem Beispiel wäre die Nullhypothese "die Daten folgen einer Gaußschen Verteilung". Ihr Test wäre, a zu tun χ 2 Testen Sie auf die Passform, und sehen Sie, ob der Wert von χ 2 ausreichend klein ist, dass Sie nicht ausschließen können, dass es sich um eine Gaußsche Funktion handelt. Dazu sehen Sie sich den p-Wert an - wenn er kleiner als ein bestimmter Grenzwert ist (normalerweise 0,05), können Sie sagen (mit einem Hut auf @Henry, der eine genauere Formulierung vorgeschlagen hat):

„Wenn diese Kurve tatsächlich Gaußsch ist und ich diese Methode anwende, werde ich fälschlicherweise behaupten, dass sie nicht gaußsch ist (diese Hypothese ablehnen) in weniger als 5% (was auch immer p verwendet wird) der Zeit, in der ich sie nicht ablehnen sollte.“

Der Grund für die verschlungene Formulierung ist, dass eine Zufallsstichprobe aus einer Gaußschen Verteilung zu einer Verteilung führt, die etwa 1 von 20 Mal "nicht gaußisch aussieht", wenn Sie diesen Grenzwert verwenden - mit anderen Worten, der p-Wert sagt tatsächlich "Sie werden bekommen dieses Ergebnis etwa p% der Zeit, wenn die Verteilung Gauß ist".

Es kann am Anfang etwas verwirrend sein. Fazit – Ihre Passform sieht gut aus, machen Sie sich keine Sorgen über die Asymmetrie, fahren Sie mit Ihrem Chi-Quadrat-Test fort.

Zu meiner eigenen Unterhaltung habe ich die obige Anpassung (mit einigen erfundenen Daten) mit den folgenden Ergebnissen durchgeführt:

Geben Sie hier die Bildbeschreibung ein

Dies ist die "normale" Ansicht. Sie können sehen, dass ich X- und Y-Werte eingegeben habe und eine "fit"-Spalte erstellt habe, die von drei Zellen abhängt (die ich mu, sigma und A genannt habe); Schließlich habe ich eine Fehlermetrik erstellt {=SUMSQ(B2:B12-C2:C12)}- beachten Sie die geschweiften Klammern, die Sie erhalten, wenn Sie sie als "Array-Formel" eingeben (Strg-Umschalt-Eingabe auf dem PC oder cmd-Umschalt-Eingabe auf dem Mac). Auf diese Weise können Sie das Ganze in einer Zelle berechnen, ohne eine separate Spalte mit den Fehlerwerten zu erstellen. Ich habe dann die Fehlerzelle ausgewählt und den Solver ausgeführt, wobei ich die Zelle minimiert habe, F6während ich die Zellen geändert habe F2:F4:

Geben Sie hier die Bildbeschreibung ein

Ein genauerer Blick auf die Formeln (verwenden Sie Strg-Backtick, um Formeln in Excel zu erweitern - aber beachten Sie, dass es nicht die {}der Array-Formel anzeigt ... einer von vielen Fehlern, da bin ich mir sicher):

Geben Sie hier die Bildbeschreibung ein

Sie können hier sehen, dass es eine eingebaute Funktion gibt, =CHITESTum die Anpassungsgüte zwischen den Daten und der Gaußschen Anpassung zu testen - und sie gibt einen p-Wert an, der weit über 0,05 liegt, sodass Sie nicht sagen können, dass diese Daten nicht normalverteilt sind.

Eine Gaußsche Anpassung ist per Definition symmetrisch, weil sie eine Gaußsche ist. Ihre orangefarbene Passform sieht nicht aus wie eine Gaußsche, sie ist nicht einmal glatt. Ich glaube nicht, dass Excel eine Gaußsche Anpassungsfunktion hatte (aber ich verwende Excel nicht, kann es also nicht sicher sagen. Sie können andere Software wie Matlab oder wahrscheinlich kostenlose im Internet verwenden. Oder verwenden Sie einfach diese Daten, um die Parameter zu berechnen von die am besten passende Gaußsche und zeichne sie in Excel. Update: Ich kann nicht sagen, was Ihr Professor will, aber ich habe die Felder, die ich bearbeitet habe, wenn Sie eine Gaußsche passen, passen Sie sie mit einer kontinuierlichen (die einzige "echte" Gaußsche) . Die Daten können nicht symmetrisch sein, aber die Gaußsche wird es. Die eigentliche Quelle der Daten kann symmetrisch sein, aber nur durch Zufall und Fehler sind Ihre Daten möglicherweise nicht symmetrisch. Jetzt, nachdem Sie sie mit einer Gaußschen Funktion angepasst haben, Es gibt Tests, die Ihnen sagen, ob die Anpassung gut ist und Sie die Asymmetrie dem Zufall zuschreiben können, oder ob Ihre Daten nicht wirklich gut von einer Gauß-Funktion beschrieben werden. Aber ich denke, das wird für das, was Ihr Professor will, ziemlich weit fortgeschritten sein. Ich würde (nur mit dem Auge) sagen, dass Ihre Daten eine Gaußsche akzeptabel gut darstellen

Ich denke, wie gezeichnet, ist es eine Gaußsche, die an den X-Werten der ursprünglichen (Daten-)Punkte mit linearer Interpolation ausgewertet wird. Solver in Excel kann die Koeffizienten der besten Anpassung leicht bestimmen - es ist ein ziemlich leistungsfähiges nichtlineares Optimierungstool, wenn Sie wissen, wie man es benutzt.
@Floris Oh, verstehe, das war mir nicht klar, ich dachte, es wäre irgendwie von Hand gemacht!
Hallo, ich habe die Gaußsche Anpassung manuell erstellt, also nehme ich an, dass es sich um eine Reihe von Punkten entlang einer Gaußschen Anpassung handelt, die mit geraden Linien verbunden sind. Ich folge einem Laborskript, daher bin ich zuversichtlich, dass mein Ausbilder danach gesucht hat. Das Ziel hier ist zu bestimmen, ob die Daten Gauß-verteilt sind oder nicht. Offensichtlich soll es kontinuierlich sein und ich habe relativ wenige Messungen, aber ist die nicht symmetrische Eigenschaft meiner Anpassung zu erwarten?
@Floris Ja, das habe ich getan
Ich aktualisiere meine Antwort, aber die von Floris ist detaillierter

Innerhalb der Spezifikation kann ich aus der Frage entnehmen - hier ist, was ich tun würde.

(i) Finden Sie den am besten geeigneten Gaußschen - was ich annehme, ist das, was Sie getan haben.

(ii) Ihre beste Anpassung sollte einen Chi-Quadrat-Wert zurückgeben

Sie sollten den Chi-Quadrat-Wert mit kritischen Werten der Chi-Quadrat-Verteilung für die entsprechende Anzahl von Freiheitsgraden der Anpassung vergleichen. Hier würde ich davon ausgehen, dass Sie 3 Modellparameter für Ihren Gaußschen (Höhe / Normalisierung, Breite / Sigma und Mittelwert / Mitte), 14 Datenpunkte und daher haben 14 3 = 11 Freiheitsgrade.

zB Für 11 dof können Sie die Gaußsche Hypothese mit 99%iger Sicherheit ablehnen, wenn der Chi-Quadrat-Wert 24,725 übersteigt.

Tabellen mit kritischen Werten unter: http://www.medcalc.org/manual/chi-square-table.php

(iii) Untersuchen Sie, ob die Residuen von der Anpassung abhängen X . Wenn es einen Trend in den Residuen gibt, erhalten Sie zwar möglicherweise ein akzeptables Chi-Quadrat, aber der Trend sagt Ihnen, dass es eine gewisse Asymmetrie gibt, die von einem Gaußschen Wert nicht gut angepasst wird.

Wenn man sich Ihre Daten ansieht, scheint dies nicht der Fall zu sein.