Wie quantifiziert man den Fehler für einen multivariaten Ausdruck/eine multivariate Gleichung?

Nehmen wir an, ich habe einen abgeleiteten Ausdruck, den ich mit dem Experiment testen möchte: F ( X , j , z ) . Dazu habe ich die folgenden drei Tests mit Daten durchgeführt:

  1. Scan F ( X , j 0 , z 0 ) für mehrere X Werte und fand den std des Ausdrucks im Vergleich zum Experiment σ X .

  2. Scan F ( X 0 , j , z 0 ) für mehrere j Werte und fand den std des Ausdrucks im Vergleich zum Experiment σ j .

  3. Scan F ( X 0 , j 0 , z ) für mehrere z Werte und fand den std des Ausdrucks im Vergleich zum Experiment σ z .

Wie quantifiziere ich nun den Fehler oder die Gültigkeit des Ausdrucks? F ( X , j , z ) ?

Mein Ziel ist wissen, ob der Ausdruck F ( X , j , z ) ausreicht, um die Daten zu beschreiben, und wenn nicht, um Regionen zu identifizieren, in denen sie zusammenbricht. Mit anderen Worten, sagen wir, ich hatte einen Punkt F ( X 1 , j 1 , z 1 ) und ein experimenteller Datenpunkt, woher weiß ich, ob F ( X 1 , j 1 , z 1 ) fällt in den std und beschreibt die Daten vernünftig?

Vielen Dank im Voraus!

randomservices.org/random/hypothesis/ChiSquare.html Sie können versuchen, den Chi-Quadrat-Test zu verwenden, um die Güte Ihrer Funktion zu testen.
Sie haben nicht getestet F über den gesamten Parameterraum, kann also außerhalb des von Ihnen getesteten Bereichs nicht viel sagen.

Antworten (1)

Wenn ich das richtig verstehe, die σ X , σ j , σ z beinhalten sowohl Abweichungen des Modells von der Realität als auch die Varianz aufgrund von Messunsicherheiten, so dass sie allein nicht ausreichen, um Kriterien dafür zu definieren, ob das Modell die Daten angemessen beschreibt. Riesig σ X , σ j , σ z kann entweder auf schlechte Messungen oder ein schlechtes Modell zurückzuführen sein.

Man muss die Unsicherheiten abschätzen ( σ M ich ) in den Messwerten ( M ich ), idealerweise basierend auf einem guten Verständnis des Messsystems; Kalibrierungsmessungen bekannter Werte sind sehr hilfreich. Wenn der einzige Anhaltspunkt für die experimentelle Unsicherheit die Varianz der Daten ist, dann kann man die Unsicherheit teilweise abschätzen, indem man sich die lokale Variation (dh das Rauschen) von Datenpunkten ansieht, die in (x,y,z) nahe genug beieinander liegen, so dass die Änderungen in F(x,y,z) werden als vernachlässigbar angesehen. Beispiel: Wenn Sie wiederholt Werte an 10 Stellen messen, wie groß sind die 10 Standardabweichungen der Messungen, die für jeden der 10 Punkte durchgeführt wurden. (Es ist wichtig, nicht einfach wiederholte aufeinanderfolgende Messungen am selben Punkt durchzuführen, da dadurch Fehler aufgrund von Drifts und Neupositionierungen übersehen werden. Die Varianz des Rauschens sagt Ihnen auch nichts über systematische Fehler aus, wie sie bei der Instrumentenkalibrierung auftreten.

Beachten Sie, dass Sie auch außeraxiale Messungen vornehmen sollten, da dies möglich ist F ( X , j 0 , z 0 ) , F ( X 0 , j , z 0 ) , Und F ( X , j 0 , z ) Alle stimmen den Daten sehr zu, haben aber große Meinungsverschiedenheiten außerhalb der Achse, z. B. entlang der Diagonale F ( X , j , z 0 ) .

Ein wichtiger Punkt, den Sie nicht erwähnen, ist, ob es im Modell freie Parameter gibt, die aus den Daten ermittelt werden. Ein Modell mit vielen angepassten Parametern kann manchmal Daten „angemessen beschreiben“, ohne tatsächlich etwas Nützliches über die Physik des Systems zu sagen (siehe z. B. https://www.johndcook.com/blog/2011/06/21/how-to- fit-an-Elefanten/ ). Angepasste Parameter sind besonders problematisch, wenn außerhalb der Regionen, in denen die Daten aufgenommen wurden, extrapoliert wird.