Sollte bei der Regression von Daten der yyy-Abschnitt auf einen Wert gemäß dem Modell gezwungen werden?

Ich habe ein theoretisches Modell der Form

j = k X
Angenommen, ich messe die Datenpaare experimentell ( j , X ) , aus der ich den Wert von ermitteln möchte k . Ich verwende die Kurvenanpassungsfunktion von MS Excel (von der ich annehme, dass sie die lineare Regressionsmethode verwendet). Das heißt, ich zeichne die j Daten als Funktion der X Daten, und wenden Sie dann eine "lineare" Trendanpassung auf das Datendiagramm an, um den Wert für zu erhalten k . Meine Daten ( j , X ) wird zweifellos einen Fehler haben (wie in den Antworten und Kommentaren in diesem PSE-Post besprochen ). Beim Erstellen der Kurvenanpassung habe ich die Option, den y-Achsenabschnitt auf Null zu setzen, dh die Anpassungslinie durch den Ursprung des Diagramms verlaufen zu lassen. Dies wäre das vom theoretischen Modell vorhergesagte Ergebnis.

Alternativ kann die Kurvenanpassung so vorgenommen werden, dass der y-Achsenabschnitt der Wert ist, der am besten zu den Daten passt, was den ermittelten Wert ändern würde k .

Abgesehen von der Tatsache, dass ich MS Excel verwende, was ist die beste Methode für die Regression von Daten, um den Parameter zu finden k ? Soll ich die Regression erzwingen, um die Daten anzupassen und die j -Abfangen bei Null oder nicht?

Antworten (2)

Wenn Sie dem Modell glauben, sollten Sie die Steigung durch Anpassen finden j = k X . Die Lösung der kleinsten Quadrate für Daten mit identischen Fehlern ist k = X j ¯ / X 2 ¯ .

Sollte man dem Modell glauben? Das ist eine ganz andere Frage. Verwirren Sie sie nicht. Berechnung der χ 2 wäre ein guter Anfang.

Auf jeden Fall sollten Sie Excel nicht für ernsthaft wissenschaftliche Zwecke verwenden. Bewahren Sie es für Ihre Spesenformulare auf.

Zur Verdeutlichung, ob das Modell für Spannung steht v = ICH R , und wir haben die Daten wie in diesem PSE-Beitrag ( physics.stackexchange.com/questions/55534/… ) gezeigt, die Anpassung sollte so erfolgen, dass der y-Achsenabschnitt Null ist und wir den besten Wert für finden R (was ist die Steigung der Linie zu den Daten mit y-Achsenabschnitt = 0)?

Wenn Sie Federdehnungsdaten erhalten, sollte die Antwort lauten, dass Sie den y-Abschnitt nicht auf Null zwingen. Für solche Daten haben neue Federn einen gewissen Widerstand, der eine geringe Kraft erfordert, die auf sie ausgeübt werden muss (z. B. ein kleines hängendes Gewicht), bevor sie sich dehnen. Dies ist ein realer Effekt, entspricht einer „zu stark komprimierten“ Feder und ist zweifellos auf den Herstellungsprozess der Feder zurückzuführen. Unabhängig davon, ob Ihr Prozess eine Feder dehnt oder nicht, sollten Sie außerdem Daten in einem Bereich erhalten, der verifizieren kann, ob Sie es mit einem solchen Effekt zu tun haben, und sicherstellen, dass Ihr mathematisches Modell mit den experimentellen Daten übereinstimmt.

Zugegeben, die Frage, was die beste Methode für die Regression von Daten ist, um sie nach Parametern aufzulösen, ist interessant. Auf der einen Seite könnte Ihnen die endliche Intercept-Regression etwas über die Daten sagen, z. B. dass sie irgendeine Form von experimentellem Fehler erleidet oder Phänomenen unterliegt, die in dem Modell, von dem Sie annehmen, dass es regiert, nicht berücksichtigt werden (Ihr „übermäßig komprimiertes“ Federbeispiel). . Wenn andererseits alles, was Sie wissen, das eine „theoretische“ Modell ist und Sie glauben, dass dieses Modell „wahr“ ist, dann sollten Sie anscheinend die Null-Achsenabschnitt-Option wählen, um mit dem Modell in Einklang zu stehen …
...Wenn diese Option zeigt, dass die Anpassung an das Modell „schlecht“ ist, weist dies ebenfalls darauf hin, dass etwas mit Ihren Messungen nicht stimmt. Wenn Sie ein Federhersteller waren und die Federkonstante melden mussten k , je nach Modell j = k X , wäre es eine bewährte Methode, den Zero-Intercept-Ansatz zu verwenden, um zu finden k und dann die damit verbundene Ungewissheit melden k ?
@Armadillo, für das Federbeispiel gilt: Sobald einer "komprimierten" Feder eine kleine Menge Gewicht hinzugefügt wird, folgt sie dem Hooke'schen Gesetz, das durch Experimente demonstriert werden kann. Daher ist nichts falsch daran, die Gleichung zu verwenden, die tatsächlich diese bestimmte Feder darstellt, insbesondere wenn Sie diese Feder als Element eines anderen Experiments verwenden.
Was ist, wenn der y-Achsenabschnitt ein positiver Wert ist? Das heißt, die Best-Fit-Linie zeigt, dass sich die Feder dehnt, wenn die Kraft auf die Feder Null ist. Schlagen Sie immer noch vor, dass ich den y-Achsenabschnitt nicht auf Null erzwinge?
@Armadillo, ich denke, Sie meinen, was ist, wenn der y-Achsenabschnitt negativ ist (dh es ist eine Druckkraft erforderlich, um die Feder wieder auf ihre ursprüngliche Länge zu bringen, und Sie passen die Federlänge an die Dehnungskraft an). Die Antwort hängt davon ab, ob Sie die Daten an die Originallänge der Feder oder an die gestreckte Länge der Feder anpassen.
Nein, das meine ich nicht. die y-Achse ist die Änderung der Federlänge (Dehnung) und die x-Achse ist die ausgeübte Kraft. Ein negativer Schnittpunkt weist, wie Sie erklärt haben, auf „übermäßig komprimiert“ hin. Meine Frage an Sie ist, was ist, wenn Ihre Daten die beste Anpassung für einen positiven y-Abschnitt zeigen? Beachten Sie, dass Sie einen anfänglichen Datenpunkt als 0 Kraft anwenden, es gibt keine Dehnung, daher ist das Paar (0,0) ein Datenpunkt in Ihrem Datensatz.
@Armadillo, verwenden Sie für eine ideale Feder das Hookesche Gesetz. Verwenden Sie für eine bestimmte reale Feder die Gleichung, die zu den experimentellen Daten passt.