Wie finden Sie die Unsicherheit eines gewichteten Durchschnitts?

Das Folgende stammt aus einer Übungs-GRE-Frage:

Zwei experimentelle Techniken bestimmen die Masse eines Objekts 11 ± 1 k g und 10 ± 2 k g . Diese beiden Messungen können kombiniert werden, um einen gewichteten Durchschnitt zu erhalten. Wie groß ist die Unsicherheit des gewichteten Durchschnitts?

Was ist das richtige Verfahren, um die Unsicherheit des Durchschnitts zu finden?

Ich weiß, was die richtige Antwort ist (aufgrund des Antwortschlüssels), aber ich weiß nicht, wie ich diese Antwort erhalten soll.

Vergiss, dass es ein Durchschnitt ist. Wissen Sie, wie man Fehler für Summen (und Produkte) kombiniert?
Ich habe das Hausaufgaben-Tag hinzugefügt, weil es so ist, obwohl es nicht buchstäblich Hausaufgaben sind
Ja, aber dabei komme ich zu 5 / 2 . Laut Praxistest ist das falsch.
Die Personen, die diese Tests bei ETS durchführen, sind in der Regel inkompetent, und es ist oft unmöglich, ihre Gedanken zu lesen. Sie sollten einfach sagen, welche Antwort sie erhalten haben, damit die Leute versuchen können, rückwärts zu arbeiten, um die fehlerhafte Argumentation zu extrahieren, die sie verwendet haben. Es gibt keinen anderen Weg, ETS-Probleme zu lösen, als die Psychologie der Tester zu lernen.
Der richtige Fehler ist so, wie Sie ihn angeben. Es könnte ein Tippfehler im Schlüssel sein. Ich denke, menschliche Tippfehler können bis zu 5% betragen. Dies wurde in den frühen Computertagen untersucht, als wir Computer mit Lochkarten mit Daten fütterten. Zuerst haben wir die Daten mit einer Lochmaschine, einem großen Schreibtisch mit Tastatur usw. eingelocht, und dann wurden die Lochkarten zur Kontrollmaschine gebracht und erneut abgetippt/gelocht, damit Fehler auftauchten und korrigiert wurden. Das brachte die Fehlerquote auf eine akzeptable Zahl.
Dies ist eine ziemlich spezifische Frage, die kurz davor steht, als "zu lokalisiert" geschlossen zu werden, aber ich habe sie ein wenig bearbeitet, um zu versuchen, sie allgemein genug zu halten, um offen zu bleiben. Die Sache ist die, weil der Antwortschlüssel falsch ist, gibt es in einer Antwort nicht viel zu sagen, außer das allgemeine Verfahren zum Kombinieren von Unsicherheiten zu erklären, und ich bin mir ziemlich sicher, dass dies bereits von anderen Fragen hier und auf vielen anderen Websites abgedeckt wird.
Eigentlich liegt der Fehler am gewichteten Durchschnitt 2 / 5 kg (und nicht 5 / 2 kg wie in einem der obigen Kommentare angegeben). Dies ist kleiner als die kleinste der beiden Unsicherheiten und dies ist sinnvoll, da Sie Informationen hinzufügen.

Antworten (3)

Ich stimme @Ron Maimon zu, dass diese ETS-Fragen problematisch sind. Aber das ist (glaube ich) die Argumentation, mit der sie gehen. Anders als bei @ Mikes Annahme sollten Sie nicht den normalen Durchschnitt nehmen, sondern wie in der Frage angegeben den gewichteten Durchschnitt. Jeder Messung wird ein gewichteter Durchschnitt zugeordnet x ich ein Gewicht w ich und der Durchschnitt ist dann

ich w ich x ich ich w ich

Nun stellt sich die Frage, welche Gewichte man nehmen sollte. Ein sinnvoller Ansatz ist es, die Messungen mit besserer Genauigkeit stärker zu wiegen als die mit geringerer Genauigkeit. Es gibt eine Million Möglichkeiten, dies zu tun, aber aus diesen könnte man die folgenden Gewichte geben:

w ich = 1 ( Δ x ich ) 2 ,
was dem Kehrwert der Varianz entspricht.

Wenn wir das also anschließen, haben wir es

c = 1 a + 1 4 b 1 + 1 4 = 4 a + b 5

Daher,

Δ c = ( c a Δ a ) 2 + ( c b Δ b ) 2

Δ c = ( 4 5 1 ) 2 + ( 1 5 2 ) 2 = 16 25 + 4 25 = 20 25 = 4 5 = 2 5

das ist die Antwort im Lösungsschlüssel.

Warum w ich = 1 / σ ich 2

Die Wahrheit ist, dass diese Wahl nicht völlig willkürlich ist. Es ist der Wert für den Mittelwert, der die Wahrscheinlichkeit maximiert (der Maximum-Likelihood-Schätzer).

P ( { x ich } ) = f ( x ich | μ , σ ich ) = 1 2 π σ ich exp ( 1 2 ( x ich μ ) 2 σ ich 2 )
. Dieser Ausdruck maximiert, wenn der Exponent maximal ist, also die erste Ableitung bzgl μ soll verschwinden:

μ ich ( 1 2 ( x ich μ ) 2 σ ich 2 ) = ich ( x ich μ ) σ ich 2 = 0

Daher,

μ = ich x ich / σ ich 2 ich 1 / σ ich 2 = ich w ich x ich ich w ich
mit w ich = 1 / σ ich 2

luksen hat erklärt, wie man einen gewichteten Durchschnitt findet, aber ich habe keine direkte Antwort auf die Frage gesehen. Wenn der gewichtete Durchschnitt durch die Genauigkeit jeder Messung berechnet wird, finden wir immer noch einen Fehler? Oder weil wir Fehler verwendet haben, um den gewichteten Durchschnitt zu finden, ist er im Ergebnis enthalten?
Was ist also die Antwort auf die Frage?

Da andere Fragen sowie Google auf diese Frage hinweisen, möchte ich die bereits vorhandene Antwort von luksen um eine Motivation aus der Stochastik zur Verwendung der Fehlerfortpflanzungsgleichung erweitern.

Nehmen wir an, wir haben n Zufallsmessungen X ich , typischerweise mit bezeichnet E { X ich } ± σ ich (oder x ich ± Δ x ich ), wohingegen E { } und σ ich bezeichnen den Erwartungswert bzw. die Standardabweichung. Entsprechend der Frage interessiert uns der gewichtete Durchschnitt dieser Messungen, berechnet nach Y = ich w ich X ich ich w ich ( = c ). Dank der Linearität des Erwartungswerts ist er ziemlich einfach zu bekommen

E { Y } = E { ich w ich X ich ich w ich } = ich w ich E { X ich } ich w ich .
Für die Varianz σ 2 , wir brauchen noch ein paar Zeilen, aber keine Tricks.
σ 2 = E { ( Y E { Y } ) 2 } = E { ( ich w ich X ich ich w ich E { ich w ich X ich ich w ich } ) 2 } = 1 ( ich w ich ) 2 E { ( ich w ich X ich ) 2 2 ( ich w ich X ich ) ( j w j E { X j } ) + ( ich w ich E { X ich } ) 2 } = 1 ( ich w ich ) 2 E { ich , j w ich X ich w j X j 2 ich , j w ich X ich w j E { X j } + ich , j w ich E { X ich } w j E { X j } } = 1 ( ich w ich ) 2 ich , j w ich w j ( E { X ich X j } 2 E { X ich } E { X j } + E { X ich } E { X j } ) = 1 ( ich w ich ) 2 ich , j w ich w j ( E { X ich X j } E { X ich } E { X j } ) = 1 ( ich w ich ) 2 ich , j w ich w j C Ö v ( X ich , X j )
Die Kovarianz gilt C Ö v ( X ich , X ich ) = σ ich 2 und, solange die ursprünglichen Messungen X ich und X j unabhängig sind, C Ö v ( X ich , X j ) = 0 Andernfalls. Dies führt zur Antwort auf die ursprüngliche Frage, die Varianz (quadratische Standardabweichung) des Durchschnitts Y von n Messungen X ich mit zufälliger Unsicherheit σ ich :
σ 2 = 1 ( ich w ich ) 2 ich w ich 2 σ ich 2 ,
was nachgibt
Δ c = σ = 1 ich w ich ich ( w ich σ ich ) 2 .
Genau das ergibt die Fehlerfortpflanzungsgleichung nach Einsetzen der Ableitungen von c . Warum ist es genau, während die Fehlerfortpflanzungsgleichung eine Annäherung ist? Die Fehlerfortpflanzungsgleichung nähert sich durch eine Tayler-Entwicklung erster Ordnung an . Da der Mittelwert eine lineare Funktion ist, ist er hier exakt und nicht nur angenähert.

Zusatzinformationen: Für den ungewichteten Durchschnitt ( w ich = 1   ich ), wir bekommen

E { Y } = 1 n ich E { X ich } σ 2 = 1 n 2 ich σ ich 2
Wenn alle Originalmuster X ich haben die gleiche Varianz σ ~ 2 , führt dies auch zu der bekannten Varianz des Durchschnitts:
σ 2 = σ ~ 2 n .

Es wäre höchst unvernünftig, die Unsicherheit des Mittelwerts der Messungen größer als die Unsicherheit einer beliebigen Messung zu erhalten (√5/2 > 1). Was nützt es schließlich, Durchschnittswerte zu nehmen, wenn es Ihre Messwerte nur unsicherer macht?

Ich glaube, die ETS-Leute haben das Argument verwendet, dass die harmonische Summe der einzelnen Varianzen den Kehrwert der durchschnittlichen Varianz ergeben sollte, dh 1/v = 1/v1 + 1/v2, wie hier beschrieben: http://en.wikipedia.org /wiki/Weighted_arithmetic_mean#Dealing_with_variance

In der Tat ist die Unsicherheit 2 / 5 kg ( < 1 kg) und nicht 5 / 2 wie in einem der obigen Kommentare angegeben