Um 4:30 dieses Videos beschloss der Autor, die Standardabweichung der Grundgesamtheit mit der Stichproben-Standardabweichung zu schätzen (Stichprobengröße war ).
Im nächsten Video erwähnte der Autor, dass es vernünftig sei, weil die Stichprobengröße größer als sei . Nun, was sagt uns, dass wir die Standardabweichung auf diese Weise schätzen könnten? Warum ist diese magische Grenze? Hat es etwas mit dem zentralen Grenzwertsatz zu tun? (Ich denke nicht, weil wir die Standardabweichung des Mittelwerts nicht berechnen, also in keiner Weise damit zusammenhängt).
Im Grunde scheint die Frage hier zu sein, ob die z-Statistik oder die t-Statistik verwendet werden soll, um ein Konfidenzintervall für den Mittelwert der Grundgesamtheit zu finden oder beim Testen einer Hypothese über
Vermuten ist eine Zufallsstichprobe aus einer Normalbevölkerung, von der sowohl der Mittelwert und die Standardabweichung sind unbekannt. Wir möchten ein 95%-Konfidenzintervall (KI) finden für
Wenn wir wüssten Dann
Falls unbekannt ist, ist es zweckmäßig, die Standardabweichung der Stichprobe zu verwenden stattdessen behaupten oder vielleicht ist ein ungefähres 95 %-KI für Wenn Diese Annäherung ist ziemlich gut, aus Gründen, die wir gleich unten sehen.
Wenn
ist nicht bekannt, die genaue Verteilung ist
Für kleinere Werte von , die Werte von deutlich größer werden. Zum Beispiel wenn , wir haben Dadurch wird das 95 %-KI länger (ungenauer). Sie können sich diesen Genauigkeitsverlust als „Strafe“ für die Schätzung vorstellen von anstatt den genauen Wert zu kennen
Es gibt ein paar gute Gründe, die „Rule of 30“ ganz zu vergessen:
Erstens „funktioniert“ es nur für 95 % CIs. Für ein KI von 99 % müssen wir 0,5 % der Wahrscheinlichkeit von jedem Rand abschneiden: der normale Grenzwert ist und wir müssen die Stichprobengröße auf etwa erhöhen Vor
Zweitens kennen wir bei der Verwendung von Statistiksoftware entweder den genauen Wert von oder das Programm wird es aus den Daten wie annähern Von Anfang an müssen wir wissen, ob wir ein z-Intervall oder ein t-Intervall machen. Die Verwendung einer unnötigen Regel zur Stichprobengröße verwirrt das Problem nur. Die richtige Regel lautet: Verwenden Sie z-Prozeduren ist ist bekannt (und ist es normalerweise nicht in der Praxis); Verwenden Sie t-Prozeduren von not.
Drittens versuchen einige Autoren von Grundschulbüchern, die „30er-Regel“ (ohne theoretische Begründung) für verschiedene Arten von Begrenzungsverfahren, die Anwendbarkeit des zentralen Grenzwertsatzes, die sichere Verwendung von t-Verfahren für nichtnormale Daten und so weiter zu verwenden An. Bei diesen Anwendungen ist 30 selten eine geeignete Trennlinie.
Keine der beiden Methoden zum Schätzen der Standardabweichung der Grundgesamtheit von der Stichprobe ergibt jedoch eine unverzerrte Schätzung Methode erzeugt eine unverzerrte Schätzung der Varianz.
Wenn Sie die beiden Schätzungen der Varianz vergleichen
[ ]
s konvergiert mit zunehmendem Wert gegen 1
. Siehe Wikipedia unter „Unvoreingenommene Schätzung der Standardabweichung“.
Maskulin