Entschuldigen Sie, wenn ich mich im Folgenden etwas vage ausdrücke, ich wurde gebeten, bestimmte Aspekte des Experiments vorerst vertraulich zu behandeln.
Ein analoges Experiment wäre wie der Versuch, das Auf und Ab der Flut (Periode von 0,5 Tagen) zu „sehen“, indem man einen Photonendetektor auf dem Grund des Ozeans platziert (obwohl dies natürlich nicht funktionieren würde und dumm ist, aber das Prinzip ist zumindest ziemlich ähnlich.) Hoffe, das verdeutlicht es ein wenig, lass es mich wissen, wenn nicht.
Ich befinde mich derzeit in der Planungsphase dieses Experiments, von dem ich hoffe, dass es innerhalb eines angemessenen Zeitrahmens (idealerweise weniger als 6 Monate) eine Signalvariation (relative Größe) von 0,155% erkennt. Ich habe die Rate der (verwendbaren) Daten berechnet werden etwa 68 Ereignisse pro Tag sein, obwohl betont werden sollte, dass dies eine Zufallsvariable ist. Jetzt versuche ich herauszufinden, wie viele Tage ich den Detektor laufen lassen muss, um die Variation mit einem Konfidenzniveau von 3σ zu sehen?
Einige andere Details, die relevant sein können (oder auch nicht), sind: Es wird erwartet, dass die Schwankung des Signals sinusförmig mit einer Periode von 0,5 Tagen ist. Aus diesem Grund habe ich meine Nutzereignisrate auf 34 (d. h. die Hälfte) reduziert, da eindeutig keine Veränderung zu sehen ist, wenn das Sinussignal auf oder nahe dem Mittelwert liegt.
Ich habe nach einer Methode gegoogelt, um die Größe eines Datensatzes vorherzusagen, der erforderlich ist, um eine so kleine Signalvariation zu sehen, bin aber auf nichts gekommen. Ich wäre sehr dankbar für alle Hinweise / Tipps, die jemand anbieten könnte.
Ich glaube nicht, dass du das in sechs Monaten schaffst.
Ich werde unten eine Berechnung geben, aber zuerst eine Schätzung der Größenordnung. Wenn Sie insgesamt erkannt haben Ereignissen hat Ihre Messung einer Modulation einen Ordnungsfehler -- -- diese Dinge tun es immer! -- also wird die Anzahl der erforderlichen Ereignisse wie folgt sein Wo ist der gesuchte Modulationsgrad. In Ihrem Fall, , was etwa 400.000 Ereignissen entspricht, was bei der gegebenen Ereignisrate Jahrzehnte dauern wird.
Nun zu den Details.
Lassen die Gesamtzahl der Ereignisse in Ihrem Datensatz sein. Angenommen, Sie ordnen Ihre Daten ein Behälter nach Tageszeit. Sie gehen davon aus, dass das Signal die Form hat
Geht man weiter davon aus, dass Ihre Daten gleichmäßig über alle Tageszeiten verteilt sind, sind die Fehler in werden alle ungefähr gleich sein (weil ist klein). In diesem Fall ist der beste Schätzer von Ist
Rückseite der Umschlagsberechnung. (Ich bin in Eile, hoffe, ich habe das richtig verstanden.)
Wahrscheinlichkeitsfragen wie diese werden am besten mit Wahrscheinlichkeiten beantwortet, also wandeln wir zuerst Ihre Schätzung in eine Wahrscheinlichkeit um
:
Ihre Signalvariation beträgt 0,00155, also:
Sie möchten, dass die Standardabweichung 1/3 der Differenz zwischen 0,5 und beträgt
also lösen wir nach N auf:
Bei 68 Ereignissen pro Tag (eigentlich werden es wegen der Sinuswelle weniger sein) sind das 21.000 Tage.
Ted Bunn
Crowley
Colin K
Colin K
qftme