Ich messe spezifische phenolische Verbindungen in Blättern von A. thaliana . Ich habe viele verschiedene Sorten und verschiedene Behandlungen. Anfangs habe ich ein Blatt pro Pflanze für drei Pflanzen für jede Behandlung gemessen, Sortenkombination (links im Beispielbild). Das Entnehmen von Blattstanzen ist der schnelle Teil, die eigentliche Verarbeitung der Proben ist sehr zeitaufwändig und geschwindigkeitsbegrenzend. Um meine Genauigkeit und meinen Durchsatz zu erhöhen, wäre es schön, wenn ich mehr als 3 Pflanzen pro Behandlung und Sortenkombination beproben könnte! In diesem Fall sollte die Standardabweichung die Unterschiede zwischen Proben der gleichen Behandlung, Sortenkombination darstellen.
Daher entscheide ich mich jetzt dafür, die drei Proben von den drei verschiedenen Pflanzen aus derselben Behandlung und Sortenkombination zu mischen und dies zwei- oder dreimal zu wiederholen (rechts im Beispielbild). Auf diese Weise verliere ich Messungen an einzelnen Pflanzen, aber ich sollte immer noch den Durchschnitt meiner Kombination aus Behandlung und Sorte messen. Wenn ich auf diese Weise Messungen durchführe, bedeutet dies auch, dass ich mehr als 3 Pflanzen, zum Beispiel 6, in einer einzigen Probe zusammenfassen kann, während ich den gleichen Verarbeitungsaufwand hinterher habe. In diesem Fall sollte die Standardabweichung die Genauigkeit meiner Laborpraktiken darstellen, aber der Mittelwert liegt tatsächlich näher am wahren Mittelwert.
Meine Frage ist, ob dies wissenschaftlich fundiert ist?
Wenn Sie die Konfiguration auf der linken Seite verwenden, spiegelt Ihre Varianz zwischen den Röhren die Varianz zwischen Individuen wider.
Wenn Sie die Konfiguration auf der rechten Seite verwenden, spiegelt Ihre Varianz zwischen den Röhrchen hauptsächlich die Varianz in Ihrem Assay wider (und vielleicht etwas die Varianz innerhalb eines Blattes).
Normalerweise führen Sie ein solches Experiment durch, weil Sie Ihre Ergebnisse auf eine größere Population extrapolieren möchten. Um dies gültig zu tun, müssen Sie in der Lage sein, die Varianz in der Grundgesamtheit aus Ihrer Stichprobe zu schätzen: die Varianz zwischen Individuen. Anhand Ihrer Konfiguration auf der rechten Seite können Sie feststellen, ob sich Ihre Beispiele intern unterscheiden, aber sie sagen Ihnen nicht viel darüber aus, was Sie außerhalb Ihres Beispiels erwarten können. Wichtig ist, dass eine Ausreißerpflanze alle Proben kontaminieren würde, zu denen sie beiträgt.
Beachten Sie, dass 3 Personen pro Gruppe wahrscheinlich eine zu schwache Stichprobe sind, es sei denn, Ihre Effektgrößen sind sehr groß, was bedeutet, dass Sie nicht genügend Beobachtungen haben, um einen echten Unterschied in Ihren Gruppen zu erkennen. Sie können dies nicht umgehen, indem Sie mehr Proben von denselben Personen nehmen, Sie benötigen mehr Personen.
Es gibt einige Fälle, in denen Sie möglicherweise einen Ansatz wie rechts verwenden, um Ihren Assay zu testen , jedoch nicht, um Schlussfolgerungen über Unterschiede in den Behandlungen zu ziehen .
Die Sprache, die wir in der Statistik verwenden, um diese Szenarien zu beschreiben, ist Unabhängigkeit . Damit beispielsweise ein ungepaarter t-Test gültig ist, müssen die Stichproben sowohl innerhalb als auch zwischen Gruppen unabhängig sein (dasselbe gilt für ANOVA-Äquivalente mit mehreren Gruppen). Im richtigen Szenario sind Ihre Stichproben nicht unabhängig: Jede Stichprobe, die einen Teil von „Blatt 1“ enthält, wird eine Beziehung zu jeder anderen Stichprobe haben, die einen Teil von „Blatt 1“ enthält. Wenn Sie diese Stichproben so behandeln, als ob sie unabhängig wären, brechen Sie die Annahme Ihrer Hypothesentests und können sich beim Vergleich von Gruppen nicht auf die Ergebnisse verlassen.
Angenommen, Sie möchten wissen, ob Gruppe A schwerer als Gruppe B ist. Das Verfahren auf der linken Seite ist wie das Wiegen jedes Mitglieds der Gruppe A und das Vergleichen dieser Gewichte an Mitglieder der Gruppe B.
Das Verfahren auf der rechten Seite ist so, als ob alle Mitglieder der Gruppe A auf einer Waage stehen, dann absteigen, dann alle wieder auf einer Waage stehen, dann absteigen usw. Sie haben die beste Messung, die Sie bekommen können, wie viel die Eine bestimmte Stichprobe von Gruppe A wiegt über verschiedene Messungen auf Ihrer Waage hinweg, aber Sie können Ihre Stichprobe von Gruppe A nicht verwenden, um abzuschätzen, wie viel Variation es in Population A gibt: Ihre Variation sagt Ihnen nur, wie zuverlässig Ihre Waage ist. Dies ist eindeutig ein sehr, sehr falsches Verfahren, das dem Ansatz entspricht, den Sie auf der rechten Seite Ihrer Frage vorschlagen. Gehen Sie nicht so vor, Sie verschwenden Ihre Zeit und Ihre Ergebnisse werden falsch sein; Wenn Sie die Tatsache verbergen, dass Sie diesen Ansatz gewählt haben, wird Ihre Arbeit betrügerisch sein.
Ihre Intuition ist hier weitgehend richtig. Die Kommentare von Bryan Krause konzentrieren sich darauf, wo Ihre Antwort falsch ist. Einige seiner Aussagen sind wahr, andere spekulativ. Seine Antwort, kombiniert mit Ihrer Intuition, könnte Ihre Messungen verbessern. Ich habe unten ein Pooling-Schema gezeigt. Es sollte die wichtigsten Ideen sowohl aus Ihrer Frage als auch aus Bryans Antwort ansprechen. Die beiden Schlüsselideen hier sind (i) dass Pooling die Schätzungen verbessern kann und (ii) dass wiederholte Messungen Ihnen einen Einblick in die Stichprobenvariation geben können.
Jede Beobachtung, die Sie machen, zeigt eine andere Menge der Phenolverbindung. Einiges davon ist auf tatsächliche Unterschiede in der Menge der Phenolverbindung zurückzuführen. Diese Unterschiede können zwischen Pflanzenfeldern, zwischen Blättern einer Pflanze, zwischen Stempeln von einem einzelnen Blatt bestehen. Die Liste geht weiter. Darüber hinaus erzeugt jede Messung einer einzelnen Probe einen anderen Messwert. Dies ist eine Menge zu berücksichtigen. Wenn Sie Statistiken verwenden möchten, sollten Sie deutlich machen, wie sich Ihre Stichprobe auf die Population bezieht, an der Sie interessiert sind.
Sie haben erwähnt, dass die Einnahme von Blattstanzen relativ einfach ist. Das Sammeln von Blattproben nutzt dies zu Ihrem Vorteil. Angenommen, Sie führen nur drei Messungen für Sorte A und drei Messungen für Sorte B durch. Für die erste Messung könnten Sie 9 Pflanzen der Sorte A anbauen und von jeder dieser Pflanzen 4 Schläge nehmen. Sie mischen diese Schläge zusammen und messen die Fülle Ihrer Phenolverbindung. Für die zweite Messung an Sorte A könnten Sie diesen gesamten Vorgang mit verschiedenen Pflanzen wiederholen. Der Unterschied zwischen diesen beiden Messungen spiegelt die Stichprobenvariation wider. Dies ist auf alle oben genannten Quellen und andere zurückzuführen. Die Anzahl der Pflanzen zu verringern, die Sie zusammenfassen, löst das Problem der Stichprobenvariation nicht.
Aus statistischer Sicht kann uns das Pooling eine Durchschnittsbildung ermöglichen. Sagen wir Schläge werden der Sorte A entnommen. Sie werden als volumengleiche Proben hergestellt. Die entsprechende Konzentration der phenolischen Verbindung in jeder Probe ist . Das Mischen dieser Lösungen ergibt eine Probe mit Konzentration . Die Formel für diese Konzentration kann aus der jeweiligen Konzentration erhalten werden folgendermaßen
Wir möchten zeigen, dass Pooling die Varianz von verringert . Um zu sehen, wann dies passieren kann, beachten Sie
Eine Pooling-Strategie . Jedes Röhrchen misst eine Mischung, die mit mehreren Schlägen erstellt wurde. Jeder Schlag wird in einem einzigen Rohr gemessen.
Ben Bölker
Akkumulation
Robbie Goodwin
Geflusst