Ich lese aus dem klassischen Lehrbuch Principles of Population Genetics, Hartl und Clark (pdf hier ).
Einführung
Lassen bezeichnen die Verteilung der Allelhäufigkeit zum Zeitpunkt das zu der Zeit wissen Die Frequenz war . Man kann die zeitliche Änderung dieser Verteilung unter Verwendung der Kolmogorov-Vorwärtsgleichung modellieren
wo ist der "Driftparameter", der die natürliche Selektion darstellt (also in Abwesenheit der Selektion ), und ist der "Diffusionsparameter", der die genetische Drift darstellt. Der Diffusionsparameter ist , wo ist die Populationsgröße.
Frage
Warum stimmt das ?
Ich begrüße intuitive Erklärungen und mathematische Beweise.
Gedanken
Ich würde denken, dass es vom Wright-Fisher-Modell der genetischen Drift abgeleitet ist, bei dem die Verteilung der Allelhäufigkeit bei der nächsten Generation durch eine Binomialverteilung gegeben ist.
Es geht in der Tat vom Wright-Fisher-Modell aus, insbesondere von dessen Diffusionsprozess-Näherung.
Wenn die Population groß ist , dann bei der Erzeugung die Anzahl der Allele ist , und so ist die Häufigkeit von Allelen , den diploiden Fall annehmend. Dann sagt Wright-Fisher:
Wir können dies wie folgt auf Forward Kolmogorov beziehen. Denken Sie daran, dass die Binomialverteilung durch eine Normalverteilung mit Mittelwert angenähert werden kann und Varianz gegeben durch den Mittelwert und die Varianz des Binoms. Dies sagt uns Folgendes:
In Bezug auf die Intuition bin ich mir nicht sicher. Im Wesentlichen misst, wie viel Störung in der Allelfrequenz Sie aufgrund rein zufälliger Effekte, dh genetischer Drift, in jeder Generation erwarten können. Beachten Sie, dass es keine Störung gibt, wenn oder , dh es können keine zufälligen Veränderungen auftreten, wenn niemand oder alle das Allel haben. Beachten Sie auch, dass diese Varianz genau die Varianz einer Bernoulli-Verteilung ist . Es ist, als hätten wir das Modell auf individueller Ebene zu einem Modell auf Bevölkerungsebene destilliert, das einfach die Häufigkeit der binären Wahl der Allelpräsenz betrachtet, denke ich. Die Varianz (Rauschen) ist maximal, wenn die Frequenz ist . Es drückt das Allel irgendwie von der Mitte weg, indem es das Rauschen erhöht, wenn man dorthin geht; man könnte erwarten, dass (wenn es lange genug läuft) ein solches Modell trifft und stecken bleibt oder (nicht sicher, ob das stimmt). Ich habe ein bisschen geschaut, ob es noch andere interessante Interpretationen des hier betrachteten sde gibt (zB in der Physik), konnte aber keine finden. Im Grunde wäre es gleichbedeutend mit einer Wärmegleichung, die sich unter irgendeiner potentiellen Funktion ausbreitet, die durch gesteuert wird .
Ihre Frage hängt eng mit dieser zusammen . Meine Antwort folgt weitgehend Tataru et al., Statistical Inference in the Wright-Fisher Model Using Allele Frequency Data .
ddiez
V(x)
?Remi.b