Kimuras Näherung für die Wahrscheinlichkeit der Fixierung einer Mutation unter Selektion findet bis heute immer wieder Verwendung in populationsgenetischen Modellen. Ich versuche, die mathematische Grundlage dieser Gleichung zu verstehen, aber keines der Lehrbücher oder Online-Ressourcen, die ich überprüft habe, bietet eine einfache Ableitung dieser Annäherung, sondern zitiere einfach Kimuras Artikel von 1962 .
Ich habe also das Originalpapier gelesen, aber die bereitgestellte Ableitung erscheint mir nicht klar.
Kimura beginnt mit der Definition der Wahrscheinlichkeit einer Änderung der Allelhäufigkeit als:
wo (genau zitiert)
Dann verwendet er die Näherung der Taylor-Reihe, um eine Gleichung dieser Form zu erhalten:
Er definiert und als Mittelwert und Varianz der Änderung von pro Generation. Diese sind formal definiert als:
( sollte eigentlich nur das zweite Moment gemäß der mathematischen Definition sein und nicht die Varianz)
Dann löst er Gleichung 3 im stationären Zustand mit Randbedingungen und um dies zu erhalten:
wo:
Ich habe die Herleitung bis zu diesem Punkt verstanden.
Dann setzt er einfach:
und erhält Gleichung 1.
Gibt es eine einfache Herleitung für Gleichung 1?
Wenn nicht, kann mir jemand erklären, wie M und V wie oben angenähert wurden?
Vermutlich haben Sie dies gelöst, aber falls nicht, liegt es daran, dass die PDE eine Kolmogorov-Rückwärtsgleichung ist , sodass die Koeffizienten erster und zweiter Ordnung der Mittelwert und die Varianz des zugrunde liegenden stochastischen Prozesses sind, der modelliert wird.
Betrachten Sie im Detail eine stochastische Differentialgleichung (deren Lösung durch einen Ito-Diffusionsprozess gegeben ist):
Beachten Sie, dass die Drift (infinitesimaler Mittelwert) und Diffusionskoeffizient (infinitesimale Varianz) sind wie in der Zeitung (mit Ausnahme des negativen Vorzeichens, von dem ich annehme, dass es ignoriert werden kann, da er sich meistens nur um den Fall zu kümmern scheint, wenn ohnehin). Tatsächlich werden sie äquivalent geschrieben:
Beachten Sie, dass eine nützliche Näherung der Übergangsdichte gegeben ist durch:
Ok, alles oben genannte ist also nur die grundlegende Theorie stochastischer Prozesse. Wenn wir also ein stochastisches Modell für die Populationsdynamik haben, können wir Werte für ableiten und daraus (durch Berechnung seiner Momente), und diese werden auf die rückständige Kolmogorov-Gleichung übertragen, auf der Kimuras Arbeit beruht.
Hier zeigt sich meine Unkenntnis der Bevölkerungsdynamik. Da Kimura jedoch Fisher und Wright erwähnt, habe ich das Wright-Fisher-Modell nachgeschlagen. Es scheint, als würde Kimura die Näherung des Diffusionsprozesses des Wright-Fisher-Modells verwenden. Dies scheint ein gut untersuchtes und geschichtsträchtiges Modell zu sein, das ich hier nicht vollständig beschreiben kann; Stattdessen fand ich die Arbeit von Tataru et al., Statistical Inference in the Wright-Fisher Model Using Allele Frequency Data , als hervorragende Beschreibung dafür, obwohl ich nicht vorgebe, viel davon zu verstehen.
Wichtig ist jedoch, dass die Veränderung der Gene (Übergangsdichte) durch eine Binomialverteilung beschrieben werden kann. Dies kann durch eine Normalverteilung angenähert werden:
( Mir ist aufgefallen, dass eine andere Möglichkeit, dies zu beweisen, darin besteht, festzustellen, dass die Wright-Fisher-Annäherungsdiffusion (ohne Auswahl usw.) ) hat einen infinitesimalen Generator, der gegeben ist durch: . Dies impliziert sofort . Aber möglicherweise weniger einfach zu verstehen. )
Verwirrenderweise hat das Papier jedoch Zeitskalen (Variablen) geändert, so dass , und dann einstellen zu (wahrscheinlich damit sie nicht schreiben müssten überall). Wenn wir diese Transformation rückgängig machen, erhalten wir
Nun, was ist das infinitesimale Mittel, dh oder ? Dies hängt eindeutig vom Auswahlmodell ab, da es steuert, wie die "Umgebung" den Prozess deterministisch beeinflusst. Kimura beschreibt dies als „konstanten Selektionsvorteil“ mit Koeffizient . Das Tataru-Papier stellt fest, dass die Diffusionsnäherung an Wright-Fisher unter genetischer Drift, Mutation und Selektion gegeben ist durch:
So haben wir abgeleitet, wo Kimura ist und kommen, wenn auch wahrscheinlich nicht auf die einfachste Art und Weise.
Es bleibt nur noch die (stationäre) Gleichung für herzuleiten . Ich denke, ich werde es der Vollständigkeit halber tun.
Wenn wir die stationären Indizes ignorieren, erhalten wir:
Entschuldigung für eventuelle Fehler. (Ich bin weder ein Populationsdynamikmodellierer noch ein Mathematiker, also weisen Sie bitte auf etwaige Probleme hin).
Nicolai
WYSIWYG