Frage
Stellen Sie sich eine sehr lange (möglicherweise unendliche) DNA-Sequenz neutraler Stellen vor. Stellen Sie sich eine panmiktische Population konstanter Größe vor mit einer Mutationsrate pro Standort von wo alle Individuen die exakt gleiche Fitness haben.
Wie hoch ist der Anteil der Stellen, von denen wir erwarten würden, dass sie in der Population polymorph sind (SNPs)?
Motivation hinter dieser Frage
Ich stelle diese Frage, um die Ergebnisse der von mir durchgeführten Simulationen zu überprüfen. Zum Beispiel führe ich eine Simulation mit durch ( unten variieren) neutrale Stellen mit einer Mutationsrate pro Stelle und einer Einwohnerzahl von . Ich führe die Simulationen für 10.000 Generationen durch. Es findet keine Rekombination statt. Wenn die Anzahl der Standorte:
Gibt es einen Fehler in meinem Modell oder ist es das, was wir angesichts der Parameter erwarten würden?
Im menschlichen Genom ist 1 von 300 Stellen polymorph (SNPs) ( Ref. ). Das ist eine Häufigkeit von SNPs, die 100-mal größer ist als das, was ich in meinen Simulationen beobachte. Beachten Sie jedoch, dass die Annahme der Neutralität und unsere demografischen Annahmen nicht perfekt zutreffen würden und dieses Ergebnis ziemlich weit von der neutralen Erwartung entfernt sein könnte. Mein Ziel ist es nicht, etwas zu reproduzieren, das wie das menschliche Genom aussieht, sondern nur die im Moment neutralen Erwartungen zu reproduzieren.
Wiederholung der obigen Kommentare. Schauen Sie sich Tajimas D an. Es liefert eine Schätzung für die Anzahl der Segregationsstellen für eine Population unter einem neutralen Mutationsmodell.
Die allgemeine Form der Schätzung für eine diploide Population ist . Hier ist die Mutationsrate pro Genom, nicht pro Standort, also Wo ist die Genomgröße. Abschätzung der Segregationsorte einer ganzen Population von mit einer Genomgröße von wobei jeder Standort eine Mutationsrate pro Genom von hat das würde man erwarten . Ihre Zahlen scheinen also höher als erwartet zu sein.
Ich habe eine beispielhafte Simulationssoftware geschrieben, die in der Lage ist, solche Evolutionsszenarien durchzuführen ( Clotho-Manuskript ). Ebenso können Sie Ihre Zahlen mit einer Population vergleichen, die mit MS generiert wurde .
Der Anteil an polymorphen Stellen, die in einer Population vorhanden sind, hängt von der Biologie des Organismus ab. Zum Beispiel würde man erwarten, unterschiedliche Polymorphismusraten in verwandten Pflanzen zu finden, die unterschiedliche Zuchtsysteme haben, zB in Silene [ 1 ]. Es wird auch erwartet, dass frühere Engpässe die Polymorphismen verringern [ 2 ]. Die Antwort auf Ihre Frage hängt also von der genauen Art und Population ab, die Sie betrachten.
Wir haben ein Skript hinzugefügt, um dies in zusätzlichem Material zu berechnen
http://onlinelibrary.wiley.com/doi/10.1111/mec.13034/full
....einzelne Trennstelle pro Locus oder bis zu maximal vier SNPs, wie es für Short-Read-Genomdaten erwartet wird (siehe beigefügtes R-Skript zur Schätzung).
putnampp
Remi.b
putnampp
Remi.b