Beziehung zwischen genetischer Vielfalt innerhalb und zwischen Arten

Hier ist ein Zitat von Wagner (2008)

Eine zweite Beweisführung [gegen Neutralismus] ergibt sich aus der Beziehung zwischen der mittleren Anzahl polymorpher Unterschiede zwischen Allelen innerhalb einer Art, π , und die Anzahl fester Unterschiede zwischen Genen in zwei Arten, D . Für neutrale Mutationen eine positive Assoziation zwischen π Und D existieren sollte, da die neutrale Theorie vorhersagt, dass beide Größen linear proportional zu der Rate sind, mit der neutrale Mutationen auftreten. Neuere Daten im Genommaßstab zeigen stattdessen, dass diese Assoziation tatsächlich negativ ist.

Was haben "die mittlere Anzahl polymorpher Unterschiede zwischen Allelen innerhalb einer Art" und "die Anzahl fester Unterschiede zwischen Genen in zwei Arten" miteinander zu tun? Warum sollte es überhaupt eine Beziehung geben? Und mit „zwei Arten“ sprechen sie von Östlichen Gelbrücken-Keuchfinken im Vergleich zu Westlichen Gelbrücken-Keuchfinken oder irgendwelchen zwei Arten, wie E. Coli im Vergleich zu Bisamratten?

Ich habe diese verwandte Frage gefunden , aber sie sagt nichts über verschiedene Arten aus.

Gute Frage +1. Ich habe Ihren Beitrag bearbeitet, um das zu entfernen, was ich für unnötige Informationen hielt. Fühlen Sie sich frei, einen Rollback durchzuführen, wenn Ihnen die Bearbeitung nicht gefällt.
Vorausgesetzt, alle anderen hier haben den notwendigen Hintergrund, ist es in Ordnung. Ich bin kein Biologe, also waren die Neutralismus/Selektionismus-Theorien neu für mich.

Antworten (1)

Metriken von Interesse

Die beiden Metriken, an denen Sie interessiert sind, sind

  • π - die durchschnittliche Anzahl der Unterschiede zwischen zwei zufällig ausgewählten (mit Ersatz-)Allelen in einer Population
  • D - die durchschnittliche Anzahl der Unterschiede zwischen zwei zufällig ausgewählten (mit Ersatz) Allelen, die von zwei verschiedenen Arten stammen

Betrachten Sie zwei Sequenzen

  • ATCGTCAAT
  • ATAGTTAAT

Es gibt 2 paarweise Unterschiede zwischen diesen beiden Sequenzen (Positionen 3 und 6).

Der springende Punkt hier ist zu verstehen, dass zwei Individuen derselben Population zu einem bestimmten Zeitpunkt in der Vergangenheit zusammenwachsen, genau wie zwei Individuen, die von zwei verschiedenen Arten stammen. Die Anzahl der paarweisen Unterschiede ist genau gleich der Rate, mit der Mutationen akkumulieren, multipliziert mit der Koaleszenzzeit. Lassen Sie mich diese Idee mit ein paar Gleichungen weiter unten entwickeln.

Neutrale Erwartungen

Lass uns rechnen! Wir werden im Folgenden zwei wichtige Annahmen treffen.

  1. Jede Mutation erzeugt ein neues Allel (es ist ein unendliches Allelmodell)
  2. Alle Mutationen sind Substitutionen (keine Indels, keine Genverdopplung usw.)

Einführung in die Koaleszenztheorie

Stellen wir zunächst sicher, dass Sie das Konzept der Koaleszenz verstehen. Stellen Sie sich vor, Sie würden eine sich entwickelnde Bevölkerung zeitlich rückwärts betrachten. Ein zusammenwachsendes Ereignis ist ein Ereignis, bei dem zwei Linien zu einer werden (in der Zeit zurückblickend). Betrachten Sie der Einfachheit halber einen Fall einer asexuellen Bevölkerung (aber zukünftige Berechnungen machen diese Annahme nicht). In einer asexuellen Population verschmolzen zwei Geschwister mit der vorherigen Generation, da in der vorherigen Generation die Gene, die sie trugen, in einem einzigen Individuum (ihrem Elternteil) lagen.

Wir werden unten sehen, wie die Koaleszenzzeit zwischen zwei zufällig gezogenen Individuen aus einer Population berechnet wird und wie wir aus dieser Koaleszenzzeit auf die genetische Vielfalt schließen können.

Akkumulationsrate neutraler Mutationen

Die Akkumulationsrate neutraler Mutationen wird auch als Fixierungsrate neutraler Mutationen bezeichnet. Lassen F ich X sei diese Fixierungsrate. Stellen Sie sich eine panmiktische diploide Population konstanter Größe vor N . An einem bestimmten Ort von Interesse ist die Mutationsrate μ . Die Anzahl der Mutationen, die jede Generation in dieser Population auftreten, ist 2 N μ (Der 2 kommt von der Tatsache, dass es in einer diploiden Population zwei homologe Kopien jedes Gens in jeder Zelle gibt). Wenn die Mutation neutral ist, dann hat jedes einzelne Individuum in der Population die gleiche Wahrscheinlichkeit, in langer Zukunft Elternteil der gesamten Population zu sein. Mit anderen Worten, wenn man dieses Problem aus der Zukunft betrachtet und in der Zeit zurückblickt, stammt jedes Individuum in einer Entfernung weit genug in der Zukunft von einem einzigen Individuum in der Gegenwart ab. Als Folge davon ist die Wahrscheinlichkeit, dass eine neue Mutation eine Fixierung erreicht, größer 1 2 N . Multiplizieren wir die Wahrscheinlichkeit der Fixierung mit der Rate, mit der Mutationen in der gesamten Population auftreten, erhalten wir 1 2 N 2 N μ = μ . Mit anderen Worten, die Fixierungsrate neuer neutraler Mutationen ist einfach gleich der Rate, mit der Mutationen auftreten.

Schlüsselgleichung:

F ich X = 1 2 N 2 N μ = μ

D - Anzahl der paarweisen Unterschiede zwischen zufällig ausgewählten (mit Ersatz) Allelen, die von verschiedenen Arten stammen

Betrachten Sie zwei Arten, deren gemeinsame Vorfahren lebten T vor Generationen. Jede Linie akkumulierte Mutationen mit einer Rate μ (und oben erklärt) und daher die erwartete (durchschnittliche) Gesamtzahl der paarweisen Differenzen ist D ¯ = 2 μ T . Die Wahrscheinlichkeit genau zu haben D Paarweise Differenzen stammen aus einer Poisson-Verteilung mit Rate 2 μ T ( P ( D = D ) = P Ö ich S S Ö N ( 2 μ T ) ).

Schlüsselgleichung:

D ¯ = 2 μ T

π - Anzahl der paarweisen Unterschiede zwischen zufällig ausgewählten (mit Ersatz) Allelen, die aus derselben Population stammen

Hier folgen die Berechnungen der gleichen Logik wie oben π = 2 μ T . Das ganze Problem ist das T (die Koaleszenzzeit) ist im Moment unbekannt und wir müssen sie berechnen.

Lassen P ( T ) sei die Wahrscheinlichkeit, dass zwei zufällig ausgewählte (mit Ersatz) Individuen aus einer diploiden panmiktischen Population genau zusammenwachsen T vor Generationen. Die Wahrscheinlichkeit, in einer bestimmten Generation zusammenzuwachsen, ist einfach die Wahrscheinlichkeit, dasselbe Individuum zu ziehen 1 2 N und die Wahrscheinlichkeit, in keiner nachfolgenden Generation zu verschmelzen, ist 1 1 2 N . Iterieren über die Generationen, die wir erhalten

P ( T ) = 1 2 N ( 1 1 2 N ) T 1 2 N e T 2 N

, Wo e 2.7 ist die Eulersche Zahl. Die obige Annäherung ist für große genau N (sagen wir größer als 100). Falls Sie interessiert sind, finden Sie in diesem Math.SE-Beitrag eine Erklärung für diese Annäherung.

Der erwartete Wert (Durchschnitt) T ¯ dieser Verteilung ist T ¯ = 2 N (und die Abweichung ist v A R ( T ) = 4 N 2 ). Folglich ist die erwartete Anzahl von paarweisen Unterschieden zwischen diesen beiden Individuen π = 2 μ 2 N = 4 N μ

Kurz gesagt, diese Berechnungen können erweitert werden, um die Koaleszenzzeit dazwischen zu berechnen k zufällig ausgewählte Allele. Die erwartete Koaleszenzzeit ist dann T ¯ = 4 N k ( k 1 ) und daher zeigt etwas Algebra, dass die gesamte erwartete Zeit (entlang aller Zweige) ist 4 N ich = 1 k 1 1 ich und die erwartete Anzahl von Trennstellen ist 4 N μ ich = 1 k 1 1 ich .

Schlüsselgleichung:

π = 4 N μ

Abschluss

Aus dem oben Gesagten geht hervor π = 4 N μ Und D = 2 μ T sind korreliert, da sie beide linear mit der Mutationsrate zusammenhängen. So wie es in deinem Zitat steht

Für neutrale Mutationen eine positive Assoziation zwischen π Und D existieren sollte, da die neutrale Theorie vorhersagt, dass beide Größen linear proportional zu der Rate sind, mit der neutrale Mutationen auftreten

Das Zitat geht ein Sprichwort

Neuere Daten im Genommaßstab zeigen stattdessen, dass diese Assoziation tatsächlich negativ ist.

Eine solche negative Beziehung zwischen D Und π kann nicht durch neutrale Prozesse verursacht werden. Daher muss die Selektion irgendwie beteiligt sein.

Stellen Sie sich zum Beispiel vor, dass zwei Arten beide bei unterschiedlichen Optima (entgegengesetztem Selektionsdruck) selektiert werden. In einem solchen Fall würden Sie sehen, dass eine reinigende Selektion innerhalb der Art die Wahrscheinlichkeit verringert, dass eine neue Mutation eine Fixierung auf einen Wert von weniger als erreicht 1 2 N und daher die Fixierungsrate verringern F ich X so dass F ich X < μ . Ein solcher gegensätzlicher Selektionsdruck zwischen den Arten wird jedoch dazu führen, dass die Arten durch zufällige Prozesse stärker auseinandergehen als erwartet π > 4 N μ . Ein solches selektives Muster könnte die beobachtete negative Beziehung erklären.

Mehr Informationen

Dieser Beitrag bietet Buchempfehlungen zum Thema (Populationsgenetik).

Wenn Sie "mittlere Anzahl von Unterschieden" sagen, wie wird dies quantifiziert? Anzahl unterschiedlicher Basenpaare?
Ja genau. Es gibt zwei Annahmen (ich habe sie in meiner Antwort vergessen, aber ich werde sie hinzufügen) 1. Alle Mutationen sind Substitutionen (kein Indel, keine Duplikation ganzer Chromosomen usw.) und 2. jede Mutation erzeugt ein neues Allel (Infinite-Allel-Modell)
Sind diese Annahmen spezifisch für die neutrale Theorie? Ich denke, dies soll ein Beweis durch Widerspruch sein, also möchte ich sehen, welche spezifischen Prämissen uns zu dem Widerspruch führen.
Dies sind sehr verbreitete Annahmen, die in der neutralen Theorieliteratur und globaler in der Literatur über genetische Drift zu finden sind. Das Konzept des Widerspruchsbeweises gilt für die Mathematik, aber nicht für die empirischen Wissenschaften (nicht wahr?). Wir haben nur eine Nullvorhersage (Modell ohne Auswahl) und wenn die Daten nicht mit diesen übereinstimmen, muss etwas anderes vor sich gehen. (Danke für die Bearbeitung)