Wie formulieren wir die Mutationslast für „Junk-DNA“?

Fragen)

Basierend auf dem Lehrbuch von Joe Felsenstein habe ich versucht, die Mutationslast für die Mehrheit der eukaryotischen Genome zu formulieren, die Junk-DNA sind ( L M Ö S T _ Ö F _ G e N Ö M e ). (Weitere Einzelheiten und relevante Zitate finden Sie im Abschnitt Hintergrund.)

Extrapoliert von dem, was Joe über Nicht-Junk-Loci schreibt und eine vereinfachende Annahme (Muller-Haldane) entfernt, glaube ich, dass dies gleich der Allelfrequenz jedes Locus sein sollte (vereinfacht hier auf den Durchschnitt über diese Loci, Q e ) multipliziert mit dem infinitesimalen Auswahlkoeffizienten, den jeder Locus hat ( S , im Durchschnitt), summiert über alle Loci ( N P Ö S ich T ich Ö N S ):

L M Ö S T _ Ö F _ G e N Ö M e = N P Ö S ich T ich Ö N S Q e S

(Idealerweise würden wir dies über einzelne Schätzungen von summieren Q e Und S für jeden Locus, aber das ist hier offensichtlich unpraktisch, also verwenden wir den Mittelwert über die Loci.)

Hier sind einige eng verwandte Fragen:

1) Ist das obige eine vernünftige Formulierung für L M Ö S T _ Ö F _ G e N Ö M e ? Wenn nicht, was wäre? (Ich kann mir leicht vorstellen, dass viele Annahmen bei Hunderten von Millionen Positionen usw. zu brechen beginnen.)

2) Wenn es sich um eine vernünftige Formulierung handelt, wofür sind "vernünftige" Parameterbereiche? S Und Q e von "schädlichen" nahezu neutralen Mutanten für diesen Großteil des Genoms? (Zum Beispiel könnten wir das sagen S kann Werte annehmen, die kleiner als der Kehrwert der Populationsgröße sind.)

Beachten Sie, dass ich von Junk-DNA spreche, nicht von nicht codierender DNA. Wir wissen ziemlich viel über die Mutationslast von (Nicht-Junk) nicht codierender DNA .

Mögliche Probleme damit

Lassen Sie uns hier einige Werte einsetzen, sagen wir über eine Milliarde Loci mit sehr kleinen Auswahlkoeffizienten von 10 10 Und Q e gleich der Mutationsrate u von 10 8 (z. B. alle schädlichen Varianten sind Neumutationen), kann ich schreiben:

L M Ö S T _ Ö F _ G e N Ö M e = N P Ö S ich T ich Ö N S Q e S = ( 10 9 ) ( 10 8 ) ( 10 10 ) = 10 9

Dies ist eine Teilmenge der gesamten Mutationslast. Für diese Parameterwerte scheint das plausibel, aber wenn wir Joes Argument ernst nehmen (siehe unten), dass viele dieser Loci schädliche Varianten beheben werden, z Q e 1.0 , dann könnte dieser Wert ziemlich hoch werden.

Hier ist zum Beispiel eine andere Berechnung, die davon ausgeht Q e 0,1 :

L M Ö S T _ Ö F _ G e N Ö M e = N P Ö S ich T ich Ö N S Q e S = ( 10 9 ) ( 10 1 ) ( 10 10 ) = 0,01

Das ist eine nicht triviale Last!

Tatsächlich erwarten wir asymptotisch, dass jeder Locus leicht schädliche Varianten repariert. In diesem Fall von universell festgelegten leicht nachteiligen Varianten liegt diese Belastung näher bei 10 1 für das obige Beispiel. Für Koniferen und Axolotl mit >10 Gbp Genomen würden wir dann erwarten, dass die Belastung nur durch Junk-DNA für diese Parameterwerte größer als 1 ist, z. B. tot. Joe hat einen Abschnitt "Warum sind wir nicht alle tot?" aber es spricht dies nicht direkt an und verwendet hauptsächlich verbale Argumente.

Hintergrund

Ich frischen mein Wissen über die Mutationslast auf, indem ich den Abschnitt von Joe Felsensteins Buch zu diesem Thema lese (S. 152-158), und ich erinnere mich jetzt an etwas, mit dem ich zu kämpfen hatte, als ich an dem Kurs teilnahm, den er zu diesem Thema unterrichtete.

Joe schreibt im Abschnitt "Weak selection and mutational load":

Da die Mutationslast eine Funktion der Mutationsrate, aber nicht des Selektionskoeffizienten sein soll, stellt sich natürlich die Frage, wie eine sehr schwache Selektion eine Last auferlegen könnte. Sicherlich kann das Haldane-Müller-Prinzip nicht bis zum Ende gelten S = 0 . Natürlich nicht. Im haploiden Fall die Genfrequenz des Mutationsgleichgewichts Q e = u S ist nur richtig, wenn u < S , ansonsten ist das einzige Gleichgewicht des Systems (III-21). Q e = 1 . Wenn u S , so dass Q e = 1 , die Last ist L = Q e S = S , so dass wir Fälle mit zunehmend kleineren Werten von betrachten S , die Ladung bleibt u bis S = u , dann sinkt die Last unterhalb dieses Punktes gleichmäßig auf Null, wenn s abnimmt.

(Wo S ist der Selektionskoeffizient für ein mutiertes Allel, Q e die Mutantenallelhäufigkeit ist, und u ist die Mutationsrate an diesem Locus.)

Joe spricht dann über einige andere Dinge und kommt zu dem Schluss:

Die Last wird eine einfache Funktion von sein u es sei denn S so klein ist, dass sie nicht wesentlich größer ist als u . Unterhalb dieses Punktes sinkt die Last auf Null ab S tut .

Dieser letzte Satz (meine Hervorhebung) ist für mich nicht offensichtlich, basierend auf dem, was ich gelesen habe.

Ich habe Probleme, dieser Logik zu folgen. Folgendes verstehe ich darunter:

1) Müller-Haldane behauptet das S hat sehr wenig Einfluss auf L , so dass in enger Annäherung L u (für einen Haploiden; gezeigt auf S.153 und anderswo), mit anderen Worten, die Belastung ist meistens unabhängig von S Weil S wirkt sich nur aus, wenn Q e nicht nahe Null ist, was selten für neue Mutanten gilt.

2) Bei sehr niedrig S Es besteht eine höhere Wahrscheinlichkeit, dass die Mutante in die Fixierung geht (z. B. das Erreichen der Q e = 1 Gleichgewicht) aufgrund der geringeren Selektionswirkung.

3) Von (2) denke ich, dass dies das bedeutet S ist dann Teil der Lastformulierung wieder bei Low S .

4) So wie S gegen Null geht der Beitrag solcher Varianten immer noch gegen Null.

5) Joe verwendet auch das C-Wert-Paradox/Junk-DNA/Zwiebel-Prinzip, um zu argumentieren, dass die Mutationslast nicht durch den größten Teil des Genoms für große Genome, z. B. Menschen, beeinflusst wird. Aber dieses Argument scheint zu sagen, dass wir uns um diese Regionen des Genoms einfach keine Sorgen machen sollten, weil ihre Selektionskoeffizienten im Bereich der Vernachlässigung nahe Null liegen.

Aber diese werden hier im Buch nicht formal ausgearbeitet. Kann jemand einen Ausdruck oder eine Annäherung dafür formulieren, wie wir die Belastung behandeln können, die mit sehr kleinen Selektionskoeffizienten verbunden ist, die in den meisten großen eukaryotischen Genomen zu finden sind?

Antworten (1)

Am Ende schrieb ich direkt an Joe, nachdem ich hier keine Antwort von außen erhalten hatte. Ich werde ihn ohne seine Erlaubnis nicht direkt zitieren, aber zusammenfassend schrieb er Folgendes:

  1. Dieses Papier gibt (unter anderem) eine numerische Behandlung verschiedener Selektionskoeffizienten in kleinen Populationen, was effektiv Loci bedeutet, die nicht selektiert werden, aber immer noch Koeffizienten haben (die ich in meiner Frage als Junk-DNA definiere). Es zeigt einen sanften Rückgang (Abbildung 1) mit abnehmendem Wert S und Populationsgröße, was darauf hindeutet, dass mein Instinkt richtig war, dass es eine Menge solcher "Junk"-DNA gibt.

Geben Sie hier die Bildbeschreibung einAbbildung 1 von Kimura, Maruyama und Crow 1963

  1. Joe war eher skeptisch, dass solche Belastungen tatsächlich für die Evolution von Bedeutung sind, außer im Fall sehr kleiner Populationen. Ich denke, dass dies auch meiner Intuition entspricht, aber als wichtiger praktischer Hinweis ist es wichtig, sich aus biologischer Sicht nicht zu sehr über Junk-DNA aufzuregen (siehe zB Graur et al. 2013).