Auswirkung auf die Fitness von Mutationen

Was ist die Verteilungs-/Wahrscheinlichkeitsdichtefunktion ( PDF ) der Auswirkungen auf die Fitness neuer Mutationen?


Ich begrüße sehr jede Teilantwort, die nicht das gesamte PDF enthält, sondern nur einige Informationen über den erwarteten Wert oder die Varianz dieser Verteilung. Informationen der Art: „Wenn wir nur vorteilhafte Mutationen betrachten, dann ist das PDF P ( X = X ) = F ( X ) “ sind ebenfalls willkommen.

Wenn ich Mutationen sage, möchte man vielleicht das Konzept der Mutationen nur auf Indels und Punktmutationen reduzieren.

Natürlich wird die Antwort von der betrachteten Art und von Population zu Population abhängen, aber ich begrüße jede Antwort, die einige Einblicke geben könnte. Schließlich könnten einige Informationen gemäß dem, was allgemein als PDF der Auswirkungen auf die Fitness neuer Mutationen angenommen wird, nützlich sein.

Hier ist eine verwandte Frage

Hier ist ein Artikel, der von einer exponentiellen Verteilung der Auswirkungen auf die Fitness vorteilhafter Mutationen ausgeht.

das PDF sollte ein bedingtes sein.
Auch Ihre Frage ist ziemlich weit gefasst und erfordert eine rationale Modellierung für eine einigermaßen genaue Antwort.
@WYSIWYG Wovon sollte das PDF abhängig sein? Auf die Arten. Ja offensichtlich. Aber jede Information wäre willkommen. Ich habe meine Frage überarbeitet, um klarzustellen, was ich unter Mutation verstehe. Ich glaube nicht, dass meine Frage zu weit gefasst ist. Bitte lassen Sie mich wissen, wenn Sie eine Möglichkeit finden, wie ich meine Frage eingrenzen könnte.
Sie können das eingrenzen, indem Sie vielleicht ein hypothetisches statistisches Modell annehmen

Antworten (2)

In guter erster Näherung Δ F ¯ = 0 . Wo Δ F ¯ ist die durchschnittliche Änderung der Fitness bis hin zu einer beliebigen Punkt- oder Indel-Mutation. Die Gründe dafür sind wie folgt:

  1. Im Genom höherer Organismen ist der größte Teil des Genoms nicht funktionsfähig ("Junk"), sodass die meisten Mutationen unabhängig von der vorgenommenen Änderung keine Wirkung haben.
  2. Ein erheblicher Teil der In-Frame-Punktmutationen werden synonyme Mutationen sein, die dazu führen, dass dieselbe Aminosäure kodiert wird (tatsächlich kann sich dies auf die Proteinexpression auswirken, aber ich glaube nicht, dass jemand – noch – einen Fitnessunterschied gezeigt hat?)
  3. Selbst wenn eine Mutation eine Aminosäure verändert, haben viele Aminosäureänderungen keine messbare Wirkung auf das produzierte Protein. Vor allem, wenn die neue Aminosäure ähnliche Eigenschaften hat wie die, die sie ersetzt hat.
  4. Selbst wenn eine Mutation die Proteinfunktion verändert oder das Produkt funktionsunfähig macht, wirkt sich dies in vielen Fällen nicht auf die Fitness aus, da die Fitness von der Umgebung abhängt, in der sie gemessen wird, und nicht alle Gene alle Umgebungen beeinflussen.

Die Verteilung, was auch immer sie ist, wird also eine große Spitze bei 0 haben. Wahrscheinlich ist diese Spitze mehrere Größenordnungen höher als der nächsthöhere Wert. Darüber hinaus können wir uns einigermaßen sicher sein Δ F ¯ < 0 da es mehr Möglichkeiten gibt, ein Gen durch eine Punkt- oder Indel-Mutation zu brechen, als es zu verbessern. Wenn dies der Fall ist, sodass ein großer Überschuss an Mutationen mit negativen Auswirkungen auf die Fitness vorliegt, können wir schlussfolgern, dass die Verteilung der mutationsbedingten Fitnessänderungen nicht normal ist (negativer Schiefe und Spitze bei Null), und dass die Normalverteilung wird eine schlechte Annäherung sein.

Ich mag deine Argumentation, verstehe aber nicht, was du mit dem letzten Satz meinst.
Erinnert mich an die Pareto-Optimierung. Aber die Auswirkungen jeder Mutation auf ein Gen müssen noch untersucht werden.
@fileunderwater: Wenn es schief bleibt und eine zentrale Spitze bei einem genauen Wert hat, wird es daher durch jede Annahme der Normalverteilung schlecht angenähert.
@JackAidley Gotcha. Vorgeschlagene Klarstellung.
Schauen Sie sich dieses Papier an. Dies spricht von einem Konzept, das dem Ansatz von Jack Aidley ähnelt.

[Das ist rein spekulativ]

Annahmen:

  • Die Auswirkungen auf die Fitness werden anhand der Überlebenschance gemessen
  • Die Auswirkungen sind auf proteincodierende Gene zurückzuführen

Wahrscheinlichkeit einer Mutation an Position ich

P ( M = ich   |   G )

Wo G ist das Genom mit seinen Annotationen.

Wahrscheinlichkeit, dass sich die Aktivität einiger Proteine ​​bei X-facher Mutation ändert ich T H Position(en) im Genom:

ich G e N e P ( A G e N e = X   |   M = ich )

Summe über alle Gene, die diesen Locus besetzen.

Wahrscheinlichkeit, dass bei einem gegebenen Selektionsdruck S und Proteinaktivitätsänderung X , überlebt das Individuum die Selektion.

ich G e N e P ( 1   |   A G e N e = X , S )

Ich bin kein Experte für Bayes'sche Modellierung. Aber ich denke, dies ist eine Möglichkeit, das PDF zu erhalten. Jeder Schritt muss erweitert und kombiniert werden, um eine Gleichung für PDF zu erhalten.

Ich bin mir nicht sicher, ob das überhaupt hilft.

Vielen Dank für Ihre Antwort. Obwohl es wahrscheinlich interessant ist, muss ich gestehen, dass ich nicht alles verstehe. Ich verstehe nicht wirklich, warum man einen Locus als eine Sequenz definiert, die lang genug ist, damit sie mehrere Gene belegt. Ich glaube nicht, dass es wirklich die Frage beantwortet. Wenn S ist die zufällige Effektvariable, die eine Mutation hat, ich frage nach der Verteilung von S : P ( S = S ) . Oder wie Sie sagten, das könnte unter einigen Annahmen entsprechen P ( A G e N e = X | M = ich ) aber es besteht keine Notwendigkeit, alle Mutationen im Genom zu summieren. Ich frage nicht nach der Wirkung der Summe aller Mutationen
Ich glaube nicht, dass ein rein theoretisches Modell viele Erkenntnisse liefern könnte (oder nur ein Modell, das das komplexe Netzwerk von Proteininteraktionen berücksichtigt), aber ich könnte mich irren.
Mit mehreren Genen meinte ich Spleißvarianten, die den gleichen Genort besetzen. Nur wenn wir alle Positionen im Genom berücksichtigen, können wir ein PDF erhalten. Und in diesem Fall wird der Effekt einer Mutation durch die Zufallsvariable bezeichnet X , wohingegen S ist der ausgeübte Selektionsdruck. Ich stimme vollkommen zu, dass ein rein theoretisches Modell nicht viel Aufschluss geben wird. In diesem Fall müssen die A-priori-Wahrscheinlichkeiten aus experimentellen Beobachtungen berechnet werden. Aber mit einem Modell können wir bessere Vorhersagen treffen.