Hintergrund
Der GC-Gehalt bezieht sich auf die Häufigkeit von Basenpaaren, die im Genom entweder C oder G sind, oder mit anderen Worten, die Anzahl der GC-Basenpaare dividiert durch die Addition der Anzahl der GC-Basenpaare plus der Anzahl der AT-Basenpaare.
Frage
Wie entwickelt sich der GC-Gehalt und warum unterscheidet sich der GC-Gehalt zwischen Populationen/Arten/Linien? Entwickelt es sich nur unter genetischer Drift? Unter Auswahl? Intuitiv würde ich sagen, dass das Verhältnis der Mutationswahrscheinlichkeiten von A oder T zu G oder C ein wichtiger Faktor sein sollte, der die Entwicklung des GC-Gehalts antreibt. Macht es? Beeinflusst die Gesamtmutationsrate den GC-Gehalt? Welche anderen Eigenschaften/Kräfte beeinflussen die Entwicklung des GC-Gehalts?
Ich denke, die Schlüsselarbeit hier ist „sich entwickeln“. Die gesamten GC/AT-Verhältnisse ändern sich durch Mutationen, deren Rate konstant ist. Die Wahrscheinlichkeit, dass bei einem Mutationsereignis eine Base durch eine andere ersetzt wird, wurde auf verschiedene Weise modelliert, wobei die Wahrscheinlichkeiten verschiedener Mutationen gleich sein können oder nicht .
Insgesamt tendiert der GC-Gehalt zu fast 50 %. Was dazu führt, dass GC-reiche Genome GC-reich werden (60–70 %), ist, dass Mutationen an GC-Basenpaaren selektive Vorteile entweder in Regionen oder im Genom insgesamt haben, die bewirken, dass sie beibehalten werden . Die Mutationsrate ist in GC-reichen Organismen möglicherweise nicht anders (oder sogar niedriger) (viele von ihnen befinden sich tief unter der Erde oder tief unter Wasser. GC-reiche Genome treten auf, weil AT-> GC-Mutationen einen Vorteil bieten und sie bestehen bleiben.
Die Gründe, warum der GC-Gehalt von 50 % weg wandert, fallen in zwei Kategorien, die ich entropisch und selektiv nennen möchte.
Mit entropisch meine ich speziell codierende Sequenzen für Gene und andere Merkmale wie Bindungsstellen auf der DNA oder andere Merkmale wie Zentromere, die dazu führen, dass das Gesamtverhältnis von 1 abweicht, da die Sequenz durch die darin enthaltenen Informationen eingeschränkt ist. Während codierende Regionen ein Verhältnis von mehr als 1 aufweisen , liegt der GC-Gehalt tendenziell bei etwa 54 % . Eukaryoten haben GC-Inseln usw., aber auch dies ändert insgesamt nichts am GC-Gehalt
Genreiche Genome und typische funktionelle Merkmale des Genoms erklären also einige der spektakulär hohen gefundenen GC-Gehalte nicht wirklich; bis in den 70% Bereich. Während der obige Link die GC-Voreingenommenheit in codierenden Regionen betrachtet, ist es selbstverständlich, dass jeder Teil des Genoms, der lediglich ein Abstandshalter zwischen Elementen mit spezifischen Funktionen ist, sich frei von GC unterscheiden kann, wenn dies nützlich ist.
Zu den selektiven Faktoren für einen hohen GC-Gehalt gehören beispielsweise Hochdruck- und Temperaturumgebungen, die durch diesen Mechanismus normalerweise stark zu einem hohen GC-Gehalt neigen. Sie können sich vorstellen, wie das funktioniert: Genome mit hohem GC-Gehalt sind thermodynamisch stabiler und können die extramolekularen Kollisionen mit höherer Energie dieser Umgebungen leichter überleben.
GC-reiche Genome sind keine einfachen Anpassungen, mit denen man leben muss. Alle Gene für DNA-orientierte Prozesse wie Transkription, Chromosomenpackung, DNA-Polymerase müssen sich stark anpassen. Wenn sich der Organismus an heißere Temperaturen oder höhere Drücke anpasst, muss sich auch jedes einzelne produzierte Protein verändern, um stabil zu sein und unter den neuen Bedingungen zu funktionieren . Daher treten diese Veränderungen nur über lange Evolutionszeiten auf. Dies ist wahrscheinlich ein guter Teil des Grundes, warum die Archaea-Nischen in den über 1 Milliarde Jahren, seit es Leben auf der Erde gibt, nicht von Eubakterien verdrängt wurden.
Verrückter Wissenschaftler
Remi.b