Als ich NCBI durchsuchte, sah ich ein Muster: Selbst wenn die Chromosomengrößen, die Anzahl der Gene und die Anzahl der Proteine unterschiedlich sind, sind die GC% in Chromosomen tendenziell ähnlich. Die Beispiele sind unten verlinkt.
Wenn Sie das Mitochondrien-Genom sehen, ist es dem Chromosom nicht sehr ähnlich. Warum neigen alle Chromosomen dazu, ihren GC% nahe an den Durchschnitt des gesamten GC% anzupassen? Gibt es einen bestimmten Grund im Zusammenhang mit der Metaphase der Meose?
Zur weiteren Verdeutlichung habe ich einige Bilder zur Hilfe
Die Chromosomengröße oder Gene in einem Organismus passen sich nicht annähernd dem Durchschnitt ihrer Gesamtzahl an, aber GC% tut es. Es hat nur 3-2 % (falciparum) oder 3-4 % (vivax) Variation in GC%. Es fühlt sich an, als ob es wie ein Equalizer balanciert. Wieso den?
Wie @dd3 betont, weist der durchschnittliche GC% darauf hin, dass Stabilität erforderlich ist, und codierende Regionen oder strukturelle Regionen des Genoms müssen möglicherweise stabiler sein. Aber die größten %GC in Genomen findet man in Thermophilen – Organismen, die in heißem Wasser leben – in heißen Quellen und geothermischen Quellen unter Wasser. Diese Übersicht erwähnt, wie einige Thermophile mit 50 % GC gefunden werden können. Der extrem wärmeliebende Thermus thermophilus kann einen GC%-Gehalt von 69,4 % aufweisen.
Aber Sie fragen sich, wie der GC-Gehalt über die Länge eines großen Genoms gemittelt wird. Die Antwort ist Variation und Auswahl. Wenn ein Gen aufgrund der genomischen Funktion stabiler sein muss oder weil es versucht, in einer heißeren Umgebung zu leben, bringen Mutationen, die A/T- in G/C-Basenpaare umwandeln, einen inkrementellen Vorteil für das Überleben und bleiben tendenziell im Gen erhalten Pool, solange kein größerer Nachteil durch die Mutation entsteht. Im Laufe der Zeit und wenn die Stabilität einen größeren Vorteil schafft, wird der GC-Prozentsatz immer weiter vom Mittelwert abweichen.
Dies funktioniert sowohl für die Thermotoleranz als auch aufgrund der biofunktionellen Einschränkungen, ein Telomer, Zentromer oder eine codierende Region zu sein – Stabilität und Codierungsbeschränkungen spielen gegeneinander, um einen optimalen GC-Gehalt in einem bestimmten Abschnitt des Genoms zu erreichen.
Umgekehrt wandern die meisten Genome mit einem GC-Gehalt unter 50 % dorthin, weil zu viel Stabilität auch ihren Preis haben kann. Auch das Aufbrechen der DNA-Helix für die Transkription und andere zelluläre Prozesse müssen reibungslos ablaufen.
Kodierende Regionen sind für Bakterien von Bedeutung ( E coli ist zu 89 % kodierende Sequenz). Bei codierenden Sequenzen beträgt der genetische Code logischerweise im Durchschnitt 50 % GC, aber wenn Sie sich die tatsächlichen Codons im Diagramm unten ansehen, sehen Sie, dass außer im Fall eines einzelnen Codons (Tryptophan, Methionin) immer die dritte Base verfügt über eine GC-Option, die einen GC-Gehalt im mittleren 60. Perzentil zulässt. Die Einschränkung, dass codierende Sequenzen frei variieren können, ist nur eine Annäherung – in einigen Fällen können Substitutionen zu Aminosäuren mit GC-reichen Codons das Cieling etwas nach oben verschieben. Und die häufigeren Aminosäuren haben die Möglichkeit, aus ihren Codon-GC-Basen 2 oder 3 Basen zu machen. Insgesamt wäre es bemerkenswert, ein Bakterium mit einem GC% von mehr als 72 % zu finden. Mutationen und die Anforderungen von Proteinen, für die kodiert wird, würden es einfach nicht zulassen.
Also: Über Evolutionsperioden häufen sich diese GC-Mutationen dort an, wo sie hilfreich sind, sogar so weit, dass 2/3 des Genoms GC-Paare sind. Die stärkste selektive Kraft zur Akkumulation eines hohen durchschnittlichen GC% für ein Genom besteht darin, das Genom selbst einer Hochtemperaturumgebung auszusetzen.
Beachten Sie, dass dieses Thermostabilitätsargument für viele Tiere nicht zählt, da sie ihre Körpertemperatur regulieren.
Es gibt signifikante Unterschiede im genomischen GC-Gehalt, sowohl zwischen Arten als auch innerhalb eines individuellen Genoms. Ein durchschnittlicher GC-Gehalt im Bereich von 35 % bis 45 % ist üblich, obwohl es definitiv Organismen gibt, die außerhalb dieses Bereichs liegen. Die Plasmodium-Spezies, auf die Sie oben verlinken, ist ein Beispiel für einen extremen AT-Reichtum (niedriger GC-Gehalt), während einige Bakteriengenome bis zu 70 % GC-Gehalt oder mehr aufweisen.
Bei eukaryotischen Genomen ist die Nukleotidzusammensetzung nicht gleichmäßig verteilt. Nur weil ein Genom einen durchschnittlichen GC-Gehalt von 40 % hat, bedeutet das nicht, dass Sie eine beliebige 10-kb-Region im Genom auswählen und erwarten können, dass diese Region +/- 40 % GC-Gehalt hat. Vielmehr sind eukaryotische Genome ein Mosaik aus großen Regionen, die intern eine sehr einheitliche Zusammensetzung aufweisen, deren Zusammensetzung sich aber von flankierenden Regionen ( Isochoren ) deutlich unterscheidet.
Obwohl alle Chromosomen eines bestimmten Organismus einen ähnlichen durchschnittlichen GC-Gehalt haben können, sollten Sie sich bewusst sein, dass dies nur ein Durchschnitt ist und dass die Nukleotidzusammensetzung im gesamten Genom erheblich variiert.
Gute Antwort von Daniel. Ich möchte auch hinzufügen, dass es signifikante Unterschiede zwischen dem GC-Gehalt der chromosomalen oder nuklearen DNA und dem von extrachromosomalen Einheiten wie mitochondrialen und Chloroplastengenomen oder (natürlich vorkommenden) Plasmiden geben kann. Diese DNAs unterliegen unterschiedlichen Beschränkungen (Replikation, subzellulärer Ort, zB) und dies kann bis zu einem gewissen Grad durch einen anderen GC-Gehalt als den der Kernchromosomen widergespiegelt werden.
Zu Beginn könnte man fragen: "Was ist der Vorteil eines höheren GC-Gehalts?"
Ein höherer GC-Gehalt ist mit einer höheren Stabilität der DNA verbunden, und dementsprechend wurde vorgeschlagen, dass dies für proteinkodierende Regionen wichtig ist. Es wurde festgestellt, dass es in GC-reichen Regionen ziemlich viele proteinkodierende Regionen gibt, aber ich bin mir nicht sicher, ob das Gegenteil zutrifft, was der wichtige Teil ist.
Wenn das Gegenteil zutrifft , dann könnte man die Verteilung der proteinkodierenden Regionen über die Chromosomen betrachten und sie mit dem GC-Gehalt korrelieren. Wenn auch die Größe der proteinkodierenden Regionen in einem bestimmten Chromosom proportional zur Größe des Chromosoms ist, dann hätten Sie einen Grund dafür, warum der durchschnittliche GC-Gehalt jedes Chromosoms ähnlich ist.
Ich erkenne jedoch an, dass dies alles sehr spekulativ ist. Hat jemand bessere Ideen?
blep
grvpanchal