Chromosomen sind unterschiedlich groß, aber warum haben alle Chromosomen einen ähnlichen GC-Prozentsatz?

Als ich NCBI durchsuchte, sah ich ein Muster: Selbst wenn die Chromosomengrößen, die Anzahl der Gene und die Anzahl der Proteine ​​unterschiedlich sind, sind die GC% in Chromosomen tendenziell ähnlich. Die Beispiele sind unten verlinkt.

Hefe , Plasmodium falciparum

Wenn Sie das Mitochondrien-Genom sehen, ist es dem Chromosom nicht sehr ähnlich. Warum neigen alle Chromosomen dazu, ihren GC% nahe an den Durchschnitt des gesamten GC% anzupassen? Gibt es einen bestimmten Grund im Zusammenhang mit der Metaphase der Meose?

Zur weiteren Verdeutlichung habe ich einige Bilder zur Hilfe

Geben Sie hier die Bildbeschreibung ein Geben Sie hier die Bildbeschreibung ein

Die Chromosomengröße oder Gene in einem Organismus passen sich nicht annähernd dem Durchschnitt ihrer Gesamtzahl an, aber GC% tut es. Es hat nur 3-2 % (falciparum) oder 3-4 % (vivax) Variation in GC%. Es fühlt sich an, als ob es wie ein Equalizer balanciert. Wieso den?

Nur zur Verdeutlichung: Fragen Sie, warum Chromosomen sehr unterschiedlicher Größe jeweils einen durchschnittlichen GC-Gehalt haben, der dem durchschnittlichen GC-Gehalt des Genoms ähnlich ist?
Yupp, du hast es verstanden ... Ich möchte nur wissen, warum und wie in jedem Stadium der Evolution ein Organismus wie [Plasmodium vivax] ( ncbi.nlm.nih.gov/genome/genomes/35?details=on& ) (43-47 %) und faciparum (18-20%) (2 entwickelte Typen) versuchen, ähnliche GC% in allen Chromosomen aufrechtzuerhalten (sehen Sie sich die Links an, die angegeben sind, dass alle Chromosomen ihren GC%-Prozentsatz in Chromosomen beibehalten, und sie kümmern sich nicht um die Menge von Gene oder Chromosomengröße)

Antworten (4)

Wie @dd3 betont, weist der durchschnittliche GC% darauf hin, dass Stabilität erforderlich ist, und codierende Regionen oder strukturelle Regionen des Genoms müssen möglicherweise stabiler sein. Aber die größten %GC in Genomen findet man in Thermophilen – Organismen, die in heißem Wasser leben – in heißen Quellen und geothermischen Quellen unter Wasser. Diese Übersicht erwähnt, wie einige Thermophile mit 50 % GC gefunden werden können. Der extrem wärmeliebende Thermus thermophilus kann einen GC%-Gehalt von 69,4 % aufweisen.

Aber Sie fragen sich, wie der GC-Gehalt über die Länge eines großen Genoms gemittelt wird. Die Antwort ist Variation und Auswahl. Wenn ein Gen aufgrund der genomischen Funktion stabiler sein muss oder weil es versucht, in einer heißeren Umgebung zu leben, bringen Mutationen, die A/T- in G/C-Basenpaare umwandeln, einen inkrementellen Vorteil für das Überleben und bleiben tendenziell im Gen erhalten Pool, solange kein größerer Nachteil durch die Mutation entsteht. Im Laufe der Zeit und wenn die Stabilität einen größeren Vorteil schafft, wird der GC-Prozentsatz immer weiter vom Mittelwert abweichen.

Dies funktioniert sowohl für die Thermotoleranz als auch aufgrund der biofunktionellen Einschränkungen, ein Telomer, Zentromer oder eine codierende Region zu sein – Stabilität und Codierungsbeschränkungen spielen gegeneinander, um einen optimalen GC-Gehalt in einem bestimmten Abschnitt des Genoms zu erreichen.

Umgekehrt wandern die meisten Genome mit einem GC-Gehalt unter 50 % dorthin, weil zu viel Stabilität auch ihren Preis haben kann. Auch das Aufbrechen der DNA-Helix für die Transkription und andere zelluläre Prozesse müssen reibungslos ablaufen.

Kodierende Regionen sind für Bakterien von Bedeutung ( E coli ist zu 89 % kodierende Sequenz). Bei codierenden Sequenzen beträgt der genetische Code logischerweise im Durchschnitt 50 % GC, aber wenn Sie sich die tatsächlichen Codons im Diagramm unten ansehen, sehen Sie, dass außer im Fall eines einzelnen Codons (Tryptophan, Methionin) immer die dritte Base verfügt über eine GC-Option, die einen GC-Gehalt im mittleren 60. Perzentil zulässt. Die Einschränkung, dass codierende Sequenzen frei variieren können, ist nur eine Annäherung – in einigen Fällen können Substitutionen zu Aminosäuren mit GC-reichen Codons das Cieling etwas nach oben verschieben. Und die häufigeren Aminosäuren haben die Möglichkeit, aus ihren Codon-GC-Basen 2 oder 3 Basen zu machen. Insgesamt wäre es bemerkenswert, ein Bakterium mit einem GC% von mehr als 72 % zu finden. Mutationen und die Anforderungen von Proteinen, für die kodiert wird, würden es einfach nicht zulassen.

genetischer Code

Also: Über Evolutionsperioden häufen sich diese GC-Mutationen dort an, wo sie hilfreich sind, sogar so weit, dass 2/3 des Genoms GC-Paare sind. Die stärkste selektive Kraft zur Akkumulation eines hohen durchschnittlichen GC% für ein Genom besteht darin, das Genom selbst einer Hochtemperaturumgebung auszusetzen.

Beachten Sie, dass dieses Thermostabilitätsargument für viele Tiere nicht zählt, da sie ihre Körpertemperatur regulieren.

Ich mochte Ihre Zeile "Stabilitäts- und Codierungsbeschränkungen spielen gegeneinander, um einen optimalen GC-Gehalt in einem bestimmten Abschnitt des Genoms zu erreichen." Es fühlt sich passender für meine Frage an. Kann ich bitte ein Nachschlagewerk bekommen?
Vielen Dank. Dieser Gedanke ist allgemein bekannt und in der Praxis umsetzbar. Lassen Sie mich die obige Antwort ergänzen.

Es gibt signifikante Unterschiede im genomischen GC-Gehalt, sowohl zwischen Arten als auch innerhalb eines individuellen Genoms. Ein durchschnittlicher GC-Gehalt im Bereich von 35 % bis 45 % ist üblich, obwohl es definitiv Organismen gibt, die außerhalb dieses Bereichs liegen. Die Plasmodium-Spezies, auf die Sie oben verlinken, ist ein Beispiel für einen extremen AT-Reichtum (niedriger GC-Gehalt), während einige Bakteriengenome bis zu 70 % GC-Gehalt oder mehr aufweisen.

Bei eukaryotischen Genomen ist die Nukleotidzusammensetzung nicht gleichmäßig verteilt. Nur weil ein Genom einen durchschnittlichen GC-Gehalt von 40 % hat, bedeutet das nicht, dass Sie eine beliebige 10-kb-Region im Genom auswählen und erwarten können, dass diese Region +/- 40 % GC-Gehalt hat. Vielmehr sind eukaryotische Genome ein Mosaik aus großen Regionen, die intern eine sehr einheitliche Zusammensetzung aufweisen, deren Zusammensetzung sich aber von flankierenden Regionen ( Isochoren ) deutlich unterscheidet.

Obwohl alle Chromosomen eines bestimmten Organismus einen ähnlichen durchschnittlichen GC-Gehalt haben können, sollten Sie sich bewusst sein, dass dies nur ein Durchschnitt ist und dass die Nukleotidzusammensetzung im gesamten Genom erheblich variiert.

Danke, ich verstehe wirklich, dass die Nukleotidzusammensetzung erheblich variiert (A: T: C: G-Änderungen), aber dennoch bleibt WIE GC% in allen Chromosomen ähnlich bleibt. Zur weiteren Klarstellung: vivax (V) (Bereich 43-47 %) und faciparum (F) (Bereich 18-20 %) gehören zur gleichen Plasmodium-Familie. ZB chr 11 von beiden haben fast die gleiche Größe, aber ihre GC% Prozent fallen in einen bestimmten gegebenen Bereich (V: 45:1%, F:19%). Es fühlt sich an, als ob unterschiedlich entwickelte Organismen versuchen, einen bestimmten Bereich von GC% aufrechtzuerhalten. WIE? Und eine Zeitschriftenreferenz wäre sehr willkommen.

Gute Antwort von Daniel. Ich möchte auch hinzufügen, dass es signifikante Unterschiede zwischen dem GC-Gehalt der chromosomalen oder nuklearen DNA und dem von extrachromosomalen Einheiten wie mitochondrialen und Chloroplastengenomen oder (natürlich vorkommenden) Plasmiden geben kann. Diese DNAs unterliegen unterschiedlichen Beschränkungen (Replikation, subzellulärer Ort, zB) und dies kann bis zu einem gewissen Grad durch einen anderen GC-Gehalt als den der Kernchromosomen widergespiegelt werden.

Zu Beginn könnte man fragen: "Was ist der Vorteil eines höheren GC-Gehalts?"

Ein höherer GC-Gehalt ist mit einer höheren Stabilität der DNA verbunden, und dementsprechend wurde vorgeschlagen, dass dies für proteinkodierende Regionen wichtig ist. Es wurde festgestellt, dass es in GC-reichen Regionen ziemlich viele proteinkodierende Regionen gibt, aber ich bin mir nicht sicher, ob das Gegenteil zutrifft, was der wichtige Teil ist.

Wenn das Gegenteil zutrifft , dann könnte man die Verteilung der proteinkodierenden Regionen über die Chromosomen betrachten und sie mit dem GC-Gehalt korrelieren. Wenn auch die Größe der proteinkodierenden Regionen in einem bestimmten Chromosom proportional zur Größe des Chromosoms ist, dann hätten Sie einen Grund dafür, warum der durchschnittliche GC-Gehalt jedes Chromosoms ähnlich ist.

Ich erkenne jedoch an, dass dies alles sehr spekulativ ist. Hat jemand bessere Ideen?

Ich mochte die Idee der Proportionalität der Chromosomen-Protien-Codierungsgröße und der Gene. Danke. Warum mich diese Frage dazu gebracht hat, zu fragen, weil die Evolution mit einem zufälligen Mutationsprozess und mit neuen Umweltbedingungen entwickelt sich der Organismus, um neue Gene zu bilden, und dies wird zu zufälligen großen Variationen führen, aber wenn man sich die GC%-Informationen ansieht, obwohl sie riesig sein könnten Variation in den Chromosomensequenzen, ein Leben verschwor sich, um ein Gleichgewicht im AT:GC-Verhältnis aufrechtzuerhalten. Das Leben denkt nicht, es muss ATG am Anfang und Poly A am Ende für das Gen behalten. das Leben prüft nur das Gleichgewicht