Wie groß ist die prozentuale Ähnlichkeit zwischen menschlichen Individuen (und anderen Primaten), wenn nur Exons verglichen werden?

In populärwissenschaftlichen Büchern und Artikeln sehe ich oft, dass Menschen zu >99 % einander ähnlich sind (Wikipedia hat es zu 99,5 % unter Bezugnahme auf Craig Venter und diesen PLOS-Biologie-Artikel ) und zu ~96-99 % Schimpansen oder Bonobos ähnlich sind ( Smithsonian Institute , National Geographic ). Ich habe zuvor gedacht, dass sich dies auf das gesamte Genom bezieht, aber die Formulierung auf der Seite des Smithsonian Institute, die ich verlinkt habe, lässt den Eindruck entstehen, dass es sich möglicherweise nur um Gene handelt, was gemäß den Antworten auf diesen Beitrag auch der Fall zu sein scheint Do apes und Menschen teilen 99 % der DNA oder 99 % der Gene? Was ist der Unterschied? .

Wie groß sind diese Prozentsätze, wenn man nur die kodierenden Regionen (Exons) anstelle ganzer Gene vergleicht, sowohl innerhalb unserer Art als auch im Vergleich zu anderen Arten, wie z. B. Primaten? Und, nicht so wichtig, wie lauten diese Zahlen, wenn man das gesamte Genom mit der gesamten nicht kodierenden DNA einbezieht?

Antworten (2)

Einer der Verweise auf das von Maximillian verlinkte Schimpansengenom-Papier ist Inferring Nonneutral Evolution from Human-Chimp-Mouse Orthologous Gene Trios , wo sich die Autoren anscheinend nur auf Exons konzentriert haben:

Hier wenden wir Evolutionstests an, um Gene und Signalwege aus einer neuen Sammlung von mehr als 200.000 exonischen Sequenzen von Schimpansen zu identifizieren, die Divergenzmuster aufweisen, die mit der natürlichen Selektion entlang der Abstammungslinien von Mensch und Schimpanse übereinstimmen.

Sie schließen daraus:

Vielleicht ist der beste Weg, die Beziehung zwischen der Divergenz der DNA-Sequenzen und den Unterschieden zwischen der Physiologie und Morphologie von Mensch und Schimpanse zu verstehen, ein Vergleich dieser Unterschiede mit der Variabilität zwischen Menschen. Die Divergenz der DNA-Sequenzen zwischen Mensch und Schimpanse ist ungefähr zehnmal so groß wie die Divergenz zwischen zufälligen Paaren von Menschen.

Leider haben sie dies nicht mit der Faltungsdifferenz von nicht-exonischer DNA verglichen, sodass die vergleichende Quantifizierung zwischen kodierenden und nicht-kodierenden Regionen noch bestimmt werden muss.

Dies beantwortet jedoch direkt die Frage, wie groß die genomischen Unterschiede zwischen Individuen derselben Art und denen anderer Arten sind, wenn nur codierende Regionen verglichen werden. Ich fand es auch nützlich, die Unterschiede in diesen relativen Begriffen zusätzlich zu den zuvor angegebenen Prozentsätzen zu quantifizieren.

Dieses Papier scheint relevante Schätzungen für Mensch-Affen-Divergenzen zu haben. Beachten Sie noch einmal, dass nicht das gesamte Genom verwendet wird, sondern ausgewählte Regionen von Exons, Introns, Pseudogenen usw. Das Schimpansen-Genompapier hat am Anfang eine schöne Aufzählungsliste relevanter Statistiken für Sie speziell für diese Art in der Größenordnung von insgesamt 1 %. Der Abschnitt über "Genevolution" enthält einige spezifische Nummern für codierende Sequenzen.

Für die Variation zwischen Menschen gibt es eine Seite mit Biozahlen zu diesem Thema, die auf 1000 Genomprojektzahlen basiert und bei Menschen eine Abweichung von 0,1 % ergibt.

Korrigieren Sie mich, wenn ich etwas verpasst habe (ich habe nicht den gesamten Artikel gelesen), aber verwendet der erste Artikel, den Sie verlinkt haben, nicht ausdrücklich keine Codierungsregionen? Aus der Zusammenfassung: "... wir haben 53 autosomale intergene nicht repetitive DNA-Segmente ausgewählt ..."
In dem Schimpansengenompapier heißt es: „Wenn CpG- und Nicht-CpG-Stellen getrennt betrachtet werden, stellen wir fest, dass sowohl CpG-Stellen als auch Nicht-CpG-Stellen eine deutlich geringere Divergenz in exonischen synonymen Stellen zeigen als in Introns (~50 % und etwa 30 % niedriger, beziehungsweise)." Für mich deutet dies darauf hin, dass die Unterschiede zwischen den Arten innerhalb exonischer Regionen geringer sind als innerhalb intronischer Regionen ...
... Mein Verständnis ist, dass dies auf die Überlebensbeschränkungen zurückzuführen ist, die exonischen Regionen auferlegt werden, dh einige exonische Mutationen töten den Organismus und werden nicht an die Nachkommen weitergegeben, während Mutationen in nicht exonischen Regionen das Überleben der exonischen Regionen nicht beeinträchtigen gleichen Umfang. Dies ist jedoch nicht mein Fachgebiet, daher freue ich mich zu hören, wenn ich etwas falsch interpretiert habe.
Erster Kommentar: Beachten Sie, dass Tabelle 5 des ersten Papiers die Entfernungen der Codierungsregionen vergleicht. Auch hier wahrscheinlich nicht das beste Beispiel, da es sich nur um ausgewählte Regionen handelt; aber meiner Erfahrung nach ändern sich diese Schätzungen in der Regel nicht so dramatisch mit der Stichprobengröße.
Kommentar 2+3: Sie haben Recht, dass der Mechanismus für die geringere Divergenzrate in Exons auf Selektion zurückzuführen ist. Tatsächlich hängt die Inferenz funktionell wichtiger Sequenzbrocken durch vergleichende Analyse davon ab; siehe zum Beispiel compgen.cshl.edu/~acs/phylohmm.pdf . Aber das schien nicht Teil der ursprünglichen Frage zu sein. Es gibt eine sehr umfangreiche Literatur zu diesem Thema, aber für einen kurzen Überblick von einem bekannten Autor können Sie sich sciencedirect.com/science/article/pii/S0959437X02003489 ansehen . Beachten Sie, dass die Variation der Divergenz zwischen den Standorten auch bei Proteinen wichtig ist.