Warum sind die Genome der Menschen zu 99,5 % gleich?

Die DNA-Sequenz des Menschen soll zu etwa 99,5 % gleich sein . Soweit ich weiß, bedeutet dies, dass, wenn ich zu Ihnen gehen und unsere DNA vergleichen würde, die Sequenz der Basenpaare zu 99,5 % gleich wäre.

Meine Frage ist: Warum gibt es nur 0,5 % Variation in unserer DNA? Mir fallen zwei Gründe ein:

  1. Aus irgendeinem Grund sind die anderen 99,5 % (ungefähr) an Ort und Stelle fixiert. Wenn diese Abschnitte verändert werden, führen sie entweder dazu, dass wir nicht mehr „Menschen“ sind, oder sie bekommen einfach eine Art genetische Krankheit und sind daher keine sehr guten Mutationen.

  2. Es war nicht genug Zeit. Ich erinnere mich, dass ich vor langer Zeit gehört habe, dass alle Menschen einen gemeinsamen Vorfahren haben. Wenn das der Fall ist, hatten vielleicht im Laufe der Zeit nur etwa 0,5 % unserer DNA Zeit, zufällig zu mutieren, und wenn wir wirklich, sehr, sehr lange warten, wird immer mehr unserer DNA mutieren, und wir werden „weniger wie jeder“. andere'.

Oder verstehe ich die Situation völlig falsch? Ich habe in der High School kein Biologiestudium belegt, also sollten die Antworten bitte einfach sein.

Eine vollständige Antwort muss ziemlich tief in das Gebiet der Populationsgenetik einsteigen, und es wird Zeit brauchen, um das notwendige einführende Wissen zu vermitteln. Aber kurz gesagt, die Antwort ist definitiv nicht 1. und ist ziemlich nah an 2 :)
@Remi.b Vielen Dank für den schnellen Einblick. Wissen Sie zufällig, wo ich Online-Ressourcen erhalten kann, um mit dem Lernen über Populationsgenetik zu beginnen? (oder irgendetwas, das mir helfen könnte, das besser zu verstehen)
Es ist ein wenig frustrierend, als Antwort "lernen Sie einfach mehr" zu erhalten, aber Buchempfehlungen zur Populationsgenetik finden Sie hier . Vielleicht möchten Sie zuerst einen Einführungskurs in die Evolutionsbiologie besuchen, z. B. Evolution verstehen (kostenlose Online-Ressource).
@JoshuaLin Ich bin mir nicht sicher, ob Sie über Änderungen an Antworten benachrichtigt werden. Ich habe einige wesentliche Ergänzungen zu meiner Antwort vorgenommen, um weitere Details bereitzustellen und hoffentlich auf verschiedene Details Ihrer Frage einzugehen.

Antworten (1)

Bei einem Genom mit 3 Milliarden Basenpaaren entspricht ein Unterschied von 0,5 % einem Unterschied von 15 Millionen Basen. Wenn eine einzige Basenänderung die Aminosäuresequenz eines Proteins verändern kann, kann das zu einer enormen Vielfalt führen, die wir bei den fast 8 Milliarden Menschen auf dem Planeten sehen, und die 99,5-prozentige Gleichheit ist der Grund dafür so eng miteinander verbunden wie eine Art.

Wie lässt sich die fehlende Diversität erklären?

Nichts in der Biologie macht Sinn, außer im Licht der Evolution.

Das obige Zitat stammt von dem Evolutionsbiologen Theodosius Dobzhansky. Das bedeutet im Grunde, dass Sie Ihre Frage aus der Perspektive der Evolution und der natürlichen Selektion betrachten müssen.

Das erste, was Sie beachten müssen, ist, dass es Hinweise darauf gibt, dass der moderne Mensch einen Bevölkerungsengpass durchgemacht hat. Das bedeutet, dass zu einem bestimmten Zeitpunkt in unserer Geschichte nur sehr wenige einzelne Mitglieder unserer Spezies am Leben waren, und dies kann für den „Mangel“ an Vielfalt verantwortlich sein, den wir in unserem Genom sehen. Die angegebene Zahl ist so niedrig wie 10.000 Menschen, die nach dem Superausbruch des Toba-Vulkans vor etwa 75.000 Jahren am Leben geblieben sind.

Das bedeutet, dass es nur noch sehr wenige Paarungspaare gab, was die genetische Vielfalt unserer Art erheblich reduziert hat. Dies ist als Gründereffekt bekannt.

Gründereffekte

Ein Gründereffekt tritt auf, wenn eine neue Kolonie von wenigen Mitgliedern der ursprünglichen Population gegründet wird. Diese geringe Populationsgröße bedeutet, dass die Kolonie Folgendes haben kann:

  • reduzierte genetische Variation gegenüber der ursprünglichen Population.
  • eine nicht zufällige Stichprobe der Gene in der ursprünglichen Population.

Wenn wir also durchschnittlich 20 bis 25 Jahre pro menschlicher Generation verwenden, betrachten wir nur etwa 3.000 bis 4.000 Generationen, da es vielleicht nur einige tausend Brutpaare von Menschen gab. Vergleichen Sie das mit Bakterien, die in weniger als einer Woche drei- bis viertausend Generationen durchlaufen können, und Sie können allmählich ein Gefühl dafür bekommen, warum es im menschlichen Genom so viel Sequenzhomologie (Gleichheit) gibt. Weitere Informationen finden Sie unter Bottlenecks and Founder Effects auf der Website Understanding Evolution der UC Berkley.

Sie sollten auch verstehen, dass alle schädlichen Änderungen unter starkem Selektionsdruck stehen. Dies bedeutet möglicherweise nicht, dass der Organismus nicht überleben kann, um sich zu reproduzieren, sondern kann nur bedeuten, dass er im Durchschnitt möglicherweise weniger erfolgreich ist; weniger Nachkommen, die im Vergleich zum Rest der Bevölkerung weniger Nachkommen haben. Irgendwann kann diese Linie aussterben, entweder weil die Veränderung es sehr schwierig macht zu überleben, oder weil die Nachkommen weniger begehrenswerte Partner abgeben und schließlich nicht die Gelegenheit bekommen, sich fortzupflanzen.

Alle Veränderungen, die ein lebenswichtiges Gen stören, sind wahrscheinlich tödlich und führen zu spontanen Aborten, oder wenn die Mutation in einem Spermium aufrechterhalten wurde, dann kann dieses Spermium nicht überleben, um ein Ei zu befruchten, so dass das stark mutierte Spermium möglicherweise niemals überleben wird mach es zum Ei. Die durchschnittliche Anzahl von Spermien in einer einzigen menschlichen Ejakulation beträgt etwa 250 Millionen. Und doch schafft es nur ein einziges Spermium, das Ei zu befruchten, und das setzt voraus, dass ein Befruchtungsereignis stattfindet. Es gibt eine unglaubliche Menge an Selektion, die im Akt der Zeugung vor sich geht, sogar bevor wir zur Entwicklung kommen.

Warum die Zahl von 99,5 % bis 0,5 % die Bevölkerung als Ganzes falsch darstellen könnte.

Eine andere Sache, über die Sie nachdenken sollten, ist, wie die Zahl von 0,5 % bis 99,5 % zustande kam. Die in der Frage referenzierten Links zu einem Wikipedia-Artikel Human Genetic Variation . Als Referenz diente ein Artikel der New York Times über J. Craig Venter, In the Genome Race, the Sequel Is Personal – Wade, Nicholas. 4. September 2007. Das Zitat, auf das in Wikipedia verwiesen wird, lautet:

Biologen hatten geschätzt, dass zwei Personen in 99,9 Prozent ihrer DNA identisch sein würden, aber die wahre Zahl zeigt sich jetzt als viel weniger, etwa 99,5 Prozent, sagte Dr. Scherer.

Die Zahl von 0,5 % wird als Zitat von Stephen W. Scherer angegeben, der Mitautor dieses Artikels war, The Diploid Genome Sequence of an Individual Human , Levy, et.al. PLoS-Biologie; 4. September 2007. DOI: 10.1371/journal.pbio.0050254. Aus diesem Papier findet sich folgendes Zitat:

Die Einbeziehung der genetischen Variation durch Insertion und Deletion in unsere Schätzungen der interchromosomalen Differenz zeigt, dass zwischen den beiden chromosomalen Kopien eines Individuums nur eine Ähnlichkeit von 99,5 % besteht und dass die genetische Variation zwischen zwei Individuen fünfmal höher ist als zuvor geschätzt.
- Die diploide Genomsequenz eines einzelnen Menschen , Levy, et.al. PLoS-Biologie; 4. September 2007.
DOI: 10.1371/journal.pbio.0050254

Die Aussage wurde also zumindest in einem Peer-Review-Artikel gemacht. Allerdings gibt es dabei einige Probleme.

Die erste ist die Methode des Papiers. Es betrachtet ein einzelnes menschliches Genom, das von Dr. Venter, und wird verwendet, um auf einen Unterschied von 0,5 % zwischen zwei beliebigen Personen zu schließen. Und der Vergleich basiert auf der Analyse der Unterschiede zwischen Dr. Venters mütterlichen Chromosomen und väterlichen Chromosomen. Schauen wir uns an, was die Probleme hier sein könnten:

  • Es ist ein großer statistischer Vertrauensvorschuss, anzunehmen, dass ein einzelnes Genom repräsentativ für die fast 8 Milliarden Genome da draußen ist.
  • Dr. Venters Genealogie ist in beiden Elternlinien englisch. Wir dürfen nicht vergessen, dass es im mittelalterlichen Europa einen weiteren Bevölkerungsengpass gab, der durch Cholera -Ausbrüche und den Schwarzen Tod verursacht wurde . Diese Tatsache könnte darauf hindeuten, dass Dr. Venters Abstammungslinien genetisch eng beieinander liegen und dass, wenn seine Abstammungslinie vielfältiger wäre, sagen wir Ureinwohner Ozeaniens und Engländer, sie möglicherweise einen viel höheren prozentualen Unterschied zwischen mütterlichen und väterlichen Chromosomen gefunden hätten.

Der Drei-Generationen-Stammbaum des Spenders ist in Abbildung 1A dargestellt. Der Spender hat drei Geschwister und einen leiblichen Sohn, sein Vater starb im Alter von 59 Jahren an plötzlichem Herzstillstand. Es gibt dokumentierte Fälle von Familienmitgliedern mit chronischen Krankheiten wie Bluthochdruck, Eierstock- und Hautkrebs. Gemäß den genealogischen Aufzeichnungen können die Vorfahren des Spenders bis 1821 (väterlicherseits) und 1700 (mütterlicherseits) in England zurückverfolgt werden. Durch Genotypisierung und Clusteranalyse von 750 einzigartigen SNP-Loci wurde durch diese Projektunterstützung festgestellt, dass der Spender tatsächlich zu 99,5 % Personen europäischer Abstammung ähnlich ist (Abbildung 1B), was mit Selbstangaben übereinstimmt.
- Die diploide Genomsequenz eines einzelnen Menschen , Levy, et.al. PLoS-Biologie; 4. September 2007.
DOI: 10.1371/journal.pbio.0050254

  • Dr. Venter ist männlich. Das Y-Chromosom war problematisch zu sequenzieren, und man kann es nicht wirklich mit dem X-Chromosom vergleichen. Wie würde das Genom einer Frau im Vergleich aussehen?

Das Y-Chromosom wird zu 59 % von der Eins-zu-eins-Kartierung abgedeckt, da es schwierig ist, einen Vergleich zwischen Chromosomen mit vielen Wiederholungen zu erstellen. Darüber hinaus ist das Y-Chromosom aufgrund der Schwierigkeiten beim Zusammenbau komplexer Regionen mit einer nur halb so tiefen Sequenzabdeckung wie der autosomale Teil des Genoms schlechter abgedeckt. Die X-Chromosomenabdeckung mit HuRef-Scaffolds liegt bei 95,2 %, was typisch für den Abdeckungsgrad von Autosomen ist (Mittelwert 98,3 % unter Verwendung von Läufen). Es ist jedoch klar, dass das X-Chromosom mehr Lücken aufweist, wie die Abdeckung mit Streichhölzern (89,4 %) im Vergleich zur mittleren Abdeckung von Autosomen mit Streichhölzern (97,1 %) zeigt. Die Gesamteffekte einer geringeren Sequenzabdeckung auf den Chromosomen X und Y sind deutlich erkennbar als ein starker Anstieg der Anzahl von Lücken pro Längeneinheit und kürzere Gerüste im Vergleich zu den Autosomen (Abbildung 3). Die Ähnlichkeit zwischen den Geschlechtschromosomen ist eine weitere Ursache für Zusammenbau- und Kartierungsschwierigkeiten. Beispielsweise gibt es ein 1,5-Mb-Gerüst, das identischen Regionen der X- und Y-Chromosomen gleich gut zugeordnet werden kann und daher keinem von beiden eindeutig zugeordnet werden kann (siehe Materialien und Methoden und Abbildung 3). Aus unseren Eins-zu-Eins-Mapping-Daten können wir auch die Anreicherung großer segmentaler Duplikationen erkennen10 auf den Chromosomen 9, 16 und 22, was zu einer reduzierten Abdeckung aufgrund von Schwierigkeiten bei der Assemblierung und Kartierung führt (Tabelle S3).
- Die diploide Genomsequenz eines einzelnen Menschen , Levy, et.al. PLoS-Biologie; 4. September 2007.
DOI: 10.1371/journal.pbio.0050254

Es gibt eine andere Sache, an die Sie sich erinnern müssen, und das ist die Geschichte des Human Genome Project. Dr. Venter entwickelte eine neue Sequenzierungsmethode und wurde ein kommerzieller Konkurrent des International Human Genome Sequencing Consortium-Projekts. Während das Projekt des International Human Genome Sequencing Consortium das Unternehmen von Dr. Venter besiegte ( 8), seinen Ansatz, eine Verschmelzung der DNA vieler Spender zu verwenden, von denen einige ihre DNA enthalten hatten und andere nicht, um die Anonymität zu wahren, umging Dr. Venter dies, indem er die Sequenzierung an seiner eigenen DNA durchführte. Als sein Team vom International Human Genome Sequencing Consortium geschlagen wurde, verdoppelte er sich, investierte mehr Zeit und Mühe und kam auf die in diesem Papier dargelegte Sequenz, die einen höheren Auflösungsgrad hatte als frühere Bemühungen. Das Papier argumentiert für den Wert ihrer Technik gegenüber den Techniken, die vom International Human Genome Sequencing Consortium verwendet werden, und versucht, die Überlegenheit ihrer Methode zu behaupten. Die präsentierten Daten sind wahrscheinlich sachlich, aber aufgrund dieser Geschichte müssen Sie sich das Papier, die Methoden und die Motive dahinter ansehen.

Es ist erst 15,5 Jahre her, seit wir einen vollständigen Entwurf eines Humangenomprojekts hatten , das vom International Human Genome Sequencing Consortium erstellt wurde. Um dieses Genom zu sequenzieren, wurden Proben von einigen hundert Individuen entnommen. Kleine Abschnitte der DNA wurden sequenziert und dann alle diese Teile im Computer zusammengesetzt. Das heißt, es wurde viel gemittelt. Daher wurde standardmäßig die am weitesten verbreitete Basis in der Population von Freiwilligen an jeder Position ausgewählt. Das heißt, das sollte auch für den Rest der Bevölkerung repräsentativ sein.

Wenn wir Aussagen über Vergleiche in Datensätzen machen, die so groß sind wie das menschliche Genom, betrachten wir meistens bekannte, kleine Teilmengen des Genoms und extrapolieren auf dieser Grundlage mit statistischen Methoden. Eine Sache, die Sie beim Lesen von Wissenschaftsartikeln und nicht nur von Wissenschaftsnachrichtenartikeln lernen, ist, dass Sie sich immer ihre Materialien und Methoden ansehen müssen, um festzustellen, wie sie zu ihren Daten und Schlagzeilen gekommen sind. Es wird oft zitiert, dass wir nur einen Unterschied von 1,5 % zwischen Menschen und Schimpansen haben, aber wenn Sie sich diese Papiere ansehen, wurden die Vergleiche nur an Bereichen des Genoms durchgeführt, die gut aufeinander abgestimmt waren. Das soll nicht heißen, dass es keine bemerkenswerte Ähnlichkeit zwischen uns und unserem nächsten lebenden evolutionären Verwandten gibt, es ist nur so, dass an der Geschichte mehr dran ist als an der Schlagzeile.

Außerdem haben wir nicht so viele vollständige Genome sequenziert, um sie miteinander zu vergleichen, als Prozentsatz der 8 Milliarden heute lebenden Menschen. Obwohl wir Repräsentationen von der überwiegenden Mehrheit der identifizierten ethnischen Gruppen haben, fehlen uns möglicherweise Familien mit neuartigen Abstammungslinien.

Eine andere Sache, über die Sie nachdenken müssen, ist, dass viele der Bereiche im menschlichen Genom Wiederholungen und Strukturelemente sind, die nicht für Gene kodieren, die die Genexpression beeinflussen. Dinge wie Telomere, die die Enden der Chromosomen schützen, und Zentromere, die die Befestigungspunkte auf Chromosomen sind, die dafür sorgen, dass sie richtig in neu geteilte Zellen verteilt werden. Diese Elemente bleiben in der Regel gleich, weil die Proteine, die an sie binden, diese Sequenzspezifität benötigen, um richtig zu funktionieren, also sind dies Regionen, in denen fast jede DNA gleich ist, und nicht nur zwischen Menschen. Diese Elemente sind bei den meisten Wirbeltieren oft sehr ähnlich.

Wir müssen auch strukturelle RNAs berücksichtigen. Diese Moleküle haben Funktionen innerhalb der Zelle, die erfordern, dass ihre Sequenzen hoch konserviert (unverändert) sind. Ribosomale RNAs, Transfer-RNAs und Small Nuclear RNAs sind alle auf ihre spezifische Sequenz angewiesen, um sich richtig zu falten, um ihre Aufgabe in der Zelle zu erfüllen. Eine einzelne Basenänderung kann die Faltung dieser Elemente verändern und als Ergebnis verlieren sie ihre Funktion, was bedeutet, dass diese Zellen nicht in der Lage sein werden, Proteine ​​richtig zu produzieren, was bedeutet, dass die Zellen sterben werden. Wenn dies in Keimbahnzellen geschieht, werden sie nicht an der Befruchtung beteiligt sein, sodass alle dortigen Mutationen weitergegeben werden.

Ich könnte weiter und weiter fortfahren, aber das Fazit ist, dass es nicht verwunderlich ist, dass es innerhalb der menschlichen Spezies prozentual sehr wenig Sequenzdiversität gibt, aber es gibt auch viele Vorbehalte gegenüber dieser Tatsache.

Bearbeiten: Erhebliche Änderungen, um relevante, referenzierte Informationen hinzuzufügen, um die Antwort zu sichern.

Ich möchte weitere Konten erstellen, damit ich diese Antwort weiter positiv bewerten kann.
@Nathan Ich weiß das Gefühl zu schätzen, ich bin einfach froh, dass Sie es informativ fanden.
Ich möchte anmerken, dass von den 150 Millionen Unterschieden nur ein winziger Bruchteil die Proteinsequenz auf sinnvolle Weise verändert. Erstens, weil proteincodierende Sequenzen 1,5 % des Genoms ausmachen. Zweitens ist es sehr unwahrscheinlich, dass eine zufällige Aminosäureänderung in einem Protein einen funktionellen Effekt hat. Drittens, weil Änderungen, die die Funktion beeinträchtigen, potentiell gegen selektiert werden können. Die tatsächliche Anzahl der funktionalen Unterschiede ist also viel geringer (ich schätze ~ 100000 oder weniger).
@Bitwise Ich denke, Sie sollten diesen Absatz noch einmal lesen. Ich sage nicht, dass es zu 150 Millionen Änderungen führt, ich sage, dass, weil nur eine einzige Basenänderung eine Aminosäuresequenz ändern kann, dies zu einem signifikanten Unterschied führen kann. Der Punkt war, dass Sie sehr wenige Unterschiede benötigen, um eine große Vielfalt zwischen Individuen zu erreichen. Was Sie über funktionale Veränderungen sagen, ist nicht ganz richtig. Sie können eine "stille" Mutation in einem Gen haben, aber wenn die tRNA um den Faktor 10 oder 100 weniger kodiert wird als die ursprüngliche tRNA, dann können Sie das Protein auch ohne aa-Änderung töten.
@AMR Ich habe nicht gesagt, dass Sie falsch liegen, ich wollte nur für die Leser klarstellen, dass selbst bei 150 Millionen Unterschieden nur ein sehr winziger Bruchteil tatsächlich aussagekräftig ist. Ich habe Proteine ​​in Betracht gezogen, weil Sie das erwähnt haben, aber es gibt viele andere Arten von Veränderungen, die funktionell sein können (z. B. in regulatorischen Regionen). Doch selbst wenn Sie all dies berücksichtigen, wird die überwiegende Mehrheit der Unterschiede keine Auswirkungen haben.
@Bitwise Das OP ist ein Highschool-Schüler, der kein Biologiestudium absolviert hat. Ich stimme zu, dass es noch viel mehr Stellen wie Promoter und Enhancer, Spleiß-Donor-/Akzeptor-Sites gibt, die die Funktionalität beeinträchtigen können, aber da wir das normalerweise Studenten im ersten Jahr nicht beibringen, habe ich nur darauf hingewiesen, was jemand mit einem zufälligen Verständnis tun kann wissen. Ihre Frage ist aus der Perspektive, dass 0,5 % nicht viel Variation sind, sie verwenden "nur", und ich habe versucht, ihnen zu sagen, dass das mehr als genug ist, um 8 Milliarden Individuen Einzigartigkeit zu verleihen.
@AMR: Es ist einige Zeit her, aber warum sollten Sie einen Satz wie "Sie sollten auch verstehen, dass alle schädlichen Änderungen unter starkem selektiven Druck stehen." nachdem Sie über Engpässe gesprochen haben? Nach Engpässen ist die Selektion (sei es reinigend, positiv oder ausgleichend) im Allgemeinen ziemlich schwach und hat eine geringe Wirksamkeit bei der Reduzierung schädlicher Varianten. Natürlich reduzieren sowohl die Reinigung der Selektion als auch die Drift die Variation (und tragen daher zur geringen genetischen Vielfalt unter den Menschen bei), aber dies kann immer noch zu Fehlinterpretationen führen ...