Teilen Affen und Menschen 99 % der DNA oder 99 % der Gene? Was ist der Unterschied?

Ich habe eine Antwort auf Scifi.SE gegeben, die hier gelesen werden kann . Es geht darum, wie die Charaktere in der Geschichte Jurassic Park DNA für alle gezeigten Arten bekommen haben könnten.

In meiner Antwort habe ich folgendes gesagt:

Menschenaffen und Menschen zum Beispiel teilen über 99 % ihrer Gene. Das bedeutet, dass der Unterschied zwischen unseren Arten weniger als 1 % unserer Gene beträgt. Tatsächlich teilt alles Leben auf der Erde etwa 50 % seiner Gene.

aber im ursprünglichen Posting (bevor jemand es bearbeitet hat) habe ich mich dafür entschieden, das Wort DNA anstelle von Genen zu verwenden.

Er hat diesen Kommentar im Abschnitt hinterlassen, um die Bearbeitung zu erklären:

Tut mir leid, ich bin Biologe, ich kann nichts dafür. Menschen und Affen teilen 99 % Ähnlichkeit in den kodierenden Sequenzen ihrer DNA, die ~ 5 % kodieren für Gene, nicht auf der gesamten DNA. Ich habe dies für die Antwort auf Gene vereinfacht.

Ich habe ein grundlegendes Highschool-Verständnis von DNA und Genen, daher fürchte ich, dass ich in meiner Aussage den Unterschied zwischen der Verwendung von "DNA" und der Verwendung von "Genen" nicht sehe. Ich verstehe, dass Gene spezifische DNA-Sequenzen sind, die von der Zelle auf irgendeine Weise verwendet werden. Ich verstehe, dass DNA allgemeiner ist, einschließlich aller Stränge, ob sie verwendet werden oder nicht, ob sie für etwas zu codieren scheinen oder nicht.

Ist es also falsch zu sagen, dass Menschenaffen und Menschen 99 % ihrer DNA gemeinsam haben, oder ist es genauso richtig, „Gene“ zu sagen?

Ich vertraue im Allgemeinen dem, was @terdon sagt, er ist eine ziemlich vielseitige Person. Davon abgesehen würde ich etwas pedantischer sein und sagen, dass Menschenaffen und Menschen über 99 % der codierenden Sequenzen (oder DNA) in unseren Genen gemeinsam haben, direkt in der Antwort, aber das bin nur ich. Es ist technisch falsch zu sagen, dass wir 99 % unserer DNA teilen, aus Gründen, die ich weiter unten erläutern werde...
@MattDMo Ja, ich wollte keine "Codierungssequenz" verwenden, da ich dachte, dass dies für die andere Site etwas zu technisch ist. Ich bin nur pedantisch genug, dass ich "99% der DNA" nicht unangefochten stehen lassen konnte :).

Antworten (6)

Also, eine kurze Molekularbiologiestunde.

  • Proteine ​​sind die Dinge, die einen guten Prozentsatz unserer Zellen ausmachen (die einen guten Prozentsatz von uns ausmachen ) und die Dinge, die die Arbeit der Zellen erledigen – viele sind Katalysatoren und werden als „Enzyme“ bezeichnet.
  • Proteine ​​werden von Genen kodiert - während die Aussage, dass ein Gen für ein Protein kodiert, nicht ganz korrekt ist (ein Gen kann für verschiedene Variationen desselben Grundproteins kodieren), ist es eine gute Möglichkeit, über Dinge in diesem Zusammenhang nachzudenken.

  • Gene bestehen aus DNA , einem polymeren Molekül, das unsere Chromosomen bildet, deren Informationsteil aus vier „Buchstaben“ (chemischen Basen) besteht.

  • Aber jetzt kommen wir zum Schlüsselteil – obwohl alle Gene aus DNA bestehen, macht nicht die gesamte DNA von Chromosomen Gene aus . Tatsächlich stellen, wie @terdon in einem Kommentar erwähnte, nur etwa 5 % (oder weniger) der 4 Milliarden Buchstaben in der gesamten DNA – dem Genom – Gene dar – jene Sequenzen, die
    direkt für Proteine ​​codieren.

  • Die Funktion des restlichen Genoms ist nicht ganz klar. Einige sind regulatorisch, einige können strukturell sein und können „Junk-DNA“ sein. Es ist jedoch seit Millionen von Jahren in der Nähe, also nehmen wir an, dass es einen Zweck haben muss. Diese nichtkodierende DNA unterscheidet sich zwischen den Arten in einem größeren Ausmaß als die Gene selbst, also trägt sie vielleicht irgendwie zu den Unterschieden zwischen Organismen bei.


Von AndroidPenguin

Hier sind die Links zu einem Artikel über die Funktion von "Müll"-DNA aus dem Jahr 2013.

  1. Zusammenfassung in der NY Times

  2. Abstrakt in der Natur

  3. ENCODE-Threads auf nature.com

Randbemerkung, das ENCODE-Zeug über Junk ist bestenfalls umstritten und war stärker (vom Konsortium zugegeben) purer Hype; es war nicht in dem Peer-Review-Artikel, wird von Forschern auf Junk-DNA als Unsinn angesehen und sollte nicht als gültige Referenz behandelt werden.

Da es meine Bearbeitung Ihrer Frage war, mit der all dies begonnen hat, kann ich mich genauso gut einmischen. Ich werde eine vereinfachte Version von Genen und Gentranskription geben, es gibt verschiedene Details, die den Prozess viel komplizierter machen als das, was ich beschreiben werde, aber sie sind für die Grundfrage hier nicht relevant.

Zunächst einmal sind Gene, wie andere bereits erwähnt haben, spezifische DNA-Sequenzen. Die Aufgabe eines Gens ist es, ein Protein zu „codieren“ (erste große Vereinfachung). Allerdings kodiert nicht das gesamte Gen für Protein, sondern nur die Teile davon, die als Exons bezeichnet werden (Bild von hier leicht modifiziert ):

Geben Sie hier die Bildbeschreibung ein

Die Take-Home-Botschaft aus dem obigen Bild ist, dass die roten Bits (die Introns ) entfernt werden und das endgültige Proteinprodukt nicht beeinflussen. Also kodiert nur ein Teil des Gens für das Protein. Introns neigen dazu, zwischen verschiedenen Spezies weit weniger konserviert zu sein als Exons.

Nicht nur das gesamte Gen kodiert nicht für Protein, sondern der größte Teil des Genoms enthält keine Gene. Tatsächlich machen Gene beim Menschen etwa 5 % der gesamten DNA aus und Exons etwa 2 %.

Ein weiterer Störfaktor sind die Sequenzen, die sich wiederholende Elemente genannt werden . Dies sind verschiedene Arten von normalerweise kurzen Sequenzen, die in vielen Kopien in Genomen vorkommen. Im menschlichen Genom bestehen ~41% aus sich wiederholenden Elementen verschiedener Typen, und ~10% stellen Kopien eines einzelnen solchen Elements (Alu) dar, das sind doppelt so viele als Gene. Solche sich wiederholenden Elemente werden normalerweise nicht berücksichtigt, wenn die Ähnlichkeitsraten des gesamten Genoms berechnet werden.

Mensch und Schimpanse sind sich in Bezug auf ihr gesamtes Genom sehr, sehr ähnlich. Die genauen Prozentsätze variieren jedoch (ich habe Schätzungen von etwa 85 bis etwa 90 gesehen), je nachdem, wie die Sequenzen untersucht werden. Um auf der sicheren Seite zu sein, sollten Sie sagen, dass sie auf Genebene zu 99% ähnlich sind , und es dabei belassen.

Vielen Dank für die Einzelheiten. Jetzt, nachdem ich meinen ersten Biologiekurs auf College-Niveau abgeschlossen habe, verstehe ich das meiste davon, obwohl ich sehr wenig verstand, als Sie zum ersten Mal antworteten. +1, aber ich habe Ihnen die Auswahl nicht gegeben, weil Matt's für die Einfachheit und Organisation der Gedanken besser war.

Nur um die Definitionen zu verdeutlichen, Ihr Genom besteht aus DNA-Sequenzen. DNA besteht aus Paaren von vier Nukleinsäuren oder Nukleotiden (A, G, T, C). Diese DNA hat viele Orte in sich, jeder kodiert für ein Gen. Loci erhalten Gennamen wie SHH (Sonic Hedgehog), was Teil einer Disziplin namens Gennomenklatur ist . Menschen haben zwei Versionen jedes Gens, eine von jedem Elternteil. Diese Gene, wie SHH, haben verschiedene Varianten, die Allele genannt werden . Hier haben Sie vielleicht die Begriffe homozygot und heterozygot gehört, wenn eine Person zwei Kopien desselben Allels oder zwei unterschiedliche Kopien hat. Sie erinnern sich vielleicht, dass Sie in der High School über Sichelzellenanämie gesprochen haben.

Ist es also falsch zu sagen, dass Menschenaffen und Menschen 99 % ihrer DNA gemeinsam haben, oder ist es genauso richtig, „Gene“ zu sagen?

Nun, die Ähnlichkeit zwischen Menschen und Schimpansen in Bezug auf die bekannte DNA-Sequenz beträgt etwa 98,8 %, es gibt eine ziemlich geringe Sequenzdivergenz, also haben Sie meiner Meinung nach Recht, wenn Sie sagen, dass sie 99 % ihrer DNA teilen. Dies bedeutet, dass es in 100 Nukleotiden ungefähr einen Unterschied gibt, z. B. (zeigt 90 Basen, hergestellt unter Verwendung einer Zufallsstichprobe von vier Buchstaben in R):

Menschlicher DNA-Strang:

atgactgtagcccatga t gtaaacgtaccaagcctcctcggctgtcccgaaatagatacgcctggtagacgtattaatagtgagtaa...cgt

Schimpanse:

atgactgtagcccatga c gtaaacgtaccaagcctcctcggctgtcccgaaatagatacgcctggtagacgtattaatagtgagtaa...cgt

Angesichts der Tatsache , dass es im menschlichen Genom > 3.000.000.000 Basenpaare gibt (die Sequenz von 4 Nukleotiden, aus denen die DNA besteht), entspricht dies ~ 36.000.000 verschiedenen Basenpaaren (zwischen Menschen und Schimpansen), was wahrscheinlich einem großen Unterschied entspricht. Manchmal kann sogar ein Single Nucleotide Polymorphism (SNP, ausgesprochen snip), eine Veränderung in nur einem Basenpaar, quantifizierbare Veränderungen bewirken:

eine einzelne Basenmutation im APOE-Gen (Apolipoprotein E) ist mit einem höheren Alzheimer-Risiko verbunden.

Hier ist eine kleine Lektüre zum Thema Mensch vs. Schimpanse . Vielleicht möchten Sie auch diesen ähnlichen Beitrag auf Biology SE sehen .

Aber der Herausgeber Ihres ursprünglichen Beitrags hat Recht ... nur die Euchromatische Region wurde sequenziert.

„Menschen und Affen haben 99 % Ähnlichkeit in den kodierenden Sequenzen ihrer DNA“

Die euchromatische Region wird oft als der proteincodierende Teil der DNA angesehen und macht 92 % des Genoms aus (ich denke, das sind vielleicht 92 % der Gene, aber nur ein kleiner Teil der physischen DNA).

Der Rest, das Heterochromatin, enthält nicht sequenzierte Informationen und könnte einen Teil der DNA-Variation zwischen den beiden Arten beherbergen. Einige Arbeiten deuten darauf hin, dass das Heterochromatin, das früher als Junk-DNA bezeichnet wurde, tatsächlich einen gewissen Einfluss auf die Merkmale hat. Bei Drosophila gab es beispielsweise Studien, die Auswirkungen des Y-Chromosoms auf Merkmale zeigen, obwohl das Y-Chromosom hauptsächlich heterochromatisch ist.


Weiter: Ich denke, eine häufige Ursache für Verwirrung ist die Verwendung des Wortes Gen. Es wird oft synonym verwendet, um entweder Allel oder Genetic Locus zu bedeuten . Wenn jemand sagt, dass Menschen und Affen 99 % ihrer Gene gemeinsam haben, dann meinen sie damit, dass sie 99 % ihrer genetischen Loci gemeinsam haben. Wenn jemand sagt, dass eine Person 50 % ihrer Gene mit einem Elternteil teilt, meint sie, dass sie die Hälfte ihrer Allele mit diesem Elternteil teilt (es ist nur ungefähr die Hälfte aufgrund von Rekombination und Mutation). Ein Individuum hat alle (mit Ausnahme genetischer Defekte wie Deletionen ) die gleichen Loci wie sein Elternteil.

Die meisten Antworten hier konzentrieren sich sehr gut auf den Unterschied zwischen den Konzepten „DNA“ und „Gene“. Die Sequenzidentität zwischen Menschen und Schimpansen wird jedoch nicht so streng abgedeckt und bleibt unklar aus dem, was beantwortet wurde. Deshalb werde ich darauf näher eingehen, damit auch der erste Teil der Frage abgedeckt ist.

Menschen und Schimpansen unterscheiden sich etwa alle 100 Nukleotide in ihrer gesamten DNA-Sequenz. Das bedeutet nicht, dass 98,5 % der Gene geteilt werden. Das bedeutet, dass Menschen ungefähr 98,5 % (genauer gesagt ungefähr 98,8 %, The Chimpanzee Sequencing and Analysis Consortium, 2005 ) Sequenzidentität mit Schimpansen haben, wobei Indels außer Acht gelassen werden . Sie behandelten Indels und Nukleotidunterschiede getrennt und "berechnen[d] die genomweite Nukleotiddivergenz zwischen Mensch und Schimpanse mit 1,23% ", was intergenische Regionen und Introns einschließt - also offensichtlich auch nicht-genische Regionen . Die Sequenzidentität auf Genebene ist vermutlich viel größer.

Auch das Chimpanzee Sequencing and Analysis Consortium gibt Auskunft darüber, wie diese Divergenz aufgebaut ist. Der Hauptteil (ca. 85% der 30 - 35 Mio. unterschiedlichen Nukleotide) stammt von fixen Differenzen : Eine fixe Differenz ist eine Position im haploiden Genom, an der beispielsweise jeder Mensch ein G und jeder Schimpanse ein T hat. Dementsprechend , ist der Standort zwischen den beiden Arten für jedes Individuum der jeweiligen Art unterschiedlich. Der kleinere Teil (etwa 15 %) stammt von Stellen, die entweder variabel ( SNP ) beim Menschen oder variabel beim Schimpansen oder in beiden sind (es gibt sogar eine kleine Anzahl sehr alter Varianten, d. h. gemeinsame Allele zwischen Mensch und Schimpanse, zAzevedo et al., 2015 ). Beachten Sie, dass die Schätzungen umso besser werden, je mehr Individuen der jeweiligen Art sequenziert und verglichen werden.

Ich habe gerade einen Artikel gelesen, der besagt, dass selbst die 99%-Statistik technisch nicht korrekt ist. Um diese Zahl zu erreichen, mussten sie 25 % der menschlichen DNA und ich glaube 18 % der Schimpansen-DNA ignorieren. Ich gehe auch davon aus, dass die Statistik nur die codierte DNA enthielt. Denn wenn das, was sie früher als Junk-DNA bezeichneten, nicht dasselbe ist, dann sieht die 99%-Statistik von 2005 immer weniger genau und etwas irreführend aus. https://futurism.com/watch-do-we-really-share-99-our-dna-chimps/

Es ist nicht nur kodierende DNA, sondern auch alle nicht kodierende DNA. Darüber hinaus erwähnt die Veröffentlichung, die die 98,8%ige Sequenzidentität erwähnt, ausführlich, dass dies nicht mit strukturellen Unterschieden (Indels usw.) zusammenhängt, da diese Unterschiede nicht so einfach quantifiziert werden können. Sie decken aber auch strukturelle Unterschiede im Artikel ab.

Menschen und Schimpansen unterscheiden sich ungefähr alle 100 Nukleotide in ihrer gesamten DNA-Sequenz. Dies bedeutet nicht, dass 98,5 % der Gene gemeinsam sind. 2005) Sequenzidentität mit Schimpansen, ohne Berücksichtigung von Indels. Sie behandelten Indels und Nukleotidunterschiede getrennt und "berechneten [d] die genomweite Nukleotiddivergenz zwischen Mensch und Schimpanse mit 1,23 %", was intergenische Regionen und Introns einschließt - also offensichtlich auch Nicht- Genregionen. Die Sequenzidentität auf Genebene ist vermutlich viel größer.

Ich habe das Gefühl, dass die Mathematik hier nicht funktioniert. Wie können 100 Nukleotide 1,23 % der gesamten Sequenz entsprechen?