Ich habe eine Antwort auf Scifi.SE gegeben, die hier gelesen werden kann . Es geht darum, wie die Charaktere in der Geschichte Jurassic Park DNA für alle gezeigten Arten bekommen haben könnten.
In meiner Antwort habe ich folgendes gesagt:
Menschenaffen und Menschen zum Beispiel teilen über 99 % ihrer Gene. Das bedeutet, dass der Unterschied zwischen unseren Arten weniger als 1 % unserer Gene beträgt. Tatsächlich teilt alles Leben auf der Erde etwa 50 % seiner Gene.
aber im ursprünglichen Posting (bevor jemand es bearbeitet hat) habe ich mich dafür entschieden, das Wort DNA anstelle von Genen zu verwenden.
Er hat diesen Kommentar im Abschnitt hinterlassen, um die Bearbeitung zu erklären:
Tut mir leid, ich bin Biologe, ich kann nichts dafür. Menschen und Affen teilen 99 % Ähnlichkeit in den kodierenden Sequenzen ihrer DNA, die ~ 5 % kodieren für Gene, nicht auf der gesamten DNA. Ich habe dies für die Antwort auf Gene vereinfacht.
Ich habe ein grundlegendes Highschool-Verständnis von DNA und Genen, daher fürchte ich, dass ich in meiner Aussage den Unterschied zwischen der Verwendung von "DNA" und der Verwendung von "Genen" nicht sehe. Ich verstehe, dass Gene spezifische DNA-Sequenzen sind, die von der Zelle auf irgendeine Weise verwendet werden. Ich verstehe, dass DNA allgemeiner ist, einschließlich aller Stränge, ob sie verwendet werden oder nicht, ob sie für etwas zu codieren scheinen oder nicht.
Ist es also falsch zu sagen, dass Menschenaffen und Menschen 99 % ihrer DNA gemeinsam haben, oder ist es genauso richtig, „Gene“ zu sagen?
Also, eine kurze Molekularbiologiestunde.
Proteine werden von Genen kodiert - während die Aussage, dass ein Gen für ein Protein kodiert, nicht ganz korrekt ist (ein Gen kann für verschiedene Variationen desselben Grundproteins kodieren), ist es eine gute Möglichkeit, über Dinge in diesem Zusammenhang nachzudenken.
Gene bestehen aus DNA , einem polymeren Molekül, das unsere Chromosomen bildet, deren Informationsteil aus vier „Buchstaben“ (chemischen Basen) besteht.
Aber jetzt kommen wir zum Schlüsselteil – obwohl alle Gene aus DNA bestehen, macht nicht die gesamte DNA von Chromosomen Gene aus . Tatsächlich stellen, wie @terdon in einem Kommentar erwähnte, nur etwa 5 % (oder weniger) der 4 Milliarden Buchstaben in der gesamten DNA – dem Genom – Gene dar – jene Sequenzen, die
direkt für Proteine codieren.
Die Funktion des restlichen Genoms ist nicht ganz klar. Einige sind regulatorisch, einige können strukturell sein und können „Junk-DNA“ sein. Es ist jedoch seit Millionen von Jahren in der Nähe, also nehmen wir an, dass es einen Zweck haben muss. Diese nichtkodierende DNA unterscheidet sich zwischen den Arten in einem größeren Ausmaß als die Gene selbst, also trägt sie vielleicht irgendwie zu den Unterschieden zwischen Organismen bei.
Von AndroidPenguin
Hier sind die Links zu einem Artikel über die Funktion von "Müll"-DNA aus dem Jahr 2013.
Da es meine Bearbeitung Ihrer Frage war, mit der all dies begonnen hat, kann ich mich genauso gut einmischen. Ich werde eine vereinfachte Version von Genen und Gentranskription geben, es gibt verschiedene Details, die den Prozess viel komplizierter machen als das, was ich beschreiben werde, aber sie sind für die Grundfrage hier nicht relevant.
Zunächst einmal sind Gene, wie andere bereits erwähnt haben, spezifische DNA-Sequenzen. Die Aufgabe eines Gens ist es, ein Protein zu „codieren“ (erste große Vereinfachung). Allerdings kodiert nicht das gesamte Gen für Protein, sondern nur die Teile davon, die als Exons bezeichnet werden (Bild von hier leicht modifiziert ):
Die Take-Home-Botschaft aus dem obigen Bild ist, dass die roten Bits (die Introns ) entfernt werden und das endgültige Proteinprodukt nicht beeinflussen. Also kodiert nur ein Teil des Gens für das Protein. Introns neigen dazu, zwischen verschiedenen Spezies weit weniger konserviert zu sein als Exons.
Nicht nur das gesamte Gen kodiert nicht für Protein, sondern der größte Teil des Genoms enthält keine Gene. Tatsächlich machen Gene beim Menschen etwa 5 % der gesamten DNA aus und Exons etwa 2 %.
Ein weiterer Störfaktor sind die Sequenzen, die sich wiederholende Elemente genannt werden . Dies sind verschiedene Arten von normalerweise kurzen Sequenzen, die in vielen Kopien in Genomen vorkommen. Im menschlichen Genom bestehen ~41% aus sich wiederholenden Elementen verschiedener Typen, und ~10% stellen Kopien eines einzelnen solchen Elements (Alu) dar, das sind doppelt so viele als Gene. Solche sich wiederholenden Elemente werden normalerweise nicht berücksichtigt, wenn die Ähnlichkeitsraten des gesamten Genoms berechnet werden.
Mensch und Schimpanse sind sich in Bezug auf ihr gesamtes Genom sehr, sehr ähnlich. Die genauen Prozentsätze variieren jedoch (ich habe Schätzungen von etwa 85 bis etwa 90 gesehen), je nachdem, wie die Sequenzen untersucht werden. Um auf der sicheren Seite zu sein, sollten Sie sagen, dass sie auf Genebene zu 99% ähnlich sind , und es dabei belassen.
Nur um die Definitionen zu verdeutlichen, Ihr Genom besteht aus DNA-Sequenzen. DNA besteht aus Paaren von vier Nukleinsäuren oder Nukleotiden (A, G, T, C). Diese DNA hat viele Orte in sich, jeder kodiert für ein Gen. Loci erhalten Gennamen wie SHH (Sonic Hedgehog), was Teil einer Disziplin namens Gennomenklatur ist . Menschen haben zwei Versionen jedes Gens, eine von jedem Elternteil. Diese Gene, wie SHH, haben verschiedene Varianten, die Allele genannt werden . Hier haben Sie vielleicht die Begriffe homozygot und heterozygot gehört, wenn eine Person zwei Kopien desselben Allels oder zwei unterschiedliche Kopien hat. Sie erinnern sich vielleicht, dass Sie in der High School über Sichelzellenanämie gesprochen haben.
Ist es also falsch zu sagen, dass Menschenaffen und Menschen 99 % ihrer DNA gemeinsam haben, oder ist es genauso richtig, „Gene“ zu sagen?
Nun, die Ähnlichkeit zwischen Menschen und Schimpansen in Bezug auf die bekannte DNA-Sequenz beträgt etwa 98,8 %, es gibt eine ziemlich geringe Sequenzdivergenz, also haben Sie meiner Meinung nach Recht, wenn Sie sagen, dass sie 99 % ihrer DNA teilen. Dies bedeutet, dass es in 100 Nukleotiden ungefähr einen Unterschied gibt, z. B. (zeigt 90 Basen, hergestellt unter Verwendung einer Zufallsstichprobe von vier Buchstaben in R):
Menschlicher DNA-Strang:
atgactgtagcccatga t gtaaacgtaccaagcctcctcggctgtcccgaaatagatacgcctggtagacgtattaatagtgagtaa...cgt
Schimpanse:
atgactgtagcccatga c gtaaacgtaccaagcctcctcggctgtcccgaaatagatacgcctggtagacgtattaatagtgagtaa...cgt
Angesichts der Tatsache , dass es im menschlichen Genom > 3.000.000.000 Basenpaare gibt (die Sequenz von 4 Nukleotiden, aus denen die DNA besteht), entspricht dies ~ 36.000.000 verschiedenen Basenpaaren (zwischen Menschen und Schimpansen), was wahrscheinlich einem großen Unterschied entspricht. Manchmal kann sogar ein Single Nucleotide Polymorphism (SNP, ausgesprochen snip), eine Veränderung in nur einem Basenpaar, quantifizierbare Veränderungen bewirken:
eine einzelne Basenmutation im APOE-Gen (Apolipoprotein E) ist mit einem höheren Alzheimer-Risiko verbunden.
Hier ist eine kleine Lektüre zum Thema Mensch vs. Schimpanse . Vielleicht möchten Sie auch diesen ähnlichen Beitrag auf Biology SE sehen .
Aber der Herausgeber Ihres ursprünglichen Beitrags hat Recht ... nur die Euchromatische Region wurde sequenziert.
„Menschen und Affen haben 99 % Ähnlichkeit in den kodierenden Sequenzen ihrer DNA“
Die euchromatische Region wird oft als der proteincodierende Teil der DNA angesehen und macht 92 % des Genoms aus (ich denke, das sind vielleicht 92 % der Gene, aber nur ein kleiner Teil der physischen DNA).
Der Rest, das Heterochromatin, enthält nicht sequenzierte Informationen und könnte einen Teil der DNA-Variation zwischen den beiden Arten beherbergen. Einige Arbeiten deuten darauf hin, dass das Heterochromatin, das früher als Junk-DNA bezeichnet wurde, tatsächlich einen gewissen Einfluss auf die Merkmale hat. Bei Drosophila gab es beispielsweise Studien, die Auswirkungen des Y-Chromosoms auf Merkmale zeigen, obwohl das Y-Chromosom hauptsächlich heterochromatisch ist.
Weiter: Ich denke, eine häufige Ursache für Verwirrung ist die Verwendung des Wortes Gen. Es wird oft synonym verwendet, um entweder Allel oder Genetic Locus zu bedeuten . Wenn jemand sagt, dass Menschen und Affen 99 % ihrer Gene gemeinsam haben, dann meinen sie damit, dass sie 99 % ihrer genetischen Loci gemeinsam haben. Wenn jemand sagt, dass eine Person 50 % ihrer Gene mit einem Elternteil teilt, meint sie, dass sie die Hälfte ihrer Allele mit diesem Elternteil teilt (es ist nur ungefähr die Hälfte aufgrund von Rekombination und Mutation). Ein Individuum hat alle (mit Ausnahme genetischer Defekte wie Deletionen ) die gleichen Loci wie sein Elternteil.
Die meisten Antworten hier konzentrieren sich sehr gut auf den Unterschied zwischen den Konzepten „DNA“ und „Gene“. Die Sequenzidentität zwischen Menschen und Schimpansen wird jedoch nicht so streng abgedeckt und bleibt unklar aus dem, was beantwortet wurde. Deshalb werde ich darauf näher eingehen, damit auch der erste Teil der Frage abgedeckt ist.
Menschen und Schimpansen unterscheiden sich etwa alle 100 Nukleotide in ihrer gesamten DNA-Sequenz. Das bedeutet nicht, dass 98,5 % der Gene geteilt werden. Das bedeutet, dass Menschen ungefähr 98,5 % (genauer gesagt ungefähr 98,8 %, The Chimpanzee Sequencing and Analysis Consortium, 2005 ) Sequenzidentität mit Schimpansen haben, wobei Indels außer Acht gelassen werden . Sie behandelten Indels und Nukleotidunterschiede getrennt und "berechnen[d] die genomweite Nukleotiddivergenz zwischen Mensch und Schimpanse mit 1,23% ", was intergenische Regionen und Introns einschließt - also offensichtlich auch nicht-genische Regionen . Die Sequenzidentität auf Genebene ist vermutlich viel größer.
Auch das Chimpanzee Sequencing and Analysis Consortium gibt Auskunft darüber, wie diese Divergenz aufgebaut ist. Der Hauptteil (ca. 85% der 30 - 35 Mio. unterschiedlichen Nukleotide) stammt von fixen Differenzen : Eine fixe Differenz ist eine Position im haploiden Genom, an der beispielsweise jeder Mensch ein G und jeder Schimpanse ein T hat. Dementsprechend , ist der Standort zwischen den beiden Arten für jedes Individuum der jeweiligen Art unterschiedlich. Der kleinere Teil (etwa 15 %) stammt von Stellen, die entweder variabel ( SNP ) beim Menschen oder variabel beim Schimpansen oder in beiden sind (es gibt sogar eine kleine Anzahl sehr alter Varianten, d. h. gemeinsame Allele zwischen Mensch und Schimpanse, zAzevedo et al., 2015 ). Beachten Sie, dass die Schätzungen umso besser werden, je mehr Individuen der jeweiligen Art sequenziert und verglichen werden.
Ich habe gerade einen Artikel gelesen, der besagt, dass selbst die 99%-Statistik technisch nicht korrekt ist. Um diese Zahl zu erreichen, mussten sie 25 % der menschlichen DNA und ich glaube 18 % der Schimpansen-DNA ignorieren. Ich gehe auch davon aus, dass die Statistik nur die codierte DNA enthielt. Denn wenn das, was sie früher als Junk-DNA bezeichneten, nicht dasselbe ist, dann sieht die 99%-Statistik von 2005 immer weniger genau und etwas irreführend aus. https://futurism.com/watch-do-we-really-share-99-our-dna-chimps/
Menschen und Schimpansen unterscheiden sich ungefähr alle 100 Nukleotide in ihrer gesamten DNA-Sequenz. Dies bedeutet nicht, dass 98,5 % der Gene gemeinsam sind. 2005) Sequenzidentität mit Schimpansen, ohne Berücksichtigung von Indels. Sie behandelten Indels und Nukleotidunterschiede getrennt und "berechneten [d] die genomweite Nukleotiddivergenz zwischen Mensch und Schimpanse mit 1,23 %", was intergenische Regionen und Introns einschließt - also offensichtlich auch Nicht- Genregionen. Die Sequenzidentität auf Genebene ist vermutlich viel größer.
MattDMo
Terdon