Teilen Menschen 50 % ihrer DNA mit Bananen?

Es wird allgemein behauptet, dass wir 50 % unserer DNA mit Bananen teilen. Hat dies eine tatsächliche Grundlage oder ist es ein Mythos?

Beispiel behauptet The Mirror (UK) , NHGRI

Antworten (2)

Abschließend eine Frage zu meinem nominellen Fachgebiet. Um diese Frage sinnvoll zu beantworten, müssen wir zunächst einige Konzepte definieren.

Mehr oder weniger. Die Aussage ist für vernünftige Interpretationen sachlich richtig.

Also weiter zu den Bedingungen.

Ich werde auf einen spezifischeren Stackexchange verlinken, um die Definitionen zu unterstützen

Homologie.

Um eine Analogie zu ziehen: Wenn jemand sagen würde „Menschen teilen 90 % ihres Skeletts mit Vögeln“, wäre das eine vernünftige Aussage? Die Gesamtstruktur ist die gleiche, die meisten Knochen haben ein Äquivalent, das länger, kürzer, dicker, dünner ist. Die Knochen haben möglicherweise Anpassungen an Stärke oder Gewicht, aber dehnen und quetschen die Dinge ein wenig und Sie erhalten etwas, das gleich aussieht.

Homologie

Orthologie

Orthologe sind Gene in verschiedenen Arten, die sich aus einem gemeinsamen Vorfahren entwickelt haben. Orthologe behalten normalerweise dieselbe Funktion bei.

Paralogie

Paraloge sind Gene, die dupliziert wurden. Eine Kopie kann am Ende etwas ganz anderes machen als das Original, behält aber einige Gemeinsamkeiten bei.Geben Sie hier die Bildbeschreibung ein

Wann gelten 2 Gene als gleich?

Schauen wir uns ein Beispiel an

Histon H1

Histon kommt in den meisten Arten vor und ist hoch konserviert. Es ist nicht artenübergreifend identisch, aber meistens gleich.

Histon

Tatsächlich sind viele der Gene, die wir zum Leben brauchen, bei vielen Arten gleich . Gene zum Kopieren von DNA, Gene zum Reparieren von Zellwänden, Gene zum Steuern der Temperatur, Gene zum Metabolisieren verschiedener Zucker . Egal, ob Sie ein Mensch oder eine Bananenpflanze sind, Sie brauchen viele der gleichen grundlegenden Maschinen, um zu leben.

Die Gene sind nicht vollkommen identisch, aber da sie meistens die gleiche Aufgabe erfüllen müssen und Sie ohne sie wahrscheinlich sterben oder bei der Zucht scheitern werden, sind sie in der Regel hoch konserviert, wobei die meisten Unterschiede an weniger wichtigen Stellen in den Genen liegen.

Die Gene werden verschoben, sie werden von hinten nach vorne gedreht oder Chromosomen vertauscht oder Chromosomen werden zusammengeführt oder gespalten, aber sie sind im Allgemeinen irgendwo da.

Hier ist zum Beispiel ein Mausgenom , das dadurch gefärbt ist, welche Abschnitte Homologe im menschlichen Genom haben.

Maus-Genom

Es geht nur darum, wie streng Sie mit dem sind, was Sie als "teilende" DNA bezeichnen

Wenn Sie Gensequenzen mit einer einzigen unterschiedlichen Base als nicht gleich zählen, würden die meisten Menschen anderen Menschen nicht als sehr ähnlich gelten.

Wenn Sie 1, 2, 3, 4 oder mehr Mutationen pro 100 Basen zulassen, während Sie etwas immer noch als "das Gleiche" zählen, können Sie fast jeden gewünschten Prozentsatz erhalten.

Deshalb habe ich oben "irgendwie" gesagt.

Ich könnte auf ein Papier verlinken, in dem sie eine Nummer angeben, aber das wäre nicht besonders informativ. Ich könnte auf 3 weitere verweisen, die unterschiedliche Zahlen für dasselbe geben, weil es darum geht, wo Sie die Grenzpunkte festlegen, wenn Sie entscheiden, ob etwas als dasselbe gilt.

Dies ist eine wirklich gute Antwort - sie ist informativ, referenziert und erklärt das Thema gut. Ein paar Leute werden es mögen, da es nicht wirklich das übliche Format ist (ein oder zwei Artikel, die sich auf das Thema beziehen), aber ich mag es trotzdem. +1 von mir!
Das Diagramm, das Sie zeigen, zeigt die farbcodierten Maus/Mensch-Homologe; Hat diese Art von Diagramm einen Namen?
Oh warte, vergiss es; cinteny.cchmc.org generiert sie und scheint sie als "synteny maps" zu bezeichnen. Sie haben leider keine Bananen in ihrer Datenbank, aber sie haben Reis. Ich habe das gemacht , aber ich bin mir nicht sicher, welche Parameter sie verwendet haben, um die Maus / den Menschen zu generieren.
Ja, das klingt in etwa richtig. Bei sehr entfernt verwandten Arten müssen Sie es auf Exons beschränken und viel mehr Fehlpaarungen akzeptieren, um ein vernünftiges Maß an Syntenie zu erhalten. Wenn Sie sich ihr Mensch-Maus-Synteny-Diagramm / ihre Karte ansehen, sieht es so aus, als hätten sie etwas strengere Standardparameter als die, die zum Generieren des Diagramms verwendet wurden, das ich in meinen Beitrag aufgenommen habe.
Ich bin neugierig: Was ist mit nicht-genetischer DNA? Ein Großteil der DNA enthält eigentlich gar keine Gene. Wie viel Variation gibt es dann in diesen DNA-Stücken zwischen den Arten? Sind sie sehr variabel oder stabil?
@Bakuriu Nicht genetisch? Meinst du nicht codieren? Introns? Bereiche, die keinem selektiven Druck ausgesetzt sind? Einige Bereiche unserer DNA scheinen nicht unter Selektionsdruck zu stehen, Mutationen/Veränderungen in diesen Bereichen werden nicht aus der Population ausgewählt, was darauf hindeutet, dass, wenn sie etwas tun, ihre tatsächliche Sequenz nicht so wichtig ist, dass sie eine Wirkung hat wie wahrscheinlich es ist, dass ein Individuum überlebt. In diesen Bereichen gibt es tendenziell massive Unterschiede, selbst zwischen Individuen derselben Art.
Wäre diese Antwort nicht besser formuliert als "Menschen teilen 50% der Gene mit Bananen"? Aus der Syntenie-Karte mit Reis geht ziemlich klar hervor, dass die Behauptung „50 % DNA“ falsch ist.
@MarchHo Leider werden schlecht informierte Bevölkerungsgruppen und Medien bereitwillig Worte austauschen und Dinge wirklich vermasseln. Ich habe von Leuten gehört, die die beiden Begriffe synonym verwenden ...
Sie sagen, dass dies unter "angemessenen Interpretationen" zutrifft, aber dann bieten Sie keine solche Interpretation an. Ja, es gibt viele Möglichkeiten, den Prozentsatz der DNA zu messen, die zwischen zwei Arten geteilt wird. Aber gibt es einen vernünftigen Weg, der bei 50 % herauskommt? Sie versuchen nicht einmal zu zeigen, dass es hier eine gibt.
Zeigt dieses Homologie-Maus/Mensch-Diagramm an, dass keine Gene im menschlichen Y-Chromosom im Maus-Y-Chromosom gefunden werden? Warum ist das bei all den anderen Überschneidungen so?

Die Behauptung, dass wir 50 % unserer DNA teilen, ist wahrscheinlich ein falsches Zitat einer älteren Behauptung, dass wir 50 % unserer Gene mit Bananen teilen. Beide Behauptungen sind, soweit ich das beurteilen kann, falsch. Ich werde jeden Anspruch der Reihe nach ansprechen.

50 % unserer DNA ?

Die Vorstellung, dass wir 50 % unserer DNA teilen, ist nach den offensichtlichsten Definitionen dessen, was das bedeuten könnte, völlig falsch und trivial. Laut Wikipedia ist das menschliche Genom ungefähr 3 Gigabasenpaare lang. Das Genom der Banane ( Musa Acuminata ) hingegen ist nur etwa ein Fünftel dieser Länge – 600 Mb laut ProMusa oder nur 520 Mb laut der ersten Veröffentlichung eines Referenzgenoms im Jahr 2012 .

Wir können also eindeutig keine Schnitte einer einzigen Kopie des Bananengenoms mit dem menschlichen Genom abgleichen und sie 50 % seiner Länge abdecken lassen, weil es nicht einmal genug Basenpaare dafür gibt!

Woher kommt dann diese Behauptung? Der Bioinformatiker Neil Saunders versuchte der Antwort auf die Spur zu kommen und schrieb seine Erkenntnisse in einem Blogbeitrag mit dem Titel 50 % Bananen nieder ; Die älteste Quelle, die er finden kann, ist dieses Interview mit Steve Jones in der Folge „Almost Like A Whale“ der Science Show im ABC-Radio vom 12. Januar 2002), ein volles Jahrzehnt vor der Veröffentlichung des ersten Bananengenoms.

Steve begründet die Behauptung in dem Interview nicht, und es steht im Zusammenhang mit einem Witz darüber, wie genomisch ähnliche Organismen immer noch sehr unterschiedlich sein können:

... wir teilen auch ungefähr 50% unserer DNA mit Bananen und das macht uns nicht zu halben Bananen, weder von der Hüfte aufwärts noch von der Hüfte abwärts. Es gibt also Grenzen, was die Genetik uns darüber sagen kann, was es bedeutet, ein Mensch zu sein ...

Darüber hinaus behaupteten andere Quellen kurz vor diesem Interview, dass wir 50 % unserer Gene mit Bananen teilen. Hier ist eine Quelle für diese Behauptung vom April 2001: https://www.pbs.org/wgbh/nova/genome/deco_lander.html *. Obwohl wir uns nicht sicher sein können, was Steves Grundlage war, können wir daher spekulieren , dass er diese ähnliche Behauptung einfach versehentlich falsch zitiert hat, als er in einem Radiointerview einen Witz machte.

Aber was ist dann mit dieser alternativen Behauptung?


50 % unserer Gene ?

Murphys Antwort legt nahe, dass es vernünftig ist, stattdessen die Behauptung zu verstehen, dass wir „50 % unserer DNA mit Bananen teilen“, um zu bedeuten, dass 50 % der Zehntausenden von Genen des Menschen Homologe in Bananengenen haben. Darüber hinaus sagt die älteste Quelle, die ich für irgendeine Variante der Behauptung „50 % Banane“ ausfindig machen kann – das zuvor verlinkte Interview mit Dr. Eric Lander aus dem Jahr 2001 , in dem der Interviewer , der Wissenschaftsjournalist Robert Krulwich, darauf zu sprechen kommt –, dass wir teilen 50 % unserer Gene, nicht 50 % unserer DNA. Ist diese Variante der Behauptung also wahr?

Soweit ich das beurteilen kann, nein. Zumindest ist es zweifelhaft und ich kann keine Begründung dafür finden.

Wie bereits erwähnt, wurde das Bananengenom erst 2012 sequenziert, doch diese Behauptung geht mindestens auf das Jahr 2001 zurück – und so wurde sie ohne Zugang zu den Daten gemacht, die wir jetzt haben. Und Neil Saunders versuchte in seinem Blogbeitrag „50% Bananen“, mit dem Orthologous Matrix Browser – einem öffentlichen Tool zum Auffinden von Orthologen von Genen – nach Orthologen menschlicher Gene im Bananengenom zu suchen. Er berichtet , dass es mit solchen Orthologen nur etwa 3500 menschliche Gene findet. (Insbesondere 3440 - Ich bekomme eine etwas andere Zahl, vielleicht aufgrund von Änderungen am OMB-Algorithmus.)

Sie können Neils Ergebnis selbst replizieren, indem Sie unter https://omabrowser.org/oma/genomePW/ HUMAN und MUSAM (entsprechend Musa acuminata , dem wissenschaftlichen Namen für Bananen) eingeben und auf „get pairs“ klicken. Das OMB gibt eine TSV von Orthologenpaaren zurück, wobei die ID eines menschlichen Gens links und das entsprechende Bananengen rechts stehen. Wie Neil feststellt, erhalten wir, wenn wir die Anzahl der aufgeführten eindeutigen menschlichen Gen-IDs zählen, die Gesamtzahl der menschlichen Gene, von denen der Algorithmus von OMB glaubt, dass sie mindestens ein Ortholog im Bananengenom haben. Eine solche Zählung wird unten in Python gezeigt:

>>> import requests
>>> result_tsv = requests.get('https://omabrowser.org/cgi-bin/gateway.pl?f=PairwiseOrthologs&p1=HUMAN&p2=MUSAM&p3=OMA').text
>>> unique_human_gene_names = {line.split('\t')[0] for line in result_tsv.splitlines()}
>>> len(unique_human_gene_names)
3484

Er stellt fest, dass dies

Angesichts der Tatsache, dass es etwa zwanzigtausend Gene gibt, die menschliche Proteine ​​codieren, entspricht dies ungefähr „17 % Banane“.

Natürlich verwendet das OMB nur einen Algorithmus, um zu versuchen, Orthologe zu finden, indem es sich Referenzsequenzen ansieht. Es kann einen vertretbaren alternativen Ansatz geben, der zu einem anderen Ergebnis führt. Aber wenn ja, konnte ich es nicht finden; Der einzige Versuch, den ich kenne, um die 50 %-Behauptung im Lichte veröffentlichter Referenzgenome auf Fakten zu überprüfen, stammt von Neil, und zumindest seine Methode stellt eindeutig fest, dass die Behauptung falsch ist.


* Ich habe Professor Lander eine E-Mail geschickt, um zu sehen, ob er sich an die ursprüngliche Quelle erinnert, aus der er die Behauptung gehört hat. Leider tut er das nicht. Er spekulierte, dass es sich eher um Genfamilien als um Gene handeln könnte, auf die sich die Behauptung ursprünglich bezog.

"ein Ergebnis, das Sie trivial bestätigen können" Es ist trivial, Ihren Code auszuführen. Es ist nicht trivial zu bestätigen, dass Ihr Code irgendetwas Sinnvolles tut oder dass die abgerufenen Daten sinnvoll sind.
@Oddthinking Wenn Sie diesem bestimmten Code (oder mir oder der zitierten Quelle) nicht vertrauen, zählen Sie die einzigartigen Gene einfach auf andere Weise. Es zählt lediglich die Anzahl der eindeutigen Elemente in einer Spalte eines TSV. Ich stimme zu, dass die Bestätigung der abgerufenen Daten sinnvoll ist, ist ein schwierigeres Problem.
Das Zählen der eindeutigen Elemente in einer Spalte eines TSV ist trivial (für einen Python-Entwickler). Aber Sie haben nicht gezeigt, dass das Zählen einzigartiger Elemente in dieser Spalte eine sinnvolle Methode zum Zählen von Genen ist, und dies sollte nicht mit einem von Hand geschwenkten "Trivial" abgetan werden.
@Oddthinking Das ist eine vernünftige Kritik. Ich werde die Antwort optimieren, um die Methode besser zu rechtfertigen.
@Oddthinking Ich habe den Beitrag angesichts Ihrer Kritik ein wenig optimiert. Insbesondere habe ich zwei Dinge getan: meine Erklärung des Ansatzes zur orthologen Zählung etwas konkretisiert und die Behauptung etwas abgeschwächt, dass die „50% der Gene“-Variante der Behauptung falsch ist (da alles, was ich wirklich sagen kann, vertretbar ist dass der Algorithmus von OMB, der versucht, Orthologe zu identifizieren, zu einem ganz anderen Ergebnis führt; ich weiß nicht, dass es keine vertretbare Methode gibt, die zu einem anderen Ergebnis führen würde).