In Hofstadters Gödel, Escher, Bach: An Eternal Golden Braid (GEB) erscheint die folgende Behauptung:
...bei der Art Felis catus haben tiefe Untersuchungen ergeben, dass es tatsächlich möglich ist, den Phänotyp direkt vom Genotyp abzulesen. Der Leser wird diese bemerkenswerte Tatsache vielleicht besser verstehen, nachdem er den folgenden typischen Abschnitt der DNA von Felis catus direkt untersucht hat :
...CATCATCATCATCATCATCAT... ( OP-Hinweis: abgeschnitten, weil Sie es verstehen)
Ist das wahr? Eine oberflächliche Suche nach der DNA von Felis catus gibt mir diese Arbeit von Lopez, Cvario und O'Brien aus dem Jahr 1996, und die angegebene Sequenz erscheint nicht – es gibt einige Fälle von "CAT", die jedoch nicht genug wiederholt werden, um sie so bemerkenswert zu machen wie behauptet im GEB.
Ich weiß nicht genug Biologie, um die Richtigkeit dieser Behauptung zu beurteilen. Einige Punkte, die ich in Erwägung ziehe, sind:
Sind Katzen also Rekursionen ohne Basisfälle?
Das Genom von Felis catus wurde seit 1996 ziemlich viel veröffentlicht, kommentiert und aktualisiert, einschließlich Spannen sogenannter intergenischer Regionen, die im Grunde genommen Gerüste und andere Strukturen sind, zusammen mit vielleicht einigen nicht identifizierten Genen, Pseudogenen, regulatorischen Sequenzen usw. Grundsätzlich , so ziemlich die gesamte DNA-Sequenz ist jetzt verfügbar, nicht nur die Gensequenz des mitochondrialen Genoms, die in dem von Ihnen erwähnten Artikel von 1996 veröffentlicht wurde. Mitochondrien sind die Kraftwerke der Zelle, aber nur ein Organell , das zufällig seine eigene DNA enthält; sie sind vom Chromosom getrenntDNA im Zellkern. All dies ist kostenlos erhältlich (wenn Sie wissen, wo Sie suchen müssen) im National Center for Biotechnology Information (NCBI), Teil der National Library of Medicine (NLM) an den National Institutes of Health (NIH) in den Vereinigten Staaten. Andere Websites sind ebenfalls verfügbar, wie z. B. Ensembl , ein Gemeinschaftsprojekt des European Bioinformatics Institute (EMBL-EBI), Teil des European Molecular Biology Laboratory (EMBL), und des Wellcome Trust Sanger Institute (WTSI). Beide Institute befinden sich auf dem Wellcome Trust Genome Campus in Großbritannien.
Also zum Genom. Genomsequenzen können auf verschiedene Arten durchsucht werden, je nachdem, wonach Sie suchen, aber die gebräuchlichste Methode ist die Verwendung von BLAST, dem Basic Local Alignment and Search Tool. Wie der Name schon sagt, nimmt es Sequenzen als Eingabe und sucht nacheinander, wobei die Ergebnisse mithilfe bestimmter Algorithmen, die der Benutzer definieren und optimieren kann, so gut wie möglich ausgerichtet werden. Die BLAST-Webschnittstelle zum Katzengenom ist hier . Sie müssen sich hier um keine der anderen Optionen kümmern, außer um das Feld "Abfragesequenz eingeben". Das FASTA-Format verwendet nur die Ein-Buchstaben-Abkürzungen für Nukleotide (AGCT), die alle aneinandergereiht sind.
Das Genom, das wir suchen, stammt von einer Abessinierkatze namens Cinnamon:
Cinnamon, die Katze, die als endgültiges genetisches Modell für alle Katzen im Feline-Genom-Projekt ausgewählt wurde. Bild mit freundlicher Genehmigung des College of Veterinary Medicine an der University of Missouri .
Zunächst habe ich eingegeben CATCATCATCAT
und zu meiner Überraschung über 200 Treffer zurückerhalten, die jedes Chromosom der Katze abdeckten. Also habe ich die Länge der Eingabe auf 8 CAT
s verdoppelt und die gleiche Ergebnismenge zurückerhalten. Leider waren 12 CAT
s zu viel (und es ist wirklich zu viel), also habe ich rückwärts gearbeitet.
Die endgültigen Ergebnisse sind hier (Entschuldigung, Link läuft am 13.10.16 ab. Um neu zu generieren, gehen Sie zum BLAST-Link oben und geben Sie ein CATCATCATCATCATCATCATCATCATCAT
). Anscheinend ist die Volksweisheit falsch, und die Chromosomen von Felis catus enthalten wirklich jeweils 10 CAT
s, eine mehr, als für ihre 9 Leben benötigt wird. Warum das so ist, ist noch nicht bekannt, aber Wissenschaftler arbeiten vermutlich daran.
Während Matts Antwort vollkommen richtig ist, ist es wichtig zu beachten, dass die Reihenfolge in DNA ist nicht auf Katzen beschränkt, und Sie würden erwarten, dass Sie es überall finden.
Zum Beispiel führt das Durchsuchen des menschlichen Genoms nach der gleichen 3-Tandem-Wiederholungssequenz CAT
ebenfalls zu vielen Treffern.
Dies liegt daran, dass Sie im Wesentlichen nach kurzen Tandem-Wiederholungen auf dem DNA-Strang suchen . Diese Wiederholungen können in jedem Organismus vorkommen, und daher CAT
mag es zwar amüsant sein, Teilstrings in der DNA der Katze zu finden, aber sie sind nichts Besonderes für Katzen (oder irgendein anderes Tier) und sind nur das Ergebnis eines Artefakts der zufälligen Benennung der Basen passend zum Namen des Tieres.
Um die anderen Antworten zu ergänzen, berechnen wir die Wahrscheinlichkeit, dass CATCATCATCAT in einer zufälligen DNA-Sequenz auftritt.
Die Länge der Katzen-DNA beträgt 2,7 Gigabasen ( Quelle ), und es gibt 4 mögliche Basen. Für 1 CAT gibt es 3 Basen, was die erwartete Anzahl von Vorkommen in 2,7 Gb als ergibt
Die Wiederholung der Rechnung für längere Sequenzen ergibt:
Es gibt also in der Tat viel mehr CATs in Katzen, als rein zufällig zu erwarten wäre.
Es gibt hier also bereits ein paar großartige Antworten, aber es scheint, dass niemand einen interessanten Teil Ihrer Frage angesprochen hat: GEB wurde 1978 veröffentlicht und das Genom von Felis catus wurde erst viele Jahre später sequenziert ... also woher wusste er das?
Die Antwort von jpa zeigt, dass Sie erwarten würden, nur etwa fünf CATs zu bekommen - nicht zehn, und die Chance, zehn zu bekommen, ist astronomisch gering. Ich habe seine Tabelle erweitert, um die deprimierend geringe Chance zu zeigen, durch vollkommenen Zufall zehn zu bekommen:
5 CAT: 2.5 expected per Felis catus genome
6 CAT: 0.04 expected
7 CAT: 0.00061
8 CAT: 9.54 e-6
9 CAT: 1.49 e-7
10 CAT: 2.32 e-9
Das heißt, Sie würden erwarten, 10 CATs etwa 0,00000000232 Mal pro zufälligem Genom zu finden. Wie um alles in der Welt hat das Felis-catus-Genom schließlich zehn KATZEN darin enthalten? Und woher wusste Hofstadter, dass es so viele CATs geben würde?
Wie sich herausstellt, wird diese wiederholte Sequenz von wenigen Basenpaaren als "Short Tandem Repeat" oder "Mikrosatellit" bezeichnet. Dies ist der Fall, wenn eine 2–5 Basenpaarsequenz mehrmals wiederholt wird, normalerweise zwischen 5 und 50 Mal.
Um es noch einmal zusammenzufassen: Wir wissen, dass die Chance, diese 10-CAT-Sequenz zu erhalten, etwas wahrscheinlicher ist, aber da wir nur auf das Felix-catus-Genom beschränkt sind, ist uns definitiv keine 10xCAT-Sequenz garantiert. Wie also hat Hofstadter es so dargestellt, als ob es eine Tatsache wäre?
Wie sich herausstellt, besteht eine entscheidende Eigenschaft von STRs oder kurzen Tandem-Wiederholungen darin, dass Mutationen in diesen Bereichen weitaus häufiger vorkommen und einen großen Teil der genetischen Variation zwischen einzelnen Mitgliedern einer Art ausmachen. Diese Entdeckung wurde mit dem Aufkommen der DNA-Sequenzierung gemacht, die nur wenige Jahre vor der Veröffentlichung des Buches begann. Angesichts einer großen Population nicht identischer Katzen (die wir haben) können wir daher zuversichtlich sagen, dass die Wahrscheinlichkeit für eine 10xCAT-Sequenz extrem hoch ist.
Hofstadters Genie kombinierte auf perfekte Weise Mathematik (nur 2.32e-9 erwartete Sequenzen pro Genom) mit Biologie (Mikrosatelliten erhöhen die Chance, diese Sequenz zu finden) mit forensischer Genetik (in einer Population derselben Spezies weisen Individuen wahrscheinlich viele STR-bezogene Unterschiede auf .) All dies zusammen gab Hofstadter das, was er selbstbewusst sagen musste: ja, CATCATCATCATCATCATCATCATCATCAT existiert mit ziemlicher Sicherheit in der DNA von Felis catus. Solche Kleinigkeiten sind der Grund, warum Gödel, Escher, Bach mein Lieblingsbuch aller Zeiten ist.
Gescheiterter Wissenschaftler
Benutzer26965
Djechlin
Benutzer137
David
David
lästig
Rodrigo de Azevedo
David
David
Benutzer237650
David