Warum gibt es in der DNA genau vier Nukleobasen?

Weiß jemand, warum DNA aus vier Nukleobasen besteht? Gibt es insbesondere eine Erklärung für die Zahl? Warum vier und nicht zwei oder acht?

Dies gerade in - zwei neue Basen, die E. coli (X und Y) hinzugefügt wurden, reproduzieren sich. wired.com/2014/05/synthetic-dna-cells nicht klar, wie viel Anpassung erforderlich ist, damit X und Y für die Codierung von Genen funktionieren.

Antworten (7)

Eine jetzt gelöschte Antwort führte dies auf ein Argument zurück, das auf der Aminosäurecodierung in Codons basiert, aber wie Konrad Rudolph in einem Kommentar betonte, können Argumente, die auf Codons basieren, nicht korrekt sein, da das 4-Basen-System wahrscheinlich vor der Evolution von liegt Proteinübersetzung.

Warum also vier?

Ich schlage vor, dass es auf eine Kombination von Faktoren zurückzuführen ist, die es zu einer „genau richtigen“ Passform für RNA-basierte Replikatoren machen: mehr wäre schlecht, und weniger wäre auch schlecht. Die vier Basen können mit hoher Zuverlässigkeit kopieren, da zwei Merkmale kombiniert werden, um Fehlpaarungen auszuschließen: Es gibt zwei Größenklassen – was bedeutet, dass jede Purin-Purin- oder Pyrimidin-Pyrimidin-Paarung zu einer falschen Trennung zwischen den Strängen führt, mit Ausnahme von AG- und CU-Bindungen; und es gibt zwei Klassen basierend auf der Anzahl von OH-Bindungen – was das Potenzial für AC- und GU-Bindungen einschränkt. Mehr Basen müssen zwangsläufig die Stärke dieser ausschließenden Ansätze schwächen und die Zahl der Fehlpaarungen erhöhen. Replikatoren der RNA-Welt werden die ausgeklügelten Reparatur- und Fehlerprüfmechanismen moderner Lebensformen gefehlt haben, so dass diese Zunahme von Fehlpaarungen wahrscheinlich nicht korrigiert werden würde.

Natürlich wäre ein System mit zwei Basen noch besser in der Lage, Fehler zu reduzieren. Ich schlage vor, dass der Vorteil des Vier-Basen-Systems darin besteht, dass es die Bildung einer viel komplexeren dreidimensionalen Struktur in RNA ermöglicht und somit ein breiteres Spektrum an katalytischen Fähigkeiten ermöglicht. Ich habe nur gerade Zahlen betrachtet, weil nur geradzahlige Systeme den Watson-Crick-Stil der Basenpaarung verwenden konnten.

Ich würde auch vorschlagen, die Arbeit von Eörs Szathmáry aus dem Jahr 2003 zu genau dieser Frage zu lesen.

Nachtrag

Eine Gruppe in Kalifornien hat gerade eine Arbeit veröffentlicht, in der sie erfolgreich ein drittes Basenpaar stabil in die DNA eingefügt haben. Ich denke, dies könnte etwas Licht ins Dunkel bringen, warum vier – Sie können hier darüber lesen oder das vollständige Papier hier herunterladen (Nature, so pay walled).

Hier ist eine mögliche Antwort, die dieses Papier gibt:

http://www.ncbi.nlm.nih.gov/pubmed/16794952
oder http://www.math.unl.edu/~bdeng1/Papers/DengDNAreplication.pdf

Es gibt eine darwinistische Erklärung für die Frage. Es nähert sich dem Problem aus der Kommunikationstheorie von Claude Shannon. Es behandelt die DNA-Replikation konzeptionell und mathematisch genauso wie eine Datenübertragung. Es kommt zu dem Schluss, dass das System aus vier Basen, nicht zwei, nicht sechs, die meisten genetischen Informationen in kürzester Zeit repliziert.

Die kommunikative Analogie geht so. Wenn Sie zwei Datenübertragungssysteme haben, kann das eine beispielsweise 1 MB pro Sekunde und das andere 2 MB pro Sekunde übertragen, kostet aber weniger als das Doppelte. Die Antwort ist offensichtlich, dass Sie den zweiten Service für einen höheren Preis pro Kosten kaufen werden. Als Datendienst ist es egal, welche Informationen Sie konsumieren – das können Spam, Video, Audio usw. sein. Wichtig ist nur die Übertragungsrate. Die DNA-Replikation ist wie ein Datenübertragungskanal, wenn eine Base eine Zeit lang entlang der Mutter-DNA-Vorlage repliziert wird. Es spielt auch keine Rolle, ob der Prozess für ein Bakteriengenom, ein Pflanzen- oder ein Tiergenom gilt. Die Auszahlung liegt in der Information und die Kosten in der Zeit. Im Gegensatz zu Ihren abiotischen Kommunikationsvarianten ist die Zeit sowohl der Sender als auch der Empfänger aller Botschaften des Lebens, und verschiedene Lebensformen oder Arten sind lediglich die Handys der Zeit. Wenn also ein System mehr Informationen in einer Zeiteinheit replizieren kann als ein anderes, wird das schnellere das evolutionäre Wettrüsten gewinnen. Eine Beute, die auf einem langsamen Replikatorsystem operiert, wird nicht in der Lage sein, mit einem Raubtier zu konkurrieren oder sich an ein schnelles Replikatorsystem anzupassen.

Da nun das AT-Paar nur zwei schwache Wasserstoffbrücken hat, das CG-Paar aber drei, brauchen A und T eine kürzere Zeit, um die Duplizierung abzuschließen, als C und G. Obwohl die Replikationszeit in Bruchteilen von Nanosekunden kurz ist, summiert sich die Zeit schnell für Genome mit Basenpaaren in Milliardenhöhe. Das CG-Paar kann also die Replikation verlangsamen, aber der Gewinn liegt in der Information. Ein Basenpaar gibt Ihnen 1 Bit pro Basisinformation. Zwei Paare geben Ihnen 2 Bits pro Basisinformation. Das Vorhandensein von mehr Basenpaaren kann jedoch letztendlich zu einer verringerten Rendite der Informationsreplikationsrate führen, wenn die Replikation der neuen Basen zu lange dauert. Daher die Betrachtung der optimalen Replikationsrate, gemessen in Informationsbits pro Basis pro Zeit. Ohne Informationen gäbe es keine Vielfalt, keine Komplexität.

Mit einer einfachen Berechnung der Übertragungs-/Replikationsrate von Shannon können Sie die mittlere Rate für das AT-System, das CG-System, das ATCG-System und für einige hypothetische 6-Basen-, 2n-Basen-Systeme berechnen, deren neue Basen zunehmend länger dauern Zeit zu replizieren. Die Analyse zeigt, dass das ATCG-System die optimale Replikationsrate hat, wenn die CG-Basen 1,65- bis 3-mal länger brauchen, um sich zu replizieren, als die AT-Basen. Das heißt, ein Basis-2-System repliziert seine Basen schneller, trägt aber nicht mehr Informationen, um eine höhere Bitrate zu haben. Ebenso hat ein Basis-6-System eine größere Information pro Basis, repliziert aber im Durchschnitt langsamer, um mit einer suboptimalen Bitrate zu enden.

DNA-Replikationsrate

Laut einem Vergleich aus dem Artikel ist das Base-4-System etwa 40 % schneller als das reine A–T-System und 133 % schneller als das reine G–C-System. Angenommen, das Leben auf der Erde begann vor etwa 4 Milliarden Jahren, dann würde das reine AT-System die Evolution um 1 Milliarde Jahre zurücksetzen, das GC-System würde dies um 2,3 Milliarden Jahre tun. Für ein hypothetisches Basis-6-System würde dies in 80 Millionen Jahren der Fall sein. Mit anderen Worten, das Leben ist da, wo es sein sollte, weil das Base-4-System in der Lage ist, Informationen mit der optimalen Bitrate durch den Zeitengpass zu übertragen.

Zusammenfassend lässt sich sagen, dass das Leben die meisten Informationen in kürzester Zeit replizieren soll, und das Base-4-System macht das am besten. Wenn es jemals andere Systeme gegeben hätte, hätten sie die Informatikkonkurrenz von Anfang an gegen das Basis-4-System verloren. Darwins Prinzip funktioniert auf der grundlegendsten und wichtigsten Ebene des Lebens.

Es gibt andere Erklärungen, alle nicht darwinistisch. Die meisten basieren auf den molekularen Strukturen der Basis. Aber diese Art der Erklärung grenzt an einen Zirkelschluss – Beobachtungen zu verwenden, um sich selbst zu erklären. Sie stehen auch vor diesem Catch-22-Problem, da es keine Möglichkeit gibt, alle möglichen Basen für die Replikation auszuschöpfen. Dennoch sind solche Erkundungslinien fruchtbar, denn je mehr Wissen, desto besser. Aber ohne die Berücksichtigung von Informationen und deren Replikation ist eine vernünftige Antwort auf die Frage schwer vorstellbar.

Willkommen bei Biologie SE. Es wäre großartig, wenn Sie Ihre Antwort um eine Zusammenfassung der wichtigsten Punkte erweitern könnten. Wir können uns nicht darauf verlassen, dass der Link für immer da ist.
Sie können Ihre Antwort bearbeiten. (Siehe den Link unter deinem Beitrag.)
Coole Erklärung.
"und für einige hypothetische 6-Basen-2n-Basen-Systeme, deren neue Basen zunehmend länger zum Replizieren benötigen." - Diese Annahme scheint schwer zu rechtfertigen.

Diese Frage hat auch eine chemische Dimension.

Wenn Sie sich die Watson-Crick-Basispaare ansehen, können Sie sehen, dass es nicht viel Spielraum gibt:

Watson-Crick-Basenpaare

Die Nukleotidbasen haben 2 oder 3 Wasserstoffbrückenbindungen. Es ist wahrscheinlich sterisch nicht sinnvoll, 4 zu haben.

Das bedeutet, dass es nur eine begrenzte Anzahl von Möglichkeiten gibt, wie die Basenkombinationen komplementär und auch spezifisch sein können, da sie die Doppelhelix bilden. Da A->T- und T->A-Wasserstoffbindungsmuster beide Donor-Rezeptor-Kombinationen einnehmen, gibt es eine mögliche 2-H-Bindungspaarung.

Ich denke, es gibt zwei Möglichkeiten, die drei Wasserstoffbrückenbasen zu konfigurieren, also sind vielleicht sechs möglich, aber ich vermute, wenn Sie das Basenpaarungsrepetoire erweitern, könnte man anfangen, die Spezifität zu verlieren. Wenn Sie mit Nukleotiden genug spielen, können Sie Nicht-Watson-Crick-Basenpaare bilden und wahrscheinlich etwas von dem Vertrauen verlieren, dass Sie genaue 1: 1-Übereinstimmungen zwischen komplementären Basenpaarungen haben. Es konnte bereits gezeigt werden, dass Wobble-Basenpaare in RNA und Hoogsteen -Basenpaarungen Tripelhelices und nicht-perfekt passende RNA-Helices ermöglichen.

Nicht-WC-Basenpaarungen

Das 4-Basen-DNA-System mit AT-Bindungen und CG-Bindungen ist dasjenige, das sich entwickelt hat, um von den meisten Lebewesen auf der Erde verwendet zu werden, wie in anderen Antworten erwähnt, da es eine Triplett-Tabelle von Basen für alle verwendeten Aminosäuren codieren kann, was einige zulässt Aminosäuren mit mehr als einem Triplett-Code. Es gibt jedoch geringfügige Variationen des Systems: Obwohl sich die AT- und CG-Bindungen nicht ändern, können die Nukleotide modifiziert werden, um Bereiche des Genoms in dem zu markieren, was Teil des epigenetischen Codes ist. Die häufigste Modifikation ist das Hinzufügen von Methyl- und 5-Hydroxymethylmolekülen zu den Basen, obwohl noch weitere Modifikationen entdeckt werden.

Theoretisch sind aus Pyrimidinen und Purinen zusammen 6 Basenpaare = 12 Basen möglich...

WENN sich die Nukleobasen nur aus Pyrimidinen und NICHT aus Purinen entwickeln, DANN sind es nur 2 Basenpaare = 4 Pyrimidinbasen möglich !!! ...4 Purine und 12 Purine+Pyrimidine

Haftungsausschluss: Ich bin kein Biologe oder Chemiker oder Informationstheoretiker. Ich möchte nur eine Perspektive herauswerfen, die ich aus den verschiedenen Antworten hier irgendwie zusammengesetzt habe, die ich aber in keiner Antwort wirklich zum Ausdruck bringe.

Ich denke nämlich, dass es leicht vorstellbar ist, dass 4 Basenpaare das Ergebnis eines Kompromisses zwischen vielen Basenpaaren und wenigen Basenpaaren sind. Das heißt, es ist im Wesentlichen das Ergebnis eines Optimierungsproblems. Es gibt einige Vorteile, mehr Basenpaare zu haben, und einige Vorteile, weniger Basenpaare zu haben, und 4 ist einfach der beste Kompromiss zwischen ihnen. Wie bei jedem Optimierungsproblem ist das Ergebnis wahrscheinlich sehr empfindlich dafür, wie wir die Frage genau formulieren – in welcher Umgebung sich das 4-Basenpaar-System genau entwickelt hat, welche Rolle RNA zu diesem Zeitpunkt im Leben spielte, genau wie wir die Vorteile quantifizieren und Nachteile verschiedener Basenpaarsysteme usw. Und vielleicht hat sich das 4-Basenpaar-System ursprünglich in einer Umgebung entwickelt,

Wahrscheinlich sind viele dieser Modellierungsfragen derzeit unsicher genug, dass es unmöglich ist, "das Optimierungsproblem sicher auszuführen" und der Ausgabe zu vertrauen. Aber wahrscheinlich wäre der erste Schritt, so viele konkurrierende Faktoren wie möglich aufzuzählen. Lassen Sie mich das mit Hilfe der vorherigen Antworten hier versuchen:

Gründe, weniger Basenpaare zu bevorzugen

  • Weniger Basenpaare bedeuten weniger mögliche "Fehlpaarungs"-Wege, was möglicherweise die Mutationsrate verringert

  • Weniger Basenpaare bedeuten auch, dass nur die "besten Paare" verwendet werden müssen, was wiederum möglicherweise die Mutationsrate verringert.

  • Weniger Basenpaare vereinfachen den Prozess des Erwerbs oder der Synthese der Basenpaare überhaupt.

  • Kann die Transkriptionsgeschwindigkeit beeinträchtigen.

Gründe, mehr Basenpaare zu bevorzugen

  • Mehr Informationen pro Massen-/Volumeneinheit gespeichert.

  • Erhöht potenziell die Bandbreite an Strukturen, die direkt aus dem genetischen Material aufgebaut werden können.

  • Kann die Transkriptionsgeschwindigkeit beeinträchtigen.

Ich bin mir sicher, dass es noch viele andere Faktoren zu berücksichtigen gilt.

Es ist mir unklar, ob etwas Quantitatives über diese gegensätzlichen Kräfte mit genügend Zuversicht gesagt werden kann, um wirklich "die Optimierung durchzuführen" und der Antwort zu vertrauen.

Und natürlich gibt es vermutlich noch viel mehr über den Raum zu sagen, über den wir optimieren – genau welche „Basenpaare“ überhaupt denkbar wären, wie andere qualifiziertere Leute bereits angesprochen haben.

Denn vier ist die minimal mögliche Anzahl. Wenn es keinen Druck gibt, ein System komplexer zu machen, wird es sich nie zusammensetzen.

Man könnte dann argumentieren, dass ein ähnliches System nur mit zwei Basen hätte gebaut werden können.

Bußgeld.

Versuch es.

Du wirst kläglich scheitern. Sicher, Sie können einen DNA-Strang herstellen, der nur Adenin und Thymin enthält. Aber wer würde dann verhindern, dass sich Guanin und Cytosin bilden und sich mit etwas Desoxyribose verbinden? Wie würden Sie dann die Speicherung, Aufbewahrung und Übertragung von Informationen verwalten?

Basenpaarung – egal wie komplex sie aussehen mag – ist der einfachste Weg, Informationen sicher auf molekularer Ebene zu speichern, damit sie an anderer Stelle übertragen und übersetzt werden können. Die räumlichen Kombinationen von Wasserstoffbrückenbindungen, die zwischen Pyrimidin- und Purinderivaten hergestellt werden können, sind nur zwei.

Für Replikationszwecke benötigen Sie einen weiteren Symmetriebruch, wodurch Sie zwei Basen haben, eine auf jedem Strang einer DNA-Doppelhelix.

Zwei mal zwei ist vier.

PS: Übrigens, wer in aller Welt hat Ihnen gesagt, dass es in der DNA genau vier Nukleobasen gibt? Sag ihnen, dass sie wahrscheinlich Methylcytosin vergessen haben! Der Begriff „Methylierung“ ist nur ein Vorwand, um nicht zugeben zu müssen, dass DNA fünf statt vier Basen verwendet. Öffnen Sie Ihren Geist.