DNA besteht aus 4 einzigartigen Nukleotiden. Bei der Codierung eines Proteins wird eine Sequenz von 3 Nukleotiden verwendet, um für jede Aminosäure zu codieren. Warum sind Codons 3 Nukleotide lang?
Eine verwandte Frage findet sich hier: warum-gibt-es-genau-vier-Nukleobasen-in-der-DNA
DNA ist eine Referenz für Proteine*, die die funktionellen Moleküle in Zellen sind. Diese bestehen aus 20 einzigartigen Aminosäuren, und jede wird durch einen DNA-Abschnitt kodiert, der als Codon bekannt ist. Codons sind immer 3 Basenpaare (Nukleotide) lang.
DNA besteht aus 4 einzigartigen Nukleotiden; ( A )Denin, ( G )Uanin, ( C )Ytosin und ( T )Hymin. Das bedeutet, dass es 64 einzigartige Codons gibt, die mit diesen 4 Basen (4*4*4) hergestellt werden können.
Wenn Codons nur 2 Basen lang wären, wäre die Vielfalt der Codons, die erzeugt werden könnten, geringer (nur 16 einzigartige Sequenzen, wenn immer noch 4 Nukleotide vorhanden sind). Es wären mehr einzigartige Nukleotide erforderlich, um genügend einzigartige Sequenzen zu erhalten, um die 20 Aminosäuren (sowie die STOP-Codons) zu codieren. Um beispielsweise 64 einzigartige Sequenzen unter Verwendung eines 2-Basen-pro-Codon-Systems zu erhalten, müssten 8 einzigartige Nukleotide vorhanden sein.
Wir können nie wissen, was in evolutionärer Hinsicht passiert ist, aber es scheint wahrscheinlich, dass das 3-Basen (Nukleotid)-Codon-System nach einer Periode eines 2-Basen-Systems entstanden wäre, als die biologischen Systeme komplexer wurden. Dies hätte viel mehr Variation bei den verwendeten Aminosäuren und damit mehr "Evolutionsfähigkeit" ermöglicht, was für frühe Organismen sehr vorteilhaft gewesen wäre.
Da jedoch das 4-eindeutige-Nukleotid/3-Codon-System für alles Leben, das wir auf der Erde entdeckt haben, allgegenwärtig ist, scheint es wahrscheinlich, dass dies zu Beginn der DNA (eigentlich wahrscheinlich RNA) das System war, das funktionierte, oder Zumindest ist dies dasjenige, das überlebt hat (obwohl wir, wie Kevin zu Recht betont, nicht wissen, ob es jemals andere Systeme gegeben hat). Im Laufe der Jahre mögen Variationen entstanden sein, aber es ist dieses 1 System, das sich hier auf der Erde durchgesetzt hat.
Weitere interessante Informationen finden Sie in dieser Frage: Warum-20-Aminosäuren-statt-64?
Diese Theorie schließt sich nicht gegenseitig mit der oben beschriebenen aus. In einer kürzlich erschienenen Veröffentlichung stellen D'Onofrio und Abel [ 1 ] fest, dass Ribosomen an unterschiedlichen Codons unterschiedlich lang pausieren (selbst wenn das Codon für dieselbe Aminosäure kodiert), und dass diese Pause die dreidimensionale Struktur des Endprodukts beeinflusst Protein.
Daher enthält die Nukleotidsequenz mindestens zwei "Schichten" von Informationen: Erstens, welche Aminosäure hinzugefügt werden sollte, und zweitens, das spezifische Codon, das für diese Aminosäure verwendet wird, kann sich auf die endgültige Struktur des Proteins auswirken. Dies könnte nicht mit weniger Nukleotiden erreicht werden, aber mit mehr Nukleotiden könnte wohl noch mehr Kontrolle ausgeübt werden, aber vielleicht kommt dies zu meinem ersten Punkt zurück, dass sich dieses System vor so langer Zeit entwickelt hat, dass mehr Nukleotide nicht notwendig waren, damit das Leben "funktioniert". " und vermehren sich in allem, was wir heute sehen.
*nur etwa 1 % unseres Genoms ist tatsächlich proteinkodierend, und viele nicht-proteinkodierende RNA-Produkte haben sehr wichtige Funktionen, aber darauf gehe ich hier nicht ein. Es genügt zu sagen, dass ich mich auf die proteinkodierenden Regionen der DNA beziehe.
central dogma of molecular biology
aber es ist so ein schlechter Name. Dogma hat keinen Platz in der Wissenschaft. Außerdem wissen wir jetzt, dass Retrotranskription existiert und daher das zentrale Dogma der Molekularbiologie nicht immer zutrifft.Ich denke, es kann ein starkes Argument für drei nt-Codons angeführt werden, die bereits im ursprünglichen genetischen Code vorhanden waren, der nur acht abiotische Aminosäuren enthielt (dies ist heute noch deutlich in Übersetzungstabellen zu sehen, in denen die meisten abiotischen Aminosäuren durch vier oder mehr Codons definiert sind). . In diesem ursprünglichen genetischen Code war die letzte nt jedoch wahrscheinlich bedeutungslos (diese wurde in vielen mitochondrialen Genomen neu erfunden, wo eine einzelne tRNA, normalerweise dank eines modifizierten U in der Anticodon-Wobble-Position, bis zu 4 Codons erkennt). Unter der Annahme, dass der primordiale genetische Code mit drei nt-Codons existierte, sehen wir, dass der Grund für die 3-nt-Codonstruktur nicht darin bestand, dass die 2-nt-Codonstruktur nicht ausreichte, um alles zu codieren (4^2 > 9, es hätte ausgereicht), sondern etwas anderes . Was könnte es also sein? Meine fundierte Vermutung ist, dass es mit dem A, P zu tun hat, E-Site-Struktur des Ribosoms, die nicht in eine kleinere molekulare Konfiguration passt (dh Sie könnten die benachbarten A, P, E-Sites nicht innerhalb des Raums haben, der durch nur fünf Phosphodiesterbindungen (sechs nt, drei zwei nt-Codons) begrenzt ist) vs. acht Phosphodiesterbindungen (neun nt, drei drei nt Codons)). Kurz gesagt, meine Ansicht ist, dass die primordiale ribosomale Struktur der Schlüsselfaktor für die Drei-nt-Codonstruktur des genetischen Codes war, mit weniger hätte es nicht funktionieren können, und alles andere wäre Verschwendung gewesen.
Darf ich vorschlagen, dass Sie direkt zur Quelle gehen? Hier ist ein Link zu einem 1957 von Francis Crick (et al.) veröffentlichten Artikel mit dem Titel: 'Codes Without Commas' http://www.ncbi.nlm.nih.gov/pmc/articles/PMC528468/
Aus dem gleichen Grund gibt es 8 Bits in einem regulären Zeichendatentyp in Programmiersprachen der alten Schule (vor Internationalisierung und Unicode).
Bei modernen ASCII-Interpretationen muss eine bestimmte Anzahl von Zeichen codiert werden, irgendwo zwischen 128 und 256. 8 Bit wären das Minimum, das für die (moderne erweiterte) ASCII-Codierung ausreicht. (Unabhängig von der Frage: Beim Rechnen ist es oft hilfreich, wenn die Anzahl der Bits in verschiedenen Operationen eine Potenz von 2 ist. Außerdem spezifizierten die ursprünglichen Versionen von ASCII eine 7-Bit-Codierung, bevor sie früh auf ein volles Byte erweitert wurde Bemühungen zur Unterstützung der Internationalisierung.)
Zurück zu den Nukleotiden, es gibt 20 Aminosäuren. Stellen Sie sich ein Codon als Äquivalent zu einem „Byte“ und eine Base (Nukleotid) als Äquivalent zu einem „Bit“ vor. 2-Codon-Sets wären unzureichend, es sei denn, Sie planen, eine Lebensform mit kompaktem Genom nach Maß zu bauen, die nur 15 Aminosäuren, ein Stoppcodon und keine Wobbles unterstützt.
Um alle Aminosäuren plus ein Stoppcodon zu unterstützen, sind mindestens 21 unterschiedliche Codonwerte erforderlich. Finden Sie insbesondere die kleinste Potenz von 4 >= 21, die sich als 3 herausstellt.
Ein zusätzlicher Bonus: Die Anzahl der Codonwerte ist ungefähr dreimal so hoch wie die Anzahl der Aminosäuren (plus ein Stoppcodon), was Redundanz ermöglicht: Einige Aminosäuren werden von mehr als einem Codon codiert, das als Puffer gegen Mutationen fungiert.
Lukas
Benutzer6641