wo die relative Häufigkeitsverteilung synonymer Codons zu finden ist

Die meisten Aminosäuren können von mehr als einem Codon kodiert werden. Kann beispielsweise Serinedurch eines von codiert werden {UCU, UCC, UCA, UCG, AGU, AGC}.

Meine Frage besteht aus zwei Teilen:

1) Was sind die relativen Häufigkeiten dieser Codons? Diese Frage kann äquivalent probabilistisch formuliert werden: Wie groß ist die Wahrscheinlichkeit, dass eine bestimmte Aminosäure von einem bestimmten Codon codiert wurde?

2) Ist diese Wahrscheinlichkeit vom Kontext (den benachbarten Codons/Aminosäuren) abhängig?

Antworten (2)

Das Phänomen der Verwendung verschiedener Codons mit unterschiedlichen Wahrscheinlichkeiten wird Codon Usage Bias genannt . Wie die verschiedenen Codons verwendet werden, ist manchmal ziemlich unterschiedlich zwischen den Arten und erfordert einige Sorgfalt. Dies gilt insbesondere, wenn Sie Sequenzen in Bakterien überexprimieren möchten, um Protein zu produzieren, das möglicherweise eine Codon-Optimierung erfordert, um eine optimale Codon-Nutzung sicherzustellen (ansonsten können seltene tRNAs den Translationsprozess verlangsamen). Es gibt eine Datenbank (basierend auf der NCBI Genbank), die Ihnen die Codon-Wahrscheinlichkeiten für verschiedene Arten gibt:

Außerdem könnten diese Artikel interessant sein:

In Bezug auf Ihre zweite Frage glaube ich nicht (und ich habe auch keine Beweise gefunden), dass die Codon-Nutzung von den Nachbarn abhängt.

Die Codon-Usage-Bias sind artabhängig, daher müssen Sie sie möglicherweise für das Genom oder den Satz von Genen messen, an dem Sie interessiert sind.

Diese Verzerrung korreliert zumindest in einigen Fällen mit der Genomzusammensetzung in Bezug auf A, T, G und C (siehe Abbildung 3 dieser Arbeit über Cyanobakterien ). In gewisser Weise hängt es also tatsächlich vom Kontext ab, ob Sie die Nukleotidzusammensetzung in das einbeziehen, was Sie "Kontext" nennen.