Vorhersage der DNA-Nukleotidbasensequenz aus vollständig gebildetem Protein

Ich weiß, dass es viele Algorithmen (und viele verschiedene Implementierungen) gibt, die es ermöglichen, das Ergebnis der Proteinsynthese vorherzusagen, wenn eine Reihe von Nukleotidbasen in der DNA vorhanden sind. Mit anderen Worten, wenn eine Sequenz solcher Basen gegeben ist, ein endgültiges Protein produzieren (durch eine Simulation der verschiedenen Prozesse gehen, die in einem Protein enden). Gibt es jedoch Algorithmen, die es erlauben, das Gegenteil vorherzusagen, dh die Sequenz der Nukleotidbasen, die die Grundlage für die Synthese in ein bestimmtes Protein waren?

Antworten (2)

Es ist im Prinzip trivial, aber denken Sie daran, dass es mehrere Codons gibt, die eine einzelne Aminosäure produzieren können. Wenn Sie also ein Protein rückwärts übersetzen, erhalten Sie entweder die am häufigsten verwendeten Codons für das Protein oder eine große Anzahl möglicher Sequenzen .

Hier und hier sind Online-Programme, die einen einzigen Konsens geben, und hier ist eines, das Mehrdeutigkeiten berücksichtigt.

Dies ist eine Standardmethode, die in der Bioinformatik verwendet wird.

Der erste Schritt besteht darin, die Aminosäuresequenz unter Verwendung der relevanten Codon-Tabelle in eine degenerierte Nukleotidsequenz umzuwandeln.

Sobald Sie die degenerierte Nukleotidsequenz haben, können Sie sie gegen alle bekannten Nukleotidsequenzen, einschließlich ganzer Genome, sprengen.

Da die degenerierte Nukleotidsequenz im Wesentlichen eine degenerierte cDNA-Sequenz ist, können Sie dann einfach alle Gene mit Exons identifizieren, die in der Lage sind, die erforderliche cDNA durch Splicing-Ereignisse zu produzieren.

Diese Methode heißt tblastn und ist hier verfügbar: https://blast.ncbi.nlm.nih.gov/Blast.cgi