Jede DNA (RNA)-Sequenz hat 6 mögliche offene Leserahmen (ORF). Meine Frage ist: Was sind die theoretischen Grundlagen von In-vitro- oder In-Silico- Versuchen, den richtigen Leserahmen einer Sequenz zu finden?
Ist es nur der Abstand zwischen Start- und Stop-Codons oder gibt es andere Faktoren mit wichtigeren Auswirkungen auf dieses Thema?
TransDecoder ist ein häufig verwendetes Programm zum Extrahieren wahrscheinlich codierender Regionen aus Transkriptom-Assemblierungen, das Folgendes tut, um einen Anruf zu tätigen:
TransDecoder identifiziert wahrscheinliche Codierungssequenzen basierend auf den folgenden Kriterien:
- ein offener Leserahmen (ORF) von minimaler Länge wird in einer Transkriptsequenz gefunden
- ein Log-Likelihood-Score, ähnlich dem, der von der GeneID-Software berechnet wird, ist > 0.
- die obige Kodierungsbewertung ist am größten, wenn der ORF im 1. Leserahmen bewertet wird, verglichen mit den Bewertungen in den anderen 5 Leserahmen.
- wenn ein Kandidaten-ORF gefunden wird, der vollständig von den Koordinaten eines anderen Kandidaten-ORF eingekapselt ist, wird der längere gemeldet. Ein einzelnes Transkript kann jedoch mehrere ORFs melden (unter Berücksichtigung von Operons, Chimären usw.).
- Optional weist das mutmaßliche Peptid eine Übereinstimmung mit einer Pfam-Domäne über dem Rausch-Grenzwert auf.
Suchen Sie also im Wesentlichen nach dem längsten ORF und verwenden Sie dann eine sekundäre Metrik (Hidden-Markov-Modell, Positionsgewichtungs-Array, Datenbankabfrage usw.), um Ihre Vorhersage zu verfeinern.
Ein Gesicht
Kanadier
Resonanz
Mein Himmel