Mir wurde klar, dass ich in allen Fällen von „RefSeq Genes“-Annotationen von hg19 gespleißte Transkripte mit einem Exon beginnen (und enden) sah. Aus der Anmerkung geht hervor, dass keine Sequenz stromaufwärts oder stromabwärts dieser Exons in der entstehenden RNA verbleibt.
Spiegelt dies die Biologie wider oder ist es nur eine Folge des gespleißten Read-Mappings? Mit anderen Worten: Existieren in naszierender RNA transkribierte Regionen stromaufwärts des ersten Exons und stromabwärts des letzten Exons?
Diese Regionen, falls vorhanden, können nicht als Introns bezeichnet werden, wenn sie als „gespleißte Sequenzen zwischen Exons“ definiert sind. Wie würde man sie nennen?
Die meisten (fast alle, AFAIK) mRNAs und lncRNAs beginnen aus den bereits von David erwähnten Gründen mit Exons. Bei einem typischen Spleißereignis werden das Nukleotid, das sich 5' von der Spleiß-Donorstelle befindet (nennen wir es Prädonor), und das Nukleotid, das 3' von der Akzeptorstelle liegt (nennen wir es Postakzeptor), miteinander verbunden und die Intronsequenz entsteht dazwischen entfernt.
Wenn Sie sich den Mechanismus genau ansehen, werden Sie feststellen, dass der Pre-Donor (dh das 3'-Ende des ersten Exons) einen nukleophilen Angriff auf den Phosphor des Post-Akzeptors (dh das 5'-Ende des zweiten Exons) ausführt. was zur Freisetzung des Introns führt.
Bild mit freundlicher Genehmigung : http://mips.helmholtz-muenchen.de/proj/yeast/reviews/intron/spliceo_splicing.html
Daher geht im Transkript immer ein Exon einem Intron voraus.
Die RNA-Verarbeitung kann jedoch über einen anderen Mechanismus erfolgen, bei dem die Enden einfach abgeschnitten werden. Dies geschieht bei der tRNA-Verarbeitung, bei der RNAseP einen Teil 5' der reifen tRNA-Region abschneidet, die als Leader-Sequenz bezeichnet wird (siehe Abbildung unten). Mir ist nicht bekannt, dass ein solcher Mechanismus im Fall von mRNAs auftritt, aber eine Möglichkeit besteht sicherlich. Ein möglicher Grund dafür, dass mRNAs diese Art von Mechanismus nicht haben, ist, dass ihr 5'-Ende (co-transkriptionell) gekappt ist und die Spaltung des 5' zu einem Verlust der Kappe und einer Destabilisierung der mRNA führen würde (allerdings alles Vermutungen). In ähnlicher Weise ist das 3' von mRNAs polyadenyliert, was ihnen ebenfalls Stabilität verleiht. Viele lncRNAs sind ebenfalls gecappt und polyadenyliert, aber es gibt Ausnahmen (auch mRNAs).
Da dieser Mechanismus nicht sehr verbreitet ist, gibt es keinen systematischen Namen für die ausgeschnittenen Enden. Im Fall von tRNA wird sie einfach als „Leader“-Sequenz bezeichnet.
Bild mit freundlicher Genehmigung : Leigh & Lang, 2004
Soweit mir bekannt ist, beginnen und enden Transkripte immer mit Exons. Die Gründe, die ich (abgesehen von meinen Beobachtungen bei der Untersuchung von Drosophila-Transkripten) nicht anders erwarten würde, sind unten aufgeführt.
Wie Sie wissen, ist das Spleißosom (zumindest für mRNA) ein hochentwickelter ribonuklearer Proteinkomplex aus mehreren Komponenten und hat die Funktion, sowohl das Intron auszuspleißen als auch die Enden des Exons zu ligieren. Das folgende Diagramm aus einer kürzlich erschienenen Übersicht legt nahe, dass die Erkennung der Spleißstellen auch das Exon umfasst.
Und die Autoren schreiben (meine Kursivschrift):
„Die Basenpaarung zwischen dem 50-Ende der U1-snRNA und den ersten sechs Nukleotiden des Introns und bis zu drei Nukleotiden des Exons stellt die Hauptantriebskraft für die spezifische Sequenzerkennung dar.“
Ich denke also, dass die moderne Maschinerie zum Entfernen von mRNA-Introns Exon-mRNA benötigt, um sie zu „ergreifen“.
Wenn eine solche Entfernung von Introns einem funktionellen Zweck dienen könnte, würden Sie sich vorstellen, dass sich die Maschinerie entwickelt hätte, um solchen Situationen Rechnung zu tragen, aber wenn die Hauptfunktion von Introns darin besteht, differenzielles Spleißen von Exons zu ermöglichen, die Regionen des Proteins spezifizieren, Introns am Ende von a mRNA hätte keinen Zweck.
Ein weiterer zu berücksichtigender Punkt ist die RNA-Polymerase-Bindungsstelle auf der DNA (der erweiterte und komplexe Promotor). Wenn Introns ursprünglich als mobile Elemente entstanden sind (was von den Autoren der Übersicht vorgeschlagen wurde), dann hätte eine Insertion am 5'-Ende wahrscheinlich den Promotor inaktiviert, sodass kein Transkript erzeugt worden wäre.
Natürlich ist die Natur voller Ausnahmen, und es wäre töricht auszuschließen, dass Introns des von Ihnen postulierten Typs existieren (in einer weit entfernten Galaxie ...).
Vielen Dank für eine tolle Frage.
Ich möchte damit beginnen, einige Begrifflichkeiten zu klären.
Erstens bezieht sich naszierende RNA auf ein RNA-Molekül, das derzeit transkribiert und noch nicht verarbeitet wurde. Die Prozessierung kann beispielsweise das Ausspleißen von Introns oder die Polyadenylierung am 3'-Ende umfassen. Reife RNA wird (typischerweise) gespleißt und polyadenyliert.
Zweitens ist die aktuelle Konsensdefinition eines Exons eine transkribierte Region des Genoms, deren Sequenz in reifen RNA-Spezies gefunden werden kann. Wichtig ist, dass es zwei Klassen von Exons gibt: nicht kodierende Exons und proteinkodierende Exons. Ich denke, Sie haben das vielleicht verwechselt, und ich habe ein Bild eingefügt, um die Unterscheidung zwischen Introns, codierenden Exons und nicht codierenden Exons zu verdeutlichen, wobei das menschliche GAPDH-Gen als Beispiel verwendet wird.
In der Abbildung stellen die ausgefüllten blauen Kästchen Exons dar, die in der reifen mRNA vorhanden sind . Diese Exons können, wie bereits erwähnt, sowohl Protein-kodierende als auch nicht-kodierende Sequenzen enthalten. Beispielsweise enthält Exon 1 von GAPDH nur nicht kodierende Informationen, die zur 5'-untranslatierten Region (UTR) gehören, während Exon 2 sowohl kodierende als auch nicht kodierende Sequenzinformationen enthält.
Wenn Sie die RefSeq-Anmerkung anzeigen, sehen Sie alle Exons (codierend und nicht codierend). Bei einigen der Gene, wie GAPDH, ist das erste Exon nicht codierend. Andere Gene können mit einem codierenden Exon beginnen (ich muss noch eines finden, und da die 5'UTR an der Ribosomenbindung beteiligt ist , bezweifle ich, dass es viele Beispiele gibt).
Die Regionen eines mRNA-Moleküls jenseits seiner kodierenden Sequenz werden als die 5'- und 3'-untranslatierten Regionen (UTRs) bezeichnet.
Ich hoffe, das hilft bei der Beantwortung Ihrer Frage.
Vance L. Albaugh
Gescheiterter Wissenschaftler
Herr Jemine
David
Herr Jemine
David