Beginnen und enden Transkripte immer mit Exons?

Mir wurde klar, dass ich in allen Fällen von „RefSeq Genes“-Annotationen von hg19 gespleißte Transkripte mit einem Exon beginnen (und enden) sah. Aus der Anmerkung geht hervor, dass keine Sequenz stromaufwärts oder stromabwärts dieser Exons in der entstehenden RNA verbleibt.

Spiegelt dies die Biologie wider oder ist es nur eine Folge des gespleißten Read-Mappings? Mit anderen Worten: Existieren in naszierender RNA transkribierte Regionen stromaufwärts des ersten Exons und stromabwärts des letzten Exons?

Diese Regionen, falls vorhanden, können nicht als Introns bezeichnet werden, wenn sie als „gespleißte Sequenzen zwischen Exons“ definiert sind. Wie würde man sie nennen?

Willkommen bei BiologySE ... Ich stimme dem zu, was Sie am Ende sagen (dh "Ich denke, wenn Sie eine Antwort für 1 und 2 haben ..." - Ich würde Ihre Frage einschränken, um eine Antwort zu erhalten (es ist einfacher, eine einfache zu beantworten , einfache Frage anstelle einer breiten Frage mit 5 Teilfragen) Sie können immer mehr Fragen stellen – je spezifischer, desto besser
Sehr gute (und gut recherchierte) Frage!! Ich freue mich hier auf Antworten
@TalhaIrfan Danke. Ich habe den Text auf die Grundfragen komprimiert.
Könnten Sie bitte erklären, was Sie mit "gespleißter Lesezuordnung" meinen.
@David, gespleißte Lesezuordnung bezieht sich auf die Zuordnung von gespleißten Sequenzen (z. B. RNA-abgeleitete Sequenzlesevorgänge) zu einer nicht gespleißten Referenz (DNA des Referenzgenoms). Der Algorithmus, der diese Art von Aufgabe ausführt, muss in der Lage sein, lange Einfügungen in die Referenzsequenz zu akzeptieren, ohne diese als Fehlpaarungen im Alignment zu bestrafen. Diese Read-to-Reference-Einfügungen (oder Reference-to-Read-Deletionen) sind Introns.
@Herr Jemine - Ich verstehe. Danke für die Erklärung.

Antworten (3)

Die meisten (fast alle, AFAIK) mRNAs und lncRNAs beginnen aus den bereits von David erwähnten Gründen mit Exons. Bei einem typischen Spleißereignis werden das Nukleotid, das sich 5' von der Spleiß-Donorstelle befindet (nennen wir es Prädonor), und das Nukleotid, das 3' von der Akzeptorstelle liegt (nennen wir es Postakzeptor), miteinander verbunden und die Intronsequenz entsteht dazwischen entfernt.

Wenn Sie sich den Mechanismus genau ansehen, werden Sie feststellen, dass der Pre-Donor (dh das 3'-Ende des ersten Exons) einen nukleophilen Angriff auf den Phosphor des Post-Akzeptors (dh das 5'-Ende des zweiten Exons) ausführt. was zur Freisetzung des Introns führt.

Geben Sie hier die Bildbeschreibung ein Bild mit freundlicher Genehmigung : http://mips.helmholtz-muenchen.de/proj/yeast/reviews/intron/spliceo_splicing.html

Daher geht im Transkript immer ein Exon einem Intron voraus.

Die RNA-Verarbeitung kann jedoch über einen anderen Mechanismus erfolgen, bei dem die Enden einfach abgeschnitten werden. Dies geschieht bei der tRNA-Verarbeitung, bei der RNAseP einen Teil 5' der reifen tRNA-Region abschneidet, die als Leader-Sequenz bezeichnet wird (siehe Abbildung unten). Mir ist nicht bekannt, dass ein solcher Mechanismus im Fall von mRNAs auftritt, aber eine Möglichkeit besteht sicherlich. Ein möglicher Grund dafür, dass mRNAs diese Art von Mechanismus nicht haben, ist, dass ihr 5'-Ende (co-transkriptionell) gekappt ist und die Spaltung des 5' zu einem Verlust der Kappe und einer Destabilisierung der mRNA führen würde (allerdings alles Vermutungen). In ähnlicher Weise ist das 3' von mRNAs polyadenyliert, was ihnen ebenfalls Stabilität verleiht. Viele lncRNAs sind ebenfalls gecappt und polyadenyliert, aber es gibt Ausnahmen (auch mRNAs).

Da dieser Mechanismus nicht sehr verbreitet ist, gibt es keinen systematischen Namen für die ausgeschnittenen Enden. Im Fall von tRNA wird sie einfach als „Leader“-Sequenz bezeichnet.

Geben Sie hier die Bildbeschreibung ein Bild mit freundlicher Genehmigung : Leigh & Lang, 2004

Danke für deine ausführliche Erklärung. Wie David und Sie betonen, ist es sehr unwahrscheinlich, dass der Spleißmechanismus in der Lage wäre, Sequenzen stromaufwärts und stromabwärts des ersten bzw. letzten Exons zu entfernen. Ein weiterer wichtiger Hinweis ist, dass die 5'-CAP-Verarbeitung co-transkriptionell erfolgt. Dies und die Tatsache, dass eine Methode namens "CAGE" verwendet wird, um Promotorregionen durch CAP-spezifische Sequenzierung von mRNA-5'-Enden zu identifizieren, gibt ein gewisses Vertrauen, dass die 5'-Entfernung einer "Prä-Exon-Sequenz" wahrscheinlich nicht in 5' stattfindet. gekappte mRNA. Aber wir haben das 3'-Ende nicht besprochen.
@HerrJemine Ich kenne keinen Grund, warum das nicht üblich ist. Selbst für den 5'-Teil war dies nur eine wilde Vermutung. Nimm es nicht als Tatsache. Übrigens hat das 3'-Ende Poly-A, das auch für die RNA-Stabilität entscheidend ist. Eine RNA kann jedoch auch ohne Kappe und Poly-A-Schwanz stabil sein. Da solche Fälle auch sehr selten sind, können wir vermuten, dass dies ein Faktor für das geringe Auftreten von End-Chopping in RNAs sein könnte.
Ich habe einen Hinweis auf die posttranskriptionelle 3'-Endverkürzung bei der alternativen Polyadenylierung auf Wikipedia gefunden (zweiter Absatz der Einführung und Abschnitt "Alternative Polyadenylierung"). Ich würde vorschlagen, dass Sie diesen Aspekt zu Ihrer Antwort hinzufügen, und ich werde ihn akzeptieren.

Soweit mir bekannt ist, beginnen und enden Transkripte immer mit Exons. Die Gründe, die ich (abgesehen von meinen Beobachtungen bei der Untersuchung von Drosophila-Transkripten) nicht anders erwarten würde, sind unten aufgeführt.

Wie Sie wissen, ist das Spleißosom (zumindest für mRNA) ein hochentwickelter ribonuklearer Proteinkomplex aus mehreren Komponenten und hat die Funktion, sowohl das Intron auszuspleißen als auch die Enden des Exons zu ligieren. Das folgende Diagramm aus einer kürzlich erschienenen Übersicht legt nahe, dass die Erkennung der Spleißstellen auch das Exon umfasst.

Teil von Abb. 4 aus TIBS (2016) Bd. 41, S. 33-45

Und die Autoren schreiben (meine Kursivschrift):

„Die Basenpaarung zwischen dem 50-Ende der U1-snRNA und den ersten sechs Nukleotiden des Introns und bis zu drei Nukleotiden des Exons stellt die Hauptantriebskraft für die spezifische Sequenzerkennung dar.“

Ich denke also, dass die moderne Maschinerie zum Entfernen von mRNA-Introns Exon-mRNA benötigt, um sie zu „ergreifen“.

Wenn eine solche Entfernung von Introns einem funktionellen Zweck dienen könnte, würden Sie sich vorstellen, dass sich die Maschinerie entwickelt hätte, um solchen Situationen Rechnung zu tragen, aber wenn die Hauptfunktion von Introns darin besteht, differenzielles Spleißen von Exons zu ermöglichen, die Regionen des Proteins spezifizieren, Introns am Ende von a mRNA hätte keinen Zweck.

Ein weiterer zu berücksichtigender Punkt ist die RNA-Polymerase-Bindungsstelle auf der DNA (der erweiterte und komplexe Promotor). Wenn Introns ursprünglich als mobile Elemente entstanden sind (was von den Autoren der Übersicht vorgeschlagen wurde), dann hätte eine Insertion am 5'-Ende wahrscheinlich den Promotor inaktiviert, sodass kein Transkript erzeugt worden wäre.

Natürlich ist die Natur voller Ausnahmen, und es wäre töricht auszuschließen, dass Introns des von Ihnen postulierten Typs existieren (in einer weit entfernten Galaxie ...).

Warum also der Abschlag? Wenn Sie jemanden ablehnen, haben Sie den Mut und den Anstand, zu erklären, warum. Was ist so verwerflich an der Idee, dass sich das Spleißen entwickelt hat, weil es Varianten von Proteinen durch differenzielles Spleißen erlaubte, und die Maschinerie, die sich entwickelt hat, um damit umzugehen? Obwohl es Introns in den UTRs einer mRNA gibt, die vielleicht die Ribosomenbindung usw. beeinflussen, sind diese wahrscheinlich sekundär gewesen. Wenn Sie einen Komplex haben, der zwei Teile eines Seils binden muss, bevor er es schneiden und verbinden kann, ist es absolut sinnvoll, dass er am Ende nicht funktioniert. Oder gefällt dir mein letzter Absatz nicht?
Ich habe nicht abgelehnt, aber ich würde vermuten, dass die theoretische und unbelegte Natur dieser Antwort eine bedeutende Rolle spielen würde. Außerdem finde ich es seltsam, warum Sie jemanden bitten würden, seine Ablehnung so defensiv zu erklären.
@MarchHo Ich werde den Boten nicht erschießen, aber wenn Sie abstimmen, werden Sie aufgefordert, einen Kommentar abzugeben. Es ist äußerst ärgerlich, eine strukturbasierte Antwort auf eine theoretische (eher hypothetische) Frage zu geben und am Ende -1 zu erhalten, sodass ein zufälliger Besucher annehmen würde, dass Ihre Antwort grundlegend falsch ist. Meine Vermutung ist jetzt, dass die selbstironische und skurrile Star Wars-Referenz als Angriff auf die Frage missverstanden wurde. Vielleicht ändere ich es in Shakespeare, wenn ich später ein Bild des Spleißosoms hinzufüge, um meine Argumentation zu verdeutlichen.
Ihre Antwort berührt den Punkt, aber eine kleine Erklärung und einige Diagramme würden es besser machen.
@David Danke für die Antwort auf meine Frage. Ich finde es gut, dass Sie auf den strukturellen Unterschied zwischen einem Spleißen zwischen Exons und einer möglichen Sequenzentfernung stromaufwärts und stromabwärts ohne einen „Spleißpartner“ hingewiesen haben. Ich habe übrigens auch nicht runter gestimmt, aber mein Upvote hat noch nicht gezählt (missing exp.).
@WYSIWYG - Ich habe ein entsprechendes Diagramm hinzugefügt und das Argument verhärtet. Ich bin nicht zu Shakespeare gewechselt, aber das Zitat, das ich im Kopf hatte, war "There are more things in heaven and earth...". Zum Beispiel berichtet Nature diese Woche, dass N6-Methadenin in Eukaryoten gefunden wurde, wo man dachte, dass es nicht existiert. Sag niemals nie.
@ David danke. Ich habe Ihnen bereits +1 gegeben. Ich verstehe, dass es viele unbekannte Mechanismen gibt (und ja, ich hatte diesen Artikel auch gesehen), aber ich denke, wir können möglicherweise rechtfertigen, warum sie selten sind.
@David Nur zur Klarstellung: Benutzer sind in keiner Weise verpflichtet , ihre Stimmen nach oben oder unten zu erklären oder zu "begründen". Die Nachricht, auf die Sie sich beziehen, erscheint für Benutzer mit geringer Wiederholungszahl oder Gelegenheitsnutzer einer Website, aber nicht für erfahrenere Benutzer, die die Abstimmungsrichtlinien theoretisch verstehen. Ich möchte auch darauf hinweisen, wie March Ho es getan hat, dass ein derart defensives und beleidigendes Schlagen weder für den allgemeinen Ton der Website nützlich ist, noch wahrscheinlich jemanden dazu veranlasst, seine Stimme zu erklären oder zu ändern. Sei nett .
@MattDMo OK, OK. Allerdings habe ich kürzlich eine solche Nachricht erhalten und ich habe ziemlich häufig gepostet. Die Botschaft impliziert, dass dies die richtige Etikette ist, die langjährige Benutzer gelernt haben sollten. Und übrigens, ich halte meine Art nicht für beleidigend. Es war kraftvoll und direkt, aber nicht mehr. Als ich jedoch eine Ablehnung bezüglich erklärte. Bei einem anderen Posting wurde mir kürzlich der Kopf abgebissen, also denke ich, man sollte einfach akzeptieren, dass die Richtlinien in ihrem Brechen mehr geehrt werden.

Vielen Dank für eine tolle Frage.

Ich möchte damit beginnen, einige Begrifflichkeiten zu klären.

Erstens bezieht sich naszierende RNA auf ein RNA-Molekül, das derzeit transkribiert und noch nicht verarbeitet wurde. Die Prozessierung kann beispielsweise das Ausspleißen von Introns oder die Polyadenylierung am 3'-Ende umfassen. Reife RNA wird (typischerweise) gespleißt und polyadenyliert.

Zweitens ist die aktuelle Konsensdefinition eines Exons eine transkribierte Region des Genoms, deren Sequenz in reifen RNA-Spezies gefunden werden kann. Wichtig ist, dass es zwei Klassen von Exons gibt: nicht kodierende Exons und proteinkodierende Exons. Ich denke, Sie haben das vielleicht verwechselt, und ich habe ein Bild eingefügt, um die Unterscheidung zwischen Introns, codierenden Exons und nicht codierenden Exons zu verdeutlichen, wobei das menschliche GAPDH-Gen als Beispiel verwendet wird.

UCSC Genome Browser-Ansicht des menschlichen GAPDH-Gens

In der Abbildung stellen die ausgefüllten blauen Kästchen Exons dar, die in der reifen mRNA vorhanden sind . Diese Exons können, wie bereits erwähnt, sowohl Protein-kodierende als auch nicht-kodierende Sequenzen enthalten. Beispielsweise enthält Exon 1 von GAPDH nur nicht kodierende Informationen, die zur 5'-untranslatierten Region (UTR) gehören, während Exon 2 sowohl kodierende als auch nicht kodierende Sequenzinformationen enthält.

Wenn Sie die RefSeq-Anmerkung anzeigen, sehen Sie alle Exons (codierend und nicht codierend). Bei einigen der Gene, wie GAPDH, ist das erste Exon nicht codierend. Andere Gene können mit einem codierenden Exon beginnen (ich muss noch eines finden, und da die 5'UTR an der Ribosomenbindung beteiligt ist , bezweifle ich, dass es viele Beispiele gibt).

Die Regionen eines mRNA-Moleküls jenseits seiner kodierenden Sequenz werden als die 5'- und 3'-untranslatierten Regionen (UTRs) bezeichnet.

Ich hoffe, das hilft bei der Beantwortung Ihrer Frage.

Das beantwortet die Frage eigentlich nicht. Ich denke, das OP kennt sich mit Exons und UTRs aus. Ihre Frage ist, warum ein Transkript immer mit einem Exon beginnen muss. Vielleicht können Sie diesen Punkt etwas erklären.
Ich habe noch nie von einer Klassifizierung wie kodierenden und nicht kodierenden Exons gehört. Sie können Exons haben, die einen Teil der CDS und einen Teil der UTR haben.
Danke für deine Antwort. Aber meine Frage betraf nicht, ob Exons codierende oder nicht codierende Sequenzen enthalten. Ich bin mir der Tatsache bewusst, dass Exons Teil der 5'- oder 3'-UTR in der reifen mRNA sein können und dass es im Allgemeinen nicht-kodierende RNAs gibt. Wie @WYSIWYG betonte, würde ich gerne wissen, ob die unverarbeitete, entstehende RNA immer mit einem Exon beginnt und endet oder ob sie möglicherweise eine Entfernung von „Kopf“- und „Schwanz“-RNA-Sequenzen bedeutet, die von der DNA transkribiert wurden.
@WYSIWYG Vielen Dank für Ihren Kommentar. Vielleicht ist Codieren vs. Nicht-Codieren auf bestimmte Bioinformatik-Kreise beschränkt, wo ich auf den Begriff gestoßen bin. Ich denke, die 5'/3' UTR-Konvention ist intuitiver.
@HerrJemine Vielen Dank für die Klärung Ihrer spezifischen Bedürfnisse. Wie oben erwähnt, wird nur eine sehr begrenzte Untergruppe von RNAs posttranskriptionell am 5'-Ende gespalten (ich konnte keine Beispiele für Säugetier-RNAs finden, die am 3'-Ende gespalten werden). Möglicherweise interessieren Sie sich für eine Technik namens NET-seq link . Es zeigt eine durchdringende Transkription außerhalb der Transkriptionseinheit in Hefen, Fliegen und Menschen.