Müssen alle microRNA-Isoformen bekannt und sequenziert sein, um eine microRNA-Expression zu erhalten?

Soweit ich weiß, sind microRNA kurze "haarnadelförmige" nc-Strukturen. Beim Sequenzieren und Zählen von miRNA werden Isoform-miRNA "gefunden", die Unterabschnitte unterschiedlicher Länge und möglicherweise mit einigen Mutationen oder anderen Unterschieden zur "kanonischen" microRNA sind. Die Gesamtzählungen für eine miRNA sind die Summen der Zählungen für die Isoformen, die sich auf diese miRNA beziehen. [Bitte korrigieren Sie mich, wenn das alles falsch ist]

In Bezug auf die Sequenzierung der nächsten Generation muss eine „Bibliothek“ hinzugefügt werden, die ihr sagt, was sie sequenzieren soll. Bedeutet dies, dass nur „bekannte“ Isoformen gelesen und gezählt werden oder können auch „neue“ Sequenzen (dh Mutationen) gelesen und gezählt werden, die vor Beginn der Sequenzierung nicht bekannt waren?

In Bezug auf qPCR - sucht diese Technik nur nach einzelnen Isoformen? Wenn ich in diesem Fall etwas über eine bestimmte microRNA-Expression wissen möchte, müsste ich für jede bekannte Isoform, die sich auf diese microRNA bezieht, eine qPCR durchführen. ODER, ist es tatsächlich einfacher, die microRNA-Expression mit qPCR zu sequenzieren, da Sequenzen mit höherer Wahrscheinlichkeit mit der Haupthaarnadelstruktur abgeglichen werden können. (Mit einfacher meine ich im Vergleich zu sagen, den Ausdruck für eine bestimmte Isoform erhalten zu wollen, da er genau übereinstimmen muss).

> In Bezug auf Next Gen Sequencing muss eine „Bibliothek“ hinzugefügt werden, > die ihr sagt, was sequenziert werden soll. Im Zusammenhang mit NGS ist die „Bibliothek“ ein Pool von Molekülen, die Sie sequenzieren. Sie müssen ihren Inhalt nicht kennen, um ihre Sequenz zu erhalten.

Antworten (1)

Ich hatte an einem ähnlichen Problem gearbeitet und erzähle meine Erfahrung.

Zunächst müssen Sie die Tatsache berücksichtigen, dass eine reife miRNA aus mehreren genomischen Orten entstehen kann, dh viele Prä-miRNAs können zu derselben reifen miRNA führen.

Wie Sie sagten, gibt es Produkte der Prä-miRNA-Spaltung mit Heterogenität an ihren Enden, dh es gibt Sequenzen, die nicht genau mit der annotierten reifen Region übereinstimmen. Während Produkte mit 3'-Heterogenität als Isoformen bezeichnet werden können, haben Produkte mit 5'-Heterogenität wahrscheinlich unterschiedliche Ziele, da die Samensequenz unterbrochen ist, und daher sind sie technisch unterschiedliche miRNAs (per Definition).

Die beste Technik zur Analyse von Isoformen ist heute die Sequenzierung kleiner RNA (NGS). qPCR wäre keine gute Technik, da Primer sehr ähnliche Sequenzen nicht immer unterscheiden können (verschlimmert durch die Tatsache, dass miRNAs zu klein sind). Eine NGS-Bibliothek ist ein Satz von DNA-Sequenzen, die Sie durch Scheren der RNA/DNA und anschließende Adapterligation (umgekehrte Transkription für RNA) erhalten. Da die Adaptersequenz bekannt ist, erfordert die Sequenzierungsreaktion keine Kenntnis der Sequenz der Produkte. Sie müssten jedoch das Referenzgenom kennen, um neue miRNAs zu finden. Dies liegt vor allem daran, dass es sehr schwierig ist, pre-miRNAs zu sequenzieren (geringe Häufigkeit und Haarnadelstruktur). Sie können neue kleine RNAs sehr leicht identifizieren, aber nicht sagen, dass sie miRNAs sind, es sei denn, Sie können sie einem Stem-Loop-Vorläufer (Prä-miRNA) zuordnen.

Sie können sehr gut neue Reads entdecken und die Leute haben viele neue miRNAs mit NGS entdeckt. Ich kann Ihnen die Methodik erzählen, die ich befolgt habe, um atypische Produkte derselben Prä-miRNA zu finden. Der Einfachheit halber bezeichne ich die 5'-heterogenen Produkte als Badseeds (weil sie eine unterbrochene Samensequenz haben) und die 3'-heterogenen Produkte als IsomiRs . Ich habe eine Methodik verwendet, die der eines bekannten Programms ähnelt – miRdeep .

  1. Holen Sie sich die Prä-miRNA-Sequenzen von miRbase
  2. Holen Sie sich reife miRNA-Sequenzen von miRbase
  3. Verwenden Sie Bowtie-1 , um einen Index aus den Prä-miRNA-Sequenzen zu erstellen
  4. Entfernen Sie den Adapter aus Ihren fastq-Lesevorgängen und entfernen Sie Lesevorgänge mit geringer Qualität. Dafür gibt es viele Tools. Sie können Trimmomatic ausprobieren.
  5. Ordnen Sie reife miRNA-Sequenzen dem Prä-miRNA-Index mit Bowtie zu, um die genaue Position der reifen miRNA in der Prä-miRNA zu finden
  6. Ordnen Sie Lesevorgänge der Prä-miRNA-Region zu. Filtern Sie Reads, die nicht in einem vordefinierten Fenster um die reife Region abgebildet werden.
  7. Klassifizieren Sie die Reads als Badseed oder isomiR

Nun können IsomiRs und Reads, die perfekt der reifen miRNA-Region zugeordnet sind, als Mitwirkende an der gesamten miRNA-Expression betrachtet werden. Schlechte Samen sollten jedoch nicht als Isoform betrachtet werden. Sie können ebenfalls ein gewisses Maß an Diskrepanz zulassen und diese Lesevorgänge zählen. Sequenzen mit Mismatch in der Seed-Region wären wiederum Badseeds . Sie können zusätzlich Bewertungsschemata für Ihre Reads haben.

Es gibt nicht viele Studien zu einer solchen Analyse. Ich habe mit unseren Daten kein veröffentlichungsfähiges Ergebnis erhalten, aber die Methodik ist einigermaßen korrekt. Sie können es für Ihr Studium anwenden.

Ok, zumindest eine Antwort auf die Frage. Der grundlegende Punkt in der Antwort, der eigentlich ein Kommentar ist, sollte beibehalten werden: Die Bibliothek ist der Pool von Sequenzen, die Sie von NGS erhalten, und Sie sequenzieren die gesamte RNA einer bestimmten Größe. Sie identifizieren, was Sie in Bezug auf eine Referenz sequenziert haben – es könnte ein Referenzgenom sein, in dem die miRNAs bereits annotiert sind, oder Sie können versuchen, neue zu entdecken, wie Sie es getan haben. Und Sie (oder zumindest ich) finden keine pri-miRNAs.