Wie finden Sie pre-miRNAs aus dem Output von reifer miRNA Blast?

Kurz gesagt, ich habe einen Blastn mit Standalone-Blast unter Verwendung aller bekannten miRNAs gegen die EST-Sequenzen in einem Genom (Wortlänge 7 und e-Wert 0,01) durchgeführt. Um nun zu bestätigen, wäre einer der nächsten Schritte, die Prä-miRNA-Sequenz jedes Treffers zu erhalten und eine mFOLD zur strukturellen Bestätigung durchzuführen. Jedes Papier, das ich lese, erwähnt immer, ein gleitendes Fenster (mit einer Länge von 70 - 100 nt) zu erhalten, aber wie erhalten Sie dieses gleitende Fenster aus der BLASTN-Ausgabe. Müssen Sie etwas selbst codieren oder gibt es einen einfacheren Weg, dies zu tun? Danke.

miRNAs in EST- Ich bin da etwas skeptisch..
Entschuldigung für die späte Antwort. Ich bin mir nicht sicher, ob Sie es jetzt noch brauchen.

Antworten (2)

HAFTUNGSAUSSCHLUSS: Ich habe noch nie mit miRNAs gearbeitet.

Soweit ich weiß, wird die reife miRNA jedoch durch Modifikation der Prä-miRNA hergestellt. Dies bedeutet, dass Sie in der Lage sein sollten, die Prä-miRNA abzuleiten, indem Sie Ihre miRNA mit einem Tool wie BLAT auf das Genom abbilden . Da Sie bereits einen EST haben, der eine transkribierte Sequenz darstellt, können Sie Ihren EST wieder auf das Genom abbilden. Sie können dies vereinfachen, indem Sie ein solches Tool verwenden, exoneratedas auch das Spleißen modelliert.

Ein BLASTN würde für die Kartierung der reifen miRNA funktionieren, aber Sie sollten einige Parameter korrigieren.

E-Wert ist in Ordnung, aber erhöhen Sie die Wortlänge. Halten Sie es nahe bei 17, weil Sie an perfekten Übereinstimmungen interessiert sind. Bei miRNA können kleine Fehlpaarungen eine ganz andere miRNA bedeuten. Auch für nur Plus/Plus-Ausrichtungen ausführen. (Sie können diesen Beitrag auf Biostar sehen, um Einzelheiten darüber zu erfahren, wie es geht.)

Was Sie auch tun können, ist zu verwenden bowtie(manchmal ist BLAST sehr langsam und obwohl BLAST mehrere Threads zulässt, gibt es keine Option zur Verwendung mehrerer Kerne, dh echte Parallelisierung). Verwenden Sie erneut die Option --norc, um Plus-Minus-Ausrichtungen zu vermeiden.

Verwenden Sie es bowtie-buildfür Ihre EST-Sequenzen, um einen Index zu erstellen.

Es gibt jedoch noch ein weiteres Problem; Es ist unwahrscheinlich, dass Sie Prä-miRNA-Sequenzen in Ihrer EST-Sammlung erhalten. Denn die stabile Form ist reife miRNA und prä ist im Allgemeinen zu kurzlebig, um ohne geeignete selektive Maßnahmen richtig sequenziert zu werden.

Das Einfangen kleiner RNAs durch Sequenzierung ist auch nicht so einfach. Es erfordert eine Größenfraktionierung der RNA und eine anschließende Bibliotheksvorbereitung aus der kleinen RNA-Fraktion. Ich schätze also, Sie werden keine miRNAs von ESTs entdecken.

Wenn Sie kleine RNA-Sequenzen haben, können Sie diese am Genom ausrichten und dann auswählen ± 70 nt, um die Haarnadel zu finden. Tatsächlich gibt es einen Algorithmus namens Mirdeep, der das tut; Sie können es verwenden und vermeiden, eigene Codes zu schreiben. Wenn Sie sich mit Perl gut auskennen, können Sie es gegebenenfalls an Ihre speziellen Bedürfnisse anpassen.

Ich habe nie eine Fliege verwendet. Ich versuche, an Blasten zu arbeiten, wobei die Anzahl der Nichtübereinstimmungen im Moment auf 2 eingestellt ist. Was würden Sie vorschlagen, ist ein gutes Clustering-Programm, um doppelte Sequenzen zu entfernen
fastx_collapser reduziert redundante Sequenzen. BLAST kann für diese Dinge sehr langsam werden. Es ist besser, einen kurz lesbaren Aligner wie eine Fliege zu verwenden.
thx .. muss beim nächsten Mal vielleicht Bowtie ausprobieren. Zu weit mit dem aktuellen Projekt, um es noch einmal zu verfolgen.