Ich habe Sequenzierungsdaten (Illumina). Die Bibliotheksvorbereitung konzentrierte sich auf kurze ncRNAs. Ich möchte menschliche miRNAs identifizieren. Glauben Sie, dass es machbar ist, einfach BLAST
gegen eine aktuelle Version von mirBase zu suchen und die Ausgabe nach ausgereiften, menschlichen miRNAs zu filtern, ohne zuerst bowtie/tophat
gegen zu verwenden hg19
?
Vielen Dank
Sie müssen nicht verwenden, TopHat
aber es ist besser, bowtie
anstelle von zu verwenden BLAST
. Zunächst müssen Sie die Adaptersequenzen loswerden (zusammen mit anderen Verarbeitungsschritten vor dem Alignment).
Hier gibt es jetzt zwei Aspekte:
Der erste ist relativ einfach, während der zweite erfordert, dass Sie zusätzliche Tests wie die Vorhersage von Stammschleifen usw. durchführen. Es gibt veröffentlichte Software, die beide Aspekte handhaben kann ( mirDeep
, miRScan
usw.). In dieser Übersicht finden Sie Einzelheiten zu verschiedenen miRNA-Genfindern . Ich habe verwendet miRdeep
und es verwendet bowtie-1
, um auszurichten.
BLAST
würde funktionieren, aber Sie müssen Parameter einstellen, die für kleine Sequenzen geeignet sind (E-Wert-Grenzwert erhöhen, Wortgröße verringern usw.). Darüber hinaus hat BLAST
es keine Cutoff-Option für die Anzahl der Mismatches und die Länge des Alignments (es hat nur einen Post-Alignment-Filter für die prozentuale Identität).
Ich persönlich bevorzuge es auch, bowtie
weil es einen sogenannten n-
Ausrichtungsmodus gibt. In diesem Modus wird der gesamte Lesevorgang in seed
und non-seed
Regionen unterteilt. Sie können die Länge der Seed-Region und den Mismatch-Cutoff angeben. Da für miRNAs die Saatregion (Basen 2-8) für ihre Funktion entscheidend ist, setze ich den seed
Mismatch-Cutoff im Allgemeinen auf Null, während ich ein oder zwei Mismatches in der non-seed
Region zulasse (beachten Sie, dass in bowtie
der seed
immer bei 1 beginnt).
Im Allgemeinen würde ich raten, miRdeep
statt auf zu gehen BLAST
. Führt miRdeep
jedoch nicht sofort einen Abgleich mit den reifen Sequenzen durch. Es kartiert die Position reifer Sequenzen in den Prä-miRNA-Sequenzen (Stammschleifen) und richtet dann die Lesevorgänge an den Prä-miRNA-Sequenzen aus. Wenn der Ort der Reads eine signifikante Überlappung mit der reifen Region aufweist (Sie können das Fenster anpassen), wird der Read als gültige miRNA betrachtet.
twckr
WYSIWYG
-e
auf 80. Dies ist jedoch für diefasta
Datei der Lesevorgänge. Diee
Option ist für die maximale Qualitätsgrenze für Fehlanpassungen. Fürfasta
Dateien ist die Standardqualität 40; 80 bedeutet also 2 Fehlanpassungen. Dies wäre nicht der Fall, wenn Siefastq
Dateien verwendenbli
WYSIWYG
twckr
bowtie
erhalte ich ganz andere Ergebnisse als mitBLAST
. Selbst wenn ich die Option -L auf 22 setze (was nach meinem Verständnis Fehlanpassungen vermeiden sollte), finde ich signifikante Unterschiede in den Ergebnissen beider Programme. Haben Sie eine Erklärung für diesen Befund?WYSIWYG