miRNA-Analyse nur mit BLAST gegen mirbase.org

Ich habe Sequenzierungsdaten (Illumina). Die Bibliotheksvorbereitung konzentrierte sich auf kurze ncRNAs. Ich möchte menschliche miRNAs identifizieren. Glauben Sie, dass es machbar ist, einfach BLASTgegen eine aktuelle Version von mirBase zu suchen und die Ausgabe nach ausgereiften, menschlichen miRNAs zu filtern, ohne zuerst bowtie/tophatgegen zu verwenden hg19?

Vielen Dank

Antworten (1)

Sie müssen nicht verwenden, TopHataber es ist besser, bowtieanstelle von zu verwenden BLAST. Zunächst müssen Sie die Adaptersequenzen loswerden (zusammen mit anderen Verarbeitungsschritten vor dem Alignment).

Hier gibt es jetzt zwei Aspekte:

  • miRNA-Quantifizierung
  • miRNA-Entdeckung

Der erste ist relativ einfach, während der zweite erfordert, dass Sie zusätzliche Tests wie die Vorhersage von Stammschleifen usw. durchführen. Es gibt veröffentlichte Software, die beide Aspekte handhaben kann ( mirDeep, miRScanusw.). In dieser Übersicht finden Sie Einzelheiten zu verschiedenen miRNA-Genfindern . Ich habe verwendet miRdeepund es verwendet bowtie-1, um auszurichten.

BLASTwürde funktionieren, aber Sie müssen Parameter einstellen, die für kleine Sequenzen geeignet sind (E-Wert-Grenzwert erhöhen, Wortgröße verringern usw.). Darüber hinaus hat BLASTes keine Cutoff-Option für die Anzahl der Mismatches und die Länge des Alignments (es hat nur einen Post-Alignment-Filter für die prozentuale Identität).

Ich persönlich bevorzuge es auch, bowtieweil es einen sogenannten n-Ausrichtungsmodus gibt. In diesem Modus wird der gesamte Lesevorgang in seedund non-seedRegionen unterteilt. Sie können die Länge der Seed-Region und den Mismatch-Cutoff angeben. Da für miRNAs die Saatregion (Basen 2-8) für ihre Funktion entscheidend ist, setze ich den seedMismatch-Cutoff im Allgemeinen auf Null, während ich ein oder zwei Mismatches in der non-seedRegion zulasse (beachten Sie, dass in bowtieder seedimmer bei 1 beginnt).

Im Allgemeinen würde ich raten, miRdeepstatt auf zu gehen BLAST. Führt miRdeepjedoch nicht sofort einen Abgleich mit den reifen Sequenzen durch. Es kartiert die Position reifer Sequenzen in den Prä-miRNA-Sequenzen (Stammschleifen) und richtet dann die Lesevorgänge an den Prä-miRNA-Sequenzen aus. Wenn der Ort der Reads eine signifikante Überlappung mit der reifen Region aufweist (Sie können das Fenster anpassen), wird der Read als gültige miRNA betrachtet.

Danke vielmals. Ich würde es zuerst mit Fliege versuchen. Also setze ich -N auf 0. Welchen Wert empfehlen Sie für -L (Länge der Seed-Substrings, die während der Multiseed-Ausrichtung ausgerichtet werden sollen)?
@twckr Sie können es auf 10 setzen; Ich verwende 10. Ich setze -eauf 80. Dies ist jedoch für die fastaDatei der Lesevorgänge. Die eOption ist für die maximale Qualitätsgrenze für Fehlanpassungen. Für fastaDateien ist die Standardqualität 40; 80 bedeutet also 2 Fehlanpassungen. Dies wäre nicht der Fall, wenn Sie fastqDateien verwenden
Ich denke, dass einige Fehlpaarungen im miRNA-Seed je nach Position in Bezug auf die miRNA-Funktion toleriert werden könnten.
@bli Seed ist ziemlich wichtig. miRNAs werden basierend auf Samensequenzen in Familien eingeteilt. Wenn Ihr Seed also anders ist, wird er technisch gesehen zu einer anderen miRNA. Abhängig von den Bedingungen und dem Kontext können Seed-Mismatches (nicht mehr als zwei) jedoch toleriert werden.
Mit bowtieerhalte ich ganz andere Ergebnisse als mit BLAST. Selbst wenn ich die Option -L auf 22 setze (was nach meinem Verständnis Fehlanpassungen vermeiden sollte), finde ich signifikante Unterschiede in den Ergebnissen beider Programme. Haben Sie eine Erklärung für diesen Befund?
@twckr Sie müssen mir die Dateien zeigen, sonst kann ich keine Erklärung geben. Wenn die Dateien sehr groß sind, fügen Sie einfach einen Abschnitt ein, der den Unterschied zeigt.