was der beste E-Wert-Cutoff in der miRNA-Homologiesuche ist

Ich versuche, die miRBase-Datenbank zu verwenden, um einige microRNA-Sequenzen mit einer Länge von 22-24 bp zu kommentieren. Ich weiß es sehr zu schätzen, wenn mir jemand mitteilt, ob ich diesen BLAST gegen reife miRNA- oder Stem-Loop-Sequenzdatenbanken durchführen soll. und die andere Hauptfrage ist, welche Anzahl von E-Werten vernünftigerweise als niedrigster E-Wert in den miRNA BLAST-Ergebnissen akzeptiert wird? Welches Tool schlagen Sie vor, um eine miRNA-Anreicherungsanalyse durchzuführen? zum Beispiel können wir DAVID für die Anreicherungsanalyse von Genen (codierende Sequenzen) verwenden. Mithilfe einer solchen Analyse sind wir in der Lage, einer Gruppe von miRNA (nicht nur einer miRNA) wahrscheinliche Funktionen und biologische Rollen zuzuordnen. Alle Kommentare und Ideen sind willkommen.

Antworten (1)

Wenn Sie BLAST für kurze Nukleotidsuchen verwenden, sollten Sie Ihre Wortgröße auf <=7 reduzieren. Es ist besser, sich an ausgereiften Sequenzen auszurichten.

Der E-Wert hängt von der Datenbankgröße ab. Wenn Ihre Zieldatenbank sehr groß ist, sollten Sie die E-Wert-Grenze erhöhen. Wenn miRBase (für einige Organismen) Ihre Datenbank ist, müssen Sie BLAST auch nicht ausführen. Sie können einfach SSEARCH (Smith-Waterman Local Alignment Algorithm) ausführen.

Wenn Sie BLAST gegen miRbase ausführen, können Sie den E-Wert-Grenzwert auf 10 festlegen. Dies ist in Ordnung, da es viele ähnlich aussehende miRNAs mit unterschiedlichen Funktionen gibt. Wenn Sie die E-Wert-Grenze verringern, können Sie diese verlieren.

Es gibt einige andere Kriterien für die miRNA-Konservierung – z. B. sollte es eine sehr hohe (fast exakte) Ähnlichkeit in der Seed-Region geben. Stellen Sie nach dem BLAST sicher, dass die Seed-Region konserviert ist.

Können wir DAVID für die miRNA-Funktionsanalyse verwenden?

Ich glaube nicht, dass DAVID direkt verwendet werden kann (miRNAs müssen in ihrer Datenbank kommentiert werden). Was Sie tun können, ist, dass Sie die Ziele Ihrer miRNA vorhersagen und sie dann an DAVID weitergeben können. DAVID wird die Vorhersagen nicht machen, aber es gibt andere Programme (siehe diesen Beitrag). Sie können auch BioMart (bereitgestellt von ENSEMBL) ausprobieren, um GO-Details zu erhalten. Selbst BioMart bietet keine funktionale Annotation für miRNAs (ich habe nur versucht, dies zu überprüfen). Das Beste ist also, nach den Zielen zu suchen.

Vielen Dank für Ihr Feedback. Ich möchte miRBase verwenden, um diesen Knall zu machen, dessen Standardwortgröße 4 ist, was gut für die Suche nach Homologie in kurzen Sequenzen ist, aber der E-Wert-Grenzwert ist standardmäßig 10, was meiner Meinung nach für miRNA (kurze Sequenz) etwas hoch erscheint seitdem die Wahrscheinlichkeit, zufällig eine gute Nahrung zu haben, steigt, wenn die Sequenzlänge verringert wird, ist es richtig oder nein?
Ja das stimmt. Auch diese Wahrscheinlichkeit steigt, wenn die Datenbankgröße zunimmt. Wenn Sie die Antwort passend finden, können Sie sie akzeptieren (ein Häkchen auf der linken Seite).
OK. Könnten Sie mir in Bezug auf das, was wir besprechen, bitte vorschlagen, was der beste E-Wert-Grenzwert im Fall der miRNA-Homologiesuche ist? Ich bin etwas verwirrt über die Auswahl dieses Parameters.
Lieber Freund, wie Sie sagten, kann DAVID nicht direkt für die miRNA-Analyse verwendet werden. Auch die miRNA-Zielanalyse mit diesem Tool ist eine andere Geschichte. Im Moment liegt mein Fokus auf miRNA, nicht auf ihren Zielen.
@Mary- hat die Antwort bearbeitet. Nein, Sie können miRNA nicht direkt annotieren. Sie müssen zuerst seine Ziele finden. Ein E-Wert von 10 ist in Ordnung (nicht unterschreiten).
Vielen Dank, dass Sie bei mir sind! Was ist mit der Datenbank für reife miRNA und Stammschleifensequenzen, die beide in miRBase verfügbar sind? Welche soll ich als Datenbank wählen? Meine Sorge zu diesem Thema ist, dass ich den besten Treffer der Explosion mit dem bestätigen sollte, was ich im Labor suche.
Ich habe in der Antwort erwähnt - gegen ausgereift ausrichten. Andere Regionen sind nicht so gut erhalten.
10? Wirklich? Ich habe nicht mit miRs gearbeitet, aber 10 scheint extrem hoch zu sein. Tatsächlich würde ich bei der Arbeit an kurzen Nukleotidsequenzen die Verwendung des Evalue überhaupt nicht empfehlen. Ich würde mich stattdessen für eine einfache %id- und %-Abdeckung entscheiden.
@terdon 10 ist sicher. Ich denke, der Online-BLAST verlangt nach einer Evalue-Cutoff. Es weist standardmäßig 10 für kurze Nukleotidsuchen zu. Aber für miRNA denke ich, dass mehr Parameter definiert werden sollten. Ich denke, die Gap-Start-Strafe sollte hoch sein (5`-Region sollte perfekt passen). Die Verwendung eines kurzen Lese-Aligners wie einer Fliege ist auch keine schlechte Idee. Sie können eine Seed-Sequenz festlegen und zulässige Fehlpaarungen in Seed- und Nicht-Seed-Regionen separat definieren.
Absolut. Deine Parameter klingen gut. Ich würde einfach nicht einen Wert von 10 verwenden, um festzustellen, ob ein Treffer interessant war. Ich würde es bei 10 oder höher belassen, um sicherzugehen, dass ich alles bekomme, und es dann ignorieren und nach anderen Dingen filtern, wie Sie vorschlagen.