Schritte zur Bestätigung, ob die vorhergesagte miRNA gut oder schlecht ist

Ich habe alle verfügbaren miRNAs an den Supercontigs eines bestimmten Genoms mit bestimmten Parametern ausgerichtet (e-Wert von 0,01 und eine Wortübereinstimmung von mindestens 7, wie in diesem Artikel vorgeschlagen). Ich habe auch die Prä-miRNAs isoliert (+100 Nukleotide von jedem Ende des Übereinstimmungsbereichs). Was würden Sie als ideale Ab-initio-Methoden vorschlagen, um zu bestätigen, dass diese miRNAs in diesem bestimmten Genom existieren? Einige Papiere, die ich gefunden habe, verwenden mFOLD wie dieses .

Was würden Sie als beste Schritte vorschlagen, um zu bestätigen, ob eine vorhergesagte miRNA/Prä-miRNA wirklich im Genom vorhanden ist?

Sie können sich meine Antwort in Ihrem vorherigen Beitrag ansehen . Übrigens, wie haben Sie die miRNA-Sequenzen erhalten?
@WYSIWYG Ich habe alle verfügbaren reifen Sequenzen in miRBase heruntergeladen. Das Entfernen von Duplikaten ist ein Problem. Was würden Sie vorschlagen, ist ein gutes Werkzeug, um doppelte miRNAs unter 30.000 Sequenzen zu entfernen.

Antworten (1)

Es gibt keine Duplikate in miRBase (für einen bestimmten Organismus). Wählen Sie das Taxon, das Ihrem Organismus am nächsten ist, wenn Sie eine auf Homologie basierende Entdeckung durchführen. Wenn Sie alle/viele Organismen nehmen möchten, können Sie fastx_collapserredundante Sequenzen kollabieren. Sie verlieren jedoch den Namen der miRNA. Sie können auch dafür verwenden awkund es behält den Sequenzkopf vom ersten Organismus in der Liste.

awk '/>/{$0=h} !(/>/){if($0 in a){next} else{a[$0];print h"\n"$0}}' organism1.fa organism2.fa ... organismN.fa

Stellen Sie sicher, dass keine zusätzlichen Zeilenumbrüche vorhanden sind, da Sie sonst möglicherweise eine kleine Änderung benötigen

Um zu wissen, ob etwas eine exprimierte miRNA ist, müssten Sie eine kleine RNA-Sequenzierung durchführen. Es gibt einige Tools wie mirdeep und mirSVR, mit denen Sie miRNA-Sequenzen entdecken können.

Muss ich jetzt wirklich mirDeep verwenden, da ich versuche, die bereits vorhandene Liste aller verfügbaren miRNA mit dem Genom abzugleichen, anstatt neue neuartige Sequenzen zu finden? Ich dachte, dafür wäre miRdeep da.
Es findet nicht nur neuartige miRNAs, sondern prüft auch auf Merkmale wie Haarnadelbildung und vergibt Punkte. mirSVR verwendet einen maschinellen Lernalgorithmus, um miRNAs zu finden (ich habe ihn jedoch nie verwendet)