Ich habe alle verfügbaren miRNAs an den Supercontigs eines bestimmten Genoms mit bestimmten Parametern ausgerichtet (e-Wert von 0,01 und eine Wortübereinstimmung von mindestens 7, wie in diesem Artikel vorgeschlagen). Ich habe auch die Prä-miRNAs isoliert (+100 Nukleotide von jedem Ende des Übereinstimmungsbereichs). Was würden Sie als ideale Ab-initio-Methoden vorschlagen, um zu bestätigen, dass diese miRNAs in diesem bestimmten Genom existieren? Einige Papiere, die ich gefunden habe, verwenden mFOLD wie dieses .
Was würden Sie als beste Schritte vorschlagen, um zu bestätigen, ob eine vorhergesagte miRNA/Prä-miRNA wirklich im Genom vorhanden ist?
Es gibt keine Duplikate in miRBase (für einen bestimmten Organismus). Wählen Sie das Taxon, das Ihrem Organismus am nächsten ist, wenn Sie eine auf Homologie basierende Entdeckung durchführen. Wenn Sie alle/viele Organismen nehmen möchten, können Sie fastx_collapser
redundante Sequenzen kollabieren. Sie verlieren jedoch den Namen der miRNA. Sie können auch dafür verwenden awk
und es behält den Sequenzkopf vom ersten Organismus in der Liste.
awk '/>/{$0=h} !(/>/){if($0 in a){next} else{a[$0];print h"\n"$0}}' organism1.fa organism2.fa ... organismN.fa
Stellen Sie sicher, dass keine zusätzlichen Zeilenumbrüche vorhanden sind, da Sie sonst möglicherweise eine kleine Änderung benötigen
Um zu wissen, ob etwas eine exprimierte miRNA ist, müssten Sie eine kleine RNA-Sequenzierung durchführen. Es gibt einige Tools wie mirdeep und mirSVR, mit denen Sie miRNA-Sequenzen entdecken können.
WYSIWYG
Das letzte Wort