Wo finde ich einige Datensätze mit ausgerichteten Nukleotidsequenzen? Und was soll ich über die Genauigkeit der Ausrichtungen dort annehmen?
(Ich möchte solche Datensätze zum Trainieren des Ausrichtungsmodells verwenden, an dem ich arbeite. Insbesondere, um mir zu helfen, eine Schätzung einiger Parameter zu erhalten, wie z. B. die Häufigkeit einzelner nt INDEL an einigen Orten.)
Sie können das 46-Wege-Multiz-Alignment im UCSC-Genom-Browser finden , es befindet sich im Teil der vergleichenden Genomik und ist als "cons 46-way" gekennzeichnet, was ein Genom-Alignment von 46 Wirbeltierarten ist. Sie können Daten über ihren Genom-Browser auf der Website verwenden oder hier Informationen zum Download erhalten .
Wenn Sie an paarweisen Ausrichtungen interessiert sind, kenne ich keine Datenbank für paarweise Ausrichtungen, aber tatsächlich benötigen Sie keine. Sie können in der NCBI-Nukleotiddatenbank nach Nukleotidsequenzen suchen und sie mit BLAST auf deren Website ausrichten . BLAST ist vielleicht das gebräuchlichste Werkzeug für paarweise Alignments und auch für Datenbank-Alignment-Suchen, bei denen eine einzelne Abfragesequenz in einer Datenbank von Sequenzen nach Übereinstimmungen durchsucht wird. Wenn Sie eine große Anzahl von Ausrichtungen durchführen möchten, können Sie BLAST auf Ihren Computer herunterladen, um sie schneller durchzuführen.
Chris
Anas Elghafari
Behzad Rowshanravan
Anas Elghafari
Anas Elghafari
WYSIWYG
Anas Elghafari
WYSIWYG
Anas Elghafari
Anas Elghafari
WYSIWYG
Anas Elghafari
rmccloskey