Standarddatensätze zum Testen neuer multipler Sequenz-Alignment-Algorithmen?

Gibt es offene und frei verteilte Standarddatensätze zum Testen neuer Algorithmen für multiples Sequenzalignment ?

Willkommen bei Biologie Beta @msa!!! Vielen Dank, dass Sie die wunderbare Frage gestellt haben, aber ich schlage vor, Sie schließen eine der Fragen, die Sie gestellt haben, da sie sich gegenseitig duplizieren.
Ich habe mich das auch immer gefragt, also wäre es toll, eine ausführliche Antwort zu bekommen! Aber könnten Sie sich im Moment nicht ein bekanntes Protein oder eine DNA-Sequenz wie Ras innerhalb eines Organismus oder einer anderen Spezies ansehen und sie abgleichen? Der beste Weg, dies zu tun, ist, zu UniProt ( uniprot.org ) zu gehen und ein Protein wie Ras einzugeben. Sobald Sie ein bestimmtes Ras ausgewählt haben, können Sie unter den phylogenomischen Datenbanken OrthoDB auswählen, und sobald Sie die Seite betreten, können Sie oben auf der Seite FASTA oder Tabulatorgetrennt auswählen!
@DevashishDas Diese Frage ist kein Duplikat der verknüpften Frage, da sie nach einem Standarddatensatz für msa fragt, um einen neuen Algorithmus zu testen, und die vorherige Frage wird, soweit ich das beurteilen kann, nicht beantwortet, sodass sie nicht viel hilft!
@Bez: Ok. Aber sie scheinen schrecklich miteinander verbunden zu sein, sie könnten in einer einzigen Frage gestellt werden. Wie auch immer, ich werde versuchen, beide zu beantworten.

Antworten (1)

Ich würde Ihnen PAcAlCI oder Prediction of Accuracy in Alignments based on Computational Intelligence vorschlagen, obwohl das Akronym in seltsam das Tool gut zum Testen neuer Sequence Alignments ist. Sie

Aber bevor Sie mit dem Testen Ihres Algorithmus beginnen, schlage ich vor, einen Blick auf diese Papiere zu werfen:

[1] Wer beobachtet die Wächter? Eine Bewertung von Benchmarks für Multiple Sequence Alignment

[2] Probleme beim Bioinformatik-Benchmarking: die Fallstudie des multiplen Sequenzalignments

PS: Ich habe das Tool nicht selbst getestet oder verwendet.