Nach dem Multiple Sequence Alignment (MSA) werden Datensätze erstellt, auf denen Evolutionsmodelle verwendet werden. Ich habe in Büchern gesehen, dass bei starker Ähnlichkeit zwischen den Sequenzen die maximale Parsimony (MP) verwendet wird, bei geringer Ähnlichkeit die minimale Evolution und bei sehr schwacher Ähnlichkeit die entfernungsbasierte Methode. All dies hat jedoch seine eigenen Nachteile. Da zeichenbasierte Methoden zuverlässiger sind (als Buch), können diese Methoden auch dann verwendet werden, wenn eine geringe Sequenzähnlichkeit besteht? Gibt es einen Algorithmus, der das genaue Baummodell erstellt, ohne die Ähnlichkeit der Sequenzen zu berücksichtigen?
Wenn Sie mit Protein-codierenden Sequenzen arbeiten und diese auf DNA-Ebene zu unterschiedlich sind, dann ist es besser, die Aminosäuresequenz für das Alignment und die phylogenetische Rekonstruktion zu verwenden.
Eine bessere Stichprobe kann Ihnen auch helfen, dazu können Sie die Online-Datenbanken mit BLAST durchsuchen, um ähnliche Sequenzen zu finden, die die Lücke füllen würden.
Das Problem bei Sequenzen mit geringer Sequenzähnlichkeit besteht darin, dass es schwierig ist, homologe Positionen/Zeichen zu identifizieren, und alle Alignment-basierten Verfahren beruhen auf der Annahme, dass die ausgerichteten Positionen homolog sind.
Schließlich gibt es auch Alignment-freie Algorithmen. ( https://en.wikipedia.org/wiki/Alignment-free_sequence_analysis )
Heutzutage verlangen Zeitschriften normalerweise, dass Sie eine Maximum-Likelihood- Analyse (ML) oder eine Bayes'sche Analyse durchführen . Beide Methoden werden als modellbasiert bezeichnet. Die dafür am häufigsten verwendeten Programme sind RAxML (ML) und MrBayes (Bayesian). Eine weitere gängige Software ist MEGA (Molecular Evolutionary Genetics Analysis), die verschiedene Baumbildungsalgorithmen ausführen kann.
Normalerweise sind zum schnellen Nachschlagen maximale Sparsamkeit oder benachbarte Bäume gut. Für die Veröffentlichung ist ein Maximum-Likelihood- Baum sehr nützlich, da er einen einzigen besten Baum zurückgibt. Während Bayes'sche Analyse und maximale Sparsamkeit eine Sammlung von Bäumen zurückgeben.
Es ist auch hilfreich, verschiedene Algorithmen zu verwenden, und wenn alle ähnliche Bäume zurückgeben, können Sie sich über die Beziehungen sicherer sein.
bli
Pravin Pokhrel