Welcher Algorithmus, um die evolutionäre Beziehung von 5 Sequenzen zu finden?

Nach dem Multiple Sequence Alignment (MSA) werden Datensätze erstellt, auf denen Evolutionsmodelle verwendet werden. Ich habe in Büchern gesehen, dass bei starker Ähnlichkeit zwischen den Sequenzen die maximale Parsimony (MP) verwendet wird, bei geringer Ähnlichkeit die minimale Evolution und bei sehr schwacher Ähnlichkeit die entfernungsbasierte Methode. All dies hat jedoch seine eigenen Nachteile. Da zeichenbasierte Methoden zuverlässiger sind (als Buch), können diese Methoden auch dann verwendet werden, wenn eine geringe Sequenzähnlichkeit besteht? Gibt es einen Algorithmus, der das genaue Baummodell erstellt, ohne die Ähnlichkeit der Sequenzen zu berücksichtigen?

Wie misst man Sequenzähnlichkeit? Auf welches Buch beziehen Sie sich?
Multiples Sequenz-Alignment ? DW Mount, bioinformatische Sequenz- und Genomanalyse..

Antworten (1)

Wenn Sie mit Protein-codierenden Sequenzen arbeiten und diese auf DNA-Ebene zu unterschiedlich sind, dann ist es besser, die Aminosäuresequenz für das Alignment und die phylogenetische Rekonstruktion zu verwenden.

Eine bessere Stichprobe kann Ihnen auch helfen, dazu können Sie die Online-Datenbanken mit BLAST durchsuchen, um ähnliche Sequenzen zu finden, die die Lücke füllen würden.

Das Problem bei Sequenzen mit geringer Sequenzähnlichkeit besteht darin, dass es schwierig ist, homologe Positionen/Zeichen zu identifizieren, und alle Alignment-basierten Verfahren beruhen auf der Annahme, dass die ausgerichteten Positionen homolog sind.

Schließlich gibt es auch Alignment-freie Algorithmen. ( https://en.wikipedia.org/wiki/Alignment-free_sequence_analysis )

Allgemein über Algorithmen für die Phylogenetik:

Heutzutage verlangen Zeitschriften normalerweise, dass Sie eine Maximum-Likelihood- Analyse (ML) oder eine Bayes'sche Analyse durchführen . Beide Methoden werden als modellbasiert bezeichnet. Die dafür am häufigsten verwendeten Programme sind RAxML (ML) und MrBayes (Bayesian). Eine weitere gängige Software ist MEGA (Molecular Evolutionary Genetics Analysis), die verschiedene Baumbildungsalgorithmen ausführen kann.

Normalerweise sind zum schnellen Nachschlagen maximale Sparsamkeit oder benachbarte Bäume gut. Für die Veröffentlichung ist ein Maximum-Likelihood- Baum sehr nützlich, da er einen einzigen besten Baum zurückgibt. Während Bayes'sche Analyse und maximale Sparsamkeit eine Sammlung von Bäumen zurückgeben.

Es ist auch hilfreich, verschiedene Algorithmen zu verwenden, und wenn alle ähnliche Bäume zurückgeben, können Sie sich über die Beziehungen sicherer sein.

Können Sie Quellen hinzufügen, damit Benutzer Ihre Antwort im Hintergrund lesen können? Können Sie uns die Vorteile der in Bezug auf die Frage beschriebenen Methoden nennen? Von jetzt an scheint es eher ein allgemeiner Kommentar als eine Antwort zu sein
Ich habe der Antwort einen etwas gezielteren Teil hinzugefügt. Ich kenne keine genaue Referenz für das, was ich im allgemeinen Teil geschrieben habe. Das höre ich von Kollegen und sehe es in aktuellen Veröffentlichungen.