Testen der Monophylie anhand der Log-Wahrscheinlichkeiten pro Standort, ohne die Astlängen zu optimieren

Wie kann ich Protokollwahrscheinlichkeiten pro Standort für eine Topologie gegenüber einer Ausrichtung erhalten, ohne die Verzweigungslängen zu optimieren? (mit welcher software kann ich das machen)

Log-Wahrscheinlichkeiten pro Standort können für verschiedene Tests verwendet werden, ob eine Topologie gut zu den Daten in einem multiplen Sequenz-Alignment passt, z. B. unter Verwendung des Shimodaira-Hasagawa-Tests, des AU-Tests usw.

RAxML, Garli und FastTree und andere Softwarepakete können Log-Wahrscheinlichkeiten pro Standort berechnen, wenn ein Baum-, Alignment- und Substitutionsmodell gegeben ist, aber alle optimieren zuerst automatisch die Verzweigungslängen.

Ich möchte einen Baum testen, in dem ein Sequenzpaar (A und B) monophyletisch ist, wo dies in der Maximum-Likelihood-Topologie nicht der Fall ist. Mein Problem ist, dass, wenn ich einen Baum mit einer Einschränkung ableite, die erfordert, dass A und B monophyletisch sind, die Kantenlänge innerhalb der zulässigen Genauigkeit auf das Minimum gesetzt wird. Aber eine Kantenlänge so nahe bei Null zu haben, macht biologisch keinen Sinn, wenn der Baum eine monophyletische Klade für A und B beschreibt: Die Mindestlänge der Kante muss einer Substitution oder einem Zeichenwechsel entsprechen, sonst sind A und B in a Polytomie, die Klade mit anderen Sequenzen enthält, was nicht das biologische Szenario ist, das ich testen möchte (in diesem Fall gäbe es Unklarheiten bezüglich der Beziehung von A und B zu anderen Gruppen, die aus dieser Polytomie hervorgehen).

So . . . Ich möchte meinen eingeschränkten Baum bearbeiten und die Kantenlänge zum A- und B-Clade auf die minimale Substitutionslänge erhöhen und dann den AU-Test gegen die Pro-Site-Protokollwahrscheinlichkeiten für diese Topologie durchführen. Aber die obige Software optimiert die Kantenlängen und setzt die Kantenlänge zu A und B auf effektiv 0 zurück!

Danke

Antworten (1)

Wenn Sie das Budget dafür haben, empfehle ich Geneious für die Topologiearbeit. Es war letztes Jahr eine echte Ersparnis für mich bei einem epi-Papier.

Auf jeden Fall ermöglichen sie das Testen der Wahrscheinlichkeit pro Protokoll, ohne die Kantenlänge anzupassen. Wenn Sie irgendwo Dummy-Daten aufwerfen möchten, kann ich ein Beispiel aufwerfen. Ich habe keine Verbindung oder Beteiligung mit dem Unternehmen, bin einfach nur glücklich damit.

Es stellt sich heraus, dass die von mir erwähnten Tests (SH, AU) ausschließlich Tests der Topologie und nicht der Zweiglänge sind. Die Wahl beliebiger Verzweigungslängen, wie ich sie vorgeschlagen habe, würde also den Test verzerren (laut Prof. Alexandros Stamatakis; ich gehe davon aus, dass die Wahl einer willkürlichen Topologie keine ähnliche Verzerrung verursacht, da der Test dafür ausgelegt ist). Danke aber für die Beantwortung der Frage.
Ja, deshalb habe ich erwähnt, ohne die Kantenlänge "anzupassen" oder zu skalieren. Ich glaube nicht, dass Sie jemals eine willkürliche Zweiglänge zuweisen möchten, oder zumindest fällt mir kein Grund ein.
Da ein Haufen benachbarter interner Kanten der Länge null eine Polytomie ergibt, aber ein Haufen benachbarter interner Kanten einer Länge ungleich null keine Polytomie - erzeugt es eine Reihe von Kladen mit Ereignissen dazwischen, die aus den Sequenzdaten in abgeleitet werden können genauso kann eine bestimmte Topologie sein. Dies sind verschiedene biologische Hypothesen, die Sie möglicherweise testen möchten, ebenso wie die Zuweisung willkürlicher Topologien verschiedene biologische Hypothesen sind.