Ich mache ein Computerbiologie-Projekt, in dem ich die Evolution unter verschiedenen Vererbungsregelsätzen simuliere und phylogenetische Bäume erzeuge (schön visualisiert in Python mit ete3 ).
Meine Frage ist: Wo kann ich einige einfache Metriken finden und testen, die diese Bäume in Bezug auf die „Verzweigung“ beschreiben können (man merkt, dass ich kein Bioinformatiker oder Phylogenetiker bin!). Ich suche nach Art von gemeinen Felddeskriptoren der Bäume. Eine Art Gradverteilung für Netzwerke.
Mein spezifisches Ziel ist, wie in der Netzwerkwissenschaft, zu versuchen zu sehen, ob ich zwischen verschiedenen Regelsätzen unterscheiden kann, die den Baum erstellt haben, indem ich die [statistischen] Eigenschaften des Baums selbst untersuche.
Hier sind ein paar Metriken, die Sie berechnen können, um Ihnen den Einstieg zu erleichtern. Sie können R verwenden, um diese Berechnungen durchzuführen.
Die Nettodiversifikationsrate ist (Artenbildungsrate - Aussterberate). bd.ms
Sie können es mit den Funktionen oder bd.km
im geiger
Paket für R berechnen .
Der Colless-Index misst, wie unausgeglichen der Baum ist. Es summiert die Unterschiede in der Anzahl der Kladen in jedem Taxapaar. colless
Sie können es mit der Funktion im apTreeshape
Paket für R berechnen .
Die Gamma-Statistik misst, wie viel später oder früher Verzweigungszeiten auftreten, als Sie es von einem normalen Geburts-Tod-Prozess erwarten würden. Ein negativer Wert bedeutet frühere Verzweigungszeiten, ein positiver spätere Verzweigungszeiten. ltt
Mit der Funktion im R-Paket können Sie Gamma messen (und ein Lineage-Through-Time-Plot (ltt) generieren, wie unten gezeigt) .phytools
(Aus diesem Nature-Artikel )
Dies sind nur einige von vielen Parametern, die Sie für einen Stammbaum berechnen könnten. Für den Anfang sollte es reichen.
Remi.b
Krebsstecker