Was sind einige nützliche (Starter-)Metriken für phylogenetische Bäume?

Ich mache ein Computerbiologie-Projekt, in dem ich die Evolution unter verschiedenen Vererbungsregelsätzen simuliere und phylogenetische Bäume erzeuge (schön visualisiert in Python mit ete3 ).

Meine Frage ist: Wo kann ich einige einfache Metriken finden und testen, die diese Bäume in Bezug auf die „Verzweigung“ beschreiben können (man merkt, dass ich kein Bioinformatiker oder Phylogenetiker bin!). Ich suche nach Art von gemeinen Felddeskriptoren der Bäume. Eine Art Gradverteilung für Netzwerke.

Mein spezifisches Ziel ist, wie in der Netzwerkwissenschaft, zu versuchen zu sehen, ob ich zwischen verschiedenen Regelsätzen unterscheiden kann, die den Baum erstellt haben, indem ich die [statistischen] Eigenschaften des Baums selbst untersuche.

Gibt es ein bestimmtes Ziel, das Sie erreichen möchten, indem Sie diese Metriken zwischen verschiedenen Bäumen vergleichen? Man könnte die Anzahl der Äste zählen, die Zeit bis zum gemeinsamen Vorfahren aller vertretenen Linien, die Gesamtmenge der "Evolutionszeit" als Gesamtlänge aller Äste, die mittlere Artbildungszeit, ...
Das spezifische Ziel ist, wie in der Netzwerkwissenschaft, zu versuchen zu sehen, ob ich zwischen verschiedenen Regelsätzen unterscheiden kann, die den Baum erstellt haben, indem ich die [statistischen] Eigenschaften des Baums selbst untersuche.

Antworten (1)

Hier sind ein paar Metriken, die Sie berechnen können, um Ihnen den Einstieg zu erleichtern. Sie können R verwenden, um diese Berechnungen durchzuführen.

Nettodiversifikationsrate (r)

Die Nettodiversifikationsrate ist (Artenbildungsrate - Aussterberate). bd.msSie können es mit den Funktionen oder bd.kmim geigerPaket für R berechnen .

r = 1: Geben Sie hier die Bildbeschreibung ein

r = 2: Geben Sie hier die Bildbeschreibung ein

Baumungleichgewicht: Colless-Index (I)

Der Colless-Index misst, wie unausgeglichen der Baum ist. Es summiert die Unterschiede in der Anzahl der Kladen in jedem Taxapaar. collessSie können es mit der Funktion im apTreeshapePaket für R berechnen .

Ich = 0 Geben Sie hier die Bildbeschreibung ein

Ich = 21 Geben Sie hier die Bildbeschreibung ein

Verzweigungszeiten (Gamma)

Die Gamma-Statistik misst, wie viel später oder früher Verzweigungszeiten auftreten, als Sie es von einem normalen Geburts-Tod-Prozess erwarten würden. Ein negativer Wert bedeutet frühere Verzweigungszeiten, ein positiver spätere Verzweigungszeiten. lttMit der Funktion im R-Paket können Sie Gamma messen (und ein Lineage-Through-Time-Plot (ltt) generieren, wie unten gezeigt) .phytools

(Aus diesem Nature-Artikel )Geben Sie hier die Bildbeschreibung ein

Dies sind nur einige von vielen Parametern, die Sie für einen Stammbaum berechnen könnten. Für den Anfang sollte es reichen.

fantastisch! Vielen Dank. Ich verwende Python, also hoffe ich, dass ich ähnliche Pakete finden kann, um diese Dinge dort zu messen (vielleicht in ete3?)
Prost dafür. Ich werde das überprüfen.