Phylogenetische Distanz zwischen Sequenzen finden?

Ich arbeite an einer Software, die vergleichende Genomanalysen durchführt; und ich habe in Homologiemethoden für die funktionale Annotation herausgefunden, dass es vorzuziehen ist, das Homolog mit hoher Punktzahl aus einer entfernten Sequenz auszuwählen (dh nicht eng mit der Abfragesequenz im phylogenetischen Baum verwandt).

Meine Frage ist: warum? und könnte auch der für jedes Taxon berechnete NCBI verwendet werden, um diese Entfernung anzunähern? Wenn nicht, gibt es eine einfache Möglichkeit, diese binäre Entscheidung (schließen, nicht schließen) zu treffen, wenn zwei Sequenzen gegeben sind.

Antworten (1)

Nein, denn es ist wirklich keine binäre Entscheidung. Es gibt Versuche, prozentuale paarweise Unterschiede mit taxonomischen Rängen (insbesondere Arten) in Verbindung zu bringen, aber dies ist problematisch, da jede unabhängige Linie gemäß ihrer eigenen Rate variieren kann. Sie könnten Sequenzen aus verschiedenen Familien oder Ordnungen oder sogar Stämmen verwenden, aber diese beiden können davon abhängen, ob Spezialisten auf diesem Gebiet Lumper oder Splitter sind. Zum Beispiel gehören alle Ameisen derselben Familie an, und Ameisen sind über 100 Millionen Jahre alt, während Vögel, die sich möglicherweise innerhalb der letzten 10 Millionen Jahre von einem gemeinsamen Vorfahren getrennt haben, zu einer anderen Familie gehören. Sie können die paarweise Distanz ODER die Taxonomie auf höherer Ebene als Proxy verwenden. Aber es wäre grob. Warum programmieren Sie Ihre Software nicht, um schwierige Entscheidungen über Homologie zu treffen,

Beziehen Sie sich auf diese Methoden: en.wikipedia.org/wiki/Distance_matrices_in_phylogeny
und was ist auch der Grund für die Auswahl eines Homologs, das nicht eng mit der Abfragesequenz verwandt ist? ist die Sequenz taxid überhaupt sinnvoll?
Ja, die Entfernung kann einfach berechnet werden, indem die Unterschiede zwischen Paaren gezählt und diese Entfernungen dann manchmal mit verschiedenen Modellen korrigiert werden, die davon ausgehen, dass einige dieser Änderungen durch mehrere Änderungen an denselben Stellen maskiert werden. Das Taxid erzählt von der Klassifizierung. Wenn Sie ein weit von der Abfrage entferntes Homolog auswählen, erhalten Sie mehr Informationen darüber, wie stark sich ein Gen im Laufe der Zeit verändern kann.