Ich arbeite an einer Software, die vergleichende Genomanalysen durchführt; und ich habe in Homologiemethoden für die funktionale Annotation herausgefunden, dass es vorzuziehen ist, das Homolog mit hoher Punktzahl aus einer entfernten Sequenz auszuwählen (dh nicht eng mit der Abfragesequenz im phylogenetischen Baum verwandt).
Meine Frage ist: warum? und könnte auch der für jedes Taxon berechnete NCBI verwendet werden, um diese Entfernung anzunähern? Wenn nicht, gibt es eine einfache Möglichkeit, diese binäre Entscheidung (schließen, nicht schließen) zu treffen, wenn zwei Sequenzen gegeben sind.
Nein, denn es ist wirklich keine binäre Entscheidung. Es gibt Versuche, prozentuale paarweise Unterschiede mit taxonomischen Rängen (insbesondere Arten) in Verbindung zu bringen, aber dies ist problematisch, da jede unabhängige Linie gemäß ihrer eigenen Rate variieren kann. Sie könnten Sequenzen aus verschiedenen Familien oder Ordnungen oder sogar Stämmen verwenden, aber diese beiden können davon abhängen, ob Spezialisten auf diesem Gebiet Lumper oder Splitter sind. Zum Beispiel gehören alle Ameisen derselben Familie an, und Ameisen sind über 100 Millionen Jahre alt, während Vögel, die sich möglicherweise innerhalb der letzten 10 Millionen Jahre von einem gemeinsamen Vorfahren getrennt haben, zu einer anderen Familie gehören. Sie können die paarweise Distanz ODER die Taxonomie auf höherer Ebene als Proxy verwenden. Aber es wäre grob. Warum programmieren Sie Ihre Software nicht, um schwierige Entscheidungen über Homologie zu treffen,
7kemZmani
7kemZmani
Karl Kör