Mehrere Sequenzalignments werden normalerweise zwischen Sequenzen ähnlicher Länge durchgeführt, was am besten einem globalen Alignment ähnelt. Ich bin mir jedoch überhaupt nicht sicher, was der algorithmische Hintergrund in einem solchen Fall wäre. Ist es im Wesentlichen ein globales oder ein lokales Alignment, wenn man ein multiples Sequenzalignment durchführt?
Es ist gefährlich zu verallgemeinern, da verschiedene Multiple Sequence Alignment (MSA)-Programme durchaus unterschiedliche Algorithmen verwenden können. Da jedoch das Ziel darin besteht, viele Sequenzen über ihre gesamte Länge auszurichten, und alle MSA-Programme, die mir bekannt sind, die Ergebnisse als solche präsentieren, ist es schwierig, sich etwas anderes als den Einsatz einer globalen Ausrichtung vorzustellen .
Für die weit verbreiteten Clustal W und X ist dies sicherlich der Fall. Clustal verwendet einen progressiven Alignment-Algorithmus, der die heuristische Annahme beinhaltet, dass die am engsten ausgerichteten Sequenzen durch paarweises Alignment eine gültige Grundlage für die Reihenfolge sind, in der progressives multiples Alignment durchgeführt wird. Die anfänglichen paarweisen Alignments (die verwendet werden, um einen Führungsbaum zu erzeugen) verwenden dynamisches globales Alignment, ebenso wie jeder progressive Alignment-Schritt, obwohl dieses Alignment ein Profil von zuvor ausgerichteten Sequenzen ist und kontextabhängiges Scoring verwendet.
Es gibt einen ausführlichen Wikipedia-Artikel über MSA und eine der Originalarbeiten von Clustal ist online frei verfügbar. Das hervorragende Buch von Durbin et al. , Biological Sequence Analysis , enthält ein Kapitel zum Thema.
Multiples Sequence Alignment ist eine sehr komplexe Aufgabe und es gibt mehrere Ansätze, je nachdem, wonach Sie suchen.
Eine globale Ausrichtung könnte die insgesamt nächstgelegene Region finden. Es ist jedoch ein bekanntes Problem mit den Längen. Wenn die Sequenzlängen sehr unterschiedlich sind, kann dies zu schlechten Alignments führen.
Beim lokalen Alignment wird nach den am besten passenden Regionen entlang von Sequenzen gesucht.
Es ist allgemein bekannt, dass einige genomische Regionen dazu neigen, mehr Mutationen zu akkumulieren als andere. Hierfür wird die Idee von Domains vorgeschlagen. Die Hauptidee dahinter (und um es einfacher zu machen) ist wie die Durchführung mehrerer lokaler Ausrichtungen, um die optimalen Ausrichtungen für verschiedene Regionen Ihrer Sequenzen zu erhalten.
Es gibt viele Algorithmen, die dazu sehr unterschiedliche Methoden implementiert haben: von paarweisen Ausrichtungen bis hin zu HMM-Profilen.
Ich würde empfehlen, diesen Artikel zu lesen .
Wie James sagte, schließen sich diese Begriffe nicht gegenseitig aus.
deine aussage stimmt nicht:
Mehrere Sequenzalignments werden normalerweise zwischen Sequenzen ähnlicher Länge durchgeführt
Es hängt wirklich davon ab, was Sie mit Ihrem MSA (Multiple Sequence Alignment) erreichen möchten. Zunächst eine kurze Erklärung zum lokalen und globalen Alignment (der Unterschied zwischen diesen beiden wurde zuvor in dieser Frage beschrieben ):
lokales Alignment: Wenn Sie versuchen, einen Teil Ihrer interessierenden Sequenz mit einer anderen Sequenz abzugleichen , könnte dies mit MSA erfolgen, denken Sie an BLAST . Mit BLAST führen Sie ein lokales Sequenz-Alignment mit allen Sequenzen in der Datenbank durch. Wenn Sie dieses lokale Alignment verwenden, konzentrieren Sie sich auf Teile, die sich zwischen Ihrer Sequenz und denen in der Datenbank überschneiden --> Hinweis auf Domänen,
z .Wenn Sie beispielsweise ein globales Alignment mit Sequenzen unterschiedlicher Länge verwenden , werden je nach verwendetem Algorithmus ( Needleman-Wunsch ) Lücken eingefügt, um diese Sequenzen über die gesamte Länge abzugleichen.
Einige praktische Beispiele, wann Sie welche Ausrichtung verwenden sollten:
BEACHTEN SIE, dass diese Vorschläge nur einige Beispiele sind, einige Leute werden eine andere Option bevorzugen .
James