Verwenden alle Mehrfachsequenz-Alignments globale Alignment-Algorithmen?

Mehrere Sequenzalignments werden normalerweise zwischen Sequenzen ähnlicher Länge durchgeführt, was am besten einem globalen Alignment ähnelt. Ich bin mir jedoch überhaupt nicht sicher, was der algorithmische Hintergrund in einem solchen Fall wäre. Ist es im Wesentlichen ein globales oder ein lokales Alignment, wenn man ein multiples Sequenzalignment durchführt?

Globale oder lokale Alignments bedeuten, dass Teile der Sequenz oder die gesamte Sequenz ausgerichtet werden, während multiple Alignments angeben, wie viele Sequenzen ausgerichtet werden sollen (eine oder mehr als eine). Sie schließen sich nicht gegenseitig aus. Siehe " Was ist der Unterschied zwischen lokalen und globalen Sequenzalignments? "

Antworten (3)

Es ist gefährlich zu verallgemeinern, da verschiedene Multiple Sequence Alignment (MSA)-Programme durchaus unterschiedliche Algorithmen verwenden können. Da jedoch das Ziel darin besteht, viele Sequenzen über ihre gesamte Länge auszurichten, und alle MSA-Programme, die mir bekannt sind, die Ergebnisse als solche präsentieren, ist es schwierig, sich etwas anderes als den Einsatz einer globalen Ausrichtung vorzustellen .

Für die weit verbreiteten Clustal W und X ist dies sicherlich der Fall. Clustal verwendet einen progressiven Alignment-Algorithmus, der die heuristische Annahme beinhaltet, dass die am engsten ausgerichteten Sequenzen durch paarweises Alignment eine gültige Grundlage für die Reihenfolge sind, in der progressives multiples Alignment durchgeführt wird. Die anfänglichen paarweisen Alignments (die verwendet werden, um einen Führungsbaum zu erzeugen) verwenden dynamisches globales Alignment, ebenso wie jeder progressive Alignment-Schritt, obwohl dieses Alignment ein Profil von zuvor ausgerichteten Sequenzen ist und kontextabhängiges Scoring verwendet.

Es gibt einen ausführlichen Wikipedia-Artikel über MSA und eine der Originalarbeiten von Clustal ist online frei verfügbar. Das hervorragende Buch von Durbin et al. , Biological Sequence Analysis , enthält ein Kapitel zum Thema.

Multiples Sequence Alignment ist eine sehr komplexe Aufgabe und es gibt mehrere Ansätze, je nachdem, wonach Sie suchen.

Eine globale Ausrichtung könnte die insgesamt nächstgelegene Region finden. Es ist jedoch ein bekanntes Problem mit den Längen. Wenn die Sequenzlängen sehr unterschiedlich sind, kann dies zu schlechten Alignments führen.

Beim lokalen Alignment wird nach den am besten passenden Regionen entlang von Sequenzen gesucht.

Es ist allgemein bekannt, dass einige genomische Regionen dazu neigen, mehr Mutationen zu akkumulieren als andere. Hierfür wird die Idee von Domains vorgeschlagen. Die Hauptidee dahinter (und um es einfacher zu machen) ist wie die Durchführung mehrerer lokaler Ausrichtungen, um die optimalen Ausrichtungen für verschiedene Regionen Ihrer Sequenzen zu erhalten.

Es gibt viele Algorithmen, die dazu sehr unterschiedliche Methoden implementiert haben: von paarweisen Ausrichtungen bis hin zu HMM-Profilen.

Ich würde empfehlen, diesen Artikel zu lesen .

Wie James sagte, schließen sich diese Begriffe nicht gegenseitig aus.
deine aussage stimmt nicht:

Mehrere Sequenzalignments werden normalerweise zwischen Sequenzen ähnlicher Länge durchgeführt

Es hängt wirklich davon ab, was Sie mit Ihrem MSA (Multiple Sequence Alignment) erreichen möchten. Zunächst eine kurze Erklärung zum lokalen und globalen Alignment (der Unterschied zwischen diesen beiden wurde zuvor in dieser Frage beschrieben ):

lokales Alignment: Wenn Sie versuchen, einen Teil Ihrer interessierenden Sequenz mit einer anderen Sequenz abzugleichen , könnte dies mit MSA erfolgen, denken Sie an BLAST . Mit BLAST führen Sie ein lokales Sequenz-Alignment mit allen Sequenzen in der Datenbank durch. Wenn Sie dieses lokale Alignment verwenden, konzentrieren Sie sich auf Teile, die sich zwischen Ihrer Sequenz und denen in der Datenbank überschneiden --> Hinweis auf Domänen,

z .Wenn Sie beispielsweise ein globales Alignment mit Sequenzen unterschiedlicher Länge verwenden , werden je nach verwendetem Algorithmus ( Needleman-Wunsch ) Lücken eingefügt, um diese Sequenzen über die gesamte Länge abzugleichen.

Einige praktische Beispiele, wann Sie welche Ausrichtung verwenden sollten:

  • Erstellen von Profilen einer Gruppe von Proteinen --> globale Ausrichtung
  • Interessiert an homologen Proteinen -> Meistens verwenden Sie ein lokales Sequenz-Alignment, insbesondere wenn Sie wissen, dass die Homologe ziemlich weit entfernt sind, sodass es nicht viel Sequenzähnlichkeit gibt.
  • Durch die Suche nach Proteinen, die eine ähnliche Funktion haben könnten --> lokales Alignment, wird BLAST Ihnen die Proteine ​​geben, die dieselben Domänen haben, zB oder dieselbe Struktur, wenn Sie gegen die PDB-Datenbank sprengen, was Ihnen wichtige Hinweise auf die Funktion des interessierenden Proteins geben kann.

BEACHTEN SIE, dass diese Vorschläge nur einige Beispiele sind, einige Leute werden eine andere Option bevorzugen .

Rick, Englisch ist vielleicht nicht deine Muttersprache, aber das entschuldigt nicht, dass du keine Rechtschreibprüfung verwendest. Wenn Sie Ihre Browsersprache auf Englisch einstellen können (Firefox erlaubt mir, auf Französisch usw. umzuschalten), prüfen die meisten eingegebenen Text auf Rechtschreibung. Andernfalls kopieren Sie den Text in eine Textverarbeitung wie Word, markieren alles, stellen die Sprache auf Englisch (Britisch natürlich ;-) ) und führen eine Rechtschreibprüfung durch.
Danke das werde ich versuchen! , in der Tat werden meine eingegebenen Wörter in meiner Browsersprache (Niederländisch) Rechtschreibprüfung unterzogen. Wenn ich also ein englisches Wort eingebe, wird es geändert oder geteilt, damit es niederländisch aussieht. Eine Änderung meiner Browsereinstellung würde dieses Problem beheben (hoffe ich) @David