Was ist der Unterschied zwischen lokalen und globalen Sequenzalignments?

Es gibt eine Reihe verschiedener Ausrichtungswerkzeuge , und ich möchte mich nicht in der Mathematik dahinter verzetteln, da dies nicht nur von Software zu Software, sondern von Softwareversion zu Version unterschiedlich ist.

Es gibt zwei Hauptunterteilungen in den Programmen; einige verwenden lokale Ausrichtungen und andere globale Ausrichtungen. Meine Frage ist dreifach:

  • Was sind die grundlegenden Unterschiede zwischen den beiden?
  • Was sind jeweils die Vor- und Nachteile?
  • Wann sollte man entweder ein globales oder ein lokales Sequenz-Alignment verwenden?

Antworten (3)

Der grundlegende Unterschied zwischen einem lokalen und einem globalen Alignment besteht darin, dass Sie bei einem lokalen Alignment versuchen, Ihre Abfrage mit einer Teilzeichenfolge (einem Teil) Ihres Betreffs (Referenz) abzugleichen. Während Sie bei einer globalen Ausrichtung eine End-to-End-Ausrichtung mit dem Betreff durchführen (und daher, wie von Mises sagte, können Sie am Ende viele Lücken in der globalen Ausrichtung haben, wenn die Größe von Abfrage und Betreff unterschiedlich ist). Möglicherweise haben Sie auch Lücken in der lokalen Ausrichtung.

Lokale Ausrichtung

5' ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA 3' 
             |||| |||||| |||||||||||||||
          5' TACTCACGGATGAGGTACTTTAGAGGC 3'

Globale Ausrichtung

5' ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA 3'
   |||||||||||    |||||||  |||||||||||||| |||||||
5' ACTACTAGATT----ACGGATC--GTACTTTAGAGGCTAGCAACCA 3'

Ich werde das Beispiel der wohlbekannten dynamischen Programmieralgorithmen geben. Beim Needleman-Wunsch (Global)-Algorithmus erfolgt die Bewertungsverfolgung von der (m,n)-Koordinate, die der unteren rechten Ecke der Bewertungsmatrix (dh dem Ende der ausgerichteten Sequenzen) entspricht, während beim Smith-Waterman (lokal), es wird von dem Element mit der höchsten Punktzahl in der Matrix durchgeführt (dh dem Ende des Paars mit der höchsten Punktzahl). Sie können diese Algorithmen auf Details überprüfen.

Sie können beliebige Bewertungsschemata übernehmen und es gibt keine feste Regel dafür.

Globale Alignments werden normalerweise zum Vergleich homologer Gene durchgeführt, während lokales Alignment verwendet werden kann, um homologe Domänen in ansonsten nicht homologen Genen zu finden.

Globales Alignment ist, wenn Sie die Gesamtheit beider Sequenzen beim Finden von Alignments berücksichtigen, während Sie bei lokalem nur einen kleinen Teil berücksichtigen. Das klingt verwirrend, deshalb hier ein Beispiel:

Nehmen wir an, Sie haben eine große Referenz, vielleicht 2000 bp. Und Sie haben eine Sequenz, die ungefähr 100 bp lang ist. Nehmen wir an, dass die Referenz die Sequenz fast genau enthält. Wenn Sie eine lokale Ausrichtung durchführen würden, hätten Sie eine sehr gute Übereinstimmung. Wenn Sie jedoch eine globale Ausrichtung vorgenommen haben, stimmt sie möglicherweise nicht überein. Stattdessen wird möglicherweise in der gesamten Referenz nach Übereinstimmungen gesucht, sodass Sie am Ende eine Ausrichtung mit vielen großen Lücken erhalten würden. Es spielt keine Rolle, dass es in einer bestimmten Region der Referenz nahezu perfekt übereinstimmt, da es global (dh in der gesamten Referenz) nach Übereinstimmungen sucht.

Wenn Sie eine wirklich gute Übereinstimmung haben, spielt es möglicherweise keine Rolle, welche Art von Ausrichtung Sie verwenden. Aber wenn Sie Diskrepanzen und dergleichen haben, wird es wichtig. Dies liegt an den verwendeten Bewertungsalgorithmen. Nehmen wir im obigen Beispiel an, dass es eine 100-bp-Region in der Referenz gibt, die mit 85 % Genauigkeit mit Ihrer 100-bp-Sequenz übereinstimmt. Bei lokaler Ausrichtung ist es sehr wahrscheinlich, dass es dort ausgerichtet wird. Nehmen wir nun an, dass die ersten 30 bp Ihrer Sequenz mit einer Region am Anfang der Referenz 95 % übereinstimmen, die nächsten 30 bp mit einer Region in der Mitte der Referenz 85 % und die letzten 40 bp mit einer Region am Ende von die Referenz etwa 90%. Bei globaler Ausrichtung ist die beste Übereinstimmung die mit Lücken versehene Ausrichtung, wohingegen bei lokaler Ausrichtung die nicht mit Lücken versehene Ausrichtung am besten wäre. Ich denke, im Allgemeinen sind Gap-Strafen bei globalen Ausrichtungen weniger, aber ich '

Was Sie verwenden möchten, hängt davon ab, was Sie tun. Wenn Sie der Meinung sind, dass Ihre Sequenz eine Untersequenz der Referenz ist, führen Sie ein lokales Alignment durch. Aber wenn Sie denken, dass Ihre gesamte Sequenz mit Ihrer gesamten Referenz übereinstimmen sollte, würden Sie ein globales Alignment durchführen.

Schauen Sie sich die angehängte Bilddatei an. Es wird Ihre Zweifel über den Geben Sie hier die Bildbeschreibung einUnterschied zwischen lokalen und globalen Sequenzausrichtungen ausräumen.

Bitte posten Sie keine Textantworten als Bilddateien auf SE Biology. Dies diskriminiert Menschen mit Sehbehinderungen, die Screenreader verwenden, und ermöglicht keine ordnungsgemäße Indexierung.