Bewertung der Sequenzausrichtung

Die folgende Tabelle stammt aus Deoniers Text Computational Gene Analysis auf S. 152. Dies ist eine Übung zur globalen Sequenzausrichtung und Bewertung alternativer Sequenzen. Der Text schlug eine Lösung vor (in Klammern). Wenn man den oberen linken Teil der Tabelle beiseite legt, scheint es einen besseren Weg zu geben.

Es ist wahrscheinlicher, dass ich die Idee falsch verstehe, als dass es sich um einen Tippfehler handelt.

T G G T G ( 0 ) 2 4 6 8 10 EIN ( 2 ) 1 3 5 7 9 T 4 ( 1 ) 2 4 4 6 C 6 3 ( 2 ) 3 5 5 G 8 5 2 ( 1 ) 3 4 T 10 7 4 3 ( 0 ) ( 2 )

Wenn ich nur auf die obere linke Ecke schaue,

( 0 ) 2 4... 2 ( 1 ) 3... 4 ( 1 ) 2... 6 3 ( 2 ) . . .

was -7 gegenüber -8 für den Pfad des Buches zu ergeben scheint. Unten sind die Ausrichtung des Buches und die meiner Bewertung entsprechende, die meinen Fehler aufdecken kann.

EIN : EIN T C G T B : T G G T G

EIN : EIN T C G T B : T G G T G

Ich hatte keine Probleme, die Matrix zu konstruieren, nur indem ich sie bewertete. Es ist ein kleiner Punkt, aber ich möchte nicht weitermachen, ohne ihn zu verstehen. Danke für jede Hilfe.

Bearbeiten: Beide aktuellen Antworten scheinen diesbezüglich klar zu sein, aber nur der Vollständigkeit halber: eine Übereinstimmung = 1; Nichtübereinstimmung = -1; indel = -2.

Antworten (2)

Wenn ich mich nicht irre, zeigt die Tabelle die Wege des geringsten Widerstandes. Es gibt viele Wege durch diese Tabelle und es werden nicht alle angezeigt, nur die, die am wenigsten kosten. Sie müssen verstehen, dass eine Nichtübereinstimmung zwischen den Buchstaben -1 kostet (zB - AT), aber ein leeres Quadrat kostet -2 (-A oder -T). Ihre Lösung würde also = -1-3-4-3-2-4 kosten, was ebenfalls -17 ergibt.

Dies ist eine vollständige Ausrichtungstabelle. Der obere Wert geht diagonal, der zweite Wert geht nach unten und der dritte Wert geht nach rechts.

Eine vollständige Ausrichtungstabelle

Können Sie erklären, wie Sie diese -17 erhalten? Eine Lücke kostet zwischen -2 und -10, je nachdem, welche in der Tabelle im OP steht. Die Punktzahl der Nichtübereinstimmung ändert sich ebenfalls. Woher kommen Ihre Zahlen?
Die Punktzahl eines Mismatch ist immer -2, nur wenn Sie mehr als eine Lücke verwenden, erhöht sie sich mit jeder Lücke um -2. Deshalb ist die obere Zeile -2 (eine Lücke); -4 (zwei Lücken); -6 (drei Lücken) und so weiter. Ich habe erklärt, wie ich -17 = - 1 - 3 - 4 - 3 - 2 - 4 erhalten habe. Sie müssen nur die Werte jeder Stelle addieren.

Das Problem ist, dass Sie die Tdoppelt verwenden. Lassen Sie uns die Ausrichtung manuell erstellen, wir haben zwei Sequenzen:

>seq1
ATCGT
>seq2
TGGTG

Um also die Ausrichtung mit Ihrem Ansatz zu erstellen, würden wir die erste nt von seq1 nehmen, die Aund die nt mit der höchsten Bewertung aus seq2 auswählen, um sie daran auszurichten. In Ihrem Beispiel wäre das die T(-1), die Folgendes erzeugt:

A
T

OK, jetzt gehen wir zum nächsten NT von seq1, dem T. Nun, in Ihrer Tabelle ist die höchste Punktzahl tatsächlich für TT , aber wir haben bereits die Tvon seq2 verwendet , wir können sie nicht noch einmal verwenden! In Ihrer Ausrichtung haben Sie eine -. Die Punktzahl für T-Position 2 ist -4. Das bedeutet, dass Ihre Ausrichtung:

ATCGT-
T-GGTG

Hat eine Punktzahl von:

( EIN T ) p Ö s 1 + ( T ) p Ö s 2 + ( C G ) p Ö s 3 + ( G G ) p Ö s 4 + ( T T ) p Ö s 5 + ( G ) p Ö s 6

Welches ist:

1 4 2 1 10 = 18

Während die Ausrichtung des Buches ist:

( EIN ) p Ö s 1 + ( T T ) p Ö s 2 + ( C G ) p Ö s 3 + ( G G ) p Ö s 4 + ( T T ) p Ö s 5 + ( G ) p Ö s 6

Welches ist:

2 1 2 1 10 = 16

@daniel in diesem Fall ist es wahrscheinlich falsch (mein Ansatz, nicht dein Text). Ich nehme das, was Sie zeigen, aus dem Zusammenhang und verwende einfach die Punktzahl für jede Position. Da in Ihrer Tabelle T-eine Punktzahl von steht -10, verwende ich diese.
Wir stimmen über die Ausrichtungen überein. Warum ist die zweite Punktzahl -4 in meiner Ausrichtung? Das könnte für mich klären.
Wenn Sie sagen, dass die -4 in meiner Punktzahl ist, weil es -2 an der 2. Position ist, warum ist dann -1 an der 4. Position nicht -4? Dies könnte klären.
@daniel die -4 in Ihrer Punktzahl liegt daran, dass ein T in seq1, das an a -in seq2 ausgerichtet ist, eine Punktzahl von -4 in der Tabelle hat. Die -1 ist, weil TT eine Punktzahl von -1 in der Tabelle hat. Obwohl ich tatsächlich mit solchen Dingen gearbeitet habe, habe ich mich nie eingehend damit beschäftigt, und das ist jetzt ein paar Jahre her, ich kann mich durchaus irren.