Die folgende Tabelle stammt aus Deoniers Text Computational Gene Analysis auf S. 152. Dies ist eine Übung zur globalen Sequenzausrichtung und Bewertung alternativer Sequenzen. Der Text schlug eine Lösung vor (in Klammern). Wenn man den oberen linken Teil der Tabelle beiseite legt, scheint es einen besseren Weg zu geben.
Es ist wahrscheinlicher, dass ich die Idee falsch verstehe, als dass es sich um einen Tippfehler handelt.
Wenn ich nur auf die obere linke Ecke schaue,
was -7 gegenüber -8 für den Pfad des Buches zu ergeben scheint. Unten sind die Ausrichtung des Buches und die meiner Bewertung entsprechende, die meinen Fehler aufdecken kann.
Ich hatte keine Probleme, die Matrix zu konstruieren, nur indem ich sie bewertete. Es ist ein kleiner Punkt, aber ich möchte nicht weitermachen, ohne ihn zu verstehen. Danke für jede Hilfe.
Bearbeiten: Beide aktuellen Antworten scheinen diesbezüglich klar zu sein, aber nur der Vollständigkeit halber: eine Übereinstimmung = 1; Nichtübereinstimmung = -1; indel = -2.
Wenn ich mich nicht irre, zeigt die Tabelle die Wege des geringsten Widerstandes. Es gibt viele Wege durch diese Tabelle und es werden nicht alle angezeigt, nur die, die am wenigsten kosten. Sie müssen verstehen, dass eine Nichtübereinstimmung zwischen den Buchstaben -1 kostet (zB - AT), aber ein leeres Quadrat kostet -2 (-A oder -T). Ihre Lösung würde also = -1-3-4-3-2-4 kosten, was ebenfalls -17 ergibt.
Dies ist eine vollständige Ausrichtungstabelle. Der obere Wert geht diagonal, der zweite Wert geht nach unten und der dritte Wert geht nach rechts.
Das Problem ist, dass Sie die T
doppelt verwenden. Lassen Sie uns die Ausrichtung manuell erstellen, wir haben zwei Sequenzen:
>seq1
ATCGT
>seq2
TGGTG
Um also die Ausrichtung mit Ihrem Ansatz zu erstellen, würden wir die erste nt von seq1 nehmen, die A
und die nt mit der höchsten Bewertung aus seq2 auswählen, um sie daran auszurichten. In Ihrem Beispiel wäre das die T
(-1), die Folgendes erzeugt:
A
T
OK, jetzt gehen wir zum nächsten NT von seq1, dem T
. Nun, in Ihrer Tabelle ist die höchste Punktzahl tatsächlich für TT
, aber wir haben bereits die T
von seq2 verwendet , wir können sie nicht noch einmal verwenden! In Ihrer Ausrichtung haben Sie eine -
. Die Punktzahl für T-
Position 2 ist -4. Das bedeutet, dass Ihre Ausrichtung:
ATCGT-
T-GGTG
Hat eine Punktzahl von:
Welches ist:
Während die Ausrichtung des Buches ist:
Welches ist:
T-
eine Punktzahl von steht -10
, verwende ich diese.-
in seq2 ausgerichtet ist, eine Punktzahl von -4 in der Tabelle hat. Die -1 ist, weil TT eine Punktzahl von -1 in der Tabelle hat. Obwohl ich tatsächlich mit solchen Dingen gearbeitet habe, habe ich mich nie eingehend damit beschäftigt, und das ist jetzt ein paar Jahre her, ich kann mich durchaus irren.
Terdon
DovydasG