Was ist der Unterschied zwischen Sequenzalignment und Sequenzassemblierung?

Ich habe die Wikipedia-Seite über Sequenzausrichtung und Sequenzzusammenstellung gelesen , konnte aber keinen Unterschied zwischen den beiden feststellen. Was ist der Unterschied zwischen Sequenzalignment und Sequenzassemblierung? Wenn es keine Unterschiede gibt, warum sind die Terminologien unterschiedlich?

Antworten (3)

Sequenzausrichtung

Es wird durchgeführt, um die Sequenzähnlichkeit zwischen zwei oder mehreren unterschiedlichen Sequenzen zu überprüfen . Dies gibt Auskunft darüber, wie sich zwei Sequenzen unterscheiden, was ihre evolutionäre Beziehung ist, welche Reste konserviert sind usw. Schauen Sie sich die folgende Sequenzausrichtung zwischen verschiedenen Sequenzen an. (Bild mit freundlicher Genehmigung: Wikimedia Commons )

Geben Sie hier die Bildbeschreibung ein

Sie können die Konversation verschiedener Aminosäurereste in einer Vielzahl von Organismen wie Mensch, Maus, Ratte usw. sehen.

Sequenzzusammenstellung

Es dient zur Erstellung langer Konsensussequenzen aus kurzen Fragmenten derselben Sequenz . Im Allgemeinen würden Sie die Sequenzzusammenstellung durchführen, nachdem Sie ein Genom oder ein großes DNA-Fragment sequenziert haben. Werfen Sie einen Blick auf das folgende repräsentative Bild der Sequenzmontage (Bild mit freundlicher Genehmigung von Wikimedia Commons )

Geben Sie hier die Bildbeschreibung ein

Hier ist die schwarze Sequenz Ihre ursprüngliche Sequenz, die Sie sequenzieren wollten. Aufgrund technischer Schwierigkeiten können Sie jedoch nicht alle auf einmal sequenzieren. Daher fragmentieren und sequenzieren Sie verschiedene Fragmente, die in Rot, Blau und Grün angezeigt werden). Wenn Sie sich die überlappende Region zwischen verschiedenen sequenzierten Fragmenten ansehen, berechnen Sie den Konsens. Potenziell problematische Wiederholungen werden oberhalb der Sequenz angezeigt (rosa). Hier sequenzieren Sie idealerweise nur eine große Sequenz und setzen sie zusammen.

aber es ist das gleiche oder? Ich meine, beide hätten den gleichen Namen haben können ...
Nun ja. Die Sequenzzusammenstellung ist eine Art multiples Sequenz-Alignment! Die Benennung dient dazu, Verwirrung zu vermeiden, denke ich.
@Rishika Wie Dexters Antwort ganz klar zeigt, ist es nicht dasselbe. Es wäre ungenau zu sagen, dass Sie eine Sequenzzusammenstellung durchführen , wenn Sie tatsächlich Genome ( einen Sequenzabgleich ) von verschiedenen Arten vergleichen (z. B. als Teil einer phylogenetischen Analyse). Zu sagen, dass Sie eine Sequenzausrichtung durchführen , wenn Sie eine Sequenzassemblierung durchführen, könnte (für einige Schritte) korrekt sein, ist jedoch leicht irreführend und nicht sehr spezifisch.
@fileunderwater ist richtig. Ich würde sagen, die Sequenzzusammenstellung ist ein Sonderfall der Sequenzausrichtung.
okay, verstanden
@Dexter Wieder ist es nicht. Das Sequenz-Alignment ist ein Teil von Sequenz-Assemblierungsalgorithmen, aber das macht das Assemblieren nicht zu einem Sonderfall des Alignments.
okay, diskussionswürdige Nomenklatur

Die beiden Aufgaben sind sehr unterschiedlich.

Ausrichten bedeutet, Sequenzen zu vergleichen, um Unterschiede zwischen ihnen zu finden.
Zusammensetzen bedeutet, dass Sie ein paar kurze Sequenzen nehmen und versuchen, sie wieder zusammenzufügen, um die ursprüngliche DNA-Sequenz wiederherzustellen.

Bildschirmaufnahme von DNA Baser Assembler einer 'Assemblierung zur Referenz'.  Die Referenz ist in lila Farbe.  Die Vorwärts- und Rückwärtssequenzen sind rot und grün.  Das Contig ist blau.
Abb. 1: Bildschirmaufnahme von DNA Baser Assembler einer „Assemblierung zur Referenz“. Die Referenz ist in lila Farbe. Die Vorwärts- und Rückwärtssequenzen sind rot und grün. Das Contig ist blau.

Hinweis zur Eingabe der beiden Prozesse:

Die Sequenzen, die in ein Alignment eingehen, wurden (angeblich) bereits bereinigt. Jede Basis ist richtig/genau.

Die Sequenzen, die in eine Anordnung eingehen, sind „schmutzig“ und ungenau, weil es sehr wahrscheinlich ist, dass die Sequenziermaschine „schlechte“ Basen an den Enden der Sequenz erzeugt. Der Benutzer muss die Sequenzen manuell überprüfen und bereinigen (obwohl es heute intelligente Assemblierungsprogramme gibt , die den Prozess vollständig automatisieren können, wodurch die Zeit von 10 Minuten pro Contig auf praktisch nichts (unter 1 Sekunde) reduziert wird). Vorzugsweise werden mehrere überlappende Sequenzen zur Redundanz verwendet. Auf diese Weise werden „schlechte“ Basen entdeckt und eliminiert.

Sobald die Montagearbeit abgeschlossen ist, kann das saubere Contig für weitere Operationen (z. B. Ausrichtung) verwendet werden.

rohe Sequenzen
Geben Sie hier die Bildbeschreibung ein

nach umgekehrter Ergänzung
Geben Sie hier die Bildbeschreibung ein

Endkontig
Geben Sie hier die Bildbeschreibung ein

Nicht unbedingt. Eine gute Analogie zur Unterscheidung der beiden Sequenzierungsstrategien (nicht zu verwechseln mit Sequenzierungstechnologien, dh Illumina, Smart, Oxford Nanopore usw.) wäre ein Rätsel. Im Fall des Sequenzabgleichs hätten Sie eine Reihe von Puzzleteilen, dh Ihre Reads, und ein Bild des fertigen/abgeschlossenen Puzzles, dh Ihr Referenzgenom, das Sie beim Zusammensetzen des Puzzles anleitet. Bei der Sequenzmontage hat man nur die Puzzleteile und kein Bild, kein Referenzgenom. Dies macht die Montage zu einer viel schwierigeren Aufgabe.

Im ersten Fall würden Sie die N Reads mit nur 1 Referenzgenom vergleichen. Im zweiten Fall würden Sie N Reads mit N „Quasi“-Referenzgenomen vergleichen.

Beide Vergleiche sind schön, aber nur die halbe Wahrheit. Ich kann zwei Puzzleteile ohne Referenz ausrichten (paarweise Ausrichtung). Und ich kann eine referenzgeführte Montage durchführen (was Sie beschreiben, ist eine De-novo-Montage), indem ich die Ausrichtung an einer eng verwandten Referenz als Leitfaden für die Montage verwende. (also Zusammenbau mit einem Bild, das nicht das aktuelle Puzzle zeigt, sondern ein ähnliches).