Was ist der Unterschied zwischen Sequenzalignment und Sequenzassemblierung?

Question

Was ist der Unterschied zwischen Sequenzalignment und Sequenzassemblierung?

Biologie
DNA-Sequenzierung
Sequenzanalyse
Sequenz-Montage
Sequenz-Ausrichtung

Mädchen101

Ich habe die Wikipedia-Seite über Sequenzausrichtung und Sequenzzusammenstellung gelesen , konnte aber keinen Unterschied zwischen den beiden feststellen. Was ist der Unterschied zwischen Sequenzalignment und Sequenzassemblierung? Wenn es keine Unterschiede gibt, warum sind die Terminologien unterschiedlich?

Antworten (3)

Was ist der Unterschied zwischen Sequenzalignment und Sequenzassemblierung?

Dexter · Answer 1

Sequenzausrichtung

Es wird durchgeführt, um die Sequenzähnlichkeit zwischen zwei oder mehreren unterschiedlichen Sequenzen zu überprüfen . Dies gibt Auskunft darüber, wie sich zwei Sequenzen unterscheiden, was ihre evolutionäre Beziehung ist, welche Reste konserviert sind usw. Schauen Sie sich die folgende Sequenzausrichtung zwischen verschiedenen Sequenzen an. (Bild mit freundlicher Genehmigung: Wikimedia Commons )

Sie können die Konversation verschiedener Aminosäurereste in einer Vielzahl von Organismen wie Mensch, Maus, Ratte usw. sehen.

Sequenzzusammenstellung

Es dient zur Erstellung langer Konsensussequenzen aus kurzen Fragmenten derselben Sequenz . Im Allgemeinen würden Sie die Sequenzzusammenstellung durchführen, nachdem Sie ein Genom oder ein großes DNA-Fragment sequenziert haben. Werfen Sie einen Blick auf das folgende repräsentative Bild der Sequenzmontage (Bild mit freundlicher Genehmigung von Wikimedia Commons )

Hier ist die schwarze Sequenz Ihre ursprüngliche Sequenz, die Sie sequenzieren wollten. Aufgrund technischer Schwierigkeiten können Sie jedoch nicht alle auf einmal sequenzieren. Daher fragmentieren und sequenzieren Sie verschiedene Fragmente, die in Rot, Blau und Grün angezeigt werden). Wenn Sie sich die überlappende Region zwischen verschiedenen sequenzierten Fragmenten ansehen, berechnen Sie den Konsens. Potenziell problematische Wiederholungen werden oberhalb der Sequenz angezeigt (rosa). Hier sequenzieren Sie idealerweise nur eine große Sequenz und setzen sie zusammen.

aber es ist das gleiche oder? Ich meine, beide hätten den gleichen Namen haben können ...
Nun ja. Die Sequenzzusammenstellung ist eine Art multiples Sequenz-Alignment! Die Benennung dient dazu, Verwirrung zu vermeiden, denke ich.
@Rishika Wie Dexters Antwort ganz klar zeigt, ist es nicht dasselbe. Es wäre ungenau zu sagen, dass Sie eine Sequenzzusammenstellung durchführen , wenn Sie tatsächlich Genome ( einen Sequenzabgleich ) von verschiedenen Arten vergleichen (z. B. als Teil einer phylogenetischen Analyse). Zu sagen, dass Sie eine Sequenzausrichtung durchführen , wenn Sie eine Sequenzassemblierung durchführen, könnte (für einige Schritte) korrekt sein, ist jedoch leicht irreführend und nicht sehr spezifisch.
@fileunderwater ist richtig. Ich würde sagen, die Sequenzzusammenstellung ist ein Sonderfall der Sequenzausrichtung.
@Dexter Wieder ist es nicht. Das Sequenz-Alignment ist ein Teil von Sequenz-Assemblierungsalgorithmen, aber das macht das Assemblieren nicht zu einem Sonderfall des Alignments.

Schwere · Answer 2

Die beiden Aufgaben sind sehr unterschiedlich.

Ausrichten bedeutet, Sequenzen zu vergleichen, um Unterschiede zwischen ihnen zu finden.
Zusammensetzen bedeutet, dass Sie ein paar kurze Sequenzen nehmen und versuchen, sie wieder zusammenzufügen, um die ursprüngliche DNA-Sequenz wiederherzustellen.

Abb. 1: Bildschirmaufnahme von DNA Baser Assembler einer „Assemblierung zur Referenz“. Die Referenz ist in lila Farbe. Die Vorwärts- und Rückwärtssequenzen sind rot und grün. Das Contig ist blau.

Hinweis zur Eingabe der beiden Prozesse:

Die Sequenzen, die in ein Alignment eingehen, wurden (angeblich) bereits bereinigt. Jede Basis ist richtig/genau.

Die Sequenzen, die in eine Anordnung eingehen, sind „schmutzig“ und ungenau, weil es sehr wahrscheinlich ist, dass die Sequenziermaschine „schlechte“ Basen an den Enden der Sequenz erzeugt. Der Benutzer muss die Sequenzen manuell überprüfen und bereinigen (obwohl es heute intelligente Assemblierungsprogramme gibt , die den Prozess vollständig automatisieren können, wodurch die Zeit von 10 Minuten pro Contig auf praktisch nichts (unter 1 Sekunde) reduziert wird). Vorzugsweise werden mehrere überlappende Sequenzen zur Redundanz verwendet. Auf diese Weise werden „schlechte“ Basen entdeckt und eliminiert.

Sobald die Montagearbeit abgeschlossen ist, kann das saubere Contig für weitere Operationen (z. B. Ausrichtung) verwendet werden.

rohe Sequenzen

nach umgekehrter Ergänzung

Endkontig

AminomiX · Answer 3

Nicht unbedingt. Eine gute Analogie zur Unterscheidung der beiden Sequenzierungsstrategien (nicht zu verwechseln mit Sequenzierungstechnologien, dh Illumina, Smart, Oxford Nanopore usw.) wäre ein Rätsel. Im Fall des Sequenzabgleichs hätten Sie eine Reihe von Puzzleteilen, dh Ihre Reads, und ein Bild des fertigen/abgeschlossenen Puzzles, dh Ihr Referenzgenom, das Sie beim Zusammensetzen des Puzzles anleitet. Bei der Sequenzmontage hat man nur die Puzzleteile und kein Bild, kein Referenzgenom. Dies macht die Montage zu einer viel schwierigeren Aufgabe.

Im ersten Fall würden Sie die N Reads mit nur 1 Referenzgenom vergleichen. Im zweiten Fall würden Sie N Reads mit N „Quasi“-Referenzgenomen vergleichen.

Beide Vergleiche sind schön, aber nur die halbe Wahrheit. Ich kann zwei Puzzleteile ohne Referenz ausrichten (paarweise Ausrichtung). Und ich kann eine referenzgeführte Montage durchführen (was Sie beschreiben, ist eine De-novo-Montage), indem ich die Ausrichtung an einer eng verwandten Referenz als Leitfaden für die Montage verwende. (also Zusammenbau mit einem Bild, das nicht das aktuelle Puzzle zeigt, sondern ein ähnliches).

Was ist der Unterschied zwischen Sequenzalignment und Sequenzassemblierung?

Mädchen101

Antworten (3)

Dexter

Mädchen101

Dexter

Dateiunterwasser

Dexter

Mädchen101

skymningen

Mädchen101

Schwere

AminomiX

skymningen

Welche Faktoren sollte ich bei der Auswahl eines Referenzgenoms für die Kartierung berücksichtigen?

Was begrenzt heute die Genauigkeit der Genomsequenzierung?

Was ist die typische Anordnung amplifizierter Gene im Archaea-Genom?

Wie interpretiert man die von Clustal Omega erstellte prozentuale Identitätsmatrix?

Standarddatensätze zum Testen neuer multipler Sequenz-Alignment-Algorithmen?

Was ist der Unterschied zwischen lokalen und globalen Sequenzalignments?

Wie vergleicht man Implementierungen von Smith-Waterman-Algorithmen?

Wie sehen Illumina HiSeq/MiSeq-Paired-End-Reads aus?

Aufbau der Lese- und Genregion (IGV)

Tool zum Nukleotid-Alignment mit allen Nukleotid-Codes (zB R, Y, W, S, etc.)?