Ich habe die Wikipedia-Seite über Sequenzausrichtung und Sequenzzusammenstellung gelesen , konnte aber keinen Unterschied zwischen den beiden feststellen. Was ist der Unterschied zwischen Sequenzalignment und Sequenzassemblierung? Wenn es keine Unterschiede gibt, warum sind die Terminologien unterschiedlich?
Sequenzausrichtung
Es wird durchgeführt, um die Sequenzähnlichkeit zwischen zwei oder mehreren unterschiedlichen Sequenzen zu überprüfen . Dies gibt Auskunft darüber, wie sich zwei Sequenzen unterscheiden, was ihre evolutionäre Beziehung ist, welche Reste konserviert sind usw. Schauen Sie sich die folgende Sequenzausrichtung zwischen verschiedenen Sequenzen an. (Bild mit freundlicher Genehmigung: Wikimedia Commons )
Sie können die Konversation verschiedener Aminosäurereste in einer Vielzahl von Organismen wie Mensch, Maus, Ratte usw. sehen.
Sequenzzusammenstellung
Es dient zur Erstellung langer Konsensussequenzen aus kurzen Fragmenten derselben Sequenz . Im Allgemeinen würden Sie die Sequenzzusammenstellung durchführen, nachdem Sie ein Genom oder ein großes DNA-Fragment sequenziert haben. Werfen Sie einen Blick auf das folgende repräsentative Bild der Sequenzmontage (Bild mit freundlicher Genehmigung von Wikimedia Commons )
Hier ist die schwarze Sequenz Ihre ursprüngliche Sequenz, die Sie sequenzieren wollten. Aufgrund technischer Schwierigkeiten können Sie jedoch nicht alle auf einmal sequenzieren. Daher fragmentieren und sequenzieren Sie verschiedene Fragmente, die in Rot, Blau und Grün angezeigt werden). Wenn Sie sich die überlappende Region zwischen verschiedenen sequenzierten Fragmenten ansehen, berechnen Sie den Konsens. Potenziell problematische Wiederholungen werden oberhalb der Sequenz angezeigt (rosa). Hier sequenzieren Sie idealerweise nur eine große Sequenz und setzen sie zusammen.
Die beiden Aufgaben sind sehr unterschiedlich.
Ausrichten bedeutet, Sequenzen zu vergleichen, um Unterschiede zwischen ihnen zu finden.
Zusammensetzen bedeutet, dass Sie ein paar kurze Sequenzen nehmen und versuchen, sie wieder zusammenzufügen, um die ursprüngliche DNA-Sequenz wiederherzustellen.
Abb. 1: Bildschirmaufnahme von DNA Baser Assembler einer „Assemblierung zur Referenz“. Die Referenz ist in lila Farbe. Die Vorwärts- und Rückwärtssequenzen sind rot und grün. Das Contig ist blau.
Hinweis zur Eingabe der beiden Prozesse:
Die Sequenzen, die in ein Alignment eingehen, wurden (angeblich) bereits bereinigt. Jede Basis ist richtig/genau.
Die Sequenzen, die in eine Anordnung eingehen, sind „schmutzig“ und ungenau, weil es sehr wahrscheinlich ist, dass die Sequenziermaschine „schlechte“ Basen an den Enden der Sequenz erzeugt. Der Benutzer muss die Sequenzen manuell überprüfen und bereinigen (obwohl es heute intelligente Assemblierungsprogramme gibt , die den Prozess vollständig automatisieren können, wodurch die Zeit von 10 Minuten pro Contig auf praktisch nichts (unter 1 Sekunde) reduziert wird). Vorzugsweise werden mehrere überlappende Sequenzen zur Redundanz verwendet. Auf diese Weise werden „schlechte“ Basen entdeckt und eliminiert.
Sobald die Montagearbeit abgeschlossen ist, kann das saubere Contig für weitere Operationen (z. B. Ausrichtung) verwendet werden.
Nicht unbedingt. Eine gute Analogie zur Unterscheidung der beiden Sequenzierungsstrategien (nicht zu verwechseln mit Sequenzierungstechnologien, dh Illumina, Smart, Oxford Nanopore usw.) wäre ein Rätsel. Im Fall des Sequenzabgleichs hätten Sie eine Reihe von Puzzleteilen, dh Ihre Reads, und ein Bild des fertigen/abgeschlossenen Puzzles, dh Ihr Referenzgenom, das Sie beim Zusammensetzen des Puzzles anleitet. Bei der Sequenzmontage hat man nur die Puzzleteile und kein Bild, kein Referenzgenom. Dies macht die Montage zu einer viel schwierigeren Aufgabe.
Im ersten Fall würden Sie die N Reads mit nur 1 Referenzgenom vergleichen. Im zweiten Fall würden Sie N Reads mit N „Quasi“-Referenzgenomen vergleichen.
Mädchen101
Dexter
Dateiunterwasser
Dexter
Mädchen101
skymningen
Mädchen101