Sequenzierung an der Primerstelle ungenau

Die Zeiten, zu denen ich eine Probe zur Sequenzierung geschickt habe, sowohl die Vorwärts- als auch die Rückwärtsprimerstellen, zeigen eine hohe Ungenauigkeit, während der Rest des Gens korrekt sequenziert ist. Aus diesem Grund stimmen die Sequenzen meines in silico -Konstrukts und der sequenzierten Probe in diesem Abschnitt nicht überein; aber sie richten sich fast zu 100 % am Rest des Gens aus.

Gibt es dafür einen Grund? Ist dies einfach ein Sequenzierungsartefakt oder sollte ich der sequenzierten Probe vertrauen und davon ausgehen, dass die Primerstellen mutiert sind?

Der Anfang ist immer Müll, das kann man getrost vernachlässigen. Die Tatsache, dass Sie überhaupt ein Sequenzierungsergebnis haben, bedeutet jedoch, dass das 3'-Ende Ihres Primers mit der Vorlage übereinstimmt.

Antworten (1)

Die äußersten Enden der Sequenzierungs-Reads, die von den meisten, wenn nicht allen Sequenzierungstechnologien erhalten werden, sind normalerweise von geringerer Qualität, obwohl dies häufiger in der 5'-Region der Fall ist. Sie sollten diese Daten ignorieren oder noch besser weiter entfernte Primer entwerfen, um auch diese Region einzukapseln, wenn Sie sie dringend benötigen.

Unten sehen Sie eine ziemlich typische Ausgabe der FASTQC-Analyse von Illumina-Sequenzierungsdaten. Sie können sehen, wie die Qualität in der Mitte des Lesevorgangs ihren Höhepunkt erreicht (Basisindex auf der x-Achse). Sie würden wahrscheinlich etwas Ähnliches für die Sanger-Sequenzierung sehen, die Sie vermutlich verwenden.

Geben Sie hier die Bildbeschreibung ein

Was würde eine gute Note bedeuten? und was wäre eine gute Note? Ich stelle mir anhand der Farben vor, dass alles auf Grün gut ist, aber nur um ein bisschen mehr über die Sequenzierung zu erfahren.
Es kann je nach Sequenzierungstechnologie variieren, aber die meisten Techniker verwenden heutzutage etwas, das als „Phred-33“-Scoring bezeichnet wird. Es ist eine logarithmische Beziehung, die grob gesagt bedeutet, dass ein Phred-Wert von 30 (auf der Y-Achse im Bild oben) bedeutet, dass die Wahrscheinlichkeit, dass Base falsch aufgerufen wurde, nur 1 zu 1000 beträgt. Die meisten Menschen akzeptieren 30 als angemessene Qualität für die Sequenzierung, was auch durch die Tatsache unterstützt wird, dass Sie viele Millionen überlappender Reads (in NGS) haben. Selbst wenn also eine Base in 1 Read falsch angegeben wird, gibt es wahrscheinlich viele andere Reads, auf die Sie sich beziehen können dazu wäre der richtige ruf.