Wie berechnen Hochdurchsatz-/NGS-Sequenzer Qualitätskennzahlen?

Question

Wie berechnen Hochdurchsatz-/NGS-Sequenzer Qualitätskennzahlen?

Biologie
Genomik
DNA-Sequenzierung
hoher Durchsatz
Sequenzanalyse

ShanZhengYang

Ich bin verwirrt darüber, wie Qualitätsbewertungen tatsächlich von DNA-Sequenzierern wie Illumina berechnet werden. Für jeden Base-Call wird ein gewisser Qualitätsvorhersagewert berechnet, basierend auf verschiedenen Eigenschaften der Sequenzierungsmaschine, wie z. B. der Lichtintensität während des Lesens.

Wissen wir genau, wie diese Qualitätskennzahlen berechnet werden? Wie viele Faktoren fließen genau in die Berechnung dieser QUAL-Werte ein?

Benutzer3234810

nur Erfahrung mit Illumina-Plattformen haben Hier ist ein Link zu den Grundlagen Illumina-Qualitätsinformationen Ausführlichere Illumina-Informationen Werfen Sie einen Blick auf die Referenzen in diesem Dokument, um tiefer zu gehen. (Ich gehe davon aus, dass Sie nicht die Qualitätsbewertungen für Variantenanrufe meinen, die in der von mir verwendeten Pipeline alle nach der Sequenzierung behandelt werden.)

ShanZhengYang

@ user3234810 Danke. Aber ich suchte nach mehr Informationen als das. Es besteht eine gewisse Beziehung zwischen "Signal-to-Noise" und Qualitätswerten. Wie genau Illumina diese berechnet, weiß ich nicht.

WYSIWYG

Die Berechnungen des Qualitätsfaktors sind für verschiedene Maschinentypen unterschiedlich. Speziell an Illumina interessiert?

ShanZhengYang

@WYSIWYG Eigentlich würde jeder Sequenzer ausreichen. Ich habe gerade Illumina als Ausgangspunkt erwähnt.

WYSIWYG

@ShanZhengYang Ich würde vorschlagen, dass Sie Ihre Frage auf eine Art von Maschine (oder Arten von Maschinen mit derselben Basisaufruftechnik) beschränken. Sie können sich nur an Illumina halten. Darüber hinaus gibt es auch für Illumina verschiedene Base-Calling-Ansätze.

ShanZhengYang

@WYSIWYG Das ist vernünftig. Lassen Sie uns die Diskussion auf das Calling von Stützpunkten mit Illumina konzentrieren.

WYSIWYG

@ShanZhengYang Sie können sich meine Antwort ansehen

Antworten (1)

Wie berechnen Hochdurchsatz-/NGS-Sequenzer Qualitätskennzahlen?

nur Erfahrung mit Illumina-Plattformen haben Hier ist ein Link zu den Grundlagen Illumina-Qualitätsinformationen Ausführlichere Illumina-Informationen Werfen Sie einen Blick auf die Referenzen in diesem Dokument, um tiefer zu gehen. (Ich gehe davon aus, dass Sie nicht die Qualitätsbewertungen für Variantenanrufe meinen, die in der von mir verwendeten Pipeline alle nach der Sequenzierung behandelt werden.)
@ user3234810 Danke. Aber ich suchte nach mehr Informationen als das. Es besteht eine gewisse Beziehung zwischen "Signal-to-Noise" und Qualitätswerten. Wie genau Illumina diese berechnet, weiß ich nicht.
Die Berechnungen des Qualitätsfaktors sind für verschiedene Maschinentypen unterschiedlich. Speziell an Illumina interessiert?
@WYSIWYG Eigentlich würde jeder Sequenzer ausreichen. Ich habe gerade Illumina als Ausgangspunkt erwähnt.
@ShanZhengYang Ich würde vorschlagen, dass Sie Ihre Frage auf eine Art von Maschine (oder Arten von Maschinen mit derselben Basisaufruftechnik) beschränken. Sie können sich nur an Illumina halten. Darüber hinaus gibt es auch für Illumina verschiedene Base-Calling-Ansätze.
@WYSIWYG Das ist vernünftig. Lassen Sie uns die Diskussion auf das Calling von Stützpunkten mit Illumina konzentrieren.

WYSIWYG · Answer 1

Ich beschränke diese Antwort auf Illumina. Selbst dann kenne ich die genauen Details der Rohdatenanalyse nicht (es ist eine proprietäre Software).

Grundsätzlich zeichnet Illumina die Sequenz auf der Grundlage von fotografischen Bildern auf. Jedes Nukleotid hat eine eindeutige fluoreszierende Markierung. In einem Zyklus wird ein Nukleotid gepumpt und nicht eingebaute Nukleotide werden abgewaschen (dies wird für alle Nukleotide wiederholt). Ein Laser regt den Fluorophor an und das emittierte Licht wird in Form einer Fotografie festgehalten. Die Matrizen-DNA liegt in Form von Strangclustern (an einer bestimmten Stelle) vor, was eine einfache visuelle Identifizierung der Fluoreszenz ermöglicht.

Base-Calling erfolgt mittels Bildanalyse. Jedes Bild wird auf Intensitäten unterschiedlicher Farben analysiert und daraus der Qualitätswert berechnet. Der Qualitätswert ist im Grunde die Log-Wahrscheinlichkeit eines Nukleotidvorkommens an einer bestimmten Position (basierend auf seiner Farbintensität) im Vergleich zu anderen Nukleotiden.

Dies ist die einfachste Erklärung dafür, wie Illumina Base-Calling durchführt. Es gibt verschiedene Arten von Fehlern und Verzerrungen und es gibt verschiedene statistische Ansätze, um sie zu korrigieren.

Weitere Details finden Sie in den folgenden Referenzen:

Ledergerber, Christian, und Christophe Dessimoz. " Base-Calling für Sequenzierungsplattformen der nächsten Generation ." Briefings in Bioinformatik (2011): bbq077.
Illumina MiSeq-Imaging- und Base-Calling-Kurs
Genomanalyse-Wiki

Wie berechnen Hochdurchsatz-/NGS-Sequenzer Qualitätskennzahlen?

ShanZhengYang

Benutzer3234810

ShanZhengYang

WYSIWYG

ShanZhengYang

WYSIWYG

ShanZhengYang

WYSIWYG

Antworten (1)

WYSIWYG

Welche Faktoren sollte ich bei der Auswahl eines Referenzgenoms für die Kartierung berücksichtigen?

Referenzsequenz zur Definition von Einzelnukleotid-Polymorphismen

Wie genau werden Lücken in der Genomik definiert?

Parameter der Varianten-Calling-Analyse [geschlossen]

Ist es möglich, Fakten über die Eltern einer Person abzuleiten, indem man einfach ihr/sein Genom untersucht?

Wie sehen Illumina HiSeq/MiSeq-Paired-End-Reads aus?

Wo finde ich DNA-Sequenzdaten für Dickdarmkrebs?

Tool zum Nukleotid-Alignment mit allen Nukleotid-Codes (zB R, Y, W, S, etc.)?

Was ist der Unterschied zwischen Sequenzalignment und Sequenzassemblierung?

Ist die DNA-Sequenzierungsabdeckung eine Funktion der Probenreinheit?