Warum nur heterogene SNVs zur Validierung mit Genotypisierungs-Arrays?

Ich versuche, die Varianten, die ich gefunden habe, mit der Sequenzierung des gesamten Genoms zu validieren. Die Standardpraxis, die ich in den beiden folgenden Veröffentlichungen gesehen habe, bestand darin, die Anzahl der heterozygoten SNPs zu überprüfen, die vom SNP-Array aufgerufen wurden.

1) Leistungsvergleich von Gesamtgenom-Sequenzierungsplattformen

Um die Genauigkeit des Varianten-Calling weiter zu beurteilen, ... Von den 260.112 heterozygoten Calls, die mit dem Omni-Array erkannt wurden, waren 99,5 % im gesamten SNV-Datensatz vorhanden, 99,34 % waren konkordante Calls und nur 0,16 % waren plattformspezifische SNVs. Dies zeigt, dass beide Plattformen empfindlich auf bekannte SNVs reagieren und dass nur wenige bekannte Einzelnukleotid-Polymorphismen (SNPs) von nur einer Plattform erkannt werden.

2) Optimierte Filterung reduziert die Fehlerrate beim Nachweis genomischer Varianten durch Short-Read-Sequenzierung

Um zu bestätigen, dass gemeinsame SNVs tatsächlich echte Varianten sind, haben wir Illumina-Arrays mit Einzelnukleotid-Polymorphismus (SNP) verwendet und alle SNPs ausgewählt, die auf dem SNP-Array heterozygot sind.

Meine Frage ist: Warum werden bei der Verwendung von Illumina Omni-Arrays nur heterozygote SNPs zur Validierung ausgewählt?

Antworten (2)

Der Zweck der Validierung besteht darin, echte SNPs zu finden und nicht solche, die durch Sequenzierungs- oder Amplifikationsfehler verursacht wurden. Es ist äußerst unwahrscheinlich, dass Sie aufgrund eines Fehlers einen falschen homozygoten SNP haben. Denken Sie einfach darüber nach. Der gleiche Fehler, an der gleichen Basis, der in mehr als 80 % der Fälle auftritt? Es wird nicht passieren, es sei denn, Sie haben eine geringe Abdeckung, und diese SNPs sollten sowieso rausgeworfen werden. Möglicherweise gibt es Fälle, in denen ein echter heterozygoter SNP als homozygoter SNP bezeichnet wird. Aber das ist kein großes Problem. Es ist immer noch eine echte SNP. Es wäre nur ein Problem, wenn Sie nur an homozygoten SNPs interessiert wären, in diesem Fall müssen Sie nur alles biochemisch validieren, was Sie sowieso tun müssen.

Ich denke, die Chance, dass eine Sequenzierungsplattform etwas A/A nennt, wenn das Microarray es B/B nennt, ist praktisch gleich Null. Passiert einfach nicht.