Was sind die wichtigsten technischen Unterschiede zwischen der genauen Bestimmung von somatischen Punktmutationen und Kopienzahlvariationen (CNV) in Exomdaten? Nebenbemerkung: Benötigen Sie andere -omische Daten, um CNV genau abzuleiten (Exome-Daten reichen nicht aus)?
Exomdaten können verwendet werden, um sowohl somatische Punktmutationen als auch Kopienzahlvariationen zu bestimmen. Das begrenzende Element für die Erkennungsleistung für beide ist die Anzahl der Lesevorgänge (wie viele Lesevorgänge pro Gen).
Exomdaten: Exomdaten verwenden eine Referenz (bei einem Trio wären das die Eltern; bei Krebs wäre das eine gepaarte normale Probe aus Blut oder nicht-invasivem Gewebe), um festzustellen, ob ein bestimmter Punkt mutiert ist oder nicht. Die Sequenzierung der nächsten Generation ist anfällig für Sequenzierungsfehler, daher ist eine ausreichend hohe Anzahl von Lesevorgängen unerlässlich, um eine somatische Mutation richtig zu benennen. Trotzdem können Probleme mit sich stark wiederholenden Websites dies erschweren.
Die Verwendung von Exomdaten für die Kopienzahl geschieht heutzutage häufig. Die Anzahl der Reads wird als Proxy dafür verwendet, wie viele Kopien vorhanden sind, und das Gleichgewicht der Allele bei einem bestimmten Gen sagt Ihnen, ob es einen Verlust der Heterozygotie gegeben hat. Natürlich erhalten Sie mit Exomdaten keine wirklich genomischen Daten. Aber es gibt genug Abdeckung mit dem Exom, um die großen Ereignisse aufzunehmen.
CNV-Daten: Die Kopienzahlanalyse wird nun herkömmlicherweise unter Verwendung eines hochdichten SNP-Arrays (Single Nucleotide Polymorphism) durchgeführt. Diese sind so konzipiert, dass sie biallelisch sind, und es gibt zwei Arten. Das erste sind die Kopienzahl-SNPs, die so konzipiert sind, dass sie die besten Informationen über die Kopienzahl liefern. Dann gibt es noch die genotypisierenden SNPs, die Auskunft über den Verlust der Heterozygotie geben. Häufig sind SNP-Array-Daten von höherer Qualität, dies wird jedoch von Ihrer Plattform bestimmt. Neuere Plattformen haben eine extrem hohe Abdeckung des Genoms und können es Ihnen ermöglichen, fokale Veränderungen wirklich zu erkennen.
Diese Arrays sind, basierend auf den Empfehlungen des Herstellers, nicht zur Verwendung für somatisches Mutations-Calling bestimmt.
Für bioinformatische Pipelines können Sie ähnliche Tools verwenden. Beispielsweise verfügt das Aroma-Paket in R über Pipelines für Exome- und SNP-Array-Daten. GISTIC 2.0 von Broad kann verwendet werden, um Änderungen der Kopienzahl im Fokus zu finden.
Ein Wort der Vorsicht: Es ist immer am besten, das, was Sie auf einer Plattform finden, mit einer anderen zu validieren. Ich habe kürzlich an einem Papier gearbeitet, das sowohl die Exom-Sequenzierung als auch SNP-Array-Daten verwendet hat, um die Kopienzahl zu bestimmen. Unter Verwendung von GISTIC gab es keine fokalen Peaks, die übereinstimmten. Die breiten chromosomalen Trends waren die gleichen, und das berichtete die Gruppe.
Emil_Longshore
Gaius Augustus
Gaius Augustus
Emil_Longshore