Aufrufen von Änderungen in Exomdaten

Was sind die wichtigsten technischen Unterschiede zwischen der genauen Bestimmung von somatischen Punktmutationen und Kopienzahlvariationen (CNV) in Exomdaten? Nebenbemerkung: Benötigen Sie andere -omische Daten, um CNV genau abzuleiten (Exome-Daten reichen nicht aus)?

Antworten (1)

Exomdaten können verwendet werden, um sowohl somatische Punktmutationen als auch Kopienzahlvariationen zu bestimmen. Das begrenzende Element für die Erkennungsleistung für beide ist die Anzahl der Lesevorgänge (wie viele Lesevorgänge pro Gen).

Exomdaten: Exomdaten verwenden eine Referenz (bei einem Trio wären das die Eltern; bei Krebs wäre das eine gepaarte normale Probe aus Blut oder nicht-invasivem Gewebe), um festzustellen, ob ein bestimmter Punkt mutiert ist oder nicht. Die Sequenzierung der nächsten Generation ist anfällig für Sequenzierungsfehler, daher ist eine ausreichend hohe Anzahl von Lesevorgängen unerlässlich, um eine somatische Mutation richtig zu benennen. Trotzdem können Probleme mit sich stark wiederholenden Websites dies erschweren.

Die Verwendung von Exomdaten für die Kopienzahl geschieht heutzutage häufig. Die Anzahl der Reads wird als Proxy dafür verwendet, wie viele Kopien vorhanden sind, und das Gleichgewicht der Allele bei einem bestimmten Gen sagt Ihnen, ob es einen Verlust der Heterozygotie gegeben hat. Natürlich erhalten Sie mit Exomdaten keine wirklich genomischen Daten. Aber es gibt genug Abdeckung mit dem Exom, um die großen Ereignisse aufzunehmen.

CNV-Daten: Die Kopienzahlanalyse wird nun herkömmlicherweise unter Verwendung eines hochdichten SNP-Arrays (Single Nucleotide Polymorphism) durchgeführt. Diese sind so konzipiert, dass sie biallelisch sind, und es gibt zwei Arten. Das erste sind die Kopienzahl-SNPs, die so konzipiert sind, dass sie die besten Informationen über die Kopienzahl liefern. Dann gibt es noch die genotypisierenden SNPs, die Auskunft über den Verlust der Heterozygotie geben. Häufig sind SNP-Array-Daten von höherer Qualität, dies wird jedoch von Ihrer Plattform bestimmt. Neuere Plattformen haben eine extrem hohe Abdeckung des Genoms und können es Ihnen ermöglichen, fokale Veränderungen wirklich zu erkennen.

Diese Arrays sind, basierend auf den Empfehlungen des Herstellers, nicht zur Verwendung für somatisches Mutations-Calling bestimmt.


Für bioinformatische Pipelines können Sie ähnliche Tools verwenden. Beispielsweise verfügt das Aroma-Paket in R über Pipelines für Exome- und SNP-Array-Daten. GISTIC 2.0 von Broad kann verwendet werden, um Änderungen der Kopienzahl im Fokus zu finden.

Ein Wort der Vorsicht: Es ist immer am besten, das, was Sie auf einer Plattform finden, mit einer anderen zu validieren. Ich habe kürzlich an einem Papier gearbeitet, das sowohl die Exom-Sequenzierung als auch SNP-Array-Daten verwendet hat, um die Kopienzahl zu bestimmen. Unter Verwendung von GISTIC gab es keine fokalen Peaks, die übereinstimmten. Die breiten chromosomalen Trends waren die gleichen, und das berichtete die Gruppe.

Danke, wirklich schön und verständlich formuliert. Würden RNA-Seq-Daten im Nachhinein dazu beitragen, einige der Verwirrung zu beseitigen, die mit stark repetitiven exomischen Daten verbunden sind, möglicherweise durch den Vergleich übereinstimmender normaler und tumortranskriptomischer Daten? Würde die Verwendung von DNA-Microarray-Daten Ihnen auch dabei helfen, auf Variationen in der Kopienzahl zu schließen?
Expressionsdaten informieren Sie nur über Expressions-(Transkriptions-)Ebenen, nicht unbedingt über die inhärente Kopienzahl. Allerdings besteht ein Zusammenhang. Es kommt auf die wissenschaftliche Fragestellung an. RNA-Daten sind SEHR nützliche zusätzliche Daten, da sie es Ihnen ermöglichen, Gewinne oder Verluste mit Änderungen des Transkriptionsniveaus in Verbindung zu bringen (was wohl biologisch interessanter sein kann)!
Mein Verständnis ist, dass DNA-Microarrays (wie sie in CGH verwendet werden) Informationen zur Kopienzahl, aber keine LOH-Informationen liefern und daher kein vollständiges Bild davon geben, was vor sich geht. Beispielsweise können Sie 2 Kopien haben, aber ein elterliches Allel verloren haben (und somit das andere elterliche Allel dupliziert haben). Dies würde in CGH nicht angezeigt, verwendet jedoch SNP-Array-Daten.
1) Richtig – es hört sich so an, als müssten Sie die DNA-Microarray-Daten mit vollständigen Exom- oder Genomdaten kombinieren, um diese Verbindung herzustellen. 2) Vielen Dank!! Würde es Ihnen etwas ausmachen zu stimmen?