Festlegen eines angemessenen Schwellenwerts für die Variation der Kopienzahl in einem CNV (SNP-Array) TCGA-Datensatz

Gibt es eine Methode zur Auswahl eines angemessenen Schwellenwerts für die Variation der Kopienzahl in einem CNV-TCGA-Datensatz (SNP-Array), um zu definieren, wann eine signifikante Änderung vorliegt?

Kann ich CNV-Daten für normale Proben herunterladen und das 95. Perzentil der Verteilung nehmen? Gibt es bessere Methoden?

Aktualisieren

Dies ist das Perzentildiagramm der beiden Verteilungen (Tumor vs. Normal) von Werten für dieselbe Technologie (SNP-Array) und dasselbe Genom (hg19).

Die Tumorverteilung hat etwas extremere Werte, reicht meiner Meinung nach aber nicht aus. Aus diesem Grund denke ich, dass ich keinen Perzentilwert (zum Beispiel das 5. und 95. Perzentil der normalen Probenverteilung) verwenden sollte, um die Schwellenwerte zu definieren, um CNV-Veränderungen in den Tumorproben zu nennen.

Verteilungen

Antworten (2)

Ihr vorgeschlagener Ansatz, Punkt für Punkt mit der Basislinienverteilung zu vergleichen, ist nicht schlecht, obwohl er anfällig für kleine Fehlalarme durch Rauschen sein wird. Wahrscheinlich möchten Sie nur Ereignisse verwenden, die sich über eine bestimmte Mindestanzahl aufeinanderfolgender Beobachtungen erstrecken.

Vielleicht möchten Sie sich auch mit der kreisförmigen binären Segmentierung befassen, wie hier beschrieben: http://www.ncbi.nlm.nih.gov/pubmed/15475419 .

Ich habe meine Frage aktualisiert, könnten Sie sie sich bitte ansehen und mir Ihre Meinung sagen?
Hmm, okay, ich glaube, ich verstehe. Nein, Sie möchten nicht die Intensität des Tumors an einer bestimmten Position mit der 5-95 %-Verteilung der Normalverteilung über das gesamte Array vergleichen. Sie möchten die Intensität des Tumors an einer Position mit dem Normalwert an dieser Position vergleichen . Dadurch werden sequenzspezifische Bindungsunterschiede normalisiert.

Es gibt viele Methoden zur Analyse von CNV. Wenn Sie ein R - Benutzer sind, würde ich Ihnen empfehlen, einen Blick auf die Bioconductor -Paketliste zu werfen, insbesondere auf den Abschnitt für Variationen der Exemplarnummer . Derzeit enthält es 50 Pakete!