Was bedeuten Sondennummer und Segmentierung in Daten der Kopienzahlvariation (CNV).

In den Daten der TCGA-Kopiennummervariation (CNV) gibt es eine Spalte mit dem Titel Num_Probes. Was bedeutet die Sondennummer in Bezug auf die folgenden Probendaten?

Chromosome  Start   End Num_Probes  Segment_Mean
1   61735   62152   4   1.1973
1   62920   12777697    6514    2.2882

Laut Wikipedia sind Sonden normalerweise 100-1000 Basen lang. Dann bedeutet es in der ersten Reihe darüber, dass 4 Sonden benötigt wurden, um die Region zu identifizieren (61735 - 62152). Was wäre in diesem Fall die Bedeutung von Segment_Mean?

Antworten (1)

Die von Ihnen geposteten Daten scheinen von GISTIC erstellt worden zu sein , einem Programm, das häufig von TCGA verwendet wird , um Änderungen der Kopienzahl zu erkennen. Unter der Annahme, dass die Daten wirklich von GISTIC produziert werden, bezieht sich "Segment_Mean" meines Wissens auf das durchschnittliche Log2-Verhältnis der Sonden in diesem bestimmten Segment. Sieht so aus, als ob die Kopienzahl Ihres 4-Sonden-Segments in Ihrem Beispiel etwas weniger als die Hälfte der Kopienzahl des längeren Segments ist.

Sie können auch versuchen, die GISTIC Google-Gruppe zu verwenden, um mehr zu erfahren.

Wenn eine Probe eine CNV-Verstärkung bei 12792599 - 13278863 mit Sonde Nr. 100 und einem Segmentierungs-Mittelwert von 0,4 aufweist und wenn eine andere Probe ebenfalls eine CNV-Verstärkung an derselben Position 12792599 - 13278863 mit Sonde Nr. 200 und einem Segmentierungs-Mittelwert von 0,5 aufweist, bedeutet dies die 2. CNV-Region ist wichtiger als die 1. CNV-Region? Ich verstehe die Bedeutung der Segmentierung hier nicht.
Vereinfachte Antwort: Höheres Segment bedeutet == höhere Kopienzahl. Die Anzahl der Sonden für jede Region spielt wahrscheinlich keine Rolle. Auch eine Differenz von 0,1 zwischen den Segmentmittelwerten der einzelnen Regionen spielt wahrscheinlich auch keine große Rolle.