Valider Vergleich der Genexpression zwischen mehreren Genen in mehreren Zelllinien

Wir verfügen über Genexpressionsdaten (Affimetrix-mRNA-Genexpressionsergebnisse) für mehrere Zelllinien über eine Reihe von Genen. Unser Ziel wäre es, die relative Genexpression für Gene über die verschiedenen Zelllinien hinweg vergleichen zu können.

Die Methode, an die wir bisher gedacht haben, besteht darin, eine Art genbasierten Durchschnitt zu berechnen (die Expression eines bestimmten Gens über alle Linien) und unsere Expressionsdaten, gruppiert nach Gen, darauf basierend zu normalisieren. Wir sind uns jedoch nicht sicher, ob dies eine gültige Methode ist, um relative Expressionsdaten aus unserem Datensatz zu erhalten, insbesondere um die Daten mehrerer Linien zu vergleichen.

Scheint dies eine gültige Strategie zu sein? Wie wird diese Normalisierung üblicherweise durchgeführt? Sollten wir etwas anders machen, um einen besseren Vergleich zu bekommen?

Vielen Dank!

Vielleicht wäre ein formaler statistischer Test wie ANOVA anwendbar.

Antworten (2)

Dies ist keine leichte Aufgabe, da es viele Faktoren zu berücksichtigen gilt. Erstens gibt es Intra-Essay-Unterschiede als leicht unterschiedliche Bedingungen für jeden Satz von Sonden für die Wiederholungen. Dann gibt es Unterschiede zwischen den Assays, wie Unterschiede in den Array-Objektträgern und so weiter, dieses Papier (" Analyse von Mikroarray-Genexpressionsdaten ") geht näher darauf ein.

Diese Artikel könnten auch hilfreich sein:

Was Sie auch tun könnten, ist über das Researchgate zu gehen , ich denke, es gibt mehr Leute mit viel Erfahrung auf diesem Gebiet.

Vielen Dank. Das sind alles tolle Tipps! Ich werde mir die Artikel ansehen und wahrscheinlich zu Researchgate gehen.

Wenn Ihre Daten aus einem einzelnen Labor stammen und ein Standardprotokoll gcrma-Normalisierung ist eine gute Methode (und wird mit dem affy R-Paket geliefert); Wenn die Arrays vom Typ U133A oder HGU133plus2 sind, kann eine eingefrorene RMA eine gute Methode sein. Schließlich können Sie mit ComBat nach Stapeleffekten suchen und diese kontrollieren und die korrigierten Expressionsdaten verwenden.