Ich arbeite an der Analyse einer großen Anzahl von Microarray-Dateien. Ich habe versucht, die Notwendigkeit der Normalisierung von Microarray-Daten zu verstehen, und bin diesen Artikel von John Quackenbush (2002) durchgegangen . In der Abhandlung erwähnt der Autor das
Es gibt eine Reihe von Gründen, warum Daten normalisiert werden müssen, darunter ungleiche Mengen an Ausgangs-RNA, Unterschiede in der Markierungs- oder Nachweiseffizienz zwischen den verwendeten Fluoreszenzfarbstoffen und systematische Abweichungen in den gemessenen Expressionsniveaus
Dann spricht er über einfache Normalisierungstechniken. Unter der Annahme, dass die über alle Elemente in den Arrays summierten Gesamthybridisierungsintensitäten für jede Probe gleich sein sollten, definiert er einen Normalisierungsfaktor , der durch Summieren der gemessenen Intensitäten in beiden Kanälen berechnet wird.
wobei G i und R i die gemessenen Intensitäten für das 'i'-te Array-Element sind (z. B. die grünen und roten (oder experimentellen und Kontroll-) Intensitäten in einem zweifarbigen Microarray-Assay) und N Array die Gesamtzahl der Elemente ist im Mikroarray vertreten.
Dann sagt der Autor das -
Das ist der Teil, den ich nicht verstehe. Was muss eingeführt werden , und warum sind sie, was sie sind? Am wichtigsten ist, warum ist gleich zuerst und dann ( )*( )?
Irgendwelche Ideen?
Und sind normalisierte Werte von Und .
Nehmen Sie sagen G als und R wie als Ihre Werte und Sie möchten sie normalisieren. Dies skaliert einen von ihnen auf den anderen und bringt sie zum Vergleich auf eine gleiche Ebene. Also in Ihrem Fall ist der Faktor Einheiten. Also eine Einheit von R beträgt Einheiten in G.
Um also G auf R zu skalieren, multipliziere G mit oder Sie können R auf das Niveau von G skalieren, indem Sie R dividieren durch . Die Werte sind also entweder Und oder Und aus unserem Beispiel.
Ich denke, es sollte als erwähnt werden wie im Log-Verhältnis aus der Aussage in Ihrer Frage.
Benutzer1993
Kiritee Gak