Mein Algorithmus lernt die regulatorische Interaktion zwischen Genen unter Verwendung des Bayesian Network-Ansatzes aus Genexpressionsdaten. Nachdem der Algorithmus zu einem Netzwerk von interagierenden Genen konvergiert ist, wie kann man überprüfen, ob die Interaktionen korrekt sind? Ich habe den Lungenkrebs-Datensatz von NCBI GEO mit der ID: GDS2771 verwendet. Wie kann man auch den Satz von Genen ermitteln, die für eine Krankheit (in diesem Fall Lungenkrebs) verantwortlich sind, und wie kann man ihre Expressionsniveaus als über- oder unterexprimiert quantifizieren?
Sie können die Interaktionen validieren, indem Sie ein Gen niederschlagen (KD) oder überexprimieren (OE) und die Änderung der Expressionsniveaus der nachgeschalteten Knoten überprüfen. Sie können dies mit Microarray oder RNAseq mit hohem Durchsatz tun. Für Protein können Sie ein LC-MS machen. Diese Methode kann Ihnen jedoch nicht helfen bei:
Schleifen sind knifflig, aber das Abtasten in mehreren Zeitintervallen kann Sie darüber informieren, ob Schwingungen vorhanden sind oder nicht. Für die meisten üblichen Fälle funktioniert dieser Ansatz.
Normalerweise folgt darauf eine weitere Validierungsrunde unter Verwendung einer relativ niedrigen Durchsatz, aber empfindlichen Technik, wie z
In einigen Fällen müssen Sie ChIP-seq durchführen, um herauszufinden, ob ein Gen Bindungsstellen für einen TF in seinem Promotor/Enhancer hat. Sie können auch Vorhersagen für TF-Bindungsstellen verwenden. Informationen zum Auffinden der Regulation durch miRNAs finden Sie in diesem Beitrag.
Um komplexe Dynamiken wie Pulse und Schwingungen zu finden, müssen Sie Zeitverlaufsdaten sammeln.
Wie kann man ihre Expressionsniveaus als über- oder unterexprimiert quantifizieren?
Dazu müssen Sie zuerst Ihre Steuerung definieren (oben/unten geregelt bzgl. was?). Danach können Sie den Ausdruck vergleichen und die richtigen statistischen Tests verwenden, um die unterschiedliche Regulation zu überprüfen. Wenn Sie nur eine Probe haben, funktionieren die meisten Tests nicht. Für RNAseq werden EM-Algorithmen verwendet, die ein bayesisches Modell verwenden, um Wahrscheinlichkeiten und p-Werte zu erhalten (ich habe Manschettenknöpfe und eXpress verwendet). Dann kann eine FDR-Korrektur durchgeführt werden, wenn der Test mit der Kontrolle verglichen wird. Ich bin mir nicht sicher, welche Algorithmen zum Vergleich von LC-MS-Daten für Proteine verwendet werden.
rg255
WYSIWYG
Aparajita
WYSIWYG