Erklären Sie einem Erstsemester ein Gennetzwerk

Ich habe eine Adjazenzmatrix mit einer Liste von Genen, die miteinander verbunden sind, was das Gennetzwerk bezeichnet. Wie bekommt man überhaupt diese Information, dass ein Gen mit einem anderen verbunden ist? Ist es, dass Sie eine Microarray-Analyse durchführen und Gene finden, die hochreguliert und herunterreguliert sind, und davon ausgehen, dass alle hochregulierten Gene sich gegenseitig regulieren? Bitte erklären.

PS Das Microarray-Beispiel ist das, was ich angenommen habe. Das bedeutet nicht, dass es so sein sollte, wie ein Gennetzwerk abgeleitet wird. Mein Netzwerk ist ein ungerichtetes.

Was unbeaufsichtigte Netzwerke betrifft, könnten Sie damit beginnen, einige rudimentäre Netzwerk-Inferenzmethoden zu erklären. Hier ist eine gute Übersicht ncbi.nlm.nih.gov/pmc/articles/PMC3956069 .

Antworten (1)

Darauf gibt es keine einheitliche Antwort, denn Netzwerke (oder Graphen , wie sie in der diskreten Mathematik genannt werden) sind flexible Werkzeuge, die verwendet werden können, um alle Arten von Beziehungen zwischen Genen, Transkripten, Proteinen oder anderen Entitäten in der Biologie zu modellieren. (Und Netzwerke sind auch in vielen anderen Disziplinen wie der Soziologie nützliche Modelle .) Abhängig von der Art des Netzwerks, das Sie in Betracht ziehen, gibt es verschiedene experimentelle Methoden, um Verbindungen zu bestimmen. Ich gebe unten nur ein paar Beispiele. Allgemeine Informationen zu Netzwerken als abstrakte Modelle finden Sie in der Graphentheorie .

Genregulatorische Netzwerke

Ein genregulatorisches Netzwerk ist ein gerichteter Graph, in dem ein Gen (A) ein anderes (B) reguliert. In diesem Fall sind die Verbindungen zwischen Genen gerichtet und können durch Pfeile A dargestellt werden B. Je nachdem, wie Sie „Regulierung“ genau definieren, eine Verbindung A B kann verschiedene Dinge bedeuten, zum Beispiel:

  • Gen A codiert einen Transkriptionsfaktor, der an Gen B bindet. In diesem Fall ein Hinweis auf A B kommt aus Assays von Proteinen, die an DNA binden, wie z. B. Chromatin-Immunpräzipitation (ChIP). Große Sammlungen solcher Daten sind in Datenbanken wie Transfac verfügbar .
  • Die Expression von Gen A bewirkt die Regulation von Gen B durch einen beliebigen Mechanismus (möglicherweise indirekt). In diesem Fall können Daten für eine Interaktion aus Experimenten stammen, bei denen Gen A induziert (zwangsweise exprimiert) oder unterdrückt/deletiert wird und die daraus resultierenden Veränderungen in anderen Genen gemessen werden, beispielsweise durch Mikroarrays oder RNA-Sequenzierung. Ein berühmtes frühes Beispiel dafür ist der „Rosetta“-Datensatz zu Hefe-Deletionsmutanten.

Die Inferenz von genregulatorischen Netzwerken ist ein großes und kompliziertes Thema, das ich hier nicht behandeln kann. Dies hängt von vielen Faktoren ab, z. B. wie Sie die Zeitdimension modellieren (verfügen Sie über stationäre oder transiente Daten) und wie Sie das Netzwerk parametrisieren, um Expressionsdaten quantitativ zu modellieren. Die von @CMosychuk vorgeschlagene Rezension scheint ein guter Ausgangspunkt zu sein .

Koexpressionsnetzwerke

Diese Art von Netzwerk repräsentiert die Koexpression zwischen Genen (oder genauer gesagt zwischen mRNAs oder Proteinen). Dies ist in der Regel eine Darstellung von paarweisen Korrelationen zwischen Genen unter bestimmten Bedingungen, sodass die Datenquelle jede Sammlung von mRNA- oder Proteinlevel-Expressionsdaten sein kann. (Hier ist ein Beispiel .) Da Korrelationen symmetrisch sind, haben Verbindungen in dieser Art von Netzwerk keine Richtung und können einfach als Link A dargestellt werden B (kein Pfeil). Partielle Korrelationen werden manchmal verwendet, um indirekte Assoziationen herauszufiltern, aber diese Netzwerke enthalten immer noch keine Kausalitätsinformationen und sollten nicht mit dem gerichteten Typ verwechselt werden.

Protein-Protein-Interaktionsnetzwerke

Dies sind ungerichtete Netzwerkmodelle, bei denen ein Link A B bedeutet, dass zwei Proteine ​​physikalisch interagieren. Daten, die solche Verbindungen unterstützen, stammen aus verschiedenen biochemischen Assays für Proteinwechselwirkungen, wie z. B. dem Zwei-Hybrid-Assay oder der Immunpräzipitation . Es gibt große Datenbanken, die Protein-Protein-Wechselwirkungsdaten sammeln, die verwendet werden können, um diese Netzwerkmodelle zu erstellen, zum Beispiel BioGRID .

Es gibt viele andere Arten von Netzwerken, aber das ist schon eine lange Antwort :) Wie Sie sehen können, ist es wichtig, sich darüber im Klaren zu sein, mit welcher Art von Netzwerk Sie arbeiten. Häufig bestimmen die Ihnen zur Verfügung stehenden Daten, welches Netzwerkmodell geeignet ist – wenn Sie zum Beispiel nur eine Sammlung nicht verwandter Transkriptomprofile und keine Kausalitätsinformationen haben, könnte ein Koexpressionsnetzwerk das beste Modell sein.