Wie wird die Genexpression geschätzt?

Ich lese diesen fantastischen Artikel über das Schätzen der Körperzeit: Molecular-Timetable-Methoden zur Erkennung von Körperzeit- und Rhythmusstörungen aus genomweiten Expressionsprofilen zu einem einzigen Zeitpunkt Forscher schätzten, welche Gene exprimiert werden und welche nicht:

Gesamt-RNA wurde unter Verwendung von Trizol-Reagenz (GIBCO-BRL) hergestellt. cDNA-Synthese und cRNA-Markierungsreaktionen wurden wie beschrieben durchgeführt (5). Affymetrix-Oligonukleotidarrays hoher Dichte (Murine Genome Array U74A, Version 1.0, Messung von 9.977 unabhängigen Transkripten) wurden gemäß dem technischen Handbuch (Affymetrix) hybridisiert, gefärbt und gewaschen. Die Affymetrix-Software wurde verwendet, um die durchschnittliche Differenz (AD) zwischen perfekt passenden Sonden und Sonden mit fehlgepaarten Einzelbasenpaaren zu bestimmen. Die AD jeder Sonde wurde dann global skaliert, so dass die Gesamt-AD jedes Mikroarrays gleich war. Die resultierenden AD-Werte spiegeln die Häufigkeit einer gegebenen mRNA im Verhältnis zur gesamten RNA-Population wider und wurden in allen nachfolgenden Analysen verwendet

Ich bin mir nicht sicher, ob ich das richtig lese – haben die Forscher die gesamte in den Zellen verfügbare RNA untersucht und die Mengen an Boten-RNA berechnet, die von exprimierten Genen produziert wird? Wenn nicht, wie kann das Expressionsniveau eines Gens abgeschätzt werden?

Antworten (2)

Die hier beschriebene Technik wird Microarray genannt. Ihre Frage hat mir Gelegenheit gegeben, eine meiner Meinungen zu bestimmten Problemen der Genexpressionsstudien darzulegen.

Die Genexpression ist ein Maß für die Aktivität eines beliebigen Gens. Wenn das Gen seine Aktivität in Form eines Proteins ausübt, dann sollte seine Expression ein Maß für das Protein sein. Wenn ein Gen eine nicht-kodierende RNA produziert, ist seine Expression ein Maß für die RNA-Konzentration.

[Sie können die Fälle der posttranslationalen Modifikation aufgrund der Signaltransduktion weglassen. Sie werden stark exprimiert und vorübergehend, aber häufig verwendet. ]

Wie in Ihrem Beispiel gibt es viele Studien, die die mRNA-Konzentration als Proxy für die Proteinaktivität verwenden. Dieser Proxy funktioniert in vielen Fällen, da die transkriptionelle Genregulation ein häufiger verwendeter Mechanismus zur Vermittlung stabiler Veränderungen ist. Aber die beste Strategie wäre immer, auch die Proteine ​​zu messen.

Abgesehen von Microarray gibt es mehrere Techniken zur Messung der RNA-Konzentration:

  • RNA-Sequenzierung (Hochdurchsatz)
  • Real-Time PCR (mittlerer Durchsatz)
  • Northern Blotting (Niedriger Durchsatz, halbquantitativ)

Es gibt auch viele Techniken zur Messung von Proteinen:

  • Massenspektrometrie (Hochdurchsatz)
  • ELISA (Niedriger Durchsatz, quantitativ)
  • Western Blotting (Niedriger Durchsatz, halbquantitativ)

Üblicherweise wird die „Proxy-Methode“ verwendet, da die Proteinquantifizierung vergleichsweise schwieriger ist. Auf Antikörpern basierende Techniken wie ELISA und Western Blotting haben Probleme beim Kreuzvergleich von Proteinen wegen der Variabilität der Antikörperbindungseffizienz.

Wenn Sie sich auf nur ein Gen konzentrieren möchten, sollte qPCR besser funktionieren. Microarrays eignen sich am besten für die Bewertung des Gesamttranskriptoms.
ja.. ein oder abzählbare Anzahl von Genen..
Leider erinnere ich mich nicht mehr an die Details, aber ich habe kürzlich einen Vortrag auf einer Konferenz gesehen, in dem gezeigt wurde, dass mRNA-Spiegel nicht wirklich mit Proteinspiegeln korrelieren. Ich meine, wir haben das schon immer gewusst, aber die angezeigten Zahlen waren schockierend (weniger als 50 %, vielleicht so niedrig wie 30). Ich werde versuchen, eine Referenz zu bekommen und zurück zu posten.
Wow, ich habe gerade einen Artikel aus dem Jahr 1998 gefunden, der besagt, dass in Hefe "wir festgestellt haben, dass die Korrelation zwischen mRNA- und Proteinspiegeln nicht ausreicht, um Proteinexpressionsspiegel aus quantitativen mRNA-Daten vorherzusagen." Und doch sind wir hier und verwenden immer noch solche Daten ...
@terdon Es variiert je nach Fall, in vielen Fällen gibt es eine Beziehung, aber es ist schwer, a priori zu sagen. Dies ist schwierig, wenn Sie eine große Anzahl von Sondensätzen haben, die Sie interessieren. Als Faustregel gilt, dass qPCR-Panels bis zu ein paar Dutzend Gene oder so reichen und dann werden sie schwierig.
@shigeta Ich weiß, ich habe gerade dieses Diagramm von der Konferenz, die ich erwähnt habe, in meinem Kopf (kann es nicht finden), wo eine Analyse auf Transkriptomebene durchgeführt wurde und die Korrelation erbärmlich war. Ich werde es irgendwo finden, es war ein Keystone-Meeting in Heidelberg, kann nicht so schwer zu finden sein.
Soweit ich weiß, verwenden Wissenschaftler diese Microarray-Experimente oft als Hochdurchsatz-Screening-Methoden, um entweder Kandidatengene oder Gennetzwerke zu identifizieren. Wenn den Daten eines solchen Experiments wirklich vertraut werden kann, müssen sie immer mit traditionellen biochemischen Methoden (Massenspektrometrie, Western Blot, ELISA/RIA, Mikroskopie) nachverfolgt werden.
@terdon.. es ist nicht immer notwendig, aber es gibt mehrere Hinweise darauf, dass die Proteinspiegel nicht mit den mRNA-Spiegeln korrelieren.
@leonardo: hey mass spec ist nicht so traditionell :P
@terdon Ich habe auch andere Grafiken gesehen - eine bemerkenswerte wäre eine Grafik mit vielen Punkten in George Churchs Klasse an der HMS gewesen, die ich einmal gesehen habe. Angesichts des Standes der Dinge wäre ein Nachschlagewerk und eine Lektüre der Arbeit sinnvoll. Meine Erinnerung war, dass die Korrelation besonders bei schlechten mRNA-Konzentrationen war und dass die Gesamtsteigung für Menschen 3 war. Die Gesamtkorrelation war nicht großartig, aber sie war auch nicht 0. Wer für solche Dinge eine solide Regel in der Biologie erwartet, wird wie immer enttäuscht ...
Ok, ich habe einige der Informationen zu meinem Hin und Her mit @terdon gefunden und aufgeschrieben. hoffe, einige finden es relevant.
@WYSIWYG: nein, ich denke nicht, aber es ist sicherlich quantitativ und sehr empfindlich, also werfe ich es (faul) mit den traditionelleren Methoden ein. ;)
@leonardo: Sie haben sehr recht, heutzutage, da die Microarray-Modeerscheinung vorbei ist, würden nicht viele Zeitschriften eine Studie akzeptieren, die NUR Microarray-Daten ohne weitere Validierung zeigt. Natürlich besteht die Lösung darin, auf die aktuelle Modeerscheinung aufzuspringen, RNAseq :D
@leonardo: Können Sie erklären, was Sie damit meinen, dass MS hochsensibel ist? Soweit ich weiß, besteht ein Problem mit MS darin, dass Sie nur zuverlässige (irgendwelche) Messwerte für die am häufigsten vorkommenden Proteine ​​in Ihrer Probe erhalten, nicht wahr?
@SteveLianoglou: MS ist nicht mein Fachwissen, aber das verstehe ich nicht (dies kann je nach verwendetem MS-Typ variieren, z. B. TOF-SIM, GC). Die erfolgreiche Identifizierung von Proteinen mittels MS hängt von der Häufigkeit, aber auch von der Länge der Peptidfragmente ab (lesen Sie: experimentelle Optimierung). MS kann theoretisch eine Auflösung von 1 fmol erreichen. Weitere Informationen finden Sie hier: lab.rockefeller.edu/chait/pdf/08/08_eriksson_wiley.pdf
@SteveLianoglou: Soweit ich weiß, ist MS empfindlich in dem Sinne, dass es winzige Mengen erkennen kann, aber das große Problem ist die Dateninterpretation

Ergänzende Informationen aus den Kommentaren der ersten Antwort:

Ich habe vielleicht die Referenz von @terdon gefunden? Ich bin mir nicht sicher, ob dies der Fall ist, aber durch die Messung von Transkriptionsereignissen in einzelnen Zellen konnten Taniguchi et al. argumentieren sicherlich, dass es keine Korrelation zwischen Protein- und mRNA-Spiegeln gibt.

Microarray-Daten (und die meisten rnaSeq- und qPCR-Experimente) sind jedoch Ensemble-Messungen; Sie messen die durchschnittliche mRNA-Konzentration in einer Probe von Millionen von Zellen. Insgesamt sagt das Papier auch, dass insgesamt die durchschnittliche mRNA mit der durchschnittlichen Proteinproduktkonzentration korreliert . Sehen Sie sich diese schöne Beschreibung im OmeSpeak-Blog an .

Insgesamt, was mikroskopisch passiert: Die Übersetzung ist ein eher stochastischer Prozess in der einzelnen Zelle und Ereignisse müssen explizit modelliert werden. Biologie als Ganzes (gemittelter Fall in einer Zellpopulation) ist oft das, womit wir arbeiten müssen; Einzelzelltechniken sind ziemlich mühsam. (Lassen Sie ein Proteingel auf einer einzelnen Zelle laufen!). Ich denke, es gibt Platz für beide Arten von Informationen, wenn man Biologie untersucht; sicherlich wird die Veröffentlichung von Arbeiten, die an mehr als einer Zelle gleichzeitig gemessen wurden, noch einige Zeit andauern.

Alle hier zitierten Arbeiten stammen von E. coli, aber bei Eukaryoten geht man davon aus, dass dies nicht einfacher sein wird.

Genexpressionsrauschen ist auch ein variables Merkmal. In einigen Gennetzwerken ist das Rauschen gering, während es in anderen hoch ist.