Warum sind Low-Throughput-Methoden vertrauenswürdiger für die Proteininteraktion?

Ich habe gelesen, dass Proteininteraktionen, die mit Hochdurchsatzmethoden gefunden wurden, weniger vertrauenswürdig sind als solche, die mit Niedrigdurchsatzmethoden gefunden wurden.

Als ich beispielsweise nach der Interaktion von BRCA2 auf BioGRID suchte, erhielt ich dieses Ergebnis.

Wir sind uns also nicht sicher über die Wechselwirkung von BRCA2 mit SIRT1, da sie mit einer Hochdurchsatzmethode gefunden wurde.

Meine Frage: Können Sie mir ganz einfach erklären, was High- und Low-Throughput-Techniken bedeuten? (Ich habe eine vage Idee, es im Internet zu lesen, aber ich bin mit meinem Verständnis nicht zufrieden.) Warum ist der hohe Durchsatz in diesem Fall nicht zuverlässig?

Ein Grund, den ich mir vorstellen kann, ist, dass es sich hauptsächlich um In-vitro-Studien handelt.

Antworten (1)

Dieser Artikel ist ein schlechtes Beispiel, er wurde zurückgezogen. Siehe hier . Aber das spielt für die Methoden keine Rolle. Dies geschieht in der Regel durch sogenannte „genomweite Assoziationsstudien“. Dort vergleichen Sie die Regulation Ihrer Interessengruppe mit einer „normalen“ Gruppe, um Gene zu finden, die anders ausgeprägt sind. Das haben wir gemacht: Wir haben einen Transkriptionsfaktor in einer Zelllinie überexprimiert und mit der untransfizierten Zelllinie verglichen, die diesen Faktor nicht hat. Der Vergleich bringt unterschiedlich exprimierte Gene zum Vorschein. Dies geschieht entweder mit Microarrays oder heute eher per ChIP-Sequenzierung (lasst es mich wissen, wenn ihr mehr wissen wollt, ich kann ins Detail gehen).

Wenn Sie solche Daten analysieren, schneiden Sie zunächst alle Daten ab, die unter einem bestimmten Schwellenwert liegen, um sicherzugehen, dass Sie die Anzahl falsch positiver Ergebnisse reduzieren. Eine niedrige Schwelle für die Erkennung von Veränderungen bedeutet, dass Sie mit größerer Wahrscheinlichkeit falsch positive Gene in Ihrer endgültigen Liste haben. Dies kann aufgrund von Änderungen in der Zelle oder den Bedingungen, Sekundäreffekten usw. geschehen. Und Sie werden auch Signale haben, die statistisch erscheinen und falsch positiv sind.

Wenn Sie Ihre Schwelle zu hoch wählen, reduzieren Sie die Anzahl der falsch positiven Ergebnisse, erzeugen aber auf der anderen Seite auch falsch negative, da Sie Gene ablehnen, die nur eine relativ geringe Veränderung aufweisen, aber echt sind. Die Balance dazwischen ist nicht immer einfach. Als Faustregel wird normalerweise alles verwendet, was sich mindestens zweifach im Ausdruck ändert (es sei denn, Sie kontrollieren es besser).

Auch nach dem Filtern enthält die Ausgabe des Experiments immer noch einige falsch positive Ergebnisse. Dann werden Sie auch einige sekundäre Effekte aufzeichnen, was bedeutet, dass Ihr interessierendes Gen ein zweites reguliert, das wiederum ein drittes reguliert. Da beide in der Analyse auftauchen, sieht es so aus, als ob das dritte Gen durch das erste reguliert wird (und nicht durch das zweite, wie es richtig wäre). Und das sind die Gründe, warum normalerweise jede Interaktion zwischen zwei Genen (oder besser: zwischen einem Protein und einem Gen, wenn es um einen Transkriptionsfaktor oder zwei Proteine ​​geht) im Nasslabor verifiziert werden muss. Und das ist Arbeit, die ziemlich hart sein kann.