Was ist Mendelsche Randomisierung und wie wird sie verwendet, um Kausalität in der Epidemiologie abzuleiten?

Studien über menschliche Merkmale und Krankheiten sind von Natur aus auf Beobachtungsstudien beschränkt, die als epidemiologische Studien bekannt sind. Dies kann es sehr schwierig machen, festzustellen, was tatsächlich eine bestimmte Krankheit oder ein bestimmtes Merkmal verursacht und was nur ein Nebenprodukt oder Biomarker der Krankheit ist.

Die Mendelsche Randomisierung ist eine statistische Technik, die von genetischen Epidemiologen verwendet wird, um kausale Effekte zu bestimmen, beispielsweise ob ein Biomarker tatsächlich das Krankheitsrisiko beeinflusst oder ob es sich nur um einen statistischen Zusammenhang handelt.

Wie lassen sich kausale Zusammenhänge zwischen Merkmalen (z. B. Blutmarkern) und erhöhtem Krankheitsrisiko aus der Genetik grundsätzlich ermitteln und auf welchen Annahmen basiert dies?

Sollten es nicht Trigs ~ SNPs für die Triangulation sein?

Antworten (1)

Epidemiologische Studien analysieren menschliche Beobachtungskohortendaten, um zu versuchen, Krankheitsrisiko und Biomarker statistisch zu verknüpfen. Zum Beispiel ist es eine wohlbekannte Tatsache, dass Rauchen das Lungenkrebsrisiko erhöht, doch vor den 1950er Jahren wurde dies weithin als anders angesehen, bis Beobachtungsbeweise sich als unwiderlegbar erwiesen ( Levin, 1950 ).

Verwirrung

Es kann jedoch schwierig sein, anhand von Beobachtungsdaten auf Kausalitäten zu schließen. Zum Beispiel gibt es in Großbritannien einen sehr starken statistischen Zusammenhang zwischen dem Eisverkauf und dem Risiko zu ertrinken. In diesem Beispiel ist es ziemlich klar, dass die Assoziation verwechselt ist – das heißt, es gibt eine „versteckte“ Variable, die wir nicht berücksichtigt haben, die die 2 verbindet. Es ist leicht zu schließen, dass der Verkauf von Eiscreme Ihr Risiko nicht erhöht Ertrinken, aber die beiden korrelieren, weil sowohl der Eisverkauf als auch das Ertrinkungsrisiko zur gleichen Jahreszeit zunehmen; beide sind positiv mit „Schönwetter“-Eigenschaften korreliert.

Im obigen Beispiel ist es leicht zu sagen, dass die Beziehung verwechselt ist. In einer hypothetischen Studie zu Typ-2-Diabetes, die feststellt, dass ein höherer Bluthämatokrit (% des Blutvolumens aus roten Blutkörperchen) mit einer erhöhten Wahrscheinlichkeit, an Diabetes zu erkranken, verbunden ist, ist es jedoch weniger klar, ob ein höherer Hämatokrit die Anfälligkeit / das Risiko erhöht, an Diabetes zu erkranken Diabetiker, oder ob Diabetes den Hämatokrit erhöht. Längsschnittstudien, die denselben Personen viele Jahre lang folgen, helfen festzustellen, was zuerst da war – dies basiert auf der Annahme, dass, wenn ein erhöhter Hämatokritwert mit einem erhöhten Diabetesrisiko 5 Jahre später verbunden ist, es wahrscheinlicher ist, dass der Hämatokritwert ursächlich ist, und Sie haben einen Biomarker für das Diabetesrisiko (obwohl Sie immer noch nicht sagen können, dass es kausal ist, kann es nur ein Stellvertreter für ein anderes „verstecktes“ Merkmal sein, oder die Wirkung kann durch einen anderen nicht gemessenen Marker vermittelt werden) .

Kausalität

Genomweite Assoziationsstudien (GWA) sind seit Abschluss des Humangenomprojekts immer beliebter geworden, und derzeit (15. August 2012) sind 7039 genetische Varianten (SNPs, Single-Nucleotide Polymorphisms) im Katalog der veröffentlichten GWA-Studien dokumentiert ( www.genome.gov/gwastudies ). Diese SNPs wurden durch große genetische epidemiologische Studien, in der Regel mit mehreren Tausend Teilnehmern, eindeutig mit Merkmalen wie dem „Risiko für Typ-2-Diabetes“ oder dem „Adiponektinspiegel im Blut“ in Verbindung gebracht.

Der entscheidende Punkt bei SNP-Assoziationen ist, dass die Wirkungsrichtung immer bekannt ist; Ein bestimmter SNP kann Ihre Adiponektinspiegel beeinflussen, aber Adiponektin beeinflusst nicht die SNPs, die Sie erben.

Mendelsche Randomisierung

In einer Beobachtungsstudie, die einen Zusammenhang zwischen (zum Beispiel) zirkulierenden Triglyceridspiegeln und Typ-2-Diabetes (unter Verwendung von Nüchternglukose und Insulin als „Stellvertreter“) findet, ist es nicht möglich, die kausale Richtung zu bestimmen; erhöhen triglyzeride das diabetesrisiko oder umgekehrt? (Dies ist eine tatsächliche Fallstudie von De Silva, et al . 2011 ).

Unter der Annahme, dass die Vererbung von SNPs im Wesentlichen zufällig ist (dh nicht von der gemessenen Eigenschaft beeinflusst wird – in diesem Beispiel Triglyceride), ist es möglich, die kausale Wirkung von Triglyceriden auf das Diabetesrisiko zu bestimmen. Hinweis: Dies ist nur für Merkmale (z. B. Serumtriglyceridspiegel) möglich, bei denen SNPs durch GWA-Studien identifiziert wurden.

Zunächst einmal haben Sie bereits den Zusammenhang zwischen den Triglyceridspiegeln berechnet (in dieser Studie war ein Anstieg der Triglyceride um 1 Standardabweichung (SD) mit einem Odds Ratio (OR) von 2,68 mit Typ-2-Diabetes bei fast 10.000 Menschen verbunden Teilnehmer). Da es sich um eine Querschnittsstudie handelt, wird nur ein Zusammenhang gemeldet, ohne kausale Implikationen ... noch nicht!

Geben Sie die SNPs ein

Nachdem die SNPs identifiziert wurden, die den Triglyceridspiegel erhöhen (zum Zeitpunkt der Studie wurden 10 in der Literatur beschrieben), muss der Genotyp jedes Teilnehmers für diese SNPs gemessen oder abgeleitet werden (im Allgemeinen wird dies in großen Kohortenstudien durchgeführt, die dann verwendet werden für viele verschiedene Einzelprojekte).

Für jede Person wird dann eine kombinierte „Punktzahl“ abgeleitet. Das ist konzeptionell sehr einfach; Wenn eine Person 4 der 10 triglyceriderhöhenden Allele hat, erhält sie eine Punktzahl oder 4 und so weiter. Dies wird durch die Tatsache erschwert, dass die SNPs unterschiedliche Wirkungen auf die Triglyceride haben, sodass stattdessen ein „gewichteter Allele-Score“ abgeleitet wird (vereinfacht ausgedrückt wird der Koeffizient der SNP~Triglycerid-Assoziation berücksichtigt, wenn Risiko-Allele-Scores addiert werden). Durch die Verwendung dieser Art von Bewertung kann eine Schätzung der Auswirkungen „pro Allel“ vorgenommen werden;

Der Zusammenhang zwischen den Triglyceridspiegeln und dem Allel-Score wird dann bestimmt (durch lineare Regressionsanalyse – angepasst an Alter und Geschlecht, da diese bekanntermaßen Triglyceride beeinflussen). Es gibt tatsächlich zwei Möglichkeiten, die nächste Analyse durchzuführen, von denen die erste konzeptionell einfacher ist, die zweite jedoch robuster ist.

Methode 1: der „Triangulations“-Ansatz

Die zwei bisher berechneten beobachteten Assoziationen (Pro-SD-Triggerspiegel sind mit Diabetes assoziiert, und der SNP-Score pro Allel ist mit Per-SD-Triggerspiegeln assoziiert) können dann verwendet werden, um einen erwarteten Zusammenhang zu berechnen. Dies wird einfach durch Multiplizieren der beiden Koeffizienten abgeleitet. Unten ist die 'Triangulation'-Darstellung davon;

Triangulationsansatz für Mendelsche Randomisierung

Dieser erwartete Zusammenhang zwischen den Triglycerid-erhöhenden SNPs und dem Diabetes-Risiko gilt nur, wenn erhöhte Triglyceride das Diabetes-Risiko erhöhen. Der beobachtete Zusammenhang zwischen dem SNP-Score und Diabetes kann dann berechnet werden. Wenn die erwarteten und beobachteten Schätzungen ähnlich sind, erhöhen Triglyceride das Diabetesrisiko und sind ein kausaler Biomarker. Wenn die beobachtete Assoziation null ist (oder zumindest viel kleiner ist), dann sind Triglyceride wahrscheinlich sekundär.

Methode 2: die instrumentelle Variablenanalyse

Diese Methode ist für die härteren Statistiker. Instrumentelle Variablen sind abgeleitete Variablen und stellen ein Zwischenprodukt zwischen einer vorgeschlagenen "Ursache" und der "Wirkung" oder dem Ergebnis dar (in diesem Fall wird vorgeschlagen, dass die Triglycerid-erhöhenden Allele Diabetes "verursachen", und dies wird durch die Triglyceridspiegel selbst vermittelt). .

Unter Verwendung einer linearen Regression werden die "angepassten Werte" aus einem Modell mit Triglyceridspiegeln als Ergebnis und dem gewichteten SNP-Score als einziger unabhängiger Variable extrahiert. Diese angepassten Werte stellen die Varianz der Triglyceride dar, die durch den SNP-Score vorhergesagt wird. Wir verwenden hier die SNPs als Instrument , da sie den Biomarker (Exposition, dh Triglyceride) direkt beeinflussen und weder von der Exposition noch vom Outcome (Diabetes) beeinflusst werden. Die wichtige Annahme hier ist, dass die Wirkung der SNPs auf das Ergebnis nicht verfälscht wird und nur durch die Exposition vermittelt werden kann – dies gilt für Genotypen ( Lawlor, et al . 2008 ) .

Indem Sie dann den Zusammenhang zwischen der abgeleiteten Variablen und Diabetes bestimmen, wissen Sie, ob der von den SNPs vorhergesagte Anteil der Triglyceridvarianz mit Diabetes assoziiert ist – wenn ja, dann erhöhen Triglyceride das Diabetesrisiko.

Ergebnisse

Die Studie führte beide Arten der Mendelschen Randomisierungsanalyse durch und fand keine Hinweise auf einen kausalen Zusammenhang zwischen Triglyceriden und Diabetes-Phänotypen.

Die Mendelsche Randomisierung ist also ein nützliches Werkzeug, um Kausalität mit Biomarkern abzuleiten. Es ist nicht unbedingt ein schlüssiger Beweis, aber es kann helfen, Biomarker von besonderer Bedeutung und Interesse (im Hinblick auf Interventionen) von solchen zu unterscheiden, die nur Marker der Krankheit sind.

Schönes Wetter? Im Vereinigten Königreich? Lächerlich.