Paraloge Gene in genomweiten Assoziationsstudien?

Hat jemand getestet, ob paraloge Gene unter den durch genomweite Assoziationsstudien (GWAS) identifizierten Genen überrepräsentiert sind?

Wenn beispielsweise eine GWAS-Studie 200 Gene findet, die mit der Krankheit/dem Merkmal assoziiert sind, und eine Anzahl X davon als zu Y unterschiedlichen Genfamilien gehörend klassifiziert werden kann, gibt es einen Test, um festzustellen, ob X und Y größer als erwartet sind die Gesamtzahl der Gene und Genparalogien in einem Genom? Hier spreche ich von lang etablierten Kopien innerhalb einer Art, nicht von CNVs in verschiedenen Individuen derselben Art.

Ich denke, dahinter steckt eine interessante Frage: Wenn sich ein Gen während der Evolution eines Genoms dupliziert hat und die verschiedenen Genkopien spezialisierte, aber verwandte Rollen übernommen haben, sollte eine unvoreingenommene Analyse wie GWAS in der Lage sein, Fälle zu finden, in denen sie unterschiedlich sind paraloge Kopien assoziieren mit unterschiedlichen Unterkrankheiten/Untermerkmalen innerhalb derselben globalen Krankheit/Merkmal.

Hallo. Könnten Sie helfen, indem Sie Ihre Frage klären? Möchten Sie wissen, ob paraloge Gene/Regionen in GWAS-Treffern überrepräsentiert sind? Es ist eine interessante Hypothese - haben Sie Ideen/Referenzen, warum dies der Fall sein könnte? Es ist immer am besten, eine Frage so vollständig und klar wie möglich zu stellen. Vielen Dank
Das ist eine interessante Frage (danke für die Erweiterung). Wenn die paralogen Gene immer noch funktionell verwandt wären, besteht wahrscheinlich eine Redundanz zwischen ihnen, sodass sich ein SNP in einer der Kopien möglicherweise überhaupt nicht manifestiert. Ein SNP, das ein für eine der Kopien spezifisches Untermerkmal betrifft, müsste einen massiven Effekt haben (oder die Studie würde eine phänomenale Stichprobengröße erfordern), um es zu finden (es sei denn, es handelt sich um eine gezielte Studie nur an paralogen Genen, von denen bekannt ist, dass sie eine Krankheit sind verbunden?). Ich kenne keine Studien, bin aber an anderen Antworten interessiert!
Haben Sie einen exakten Test nach Fisher (ein Chi-Quadrat-Test mit lockereren Annahmen) in Betracht gezogen?
Ich verstehe tatsächlich nicht, was die Hypothese ist. Erstens gibt es Tonnen von Störfaktoren, die kontrolliert werden müssen – zum Beispiel können regulatorische Genfamilien wahrscheinlicher expandieren als strukturelle Genfamilien, also müssten Sie das (und vieles mehr) berücksichtigen. Ihre letzte Frage zur Subfunktionalisierung scheint nichts mit der ursprünglichen Frage der Überrepräsentation zu tun zu haben.
Sollen Paralogs nicht eine abweichende Funktion haben? Ich würde erwarten, dass sie unterrepräsentiert sind.
Sie könnten es auch testen, indem Sie nur Paralogs in den Treffern zählen und dann z. 200 zufällige Gene (abhängig davon, wie viele Treffer Ihr GWAS gefangen hat) und zählen dazu.
Ich denke, es hängt davon ab, wie verwandt die Paralogs sind. Wenn sie vor langer Zeit auseinandergegangen sind, können wir davon ausgehen, dass die SNPs, die in Ihren hypothetischen GWAS auftauchen, tatsächlich unabhängig mit der Krankheit assoziiert sind. Es ist jedoch nicht unbedingt möglich, dass derselbe SNP in einem anderen Gen vorkommt, es ist quasi per Definition ein anderer SNP. Da GWAS-Methoden Korrelationen und keine Kausalitäten erzeugen, wenn diese gleichen, aber unterschiedlichen SNPs mit der Krankheit in Verbindung gebracht werden, ist das das Ende der Geschichte. Um mehr zu erfahren, ist eine tiefere Inspektion erforderlich.
Dies ist eine Arbeit, in der sie Out-Paraloge von Orthologen trennten und Untersuchungen zur Erhaltung von Protein-Protein-Wechselwirkungen über Arten hinweg durchführten. Die Methoden, die sie verwendeten, könnten bei der Durchführung ähnlicher Studien hilfreich sein. ncbi.nlm.nih.gov/pmc/articles/PMC3447968

Antworten (1)

Es gibt keinen Literaturbericht, der so etwas sagt. Ich habe jedoch eine oberflächliche Überprüfung der GWAS-Studie zum Neuroblastom durchgeführt .

  • Ausgewählte SNPs mit p-Wert > 0,05
  • Umgewandelte p-Werte in eine Punktzahl —
    -log 10 (p-Wert)
  • Ordnete die SNPs Genen zu, während der kumulative Score für ein Gen berechnet wurde

Ich habe die Gene einfach nach ihren Namen sortiert, in der Annahme, dass viele Paralogs ähnliche Namen haben. Ich weiß, dass das nicht der richtige Weg ist. Ich habe jedoch viele ähnlich benannte Gruppen in der Liste gefunden.

Der nächste Schritt besteht nun darin, tatsächliche Paralogs zu finden und die kumulierte Punktzahl für eine Paralog-Gruppe zu bewerten. Das ist eine kleine Aufgabe:

  • Erhalten Sie Sequenzen der Gene
  • Führen Sie eine BLAST-Suche durch, um Paralogs zu finden
  • Ordnen Sie Gene Gruppen zu und finden Sie Punkte

Ich kann die Datei mit Genen und Partituren teilen. Ich würde jedoch nur fortfahren, wenn jemand tatsächlich daran interessiert ist, dies zu verfolgen – dies könnte eine Forschungsarbeit sein.

PS: Wenn Sie die Datei möchten, kommentieren Sie einfach Ihre E-Mail-ID. Irgendein IT-Admin-Idiot hat rapidshare/4shared usw. blockiert