Ich habe einen annotierten Satz von SNPs und möchte den Unterschied in der Bindungsaffinität des Transkriptionsfaktors (TF) untersuchen, wenn ich einen SNP in meinem Locus habe. Da meine SNPs annotiert sind (ich weiß, ob es sich um eine Intronvariante, eine Downstream-Genvariante, eine Missionsvariante usw. handelt), könnte ich die Bindungsaffinität dieser SNPs untersuchen, die als Intronvariante, Downstream-Variante, Upstream_gene_variant, Non_coding_transcript_variant kategorisiert sind , 5_prime_UTR_variant und berücksichtigen keine SNPs, die "Missense-Varianten" sind. Der Grund, warum ich das tun möchte, ist, dass Transkriptionsfaktor-Bindungsstellen (TFBS) vor und nach dem Gen liegen könnten.
Was denkst du darüber? Kann ein TFBS im Exon eines Gens lokalisiert sein? Was sind die Positionen der TFBS in Bezug auf die Exons, Introns, 5' UTR usw.?
Ich würde Ihre Daten mit dem ENCODE -Datensatz verknüpfen . Dieser Datensatz enthält Standorte von TFBS. Es ist auch über den UCSC-Genombrowser zugänglich .
Für die eigentliche Frage sind TFBS so ziemlich überall lokalisiert, einschließlich Exons (wie hier beschrieben ), Introns und natürlich intergenische Regionen (zB Enhancer, Silencer, Kontrolllocusregionen - hier eine Referenz).
mdperry