Ich arbeite an einem Projekt und versuche, Daten über die Position von Genen und Heterochromatin-Bindungsstellen wie HP1 in Drosophila melanogaster zu finden. Sind diese Informationen für die DGRP- Linien verfügbar? Wäre ich in der Lage, anhand solcher Daten die Entfernung zwischen einem Gen und seiner nächsten Bindungsstelle zu messen?
Schauen Sie sich diese ChIP-seq-Daten für HP1 in Drosophila an: 1 , 2 und 3 . Aus den ChIP-seq-Daten können Sie den Abstand zwischen den TFBS-Peaks und dem TSS des Gens ermitteln.
Sie können auch nach Nukleosomenpositionierung und DNAse-Überempfindlichkeitsregionen suchen; für Ersteres sind meines Erachtens Daten für Drosophila verfügbar.
Wie die vorherige Antwort sagte, gibt es einige öffentliche HP1 ChIP-seq-Daten von D. melanogaster, wenn nicht von der DGRP, von modENCODE und vielleicht anderen. Im Fall von modENCODE haben sie nicht nur die Reads veröffentlicht, sondern auch ihre Peak-Calls (Mapping mit Eland + Calling mit MACS).
BEDTools ( https://github.com/arq5x/bedtools2 ) ist ein nettes Befehlszeilentool zum Manipulieren von Intervallen mit genomischen Koordinaten, und der Befehl bedtools next kann die Entfernung zum nächstgelegenen Merkmal berechnen. Es würde in etwa so aussehen:
bedtools closest -d -a genomic_features.gff3 -b peak_calls.gff3
Wobei der Teil "genomic_features" eine beliebige Teilmenge der Genomanmerkung wäre, an der Sie interessiert sind.
Ich habe ein kleines Beispiel mit modENCODE-Daten, Flybase-Transkriptannotation und BEDTools durchgearbeitet:
http://martinsbioblogg.wordpress.com/2014/07/04/finding-the-distance-from-chip-signals-to-genes/
Beifall,
M.