Identifizierung, welche SNPs in TFBS (Hefe) sitzen

Ich habe eine Reihe von ~ 11.000 SNPs für Saccharomyces cerevisiae , Bäckerhefe, und ich würde gerne identifizieren, welche davon in Bindungsstellen für Transkriptionsfaktoren sitzen und ob sie Informationen zu den relevanten TFBS liefern.

Ich habe diese Seite und das Internet durchforstet und konnte keine herunterladbare Datenbank finden, die mir Standorte aller bekannten/verifizierten TFBS für Hefe geben würde. Ich habe die YEATRACT- Website gründlich studiert, aber keine solche Datenbank gefunden, um Informationen über TFBS für alle ORFs/Gene auf einmal herunterzuladen.

Als ich außerdem versuchte, die Informationen manuell über die YEATRACT-Suche online zu erhalten, fand ich die Ergebnisse verwirrend. Beispiel: Suche nach TF für ORF "YOL166W-A" gibt eine Liste mit 4 TFs zurück. Wenn Sie auf eine davon klicken, sagen wir Sok2p, gelangen Sie zu einer anderen Seite, auf der unter anderem steht, dass die entsprechende TFBS "acMTGCAKg" ist ... was bedeutet das? (Ich kenne das ACTG-Alphabet, aber was sind die Symbole „a“, „c“, „K“ und „g“?) und was sagt mir das über die tatsächliche Position der Bindungsstelle? muss ich das gesamte Genom sprengen, um es zu identifizieren? (Sollte es nicht schon eine Datenbank mit diesen Informationen für Hefe geben?) Wenn ja, wie kann ich nach Symbolen wie 'K' und 'g' BLASTEN?

Ich habe einen Hintergrund in Statistik, arbeite aber derzeit in genetischen Anwendungen, daher ist es für mich gelegentlich sehr verwirrend, relevante Bioinformatikdaten zu extrahieren. jede Hilfe wird geschätzt.

Antworten (2)

Ich stimme zu, dass es manchmal sehr verwirrend sein kann, die richtigen Daten zu finden.

Kennen Sie RSAT (Regulatory Sequences Analysis Toolkit)? Unter „Hilfe & Kontakt“ und „Motivdatenbanken“ finden Sie die Yeastract-Datenbank: http://rsat-tagc.univ-mrs.fr/rsat/motif_databases/Yeastract/

Ich dachte, es wäre auch auf JASPAR, konnte es aber nicht finden.

Dann gibt es für Ihre Analyse, bei der Sie nach SNPs in den Motiven suchen, ein Tool auf RSAT, das derzeit leider nur mit der Metazoa-Datenbank funktioniert, aber es könnte Sie interessieren, es auszuprobieren, und das entsprechende Papier: http: // rsat-tagc.univ-mrs.fr/rsat/variation-scan_form.cgi

Zusätzlich zu den 4 Nukleotidbuchstaben gibt es Buchstaben, die bedeuten „der Buchstabe ist einer dieser zwei oder drei:

M = aMine = A oder C

R = purine = A oder G

W = Schwach (zwei Wasserstoffbrückenbindungen) = A oder T

S = Stark (drei Wasserstoffbrückenbindungen) C oder G

Y = pYrimadin = C oder T

K = Keton = G oder T

B = nicht A

D = nicht C

H = nicht G

U = nicht T

Ich würde vermuten, dass die Kleinbuchstaben bedeuten, dass diese Buchstaben nicht so wichtig sind wie die Großbuchstaben, um die Bindung zu bestimmen.