Wo man Datensätze zu Stoffwechselwegen erhält

Ich habe die unter www.reactome.org verfügbaren Dateien zusammen mit einigen anderen durchgesehen, aber ich finde nur Bilder/PDFs von Stoffwechselwegdiagrammen. Wo sind die eigentlichen Daten, aus denen diese Pfade gezogen werden? Ich stelle mir vor, es sollte eine Art gerichtete Graphendarstellung geben. Ich bin auf frei verfügbare Datensätze beschränkt, daher kann ich solche wie KEGG leider nicht auschecken.

KEGG sollte für jeden offen sein, wenn ich nicht ganz falsch liege.
Laut ihrer Download-Seite erfordert der Zugriff auf die FTP-Dateien für KEGG ein kostenpflichtiges akademisches Abonnement (über bioinformatics.jp/en/keggftp.html ). Ich nehme an, die Tools auf ihrer Website sind kostenlos, aber ich habe die Pfaddaten, nach denen ich suche, nicht gefunden (das heißt, ich sehe, wo ich nur Pfaddiagramme durchsuchen kann).
Nun, jetzt sehe ich, dass KEGG ein XML-Markup ihrer Pfade hat, aber es ist nur durch Abfragen ihrer API ( kegg.jp/kegg/xml ) verfügbar. Ich frage mich, ob es eine einfache Möglichkeit gibt, alle Pfaddateien abzurufen.

Antworten (1)

KEGG ist definitiv Ihre Wahl!

Es ist möglich, die vollständige(n) Liste(n) von Pfaden zu erhalten: http://rest.kegg.jp/list/pathway (Referenzpfade) oder http://rest.kegg.jp/list/pathway/hsa (für human ).

Dann können Sie diese IDs verwenden, um Informationen über einzelne Pfade abzurufen: http://rest.kegg.jp/get/hsa00053 (GeneBank-ähnliches Format), http://rest.kegg.jp/get/hsa00053/image (image ), http://rest.kegg.jp/get/hsa00053/kgml (KEGG-XML). Es wird natürlich eine Weile dauern, und ich würde empfehlen, den Server nicht zu überlasten und keine Verzögerungen zwischen den Abfragen vorzunehmen. Mit dem GeneBank-ähnlichen Format ist auch eine Stapelabfrage möglich: http://rest.kegg.jp/get/hsa00053+hsa00061

Dies sollte aufgrund der Last auf ihrem Server wahrscheinlich ein einmaliger oder zumindest seltener Vorgang sein (und ich glaube nicht, dass sie sehr oft große Änderungen vornehmen). Sie können Informationen für neue Pfade abrufen, sobald sie in http://rest.kegg.jp/list/pathway/ ...

Ja, das ist eigentlich genau das, was ich letztendlich getan habe. Ich habe ein Python-Skript geschrieben, das die menschliche Pathway-Datei durchlaufen hat, eine Get-Anforderung an ihre API gesendet und einfach jede kgml-Datei auf der Festplatte gespeichert hat. Für das GeneBank-ähnliche Format weisen diese nicht auf eine Beziehung zwischen Genen oder beteiligten Verbindungen hin, richtig? Es sieht so aus, als wäre es nur eine Liste.
@Aaron: Soweit ich weiß, werden sie nur aufgelistet. Schade, die API hat kein Batching für die XML-Ausgabe, aber KEGG ist auf jeden Fall großartig!