Wie rufe ich einen logischen Ausdruck (KO-basiert) für Reaktionen von KEGG ab?

DefinitionOb ein Modul vollständig ist oder nicht, kann leicht durch Auswertung des dem Modul zugeordneten Eintrags überprüft werden ; zB im Modul M00010 wird es durch gegeben

Definition  K01647 (K01681,K01682) (K00031,K00030)

was übersetzt werden kann

K01647 AND (K01681 OR K01682) AND (K00031 OR K00030)

Wenn dieser Ausdruck zu ausgewertet wird TRUE, ist das Modul abgeschlossen.

Jetzt frage ich mich, ob es für eine einzelne Reaktion analoge Informationen gibt. So findet man zB für R00352 folgende Informationen zur Orthologie:

Geben Sie hier die Bildbeschreibung ein

Aber woher weiß ich nun, in welchem ​​logischen Zusammenhang die KOs stehen?

Es könnte also sein

K01648 AND K15230 AND K15231 

oder

K01648 OR (K15230 AND K15231)

usw.

Können diese Informationen von KEGG abgerufen werden und wenn ja, wie?

BEARBEITEN:

Im obigen Beispiel wäre der korrekte Ausdruck:

K01648 OR (K15230 AND K15231)

Entweder man braucht K01648oder die anderen beiden Untereinheiten zusammen. So einfach, wie @aretaon es in seiner Antwort beschreibt, ist es leider nicht, da nur eine der beiden Untereinheiten nicht ausreichen würde. Man kann also die einer Reaktion zugeordneten KOs nicht einfach logisch verbinden OR.

Antworten (1)

Um das, was Sie bereits in Ihrer Frage erwähnt haben, neu zu formulieren: Damit ein KEGG-Modul fertiggestellt werden kann (damit ein Organismus eine bestimmte Funktion erfüllen kann), benötigen Sie einen bestimmten Satz von Funktionseinheiten oder Enzymen. Um also die Fähigkeiten eines Organismus zu bewerten, würden Sie sein Genom auf die mit dem Modul verbundenen Gensequenzen überprüfen, indem Sie die oben erwähnte logische Operation durchführen.

Ein Modul besteht aus Chemikalien (C) und Reaktionen (R), wie Sie in Ihrem Beispiel sehen können . Um die Unterschiede zwischen Modulen und Reaktionen zu erklären, werfen Sie am besten einen Blick auf die letzte Reaktion, Isocitrat zu 2-Oxoglutarat. Es gibt drei umrandete Reaktionen (eine davon ist eine Kombination aus zwei), die alle zu Oxoglutarat führen. Wenn Sie sich die Orthologie (die beteiligten Enzyme) für die Reaktionen im ersten Feld ( R01899+R00268 ) und im zweiten Feld ( R00267 ) ansehen, werden Sie sehen, dass es dasselbe Enzym (K0030) ist, das unterschiedliche Reaktionen ausführt. Das dritte Feld enthält nun eine Reaktion ( R00709) durchgeführt von einem zweiten Enzym (K0031), das den gleichen Weg führt (es unterscheidet sich durch die Verwendung von NAD+ anstelle von NADP+ als Elektronenakzeptor). Für das zu vervollständigende Modul könnten Sie also eines der beiden verwenden (das ist der Grund für den OR-Operator in der logischen Operation).

Wenn Sie nun beurteilen möchten, ob eine bestimmte Art von Reaktion in einem bestimmten Organismus auftritt, reicht es aus, eines der möglichen Enzyme zu haben, das diese Reaktion katalysiert. So:

K01648 OR K15230 OR K15231 
Danke für deine Antwort. Leider ist es nicht so einfach (siehe mein EDIT), aber ich wünschte es wäre... ;)
Ich habe versucht, einen anderen Weg zu finden, aber ich glaube, es gibt keinen. Die von Ihnen beschriebene logische Syntax ist nur für Module definiert - und Module decken nur ausgewählte Teile aller Pfade ab. Um also sicher zu sein, dass das Enzym in einer Reaktion nur Teil eines Multienzymkomplexes ist (wie in Ihrem Beispiel), können Sie nicht einmal auf Wege zurückgehen, da die erforderlichen Teile auch dort nicht definiert sind.
Ja. Ich habe versucht, es aus der Modulstruktur und der Reaktionsliste abzuleiten, aber das funktioniert auch nicht, da das leider zwischen den Modulen inkonsistent ist ... Schade, dass es anscheinend keine Lösung für dieses Problem gibt.