Definition
Ob ein Modul vollständig ist oder nicht, kann leicht durch Auswertung des dem Modul zugeordneten Eintrags überprüft werden ; zB im Modul M00010 wird es durch gegeben
Definition K01647 (K01681,K01682) (K00031,K00030)
was übersetzt werden kann
K01647 AND (K01681 OR K01682) AND (K00031 OR K00030)
Wenn dieser Ausdruck zu ausgewertet wird TRUE
, ist das Modul abgeschlossen.
Jetzt frage ich mich, ob es für eine einzelne Reaktion analoge Informationen gibt. So findet man zB für R00352 folgende Informationen zur Orthologie:
Aber woher weiß ich nun, in welchem logischen Zusammenhang die KOs stehen?
Es könnte also sein
K01648 AND K15230 AND K15231
oder
K01648 OR (K15230 AND K15231)
usw.
Können diese Informationen von KEGG abgerufen werden und wenn ja, wie?
BEARBEITEN:
Im obigen Beispiel wäre der korrekte Ausdruck:
K01648 OR (K15230 AND K15231)
Entweder man braucht K01648
oder die anderen beiden Untereinheiten zusammen. So einfach, wie @aretaon es in seiner Antwort beschreibt, ist es leider nicht, da nur eine der beiden Untereinheiten nicht ausreichen würde. Man kann also die einer Reaktion zugeordneten KOs nicht einfach logisch verbinden OR
.
Um das, was Sie bereits in Ihrer Frage erwähnt haben, neu zu formulieren: Damit ein KEGG-Modul fertiggestellt werden kann (damit ein Organismus eine bestimmte Funktion erfüllen kann), benötigen Sie einen bestimmten Satz von Funktionseinheiten oder Enzymen. Um also die Fähigkeiten eines Organismus zu bewerten, würden Sie sein Genom auf die mit dem Modul verbundenen Gensequenzen überprüfen, indem Sie die oben erwähnte logische Operation durchführen.
Ein Modul besteht aus Chemikalien (C) und Reaktionen (R), wie Sie in Ihrem Beispiel sehen können . Um die Unterschiede zwischen Modulen und Reaktionen zu erklären, werfen Sie am besten einen Blick auf die letzte Reaktion, Isocitrat zu 2-Oxoglutarat. Es gibt drei umrandete Reaktionen (eine davon ist eine Kombination aus zwei), die alle zu Oxoglutarat führen. Wenn Sie sich die Orthologie (die beteiligten Enzyme) für die Reaktionen im ersten Feld ( R01899+R00268 ) und im zweiten Feld ( R00267 ) ansehen, werden Sie sehen, dass es dasselbe Enzym (K0030) ist, das unterschiedliche Reaktionen ausführt. Das dritte Feld enthält nun eine Reaktion ( R00709) durchgeführt von einem zweiten Enzym (K0031), das den gleichen Weg führt (es unterscheidet sich durch die Verwendung von NAD+ anstelle von NADP+ als Elektronenakzeptor). Für das zu vervollständigende Modul könnten Sie also eines der beiden verwenden (das ist der Grund für den OR-Operator in der logischen Operation).
Wenn Sie nun beurteilen möchten, ob eine bestimmte Art von Reaktion in einem bestimmten Organismus auftritt, reicht es aus, eines der möglichen Enzyme zu haben, das diese Reaktion katalysiert. So:
K01648 OR K15230 OR K15231
Cleb
Aretaon
Cleb