Wie parse ich SCOP-parsbare Dateien PDB-Rückstandskennungen?

Ich versuche, die SCOP-parsbaren Dateien zu analysieren , insbesondere dir.des.scop.txt Version 1.75. Aber ich hatte Probleme mit den PDB-Rückstandskennungen in der Datei. Dies ist eine tabulatorbegrenzte Datei und der PDB-Rest und die Kettenkennung ist die 6. Spalte, die. Ein Beispiel für diese Kennung ist A:1-28,A:77-837 für die Domäne d1kk8a2. Daher werde ich das als domain_id (pdb_id chain&range) darstellen. Dieses spezielle Beispiel ist unkompliziert, was bedeutet, dass die Domäne d1kk8a2 aus den Resten 1–28 und 77–837 der Kette A des entsprechenden PDB-Eintrags 1kk8 besteht. Aber einige von ihnen sind nicht intuitiv und wie d3ckra1 (3ckr A:-2-385), was bedeutet der negative Eintrag für den Start? Und dieses Beispiel d2p83b1 (2p83 B:61P-385), es gibt ein P im Bereich (61P-385).

Wenn Sie auf die pdb-Website gehen und nach den entsprechenden Einträgen suchen, dann auf die Registerkarte Sequenz gehen, sehen Sie die Ausrichtung der PDB-Kette und die entsprechenden SCOP-Domänen. Die dort angezeigten Bereiche entsprechen den Einträgen in SCOP, sind aber schwer nachzuvollziehen. Kann jemand bitte erklären oder einige Hinweise geben. Danke schön.

Antworten (1)

PDB-Reste werden durch die Restnummer und einen Einfügungscode beschrieben. Restzahlen können jede Zahl sein, einschließlich negativer Werte. In 3CKR hat der erste Rest nr. -6, gefolgt von -5 usw. Dies könnte darauf hindeuten, dass es relativ zu anderen PDB-Einträgen zusätzliche Reste am Anfang der Sequenz gibt. In 2P83 hat der erste Rest die Nummer 61P. Sehen Sie sich https://lists.sdsc.edu/pipermail/pdb-l/2004-March/001513.html an, um zu erfahren, warum PDB-Restnummern Einfügungscodes haben.

Vielen Dank für die hilfreiche Antwort. Ich möchte die mit jeder PDB-Proteinkette verbundenen Restnummern erhalten. Ich konnte die Sequenzen von diesem Ort ftp.wwpdb.org/pub/pdb/derived_data abrufen , aber ich konnte die entsprechende Restnummerierung nicht finden.
Ich denke, Sie müssen sich einen PDB-Datei-Parser besorgen und die Informationen daraus analysieren ...