Ich habe mich gefragt, wie viele menschliche Proteine eine gelöste 3D-Struktur haben. Gibt es eine Datenbank nur mit menschlichen Proteinen? Ich habe mir pdb angesehen, konnte aber keinen Filter finden.
6405 Proteine, die 5220 Genen zugeordnet sind, laut Ensembl.
Im BioMart von Ensembl können Sie die PDB-ID als externe Referenz auswählen. Exportieren Sie die Ergebnisse und zählen Sie die eindeutigen Proteine/Gene, die eine PDB-ID haben.
PDB ist eine gute Ressource zur Beantwortung solcher Fragen, da Sie die Ergebnisse nach vielen zusätzlichen Parametern filtern können. So zählen und extrahieren Sie 3D-Strukturen menschlicher Proteine:
Advanced
Sie die Suchregisterkarte der PDB-Website.Biology
-> Source organism
aus dem Menü.Homo sapiens (human)
.Remove Similar Sequences at n% identity
unten überprüfen.Um weitere Filter hinzuzufügen, klicken Sie auf Refine Query with Advanced Search
. Dort können Sie Strukturen nach Ablagerungsdatum, Qualität (z. B. Auflösung oder R-Faktoren für durch Röntgenbeugung gelöste Strukturen), Liganden, Enzymklassifizierung usw. extrahieren (durch Ankreuzen von Add Search Criteria
)
Die Suche nach menschlichen Proteinen mit Entfernung von Homologen mit 90 % Identitäts-Grenzwert ergibt 7117 Strukturen. Die Anzahl von Röntgenproteinstrukturen guter Qualität (Auflösung < 2,5 Å) beträgt derzeit 3964 (mit demselben Identitäts-Cutoff).
Sie können dann die abgerufene Liste herunterladen oder benutzerdefinierte Berichte erstellen (Menüs unten).
Ein gutes Werkzeug (das auch von PDB verwendet wird) zum Generieren nicht-redundanter Proteindatensätze ist cd-hit .
Aus Ihren Kommentaren geht hervor, dass Sie nicht abgeneigt sind, einige benutzerdefinierte Skripte zu schreiben, daher wäre eine Option, die Vorteile der NCBI-Strukturdatenbank zu nutzen. Sie können nach Organismen filtern und die Ergebnisse dann als Textdatei / XML herunterladen. Wenn Sie Zugriff auf die PDB-Rohdaten benötigen, können Sie das PDB-Archiv herunterladen und die in Ihrer gefilterten Liste untersuchen.
Das neue Suchsystem von PDBe soll genau solche Fragen beantworten http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonyms:HUMAN&view=macromolecules
zeigt, dass es 6964 einzigartige menschliche Makromoleküle mit Strukturdaten in der PDB gibt.
Natürlich sind viele eher Fragmente von Proteinen als das ganze Molekül.
GWW
Gergana Vandova
GWW
Konrad Rudolf
Benutzer560
Shigeta