Wie viele menschliche Proteine ​​haben eine gelöste 3D-Struktur?

Ich habe mich gefragt, wie viele menschliche Proteine ​​eine gelöste 3D-Struktur haben. Gibt es eine Datenbank nur mit menschlichen Proteinen? Ich habe mir pdb angesehen, konnte aber keinen Filter finden.

Ich denke, Sie werden viele Probleme mit Redundanz haben, besonders wenn Sie die Anzahl der einzigartigen Proteine ​​​​wissen möchten.
@GWW Ich denke, dass das Schreiben eines kleinen Skripts die Redundanz beseitigen kann.
Vielleicht haben Sie mehr Glück, wenn Sie diese Frage auf biostar stellen .
Beachten Sie, dass „gelöst“ sehr subjektiv ist. Nicht alle Strukturen sind von hoher Qualität, und einige von ihnen sind aufgrund experimenteller Fehler einfach falsch.
Dies ist aus zwei Gründen eine sehr heikle Frage: Die Proteindatenbank akzeptiert NMR- und Kristallstrukturen von Proteinen, die unterschiedliche Auflösungs- und Genauigkeitsgrade bieten. Diese Strukturen sind auch etwas subjektiv, da das Protein abhängig von seinem relevanten biologischen Kontext unterschiedliche Konformationen annehmen kann. Drittens können die Lösungsmittelextraktionen zu einer fehlerhaften Struktur führen.
Viele dieser Proteine ​​haben nur eine oder zwei Domänen, die als Strukturen gelöst sind. Tierische Proteine ​​sind so hart. Das ist, wo diese Frage imho ein wenig schwierig wird.

Antworten (4)

6405 Proteine, die 5220 Genen zugeordnet sind, laut Ensembl.

Im BioMart von Ensembl können Sie die PDB-ID als externe Referenz auswählen. Exportieren Sie die Ergebnisse und zählen Sie die eindeutigen Proteine/Gene, die eine PDB-ID haben.

PDB ist eine gute Ressource zur Beantwortung solcher Fragen, da Sie die Ergebnisse nach vielen zusätzlichen Parametern filtern können. So zählen und extrahieren Sie 3D-Strukturen menschlicher Proteine:

  1. Öffnen AdvancedSie die Suchregisterkarte der PDB-Website.
  2. Wählen Sie Biology-> Source organismaus dem Menü.
  3. Geben Sie ein Homo sapiens (human).
  4. Sie können die Redundanz reduzieren, indem Sie dies Remove Similar Sequences at n% identityunten überprüfen.
  5. Anfrage senden.

Um weitere Filter hinzuzufügen, klicken Sie auf Refine Query with Advanced Search. Dort können Sie Strukturen nach Ablagerungsdatum, Qualität (z. B. Auflösung oder R-Faktoren für durch Röntgenbeugung gelöste Strukturen), Liganden, Enzymklassifizierung usw. extrahieren (durch Ankreuzen von Add Search Criteria)

Die Suche nach menschlichen Proteinen mit Entfernung von Homologen mit 90 % Identitäts-Grenzwert ergibt 7117 Strukturen. Die Anzahl von Röntgenproteinstrukturen guter Qualität (Auflösung < 2,5 Å) beträgt derzeit 3964 (mit demselben Identitäts-Cutoff).

Sie können dann die abgerufene Liste herunterladen oder benutzerdefinierte Berichte erstellen (Menüs unten).

Ein gutes Werkzeug (das auch von PDB verwendet wird) zum Generieren nicht-redundanter Proteindatensätze ist cd-hit .

Aus Ihren Kommentaren geht hervor, dass Sie nicht abgeneigt sind, einige benutzerdefinierte Skripte zu schreiben, daher wäre eine Option, die Vorteile der NCBI-Strukturdatenbank zu nutzen. Sie können nach Organismen filtern und die Ergebnisse dann als Textdatei / XML herunterladen. Wenn Sie Zugriff auf die PDB-Rohdaten benötigen, können Sie das PDB-Archiv herunterladen und die in Ihrer gefilterten Liste untersuchen.

Das neue Suchsystem von PDBe soll genau solche Fragen beantworten http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonyms:HUMAN&view=macromolecules

zeigt, dass es 6964 einzigartige menschliche Makromoleküle mit Strukturdaten in der PDB gibt.

Natürlich sind viele eher Fragmente von Proteinen als das ganze Molekül.