Wo finde ich große Datensätze von Protein-Interaktionsnetzwerken?

Wo finde ich große Datensätze von Protein-Interaktionsnetzwerken für Krebs oder Alzheimer-Erkrankungen? Bisher habe ich String gefunden , aber es hat nicht genug Proteine ​​​​für meine Zwecke. Gibt es solche Datenbanken mit mehr Einträgen? Ich bin immer noch offen für jeden Vorschlag der Krankheit zur Auswahl. Der wichtigste Teil ist das Datenvolumen. Und wie kann ich die Annotation jedes Proteins des extrahierten Netzwerks von Uniprot erhalten?

Willkommen bei Biology.SE. Ich habe Ihre Frage bearbeitet, um sie klarer zu machen. Bitte zögern Sie nicht, weiter zu bearbeiten. Vielen Dank!
Die String-Datenbank ist eine der besten verfügbaren, wie viele Proteine ​​benötigen Sie? (Beachten Sie, dass das menschliche Genom voraussichtlich etwa 25.000 proteinkodierende Gene enthält.)
@alec_djinn Ich brauche ungefähr 5.000 oder 6.000 Proteine ​​​​für Alzheimer oder Krebs, aber ich weiß nicht, wie ich diese Menge auf einmal abrufen kann
@AM Ich kann die genaue Anzahl der Einträge für die menschlichen Proteine ​​​​nicht finden, vielleicht sollten Sie sie kontaktieren, 5k klingt vernünftig, ich würde erwarten, dass sie es haben. Wenn nicht, können Sie sich vielleicht mit anderen Säugetierproteinen integrieren. Soweit ich weiß, ist STRING das vollständigste, das Sie derzeit finden können.
@alec_djinn Okay. Danke, ich werde sie kontaktieren
@AM Was lässt Sie glauben, dass Sie 5k-Proteine ​​​​für Alzheimer finden können? Gehen Sie davon aus, dass 1/5 des menschlichen Genoms an Alzheimer beteiligt ist? Nichtsdestotrotz könnte man die Gene im KEGG-Weg für die Alzheimer-Krankheit nehmen oder die Gene, von denen bekannt ist, dass sie genetisch ursächlich für AD sind oder mit AD assoziiert sind, und alle ihre Interaktionspartner einbeziehen. Ich denke, das Netzwerk wird als solches ziemlich groß werden.
@alec_djinn ehm, die STRING-Datenbank ist eine der größten verfügbaren, aber absolut nicht eine der besten. Wahrscheinlich das Schlimmste, da es eine Menge beschissener Daten enthält. Empfehlen Sie es nicht, es sei denn, Sie sind sachkundig genug, um die schlechten Dinge zu analysieren.
@AM Bitte bearbeiten Sie Ihre Frage und klären Sie Ihre Bedürfnisse. Möchten Sie die Ergebnisse nur auf binäre Interaktionen beschränken? Interessieren Sie sich auch für nicht-direkte Interaktionen wie die Teilhabe am selben Komplex? Wollen Sie nur experimentell verifizierte Wechselwirkungen oder auch solche, die durch elektronische Annotationen erschlossen werden? Haben Sie eine Liste mit interessanten Proteinen? Bitte fügen Sie weitere Details hinzu.
@WouterDeCoster würden Sie mir eine Anwendung vorschlagen, mit der ich einen so großen Datensatz erhalten kann? Ich bin nicht wirklich auf Azheimer beschränkt, es war nur ein Vorschlag. Ich bin offen für jede Krankheit, die mir diesen Anteil an Daten bringt
@terdon Wenn nicht, welche Datenbank würden Sie empfehlen? Ich habe kein interessantes Protein, ich möchte nur einen riesigen Datensatz von Protein-Protein-Wechselwirkungen für eine Krankheit, das ist alles, was ich für Vorschläge offen bin.
@AM ja, aber was meinst du mit "Protein-Protein-Wechselwirkungen für eine Krankheit"? Wie würden Sie die Liste der Proteine ​​definieren, die Ihnen wichtig sind? Normalerweise beginnen Sie mit einer kleinen Liste von „Köder“-Proteinen und sammeln dann ihre Interaktoren, indem Sie so viele Schritte im Netzwerk nach unten gehen, wie Sie benötigen.
@terdon Mir ist die Liste der Proteine, die ich brauche, egal, mehr als die Idee eines spezifischen Netzwerks für eine Krankheit, 4k bis 5k Proteine ​​zu haben, das ist alles
Ich weiß nicht, wie man das überhaupt definieren könnte. Ob Sie ein Protein in die Liste der an einer Krankheit beteiligten Proteine ​​aufnehmen, hängt stark davon ab, wie Sie eine Krankheitsassoziation definieren. Sind es nur Proteine ​​mit einer Funktion, die diese Krankheit beeinflusst? Sind es auch die Proteine, die mit ihnen interagieren? Wie viele Schritte entfernt? Wie wäre es mit Proteinen, die die Expression verwandter Gene kontrollieren? Oder Proteine, die damit interagieren? Oder sollen es nur Proteininteraktionen sein, deren Störungen die Krankheit beeinflussen? Und sollte das allgegenwärtige Proteine ​​​​einschließen, die an fast allem beteiligt sind?

Antworten (1)

Es gibt eine Reihe anständiger Protein-Protein-Interaktionsdatenbanken: Biocarta, BioGrid, DIP, InnateDB, IntAct, MINT, PPID. Einige von ihnen sind derzeit nicht verfügbar, aber Sie können Datensätze von der Expression2Kinases- Downloadseite herunterladen , da sie als Teil der Genes2Networks-Analyse in die X2K-Pipeline integriert sind . Wenn Sie mehr Proteine ​​benötigen, können Sie Ihre Proteinliste bei X2K einreichen und die G2N-Analyse verwenden, um angereicherte Transkriptionsfaktoren durch bekannte Protein-Protein-Wechselwirkungen zu verbinden.

Außerdem wurde kürzlich der neue Datensatz namens hu.MAP veröffentlicht. Es handelt sich um einen Datensatz menschlicher Protein-Protein-Wechselwirkungen, die durch über 9.000 Massenspektrometrie-Experimente bestimmt wurden, die vom Marcotte Lab der UT Austin durchgeführt wurden. Ein Artikel, der das hu.MAP-Projekt beschreibt, ist auf Biorxiv verfügbar .

BioPlex ( biophysical interactions of ORFeome -based comp plexes ) ist eine weitere Datenbank mit experimenteller Überprüfung. Autoren beschreiben es als ein Netzwerk, das ist

das Ergebnis der Erstellung Tausender von Zelllinien, von denen jede eine markierte Version eines Proteins aus der ORFeome-Sammlung exprimiert. Die Immunreinigung des markierten Proteins und der Nachweis assoziierter Proteine ​​durch Massenspektrometrie sind die Bausteine ​​des Netzwerks. Das übergeordnete Projektziel ist es, Proteininteraktionen für jedes Mitglied der Sammlung zu bestimmen.

Ich habe IntAct überprüft und es bietet irgendwie das, wonach ich gesucht habe. Ich frage mich, ob es eine Möglichkeit gibt, alle Anmerkungen der zugehörigen Proteine ​​aus Uniprot zu extrahieren. weil ich alle Anmerkungen zu jedem im Datensatz enthaltenen Protein erhalten muss