Statistik: Wie verteilen sich Proteinarten auf Zelltypen?

Es gibt ungefähr 10.000 bis 20.000 Proteinarten im menschlichen Proteom (obwohl ich auch Zahlen von 500.000 bis 1.000.000 gesehen habe ). Darüber hinaus gibt es im menschlichen Körper etwa 200 verschiedene Zelltypen . Meine Frage ist:

Wie verteilen sich die Proteinspezies auf die Zelltypen?

Das bedeutet konkret:

Wie viele Proteine ​​werden von n Zelltypen exprimiert ?

Wie viele Zelltypen exprimieren n Proteine?

Wahrscheinlich sind diese Zahlen nicht genau bekannt, da möglicherweise nicht alle Proteine ​​bekannt sind, die ein bestimmter Zelltyp exprimiert.

Aber es könnte Hinweise darauf geben, welche allgemeine Form die beiden Verteilungskurven haben. Sind sie Poisson-Verteilungen und sehen eher so aus?

Geben Sie hier die Bildbeschreibung ein

Oder dieses?

Geben Sie hier die Bildbeschreibung ein

Oder das?

Geben Sie hier die Bildbeschreibung ein

Oder eine andere Art der Verteilung, zB Gauss oder sogar multimodal?

Sie können auf diese Website verweisen - ncbi.nlm.nih.gov/pmc/articles/PMC4889822 Diese Website bietet einen umfassenden Überblick über die Verteilung von Proteinarten. So können Sie es mit der Statistik korrelieren.
Möglicherweise finden Sie einige relevante Daten auf dieser Website: bionumbers.hms.harvard.edu
@Dirigible gibt eine hervorragende Antwort mit einiger guter Literatur – Sie könnten auch dieses kürzlich erschienene Papier von Interesse finden „Analytische Verteilungen für detaillierte Modelle der stochastischen Genexpression in eukaryotischen Zellen“ – einschließlich Proteinen (Abb. 5): pnas.org/content/ 117/9/4682

Antworten (1)

Aus meinen Recherchen geht hervor, dass es keine einzige Ressource gibt, die einen Atlas aller menschlichen Proteine ​​enthält, die in allen menschlichen Zelltypen produziert werden. Es gibt jedoch mehrere neuere Massenspektrometrie-Studien, die sich mit zelltypaufgelösten Proteomen für bestimmte Gewebe von Menschen und Mäusen befassen, die einen Einblick in die Verteilung von Proteinen in verschiedenen Zellen geben.

Ein zelltypaufgelöstes Leber-Proteom

Diese Studie identifizierte zwischen 6200 und 8500 Maus- Genprodukte in jedem der vier Zelltypen – Hepatozyten, hepatische Sternzellen, Kupffer-Zellen und sinusoidale Endothelzellen der Leber – und insgesamt 10.075 Genprodukte in allen vier Zelltypen. Abbildung 1D zeigt, dass es eine signifikante Überlappung zwischen den Proteomen gibt; 5.246 Proteine ​​(52,1 %) werden von allen vier Zelltypen geteilt, und nur 1.451 Proteine ​​(14,4 %) sind in diesem Satz Zelltyp-exklusiv. Neben zellständigen Proteinen berichten die Autoren auch von sekretierten Proteinen, die nur für Hepatozyten und Kupffer-Zellen gelten. Diese Ergebnisse bestätigen im Großen und Ganzen eine frühere Veröffentlichung, Cell-Type-Resolved Quantitative Proteomics of Murine Liver, wo die Autoren berichteten, dass 8.338 von 11.520 (72,4%) Proteinen den fünf getesteten Leberzelltypen gemeinsam waren.

Zelltyp- und Hirnregion-aufgelöstes Proteom des Mausgehirns

Diese Studie untersuchte vier Arten von isolierten Neuronen aus bestimmten Regionen des Mausgehirns sowie fünf Arten von primär kultivierten Neuronen. Von insgesamt 13.061 Proteinen sind 10.529 (80,6 %) den fünf getesteten kultivierten Zelltypen gemeinsam, und nur 194 (1,4 %) sind einzigartig für einen einzelnen Zelltyp. Abbildung 2D macht deutlich, dass die Proteinhäufigkeit über Zelltypen hinweg – nicht nur binäre Anwesenheit/Abwesenheit – für die Zellidentität wichtig ist. (Mehr dazu weiter unten...)

Regions- und zelltypaufgelöste quantitative proteomische Karte des menschlichen Herzens

Um zu den in Ihrer Frage erwähnten menschlichen Proteinen zu kommen, analysierte diese Veröffentlichung drei Herzzelltypen und Fettfibroblasten in 16 anatomischen Regionen und gab sowohl räumliche als auch funktionelle Perspektiven auf die Verteilung der Proteintypen im menschlichen Herzen. Abbildung 5A , wie Abbildung 1D für das Mausleber-Proteompapier, zeigt eine große Menge an Überlappung von Proteinen zwischen Zelltypen: Von insgesamt 11.163 Proteinen sind 7.965 (71,4 %) allen Zelltypen gemeinsam (einschließlich Fettfibroblasten) und 617 ( 5,5 %) sind einzigartig für einen Zelltyp. Interessanterweise und vielleicht nicht überraschend sind die Teilmengen von Proteinen, die für bestimmte Zellen einzigartig sind, mit Zelloberflächenmarkern angereichert. (Verwandt: Das menschliche Oberflächenom in silico )

Soziale Netzwerkarchitektur menschlicher Immunzellen, enthüllt durch quantitative Proteomik

Diese Autoren identifizierten mehr als 10.000 verschiedene Proteine ​​in 28 primären humanen hämatopoetischen Zellpopulationen mit drei oder vier biologischen Replikaten pro Zelltyp, darunter 17 verschiedene Arten von Immunzellen. Sie identifizierten durchschnittlich 9.500 Proteine ​​pro Zelltyp und erzeugten für die Immunzellen sowohl "stationäre" als auch "aktivierte" Proteome, was einen Einblick gab, wie sich das Proteom sowohl zwischen den Zelltypen als auch innerhalb jedes Typs zwischen Zuständen verändert .

Um Ihre Frage direkt zu beantworten,

Wie verteilen sich die Proteinspezies auf die Zelltypen?

Ich habe die Daten aus der Ergänzungstabelle 6 genommen, die Replikate gemittelt, die Werte der Proteinkopienzahl in eine binäre Anwesenheits-/Abwesenheitsmatrix umgewandelt und die Anzahl der Immunzelltypen (1–17) berechnet, die durch jede eindeutige Protein-ID repräsentiert werden. Das eingefügte Diagramm kombiniert Zelltyp- und Aktivierungszustandskennzeichnungen, um zu fragen, ob die Wirkung der Aktivierung gegenüber Zelltypunterschieden bei der Proteomdivergenz dominiert.

Immunzellen-Proteom-Vergleich, binär

Anwesenheit/Abwesenheit, kein Schwellenwert – Einzigartige Proteinverteilung über 17 primäre Immunzelltypen. Ein Protein wird in einem Zelltyp als "vorhanden" angesehen, wenn der durchschnittliche Kopienzahlwert größer als Null ist. Daten von Rieckmann et al . Nat. Immunol. 2017.

Da die abgeleiteten Proteinkopienzahlen aus den Massenspektrometriedaten einen hohen dynamischen Bereich abdecken, habe ich auch die Verteilung von Proteinen untersucht, deren durchschnittliche Kopienzahlwerte mindestens doppelt so hoch waren wie die zelltypspezifischen Medianwerte der nullverarmten Kopienzahl .

mittlere Schwelle, Proteome der Immunzellen

Sehr reichliche Proteine ​​-- Einzigartige Proteinverteilung über 17 primäre Immunzelltypen. Protein-Zell-Paare werden nur gezählt, wenn die durchschnittliche Proteinkopienzahl mindestens doppelt so groß ist wie die mittlere Proteinkopienzahl für jeden Zelltyp. Daten von Rieckmann et al . Nat. Immunol. 2017.

Zusammengenommen deuten diese Verteilungen auf einige Dinge hin:

  • Für diese vielfältige Gruppe von Immunzellen ist die Mehrheit der Proteine ​​in allen Zelltypen vorhanden, wenn man strenge An-/Abwesenheitsdaten betrachtet
  • Nach der Unterteilung für sehr häufig vorkommende Proteine ​​erscheint eine bimodale Verteilung, was darauf hindeutet, dass die Proteinhäufigkeit eine bessere Metrik für den funktionellen Vergleich von Proteomen ist als eine einfache binäre Metrik
  • die Proteome eines Zelltyps zwischen verschiedenen Aktivierungszuständen sind ähnlicher als die Proteome verschiedener Zelltypen im gleichen Zustand

Für alle Interessierten habe ich die bereinigten Daten auf Dropbox zur Verfügung gestellt .

Eine vollständigere Antwort könnte die Daten aus den Veröffentlichungen zu Immunzellen und Herzzellen kombinieren, um ein Gefühl für die Proteomkonkordanz zwischen den Geweben zu bekommen, aber nur bei einer oberflächlichen Analyse würden Unterschiede in den Proteinkennzeichnungen zwischen den Datensätzen den Vergleich ermüden, also werde ich es tun überlass das jemand anderem!