Wie viele Transkriptionsfaktor-Gene sind im menschlichen Genom vorhanden? Unterscheidet sich dieser Wert im Vergleich zu Mus musculus, Drosophila melanogaster, Arabidopsis thaliana, C. elegans und S. cerevisiae? Ändert sich außerdem das Verhältnis zwischen Eukaryoten und Prokaryoten?
Hier gehe ich davon aus, dass wir über eukaryotische sequenzspezifische Transkriptionsfaktoren (ssTFs) sprechen, und versuche, Ihre erste und einen Teil der zweiten Frage zu beantworten. Eine endgültige Antwort gibt es jedenfalls noch nicht.
Eine Schätzung der ssTFs-Gene beim Menschen findet sich in der 2009 Nature Reviews Genetics Veröffentlichung von Vaquerizas, JM et al., A census of human Transcription Factors: Function, Expression and Evolution .
Ein Auszug aus dem Abstract:
Hier präsentieren wir eine Analyse von 1.391 manuell kuratierten sequenzspezifischen DNA-bindenden Transkriptionsfaktoren, ihre Funktionen, genomische Organisation und evolutionäre Konservierung.
Die Zahlen sind jetzt etwas höher. Wingenderet al. haben 1.558 menschliche Gene in ihrem NAR-Papier der TFClass- Datenbank 2013 gezählt . In ihrem NAR-Papier von 2014 schlossen sie 1.557 menschliche, 1.147 Maus- und 1.105 Ratten-Orthologe ein.
Eine andere Möglichkeit, nach diesen Informationen zu suchen, besteht darin, die Anzahl der Einträge in TF-Datenbanken wie beispielsweise JASPAR anzuzeigen . Dies hat den Vorteil, dass andere Arten einbezogen werden. Die Abdeckung hier hängt jedoch von der Verfügbarkeit von Positionsgewichtungsmatrizen (PWMs) für die Bindungsspezifitäten ab. Viele uncharakterisierte TFs werden möglicherweise nicht gefunden.
Um Ihre dritte Frage zu beantworten, nämlich wie hoch der Anteil der TFs in den verschiedenen Arten ist, wäre ein naiver Ansatz, die Anzahl der vorhergesagten TFs durch die Anzahl der vorhergesagten Gene im Zielgenom zu dividieren. Wenn Sie beispielsweise die neuesten Schätzungen oben mit der vorhergesagten Anzahl von codierenden Genen aus der Ensembl- Datenbank (Version 78) verwenden, werden diese Prozentsätze zurückgegeben:
# Human
100 * 1557 / 20364 = 7.64%
# Mouse
100 * 1147 / 22606 = 5.07%
# Rat
100 * 1105 / 22777 = 4.85%
Dies deutet darauf hin, dass Menschen einen etwas höheren Anteil an TFs haben als Nagetiere. Diese Unterschiede sind jedoch nicht allzu groß und können von der Genauigkeit der unterschiedlichen Schätzungen zu TFs und Genzahlen abhängen. An sich sind diese Zahlen nicht so interessant.
Eine viel interessantere Frage ist, ob sich TF-Familien in verschiedenen Arten mehr oder weniger ausgedehnt haben (dh ob die Anzahl der Proteine innerhalb jeder Familie zugenommen hat, unabhängig vom Verhältnis zur Gesamtzahl der Gene im Genom). Ich konnte mindestens eine Veröffentlichung finden , in der dies systematisch für mehrere eukaryotische Arten durchgeführt wurde, die Tiere, Pflanzen und Pilze abdeckt und sich auf TFs konzentriert, die denen in Pflanzen gemeinsam sind. Die Hauptschlussfolgerung der Arbeit ist, dass sich einige TF-Familien in Pflanzen stärker ausgebreitet haben als in anderen Organismen. Zitat aus dem Abstract:
Um zu untersuchen, ob Unterschiede in den Expansionsmustern von TF-Genfamilien zwischen Pflanzen und anderen Eukaryoten bestehen, verwendeten wir zunächst TFs aus Arabidopsis (Arabidopsis thaliana), um TF-DNA-Bindungsdomänen zu identifizieren. Diese DNA-bindenden Domänen wurden dann verwendet, um verwandte Sequenzen in 25 anderen eukaryotischen Genomen zu identifizieren. Interessanterweise sind unter 19 Familien, die zwischen Tieren und Pflanzen geteilt werden, mehr als 14 bei Pflanzen größer als bei Tieren. Nachdem wir die abstammungsspezifische Expansion von TF-Familien in zwei Pflanzen, acht Tieren und zwei Pilzen untersucht hatten, stellten wir fest, dass TF-Familien, die diesen Organismen gemeinsam sind, in Pflanzen eine viel dramatischere Expansion erfahren haben als in anderen Eukaryoten. Darüber hinaus,
AliceD
Katz
AliceD
WYSIWYG
Katz
ddiez
proportion
bedeutet OP den Prozentsatz der TF-Gene im Verhältnis zur Gesamtzahl der Gene in jeder Art. Stimmen Sie der Änderung der Frage in "wie man die Anzahl der TFs herausfindet" nicht zu - das ist eine völlig andere Frage (aber eine interessante, wohlgemerkt).Katz