Was sind sie und haben sie einen gemeinsamen Vorfahren? Wie weit zurück in die Evolutionszeit müssen wir gehen, um sie zu finden?
Wenn keine bekannt sind, welche Computerwerkzeuge könnten verwendet werden, um nach solchen Beispielen zu suchen?
Die Antwort ist, dass gemeinsame Faltungen in Sequenzen entdeckt werden, die vollständig divergieren, wo im Wesentlichen keine Ausrichtung mit herkömmlichen Mitteln gefunden werden kann.
Die Gruppe von David Eisenberg erstellte Profile auf der Grundlage von Alignments bekannter Strukturen, die empfindlicher für die Entdeckung waren, ob eine bestimmte Proteinsequenz mit einer bestimmten Struktur verwandt war, und löste das, was er das „ Problem der inversen Faltung “ nannte. In jüngerer Zeit wurden HMMs aus rohen ausgerichteten Sequenzen verwendet, die noch empfindlicher für die Vorhersage sind, ob eine bestimmte Proteinstrukturfamilie in einer Abfragesequenz gefunden werden kann. Auch PsiBlast verdient eine Erwähnung als Methode, die ein solches Profil im Handumdrehen erstellt. Es kann mit Sequenzen zurückkommen, die so unterschiedlich sind, dass sie wahrscheinlich nicht wirklich verwandt sind (persönliche Erfahrung).
Ein klassisches Beispiel dafür ist Hexokinase, ein Enzym, das Zucker phosphoryliert – das in einzelligen Eukaryoten und allen Tieren vorkommt. Als die Struktur von Aktin aufgeklärt wurde, stellte sich heraus, dass es die gleiche Kernfaltung wie Hexokinase hat. Aktin ist eines der ehrwürdigsten Proteine, die in Eurkaryoten bekannt sind, daher wird dies jetzt als Aktinfaltung bezeichnet. Keine der oben genannten Software würde diese Beziehung erkennen. (Ich habe dies gerade mit Psiblast überprüft).
Das stimmt wahrscheinlich nicht immer, aber es passiert wahrscheinlich oft, dass Sequenzen mit der gleichen Proteinfaltung so unterschiedlich sind, dass sie mit keiner dieser Methoden nachgewiesen werden können. Die meisten sequenzierten Genome enthalten Dutzende oder Hunderte von „neuartigen Genen“ – 40 % der E. coli sind noch nicht charakterisiert. Entweder tauchen neue Faltungen spontan über kurze evolutionäre Zeiträume auf oder die möglichen Sequenzen für viele Proteinfaltungen sind ziemlich groß. Meine Erwartung ist, dass eine neue Proteinsequenz mit der gleichen Faltung ziemlich schnell entstehen kann, insbesondere in Bakterien.
Dieses im letzten Jahr veröffentlichte Papier befasst sich mit der Antwort auf Ihre Frage zu Computermethoden und erwähnt 3 Hauptalgorithmen für die strukturelle Ausrichtung von Proteinen:
Und schließlich könnten Sie dieses Papier als Beispiel für diese Art von Analyse mit Strukturanalysen von Stoffwechselfamilien nützlich finden.
Verweise:
Die Gruppe von Andrei Lupas untersucht dies. Er argumentiert, dass die überwiegende Mehrheit der Faltungen nur einmal entstanden ist, sodass Proteine, die eine Faltung teilen, homolog sind, selbst wenn ihre Sequenzen divergieren. Siehe zum Beispiel diesen Artikel: „ Evolutionary Relationships of Microbial Aromatic Prenyltransferases “, wo sie zeigen, dass es subtile Sequenzähnlichkeiten zwischen zwei Proteinfamilien derselben Faltung gibt, was für einen gemeinsamen Vorfahren spricht.
Ein Beispiel, das möglicherweise einen Blick wert ist, ist das Glykoprotein mit variabler Oberfläche der Blutbahnform von Trypanosoma brucei .
Trypanosomen sind der Erreger der Schlafkrankheit, und die gesamte Zelloberfläche ist von einem einzigen Glykoprotein bedeckt, das als variables Oberflächenglykoprotein oder VSG bezeichnet wird. ( weitere Informationen siehe hier )
Diese parasitären Protozoen haben die Fähigkeit, die Immunantwort durch antigene Variation zu „täuschen“. Auf der Oberfläche wird immer nur ein einziges VSG exprimiert, aber (sehr selten) kann ein Trypanosom ein anderes VSG-Genprodukt exprimieren. Wenn es also der Immunantwort gelingt, alle VSG-A exprimierenden Trypanosomen zu eliminieren, es aber in der Population nur einen Parasiten gibt, der die Hülle gewechselt hat, wird sich diese Variante vermehren, da sie der Wirtsabwehr effektiv ein anderes Antigen (und eine zweite Immunantwort) präsentiert wird resultieren).
Es gibt wenig Sequenzidentität zwischen verschiedenen VSGs, aber sie sind homolog (stammen von einem gemeinsamen Vorfahren ab).
Die Kristallstruktur der N-terminalen Domäne von zwei verschiedenen VSGs (MITat1.2 und ILTat1.24) wurde gelöst ( Blum et al. 1993; Freymann et al ., 1993). Trotz der geringen Sequenzidentität (~16%) sind die Strukturen nahezu identisch .
Eine weitere sehr interessante Eigenschaft aller VSGs ist, dass sie über einen (C-terminalen) Glycosylphosphatidylinositol-Anker (oder GPI-Anker) kovalent an der Plasmamembran verankert sind.
Verweise
Blum, ML, Down, JA, Gurnett, AM, Carrington, M., Turner, MJ, und Wiley, DC (1993) Nature 362 , 603-609 [ veröffentlicht ]
Freymann, D., Down, J., Carrington, M., Roditi, I., Turner, M., und Wiley, D. (1990) 2.9 Eine Auflösungsstruktur der N-terminalen Domäne einer Oberflächenglykoproteinvariante von Trypanosoma Brucei . J.Mol. Biol . 216 , 141-160 _
Die folgende Referenz enthält viele nützliche Hintergrundinformationen und ist für alle kostenlos.
Michael Kühn
leuchtender Fisch