Ich habe eine technische Frage zur Syntax in Protein Data Bank-Dateien. Im Protein mit PDB# 1AE9 ( PDB-Datei ) gibt es zwei Zeilen in der .pdb-Datei:
HELIX 4 4 MET A 255 ILE A 265 1 11
SHEET 2 B 2 ILE A 253 MET A 255 -1 N ILE A 253 O ILE A 248
So wie ich die Dokumentation verstehe, bedeutet dies, dass es eine Alpha-Helix gibt, die vom Rest "MET A 255" bis zum Rest "ILE A 265" beginnt. Es gibt auch einen Beta-Strang von "ILE A 253" bis "MET A 255". Wir sehen, dass die Alpha-Helix und der Beta-Strang den Rest "MET A 255" teilen.
Die Dokumentation beschreibt diese wie folgt:
Der Wortlaut deutet darauf hin, dass der "anfängliche" Rest enthalten ist, aber ich bin mir nicht sicher, ob der "terminale" Rest enthalten wäre oder nicht.
Frage : Soll ich diesen Rest als sowohl zur Alpha-Helix als auch zum Beta-Strang gehörig betrachten? Oder sollte ich den "endständigen" Rest als nicht zum Sekundärstrukturelement gehörend betrachten? (Oder etwas anderes?)
TLDR; Antwort: Sie könnten davon ausgehen, dass dieser bestimmte Rest zu beiden Strukturelementen gehört, aber es ist eine knifflige Methode und hängt von der Methode der Sekundärstrukturzuordnung ab.
Ziemlich häufig kommt es zu einer mehrdeutigen Sekundärstrukturzuordnung. Obwohl offensichtlich nicht viele Menschen in der Lage sein werden, dieses Protein speziell zu verwenden, könnte der folgende Ansatz für andere Proteine nützlich sein.
In PyMol habe ich fetch 1ae9
M an Position 255 auf der A-Kette in Rot verwendet und hervorgehoben. Ich kann verstehen, warum dies keine zufriedenstellende Darstellung ist: Die Beta-Blatt-Zuordnung ist sehr kurz, und der fragliche Rest ist eindeutig der Anfang einer Helix.
Um eine konservativere Sekundärstrukturallokation durchzuführen, führen dss
Sie Pymol (verwässertes dssp) durch. Dies zeigt, dass die Beta-Blätter tatsächlich ziemlich mutmaßlich waren.
Wir können sehen, warum, wenn wir uns das Stick-Modell (unten) ansehen. Es gibt nur wenige (2-4) Restepaare in der Nähe, die für Wasserstoffbrückenbindungen verfügbar wären, selbst wenn alle 4 H-Brücken bilden, könnte es als etwas großzügig angesehen werden , dies als echtes Beta-Faltblatt zu bezeichnen.
Wenn wir uns dieses Beispiel (1ae9) ansehen, sehen wir das Potenzial für H-Brücken mit einem anderen mutmaßlichen Beta-Faltblatt sowie einem Rückgratwinkel, der beginnt, eine Helix zu bilden. Es ist ein klassischer Fall einer mehrdeutigen Doppelzuweisung. @AlexanderDScouras zieht eine vernünftige Schlussfolgerung, dass beides in Ordnung ist, und beantwortet direkt die Frage: Doppelbelegung ist möglich und zulässig . Ich würde Beta-Faltblätter in diesem speziellen Fall lieber ausschließen, aber unter der Bedingung, dass man hervorhebt, dass in der Haarnadelschleife viele Wasserstoffbrückenbindungen vorhanden sind.
Solange Sie die Zuordnung vernünftig begründen können, ist es wahrscheinlich in Ordnung. Sie können jeden Rest und jede Sekundärstruktur manuell zuweisen .
# set residue 155 to be alpha-helical
alter 155/, ss='H'
# update the scene in PyMOL to reflect the changes.
rebuild
Beweise sind immer eine gute Idee, um manuelle Aufgaben zu unterstützen. Ein schneller und gründlicher Weg wäre, die Sequenz durch ein paar Sekundärstruktur-Prädiktoren laufen zu lassen oder den Genesilico-Metaserver zu verwenden , um sich Ärger zu ersparen (Sie benötigen ein Konto) ( das fühlt sich an, als würden Sie einen Schritt zurückgehen, da Sie jetzt einen haben Seien Sie also vorsichtig - wenn die Sequenzvorhersage gemäß der Struktur nicht korrekt aussieht, ist sie es wahrscheinlich nicht ). Eine andere von Shigeta vorgeschlagene Methode besteht darin, dies durch einen Ramachandran-Plot zu führen ( RAMPAGE ist ein Favorit).
Wenn es sehr, sehr unklar ist, besprechen Sie es gründlich und klar, wann immer dieser Teil des Proteins relevant ist. Diese sekundären Strukturzuweisungen haben schließlich etwas willkürliche Grenzen, und wenn sich die Dinge den Schwellenwerten nähern, ist es wichtig, die Situation mit Klarheit und Spezifität anzugehen.
Ramachandran-Plot-Bildquelle: Von Dcrjsr - Eigene Arbeit, CC BY 3.0, https://commons.wikimedia.org/w/index.php?curid=9105708
Dies ist fast mehr eine philosophische Frage, wie Sie Helices und Sheets definieren möchten, was meiner Meinung nach nicht so gut definiert ist. Shigeta erwähnt, dass sie gut definierte Ramachandran-Koordinaten haben, aber das gilt für die zentralen Reste. Endreste sind weitaus flexibler. Die traditionellere Definition entspricht dem DSSP-Algorithmus, dh was ist ihr Hauptketten-Wasserstoffbindungsmuster.
Der DSSP-Algorithmus ist etwas konservativ in Bezug auf Zuweisungen und lässt häufig die ersten und letzten Reste sowohl in Blättern als auch in Helices aus. In hinterlegten Strukturen können Sie Autorenanmerkungen mit DSSP und STRIDE vergleichen und sehen, dass die Autoren oft längere Läufe zuweisen als beide. Und ich habe sicherlich Strukturen gesehen, bei denen ein Rest als beides annotiert ist, insbesondere wenn er an der Verbindungsstelle zwischen zwei Sekundärstrukturelementen liegt.
Wenn man sich die Struktur ansieht, sind die Reste 254 und 255 eindeutig Wasserstoffbrückenbindungen zu einem Beta-Faltblatt auf der einen Seite und einer Alpha-Helix auf der anderen Seite, daher sehe ich keinen Grund, warum sie nicht in beide kommentiert werden sollten.
Shigeta