Was ist die optimale Rahmengröße für Methoden zur Vorhersage der Proteinsekundärstruktur?

Die ganze Frage ist

Was ist die optimale Rahmengröße für die Methoden zur Vorhersage der Proteinsekundärstruktur der zweiten und dritten Generation? Rechtfertige deine Antwort.

Ich erinnere mich, dass es etwas mit der durchschnittlichen Länge der Alpha-Helix zu tun hat. Genauer gesagt 3 auf beiden Seiten einer Site. Insgesamt sollte die Framelänge also 7 betragen. Aber ich kann mich nicht an den Grund für das Argument erinnern.

Was denkst du?


Laut dem, was mein Professor im Unterricht sagte, stützt sich die 2. und 3. Generation der Proteinsekundärstrukturrekonstruktion auf Statistikdaten mehrerer aufeinanderfolgender Reste. Ich denke, was er mit "Frame-Größe" meinte, ist, wie viele benachbarte Reste wir im Algorithmus berücksichtigen sollten.

Antworten (3)

Meinst du mit Rahmengröße Schiebefenster?

Ich weiß, dass, wenn Sie eine Sekundärstruktur eines Transmembranproteins vorhersagen möchten, Ihre Fenstergröße 20 Aminosäuren betragen sollte (dies ist die durchschnittliche Länge von 1 Transmembran-Alpha-Helix, die sich durch die Membran erstreckt).

Ich fand dieses Papier von Chen, Kurgan und Ruan [1] .

Es besagt im Grunde, dass die Fenstergröße davon abhängt, nach welcher Art von Muster Sie suchen, aber im Allgemeinen sollten 19 Reste optimal sein.

Außerdem stützen sich Prädiktoren für Sekundärstrukturen auf viele Merkmale wie Hydrophobizität, fehlende Koordinaten in Röntgenstrukturen, B-Faktoren, Motive usw.


  1. Chen K., Kurgan L., Ruan J. 2006. Optimierung der Größe des gleitenden Fensters für die Proteinstrukturvorhersage. CIBCB '06: 2006 IEEE Symposium on Computational Intelligence and Bioinformatics and Computational Biology, S. 1-7, 28-29, doi:10.1109/CIBCB.2006.330959.
Das ist das Problem der Computerbiologie – manchmal ist es schwierig herauszufinden, was genau ein Begriff bedeutet. Aber ich denke, mein Professor hat nach einer allgemeinen Aussage über die Sekundärstruktur von Proteinen gefragt, nicht nach transmembranösen Proteinen.

OK, also 2 Antworten, die jeweils unterschiedliche Proteinsegmente unterschiedlicher Art / Funktion / Struktur betreffen, aber keine Antwort, die wirklich auf den Kern der Frage trifft. Aufgrund des Hausaufgaben-Tags bin ich versucht, nicht zu antworten - das sollte der Schüler selbst erledigen. Also werde ich eine allgemeine Antwort geben, um Sie zum Nachdenken anzuregen. Grundsätzlich wird ein solcher Wert – sei es 7 oder 20 für TMs oder 13 – empirisch ermittelt.

Ich fand, dass 13 am besten für die Leistung von neuronalen Netzen und SVM von Sekundärstrukturinformationen funktionierte, als ich dies in R ausführte.

Irgendein Grund dahinter?