Da Polypeptide eine lineare Kette von zwanzig Aminosäuren sind, die jeweils eine Abkürzung aus einem Buchstaben haben (z. B. Alanin = A). Kann ein Polypeptid also nur als Sequenz dargestellt werden (sagen wir: ADN für ein Alanin-, Asparaginsäure-, Asparagin-Polypeptid)?
Dieses Verfahren zur Klassifizierung von Polypeptiden würde zu möglichen 8000 (20**3) Variationen nur für 3-Aminosäure-Polypeptide (3200000 für 5-Aminosäure-Polypeptide usw.) führen, und es gäbe viele Variationen; und für längere Polypeptide – also Proteine – gäbe es sogar noch mehr Variationen.
Oder werden nur die wichtigen Polypeptide und Proteine genannt, da nicht jede Variation von Polypeptiden und Proteinen im Körper vorkommt? Ich hätte gedacht, dass viele Proteine (und Enzyme usw.) unglaublich spezifisch sind und daher auf irgendeine methodologische Weise klassifiziert werden könnten, im Gegensatz zu nur „Lipase“ oder „Carbohydrase“, die keine strukturellen Informationen liefern (obwohl dies der Fall gewesen wäre). ein langer Methodenname).
Sie können sich auf kurze Peptide sicherlich anhand ihrer Sequenz beziehen. Ich kenne keine genauen Grenzen, aber ich habe Tripeptide gesehen, die entweder mit ihren Drei-Buchstaben-Codes (Ala-Asp-Asn) oder sogar mit dem chemischen Namen (alanylaspartylasparagine) bezeichnet werden, obwohl das offensichtlich ziemlich schnell lächerlich wird .
Als größtes bekanntes Protein hat Titin auch den längsten IUPAC-Namen eines Proteins. Der vollständige chemische Name der menschlichen kanonischen Form von Titin, der mit Methionyl beginnt … und mit … Isoleucin endet, enthält 189.819 Buchstaben und wird manchmal als das längste Wort in der englischen Sprache oder jeder anderen Sprache bezeichnet. Lexikographen betrachten generische Namen chemischer Verbindungen jedoch eher als verbale Formeln als als englische Wörter
Bei mehr als etwa 5 Aminosäuren ist nur die Reihenfolge sinnvoller. Es wäre interessant, Abstracts wissenschaftlicher Arbeiten zu analysieren, um zu sehen, wie viele die Sequenz als „Name“ haben, aber trotzdem.
Wenn wir zu Proteinen kommen, wäre es nicht hilfreich, sie anhand ihrer Sequenz zu bezeichnen. Sie haben normalerweise Namen – Enzyme werden oft nach dem benannt, worauf sie wirken (wie „Alkohol“) und wie sie auf sie wirken (wie „Dehydrogenase“). Darüber hinaus gibt es strukturierte Namen, die EC-Nummern genannt werden – Sarkosin-Dehydrogenase ist beispielsweise 1.5.8.2.
Wie Sie betonen, gibt es eine sehr große Anzahl von Sequenzen, die nicht Proteinen entsprechen, die in einem Organismus vorkommen. Eine davon zu benennen ist schwierig, und wenn jemand eine synthetisiert, müsste er sich ein Namensschema ausdenken, um sich darauf zu beziehen.
Joe Healey
Alex P
Joe Healey