Vorhersage der Proteinstruktur aus der Aminosäuresequenz

Informationen, die in dieser Ressource https://predictioncenter.org/ gegeben werden, sind nahezu unmöglich zu verdauen (wie bei allem auf diesem Gebiet). Wenn mir also jemand sagen könnte, wie genau wir jetzt die tertiäre Proteinstruktur vorhersagen können - ich wäre dankbar .

Würden Sie auch gerne Ihre Gedanken darüber hören, warum eine Zelle tausende Male genau dieselbe Proteinstruktur herstellen kann, indem sie uns bekannte physikalische Gesetze verwendet, wir sie aber mithilfe von maschinellem Lernen erraten müssen? Warum ist es schwierig?

„unter Verwendung uns bekannter physikalischer Gesetze“ – Meinen Sie damit, dass wir die Gesetze der Physik kennen oder dass wir wissen, dass die Gesetze der Thermodynamik bestimmen, dass sich ein Protein auf die geringstmögliche freie Energie faltet, oder dass wir wissen, wie ein Protein tatsächlich fortschreitet sein thermodynamisch begünstigter Zustand? Wenn Sie uns sagen, was wir Ihrer Meinung nach wissen und was genau das „es“ Ihrer Meinung nach ist, das wir erraten müssen, können wir möglicherweise erklären, warum „es“ schwierig ist. Derzeit fehlt Ihrer Frage die Klarheit, die erforderlich ist, um Ihnen effektiv zu helfen.
@David ja, du hast recht, ich hatte ein zu einfaches Bild von dem Prozess, nach mehr Studium verstehe ich, warum du Einwände erhebst

Antworten (3)

Wie genau können wir die tertiäre Proteinstruktur vorhersagen?

Das hängt vom Eiweiß ab. Wenn die Primärsequenz genau mit der Sequenz eines Proteins übereinstimmt, für das die Struktur bereits aufgelöst ist, können schablonenbasierte Methoden zum Modellieren der 3D-Struktur verwendet werden (auch bekannt als Homologiemodellierung ). Diese Methoden sind tendenziell genau, wie anhand des Template-Modeling-Scores beurteilt , obwohl eine Bestätigung der Kristallstruktur nur für eine Minderheit von Modellen verfügbar ist (1 %, laut diesem Artikel von 2010 ).

Für Proteine ​​ohne strukturell aufgelöste Homologe wird häufig eine Ab-initio- Faltung verwendet, die auf einer molekularmechanischen Bewertung der iterativen Peptidkettenfaltung beruht, um Strukturen zu finden, die die freie Gibbs-Energie minimieren. Beliebte Software für die molekularmechanische Modellierung von Proteinen sind CHARMM und AMBER . Ab-initio -Methoden sind rechenintensiv und schwieriger zu validieren.

'Warum kann eine Zelle nach uns bekannten physikalischen Gesetzen tausende Male genau die gleiche Proteinstruktur herstellen, wir müssen sie aber durch maschinelles Lernen erraten'? Warum ist es schwierig?

Es ist schwierig, alle zellulären Faktoren zu kennen, die vorhanden sind, wenn ein bestimmtes Protein synthetisiert wird, und wie diese Faktoren die Faltung des Proteins beeinflussen. Wie ist die Temperatur und der pH-Wert in der Nähe des Ribosoms? Sind Chaperonproteine ​​beteiligt? Ist die Struktur mit der niedrigsten Energie die wahre Struktur, oder fällt die natürliche Struktur in ein lokales, stabiles Minimum mit einem funktionalen Potential, das durch die Evolution ausgewählt wurde? Eine gute Diskussion zu diesem letzten Punkt finden Sie auf Quora .

Danke +1! Es gibt viele gute Punkte für weitere Recherchen in Ihrer Antwort :fire:

Das Vorhersagecenter.org veranstaltet alle zwei Jahre einen offenen Wettbewerb - Critical Assessment of Structure Prediction (CASP). CASP 14 ist jetzt im Gange.

Die besten Programme für die Ab-initio- Faltung sind stark erweiterte Molekulardynamik mit maschinellem Lernen und einer Reihe von Vorhersagealgorithmen, die aggregiert sind, um eine Struktur zu erstellen. Schauen Sie sich die Rosetta- Software von David Baker an . In jüngerer Zeit hat Googles DeepMind Rosetta und eine Schar anderer geschlagen.

Vorhersagecenter.org/casp13/zscores_final.cgi

Deepmind ist ein von Deep Belief angetriebenes Netzwerk https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery

Wir trainierten ein neuronales Netzwerk, um eine Verteilung der Abstände zwischen jedem Paar von Resten in einem Protein vorherzusagen (dargestellt in Abbildung 2). Diese Wahrscheinlichkeiten wurden dann zu einem Score kombiniert, der abschätzt, wie genau eine vorgeschlagene Proteinstruktur ist. Wir haben auch ein separates neuronales Netzwerk trainiert, das alle Entfernungen zusammen verwendet, um abzuschätzen, wie nahe die vorgeschlagene Struktur an der richtigen Antwort liegt.

Das Problem der Proteinfaltung ist als Levinthals Paradoxon bekannt: Ein typisches Protein aus einigen hundert Aminosäuren kann sich in eine astronomisch große Anzahl von Konfigurationen falten, die alle mit den Gesetzen der Physik übereinstimmen (z Energie). Das eigentliche Protein in einer Zelle faltet sich jedoch (fast) immer in der gleichen Struktur und alle bekannten Proteine ​​falten sich in etwa tausend wohldefinierten Strukturen (außerdem nehmen manchmal Proteine ​​​​mit geringer Sequenzähnlichkeit genau dieselbe Struktur an).

Für diejenigen, die mehr über die dahinter stehende Physik erfahren möchten, ist Huangs Vorlesungen zur statistischen Physik der Proteinfaltung eine ziemlich lesbare Einführung , während die anderen Antworten in diesem Thread bereits einen ziemlich guten Überblick über die in der Praxis verwendeten Methoden gegeben haben - beachten Sie, dass diese verlassen sich nicht unbedingt auf maschinelles Lernen, wie das OP suggeriert, obwohl ML bereits seit einigen Jahrzehnten für diesen Zweck verwendet wird, siehe z. B. dieses Buch .