Können erschöpfende Algorithmen MSAs erzeugen, die für die 3D-Strukturmodellierung geeignet sind?

Bei der Vorhersage der 3D-Struktur eines Proteins durch Homologiemodellierung ist der wichtigste Schritt das Multiple Sequence Alignment von Template-Sequenzen mit dem Zielprotein, dessen 3D-Modell vorhergesagt werden soll. Bei diesem Schritt wird gemäß meinem Buch für Multiple Sequence Alignment entweder die Software T-Coffee oder Praline verwendet; Diese Programme sind heuristischer Natur und basieren auf einer progressiven Ausrichtungsmethode. Es gibt immer Bedenken hinsichtlich der Sensitivität und Spezifität heuristischer Algorithmen.

Um dieses Problem zu vermeiden, stelle ich mir eine Möglichkeit vor, erschöpfende Algorithmen zu verwenden. Können wir während dieses Ausrichtungsschritts, der bei der 3D-Modellierung sehr kritisch ist, umfassende Algorithmen verwenden, um gute Modelle zu erhalten?

Von welchen erschöpfenden Algorithmen sprichst du? Das Finden des richtigen Homologs ist, AKAIK, ein NP-vollständiges Problem und deshalb werden heuristische Methoden verwendet.
Ich spreche von dynamischer Programmiermodellierung, da sie erschöpfend ist.
@WYSIWYG kannst du bitte deine Antwort erklären, damit ich ein besseres Verständnis entwickeln kann.
Heuristische/gierige Algorithmen sind schneller als DP. Ich bin kein Experte in Informatik, um dies im Detail zu erklären. Sie können sich diesen SO-Beitrag ansehen .

Antworten (1)

NEIN.

Methoden für das Multiple Sequence Alignment (MSA) wie T-Coffee, das Sie erwähnen, und Clustal ( http://www.clustal.org ), das ebenfalls weit verbreitet ist, verwenden Heuristiken für das Alignment aus dem sehr guten Grund, dass erschöpfende Algorithmen dazu sind NP-vollständig.

Sie erwähnen den dynamischen Programmieralgorithmus in Ihrem Kommentar als erschöpfend. Die Ausrichtung zweier Sequenzen durch dynamisches Programmieren hat eine Zeitkomplexität (großes O) in der Größenordnung von N 2 und kann je nach Sequenzlänge usw. einige Minuten dauern. Die Ausrichtung von drei hat ein großes O von N 3 und kann durchgeführt werden, wenn Sie viel Zeit zur Verfügung haben, aber es sollte offensichtlich sein, dass dies die Grenze der Anzahl von Sequenzen ist, die mit dynamischer Programmierung ausgerichtet werden können.

Heuristik ist keine Schande. Das vielleicht am weitesten verbreitete Bioinformatikprogramm der Welt, BLAST, verwendet eine Heuristik. (Und Ihr Gehirn trifft mithilfe von Heuristik Entscheidungen, von denen Ihr Leben jeden Tag abhängt.)

Die Methoden, die Heuristiken für MSA verwenden, wurden sukzessive modifiziert, um mit bekannten Faktoren umzugehen, die Probleme verursachen können, so dass sie oft sehr gut funktionieren. Woran erkennst du das? Was Sie bei der Verwendung von MSA-Programmen tun müssen, ist, eine "Vernunftprüfung" für jede Ausrichtung durchzuführen, die die Programme erzeugen - sieht es vernünftig aus, hat es ähnliche Regionen gut abgeglichen oder wurden große Lücken eingeführt oder offensichtliche Homologieregionen übersehen. Und wenn Sie 3D-Modellierung durchführen und keine gut aussehende Ausrichtung erhalten, wird Ihre Modellierung wahrscheinlich nicht funktionieren.

Schließlich müssen Sie immer die Möglichkeit in Betracht ziehen, dass es keine Proteine ​​​​mit bekannter Struktur gibt, die demjenigen ähneln, das Sie modellieren möchten, sodass Sie niemals eine gute MSA erhalten.