Gibt es zwischen den BLAST-Scores eine Beziehung?

Gibt es einen Zusammenhang zwischen den BLAST-Scores (E-Wert, Ähnlichkeit, Identität, Lücke, Bit-Score)? Ist der e-Wert für ein Alignment proportional zu anderen Werten, wie z. B. dem Ähnlichkeitswert (dh je niedriger der e-Wert, desto höher die Ähnlichkeit)?

Danke schön!

Diese Antwort könnte hilfreich sein: biology.stackexchange.com/a/40862/16651

Antworten (1)

Ja, es gibt eine Beziehung zwischen ihnen, aber Sie können möglicherweise keine Korrelation zwischen einigen von ihnen beobachten.

Die Anzahl der Übereinstimmungen und die Punktzahl sind definitiv proportional, jedoch würde eine höhere Ähnlichkeit nur dann zu einer höheren Punktzahl führen, wenn die Längen der Punktepaare gleich sind. Gap würde sich negativ auf die Punktzahl auswirken, hängt jedoch vollständig von Ihren Punktzahlen/Strafen ab ( siehe BLAST-Hilfe und -Dokumentation ).

Der E-Wert ist im Grunde die Wahrscheinlichkeit, dass zwei zufällige Sequenzen einen bestimmten Match-Score aus einer gegebenen Datenbank haben. Ob es also für einen Treffer niedrig ist oder nicht, hängt von der Punkteverteilung der Datenbank ab. Ein niedrigerer E-Wert bedeutet nicht eine höhere Ähnlichkeit. Dies bedeutet, dass ein Treffer mit dieser Punktzahl eine geringe Wahrscheinlichkeit hat, zufällig gefunden zu werden. Die Punktzahlverteilung ist im Allgemeinen in Richtung niedriger Punktzahlen verzerrt, und daher haben hohe Punktzahlen normalerweise einen niedrigen E-Wert, aber was eine "hohe" Punktzahl ist, hängt vollständig von Ihren Abfragen ab, und daher kann diese Aussage nicht verallgemeinert werden.

Aus BLAST-Dokumenten :

E = K . M . N . e λ . S

Diese Formel macht überaus intuitiv Sinn. Die Verdoppelung der Länge jeder Sequenz sollte die Anzahl der HSP verdoppeln, die eine bestimmte Punktzahl erreichen. Außerdem muss ein HSP, um die Punktzahl 2x zu erreichen, die Punktzahl x zweimal hintereinander erreichen, also erwartet man, dass E exponentiell mit der Punktzahl abnimmt. Die Parameter K und Lambda können einfach als natürliche Skalen für die Suchraumgröße bzw. das Bewertungssystem betrachtet werden.