Wie führt man ein multiples Sequenz-Alignment durch?

Ich habe eine DNA-Sequenz, die Protein 1 herstellt. Aber jetzt habe ich darum gebeten:

  1. Vergleichen Sie die Aminosäuresequenz von Protein 1 mit neun homologen Proteinen und führen Sie ein Multi-Sequenz-Alignment (MSA) der Sequenzen durch.

  2. Bestimmen Sie eine Konsensussequenz für die Proteine ​​basierend auf der MSA.

  3. Finden Sie bestimmte Teile der Proteine, die konserviert sind, und erklären Sie dann, warum diese Teile konserviert sind.

Ein guter Anfang wäre, Ihre Sequenz in ein Alignment-Tool/eine Alignment-Software zu laden. Ich würde vorschlagen, MUSCLE ( drive5.com/muscle ) zu verwenden. Es ist relativ einfach zu bedienen.

Antworten (1)

MSA-Tools

Vergleichen Sie die Aminosäuresequenz von Protein 1 mit neun homologen Proteinen und führen Sie ein Multi-Alignment der Sequenzen durch.

EBI hat ein Portal für viele MSA-Tools und es gibt auch andere MSA-Tools, die an anderer Stelle verfügbar sind.

In der Forschung empfiehlt es sich, mehrere Ausrichtungstechniken zu verwenden und zu prüfen, welche sinnvolle Indels erzeugen . Normalerweise ist dies die niedrigste Anzahl von Indel-Ereignissen.

Clustal Omega ist wahrscheinlich das fortschrittlichste MSA-Tool, das auf der EBI-Website gehostet wird, es ist jedoch relativ neu und nicht so etabliert wie T-Coffee oder MUSCLE .

Beachten Sie , dass diese Tools ziemlich regelmäßig aktualisiert werden. Diese Frage und Top-Antwort zu hochmodernen MSA-Tools aus dem Jahr 2014 beziehen sich auf ein Papier aus dem Jahr 2011 , in dem versucht wird, MSA-Tools zu bewerten. Wie Sie sich vorstellen können, ändern sich die hochmodernen Tools schnell (z. B. wurde clustal-w2 veröffentlicht und seit diesem Benchmarking-Papier jetzt clustal omega). Für die meisten Forscher ist dies jedoch eine persönliche Präferenz, und verschiedene MSA-Tools sindfür verschiedene Situationen "besser" (Berechnungsgeschwindigkeit, Anzahl der Ausrichtungen, Ähnlichkeit der Sequenzen, Komplexität der Sekundärstruktur, lokale vs. globale Ausrichtungen usw.) .

Konsenssequenz

Bestimmen Sie eine Konsensussequenz für die Proteine ​​basierend auf der Multiausrichtung.

Dies hängt ganz von den Informationen aus Ihrer Ausrichtung ab.

Ein üblicher Weg, eine Consensus-Sequenz herzustellen, besteht darin, einfach den am häufigsten vorkommenden Rest an jeder Position in der MSA zu nehmen. Ich mag diesen Ansatz nicht, da er die Bedeutung von häufig vorkommenden Resten erhöht und das Auftreten von weniger häufig vorkommenden Resten verringert. Das verzerrt die Biochemie und kann leicht zu Sequenzen führen, die in der Biologie unmöglich oder unbrauchbar wären. Ich würde immer lieber eine rohe Ausrichtung sehen.

Erhaltung zwischen Ausrichtungen

Finden Sie bestimmte Teile der Proteine, die konserviert sind, und erklären Sie dann, warum diese Teile konserviert sind.

Erhaltung impliziert normalerweise Funktion, und hoffentlich haben Sie ein Homolog, das eine kategorisierte Funktion hat. Vielleicht könnte man diese Funktion in Ihrem Fall einer konservierten Sequenz in den anderen Homologen zuschreiben.

Ein brillantes Tool heißt consurf .

Bild von Struktur- und Sequenzausrichtungen, gefärbt nach Konservierung

Sie können Ihre MSA-Datei darauf hochladen und es wird die Erhaltungsregionen von lila bis blau farblich kennzeichnen. Eine violette Region impliziert eine evolutionäre Selektion, um diese Region nicht zu verändern, was bedeutet, dass es sich um eine "funktionale" Region handelt.

Consurf funktioniert besser mit mehr Sequenzen, daher ist es vielleicht nicht für dieses Projekt geeignet. Versuchen Sie stattdessen, das Alignment in Jalview zu laden und "Sequenzerhaltung" anzuzeigen.

Bild eines Balkendiagramms, das unterschiedliche Erhaltungswerte an verschiedenen Sequenzpositionen zeigt

Vorsicht.

Denken Sie bei der Durchführung einer MSA daran, dass der Algorithmus davon ausgeht, dass die Sequenz homolog ist, und dass diese Annahme zu Fehlern führen kann. Wenn es falsch aussieht, ist es wahrscheinlich!