Bedeutung von „Motiv“ in der Molekularbiologie

Ich möchte die Bedeutung des Begriffs Motiv verstehen , wie er in der Molekularbiologie verwendet wird.

In einem Artikel in Nature Biotechnology stellt Patrik D'haeseleer fest:

Sequenzmotive sind kurze, wiederkehrende Muster in der DNA, von denen angenommen wird, dass sie eine biologische Funktion haben. Oft weisen sie auf sequenzspezifische Bindungsstellen für Proteine ​​wie Nukleasen und Transkriptionsfaktoren (TF) hin.

Bedeutet dies, dass es in der DNA-Sequenz eines Gens wiederkehrende Muster/Teilsequenzen der DNA gibt, von denen eine biologische Funktion vermutet wird? Wenn ja, können solche Motive einfach mit einer Software gefunden werden, die wiederkehrende Teilstrings in einem String erkennt?

In Bezug auf die biologische Funktion solcher Motive möchte ich diesen Auszug aus einer Arbeit von Williams et al. :

P. furiosus ORF PF1193 zeigte einen bis zu 12-fachen Anstieg des mRNA-Spiegels 20 min nach der Bestrahlung (Tabelle S1). PF1193 enthält ein Ferritin-ähnliches Di-Eisen- Motiv , das in Ferritin- und Dps-ähnlichen Proteinen und Bakterioferritinen vorkommt, und es wurde festgestellt, dass es zu einer neuen Unterklasse der Ferritin-ähnlichen Di-Eisen-Carboxylat-Superfamilie gehört (Ramsay et al. 2006; Tatur et al. 2005).

Meinen die Autoren mit „Motiv“, dass das Gen PF1193 eine Untersequenz aufweist, die viele Male in der DNA-Sequenz des Gens vorkommt, das für Ferritin- und Dps-ähnliche Proteine ​​kodiert, und dass dies darauf hindeuten könnte, dass sie (Gene und verwandte Proteine ​​kodiert) haben ähnliche Merkmale/Eigenschaften?

In welcher Beziehung steht dies zu dem Satz im Auszug aus dem Artikel von Nature Biotechnology ?

Oft weisen sie auf sequenzspezifische Bindungsstellen für Proteine ​​wie Nukleasen und Transkriptionsfaktoren (TF) hin.

Sie bedeuten sicherlich eine nicht allzu schlechte Ausrichtung, Sie sollten (die AA von) Ihrem Protein oder einigen Teilen davon sprengen, um zu sehen, wie gut es ist.
In dem Auszug aus Ihrem verlinkten Artikel bezieht sich "Motiv" auf ein Proteinsequenzmuster im Gegensatz zu einem DNA-Sequenzmuster.
@reuns steht AA für Aminosäuren? Ich habe das Protein "gesprengt" und einige Ähnlichkeiten mit dem Ferritin-ähnlichen Protein von Pleurocapsa (und anderen DNA-Schutzproteinen anderer Bakterien) gefunden. Dann habe ich die DNA-Sequenz des PF1193-Gens und die DNA-Sequenz des Gens, das das Ferritin-ähnliche Protein von Pleurocapsa kodiert, abgeglichen und auch dort Ähnlichkeiten gefunden ...
Ich habe Ihre Frage so bearbeitet, dass sie dem englischen wissenschaftlichen Stil entspricht. Ich habe Biologie auf Molekularbiologie umgestellt, da Ornithologen unter Motiv etwas ganz anderes verstehen würden. Ich habe den allerletzten Teil vereinfacht, weil ich nicht verstehen konnte, was Sie sagen wollten. Sie werden sehen, wie die Frage jetzt kompakter und lesbarer ist. Bitte beachten Sie, dass bei Verweisen auf veröffentlichte Artikel die darin enthaltenen Aussagen den Autoren und nicht der Zeitschrift zuzuordnen sind. Ordnen Sie Zeitschriften Meinungen nur dann zu, wenn sie in Leitartikeln erscheinen.
@David danke.
@David vielen Dank! Ich würde wirklich gerne die Fragen meines Beitrags, die Sie kursiv gesetzt haben, vollständig verstehen.

Antworten (2)

Bedeutung von Motiv in der Molekularbiologie

Im Englischen hat das Wort Motiv (aus dem Französischen entlehnt) eine Vielzahl von Bedeutungen in verschiedenen Bereichen. Diejenige, die der Molekularbiologie entlehnt ist, ist die des Musters zusammen mit einem Hinweis vielleicht auf ein Emblem oder Abzeichen.

Das Wortmuster bezeichnet sowohl eine Wiederholung als auch eine Urform, von der Kopien gemacht werden. In der Molekularbiologie weist dies darauf hin, dass dies nicht einmalig ist, sondern wiederholt vorkommt. Das Wort Emblem schlägt ein Mittel vor, um die Gruppe zu identifizieren, zu der etwas gehört. In der Molekularbiologie ist es mit einer gemeinsamen Funktion für die Mitglieder der Gruppe verbunden.

Arten von Motiven in der Molekularbiologie

Hier wird das Wort Motiv hauptsächlich auf die drei verwandten Makromoleküle DNA, RNA und Protein angewendet. All dies sind lineare Ketten begrenzter Varianten definierter Komponenten (vier Nukleotide, 20 Aminosäuren), die auf definierte Weise angeordnet sind, die wir auf die Sequenz des Makromoleküls beziehen. Innerhalb der Gesamtsequenz können Teilsequenzen vorhanden sein, die bei Wiederholung Muster darstellen und funktionelle Bedeutung haben können. Wir beziehen uns auf solche Muster wie:

  • DNA-Sequenzmotive
  • RNA-Sequenzmotive
  • Protein (oder Aminosäure)-Sequenzmotive

Auf den ersten bezieht sich D'haeseleer. Es sei darauf hingewiesen, dass diese Sequenzmotive absolut sein können oder aus Consensus-Sequenzen bestehen können, wie beispielsweise die für die ROX 1-Bindungsstelle in dem zitierten Artikel: Die Nukleotide oder Aminosäuren sind jedoch nicht die einzigen Bestandteile der Anordnung von Makromolekülen die ein Muster erzeugen kann. Motive in der Molekularbiologie können aus Strukturkomponenten zusammengesetzt sein. Dies wird in der folgenden Definition des Proteinmotivs ausgedrückt :
Consensus-Sequenz der ROX-Bindungsstelle

Proteinmotive sind kleine Regionen der dreidimensionalen Proteinstruktur oder Aminosäuresequenz, die von verschiedenen Proteinen gemeinsam genutzt werden. Sie sind erkennbare Regionen der Proteinstruktur, die durch eine einzigartige chemische oder biologische Funktion definiert sein können (oder nicht).

Und eine ähnliche Definition , die nur strukturelle Motive in Proteinen berücksichtigt, fügt hinzu: „Ein Beispiel … ist ein Helix-Turn-Helix-Motiv. ” Dies ist ein Motiv in bestimmten Proteinen, die DNA binden.

Identifizieren von Sequenzmotiven durch Computer

Die Grenze des vorgeschlagenen Ansatzes besteht darin, dass man statistisch erwarten würde, dass jedes kleine Sequenzmuster in der DNA wiederkehrt, und das Problem besteht darin, wie man feststellen kann, welche wiederkehrenden Muster biologische Bedeutung haben. Es sollte klar sein, dass es nicht das Sequenzmotiv allein ist, das es funktionsfähig macht, sondern der Kontext, in dem es gefunden wird. So wurden eine TATA-Box oder andere DNA-Motive entdeckt, die als Bindungsstellen für Transkriptionsfaktoren fungieren (und sich von anderen zufälligen oder nicht funktionellen Vorkommen im Genom unterscheiden) durch ihre Nähe zu den Positionen, an denen die Transkription initiiert wird. Ihre Funktion wurde experimentell bestätigt, zB durch Bindung von RNA-Polymerase an die DNA. (Ich hoffe, dies beantwortet die letzte Frage zur Funktion von Motiven als Proteinbindungsstellen.)

Also generell nein. Obwohl ich zugeben muss, dass ich persönlich Computeransätze verwende, um neue kleine wasserstoffgebundene Proteinmotive zu entdecken (ein etwas spezialisiertes Gebiet).

Das Ferritin-ähnliche Di-Eisen-Motiv

Dies ist kein DNA-Sequenzmotiv. Es ist nicht einmal ein Proteinsequenzmotiv, sondern ein strukturelles Proteinmotiv. Die Definition finden Sie auf InterPro :

Dieser Eintrag stellt eine Gruppe von Proteinen dar, die eine Ferritin-ähnliche Domäne enthält, die eine Domäne mit etwa 145 Resten ist, die aus einem Vier-Helix-Bündel besteht, das eine Nicht-Häm-, Nicht-Schwefel-, Oxo-verbrückte Dieisen-Stelle umgibt. Die Dieisen-Stelle ist in einem verdrillten, linkshändigen Vier-Helix-Bündel enthalten, das aus zwei antiparallelen Helixpaaren besteht, die durch eine linkshändige Überkreuzungsverbindung verbunden sind.

Es ist hier mit den gelb gefärbten Helices und den roten Kugeln der Eisenatome dargestellt:

Das Ferritin-ähnliche Di-Eisen-Motiv

[Von deMare et al. (1996) ]

Fußnoten

  1. Die Helix-Windung-Helix wird auch als Domäne bezeichnet . Die Unterscheidung zwischen Motiv und Domäne ist eine der Größe (beachten Sie die Kleinigkeit in der Definition des Proteinmotivs). Allerdings bezieht sich InterPro auf das Ferritin-ähnliche Di-Eisen-Muster als Motiv, so dass dies als akzeptable Verwendung angesehen werden kann.

  2. Man könnte argumentieren, dass, da die Sequenz und Struktur von Proteinen in der DNA festgelegt sind, das Motiv auch in der DNA enthalten sein sollte. Dies ist ein Trugschluss. Die Information ist da, aber in kryptischer Form. Die Redundanz des genetischen Codes bedeutet, dass Proteinsequenzen weitaus konservierter sind als die entsprechenden DNA-Sequenzen, und die dreidimensionalen Strukturmuster sind aus der Untersuchung von Aminosäuresequenzen nicht ersichtlich.

Vielen Dank @David. Die Situation ist komplizierter als ich dachte. Aber gibt es Software, die Motive erkennt? Zum Beispiel, wenn ich die DNA-Sequenz des Gens als Eingabe gebe und sie mir gibt ... Ich habe in diesem Forum über den "SSR" -Locator gelesen biology.stackexchange.com/questions/38913/…
Eine Software, die den biologischen Kontext, den Sie benötigen, und die experimentellen Beweise implementiert hat (so dass es eine Art "Datenbank" von Motiven ist).
Abschließend, nur um diesen wichtigen Punkt definitiv zu klären: Wenn Sie sagen, dass das Wort Emblem ein Mittel zur Identifizierung der Gruppe vorschlägt, zu der etwas gehört. In der Molekularbiologie ist es mit einer gemeinsamen Funktion für die Mitglieder der Gruppe verbunden. Bedeutet dies, dass, wenn zwei Gene ein gemeinsames DNA-Sequenzmotiv haben, sie die biologische Funktion relativ zu diesem Motiv teilen?
@Manuella-DNA-Sequenzmotive beziehen sich im Allgemeinen auf die Erkennung durch Proteine ​​– zur Bindung und möglicherweise zur Spaltung oder chemischen Modifikation. Wir sprechen im Allgemeinen nicht über die Funktion der biologischen Funktion eines DNA-Motivs, und wie ich versuchte anzudeuten, können solche Motive notwendig, aber nicht ausreichend sein, um die Transkription zu initiieren. Dieses Thema wird in vielen Besprechungen der Transkription behandelt, von denen einige zweifellos Motivtabellen enthalten werden.
@Manuella Der Vorhersagewinkel steht bei Proteinen mehr im Vordergrund, bei denen bestimmte Sequenzmotive darauf hindeuten könnten, dass ein Protein für den Transport zu einer bestimmten Organelle markiert ist. Daher haben Websites wie SwissProt Datenbanken mit bestimmten Proteinmotiven und ermöglichen es Ihnen, eine Proteinsequenz einzugeben, um herauszufinden, welche Motive sie enthält. 3D-Struktur ist etwas anders. Es gab eine Reihe von Projekten zur Bestimmung der Struktur unbekannter Proteine. Eine mutmaßliche Funktion basiert häufig auf den aufgedeckten Strukturmotiven, im Allgemeinen unter Verwendung von Fachwissen, obwohl 3D-Strukturvergleichssoftware existiert.
Ok vielen Dank. DNA-Sequenzmotive beziehen sich also im Allgemeinen auf die Erkennung durch Proteine ​​... daher denke ich, dass meine ursprüngliche Idee völlig falsch war. Also eine allerletzte Frage @David, um offiziell zu bestätigen, dass meine Vermutungen leider Unsinn waren.
Mit biologischer Funktion meinte ich einfach, dass, wenn zwei Gene ein gemeinsames DNA-Sequenzmotiv haben, ihre kodierten Proteine ​​vielleicht einige "funktionelle" Eigenschaften gemeinsam haben könnten ... wenn ich zum Beispiel das Gen betrachte, das das Ferritin-Protein kodiert, weiß ich das Das Ferritin-Protein hat die Fähigkeit, die Produktion freier Hydroxylradikale zu verhindern, die die oxidative Schädigung von Biomolekülen katalysieren können, da sie Eisen speichern und eine Fenton-Reaktion vermeiden können.
Wenn ich also ein anderes Gen betrachte, das eine Untersequenz in seiner DNA-Gensequenz hat, die ein Motiv für das Gen ist, das das Ferritin-Protein codiert, kann ich sagen, dass dieses letzte Gen ein Protein codieren könnte, das die gleiche schöne Speichereigenschaft des Ferritin-Proteins hat Eisen und Vermeidung der Produktion freier Hydroxylradikale ?
Ein Punkt, den ich in meiner Antwort nicht betont habe (den ich möglicherweise in einer späteren Überarbeitung einbeziehe) – die meisten DNA-Sequenzmotive liegen außerhalb der Region eines Gens, das die Aminosäuresequenz spezifiziert. Wenn also zwei Gene ein solches Motiv gemeinsam haben, impliziert dies eher eine Art Ähnlichkeit in der Kontrolle ihrer Expression als ihrer Proteinprodukte. Ich bin kein Transkriptionsexperte, aber zum Beispiel werden viele Gene als Reaktion auf Interferon transkribiert und diese gemeinsamen Motive – Interferon-sensitive Response-Elemente. Die Gene codieren jedoch viele verschiedene Arten von Proteinen, die zur Bekämpfung von Viren benötigt werden.
OK ! @David Das war der Punkt, den ich in wirklich wenigen Worten wollte ... wenn diese Motive im CDS gefunden werden (dessen Sequenz die Sequenz der Aminosäuren in einem Protein bestimmt), was passiert. Sind die codierten Proteine ​​in ihren Funktionen ähnlich? Diese Diskussion hat mir klar gemacht, dass ich das wissen will.
@Manuela — Siehe Fußnote 2. Dann ist es besser, sich die Aminosäuresequenzen anzusehen. Sequenzmotive in Proteinen können wie in den Proteinkinasen auf eine Funktion hinweisen, aber auch Transporttags sein. SwissProt wird es Ihnen in der Regel sagen.

Betreff:

Wenn sie "Motiv" sagen, meinen sie damit, dass das Gen PF1193 eine Untersequenz hat, die viele Male in der DNA-Sequenz des Gens vorkommt, das für Ferritin- und Dps-ähnliche Proteine ​​kodiert? Und dies kann bedeuten, dass sie ähnliche Merkmale/Eigenschaften haben?

Ja, obwohl Motivsequenzen möglicherweise nicht genau identisch sind, denn was wirklich zählt, ist die erzeugte dreidimensionale Struktur und damit ihre Funktion (ob bindend, enzymatisch oder was auch immer). Man kann sie sich als erkennbare Funktionseinheiten vorstellen, die oft, aber nicht immer autark sind. Beispielsweise würde eine Promotorsequenz in DNA als Motiv betrachtet werden, ebenso wie ein Zinkfinger in einem Protein, ebenso wie ein Poly-A-Schwanz auf einer mRNA.

Ein Problem bei der Verwendung von Motivsequenzen zur Identifizierung von Genen mit verwandter Funktion besteht darin, dass sich Sequenzen während der Evolution möglicherweise geändert haben, selbst wenn die 3-D-Struktur (und Funktion) ähnlich bleibt. Hier ist ein Papier, das an diesem Problem von vor etwa einem Jahrzehnt arbeitet:

JBiolChem. 8. Juni 2012; 287(24): 20565–20575. Online veröffentlicht am 25. April 2012. doi: 10.1074/jbc.M112.367458 PMCID: PMC3370241 PMID: 22535960 „Use of Structural Phylogenetic Networks for Classification of the Ferritin-like Superfamily“

Sprengen Sie das Protein und sehen Sie, ob die ersten Ergebnisse Ferritin-ähnlich sind!
Danke @Armand! Ja, ich habe auch in ncbi gelesen, dass Motive als Grundlage für die Klassifizierung von Proteinen verwendet werden. Aber so, da Sie das, was ich geschrieben habe (den von Ihnen gemeldeten Auszug), zumindest konzeptionell bestätigt haben, kann ich als grobe Schätzung Motive mit einem Python-Code finden, der wiederkehrende Teilstrings in einem String findet? (wobei die Zeichenfolge die DNA-Sequenz des Gens ist)
Diese Antwort ist in Bezug auf das in der Frage zitierte Ferritin-ähnliche Di-Eisen-Motiv falsch. Dies ist ein Proteinstrukturmotiv, kein DNA-Motiv. Die Identifizierung von Genfamilien aus DNA-Sequenzen ist natürlich wichtig, aber sie erfolgt auf der Grundlage der Gesamtsequenzähnlichkeit, normalerweise nicht auf der Grundlage bestimmter Motive, und ich glaube nicht, dass das Poster danach gefragt hat Begriffe der Computeranalyse. Ich interpretiere ihre Frage so, als würde man Computer verwenden, um Motive zu entdecken, anstatt sie in DNA-Sequenzen zu identifizieren.
@David Eigentlich war ich besonders daran interessiert, Motive in DNA-Sequenzen zu identifizieren ... aber ja, der Antwort fehlten einige Dinge.