Welches ist die Referenz-16S-rRNA?

Kürzlich bin ich über eine Tatsache gestolpert, die mich seit vielen Jahren nicht mehr gestört hat. Tatsache ist, dass alle universellen 16S-Primer als "[FR][0-9]+" (in Regex-Notation) geschrieben werden, also eine Position zu einer Referenz haben. Ich habe viele Artikel gelesen, in denen diese Primer vorgestellt wurden, und meistens sagen die Autoren nichts als "E. coli 16S". Jedenfalls habe ich in einem Fall festgestellt, dass es sich tatsächlich um die Referenz K12 E. coli handelt. Aber das Problem ist, dass es 7 verschiedene rRNA-Operons hat: rrnA, rrnB, rrnC, rrnD, rrnE, rrnF, rrnG. Haben Sie eine Referenz, die ein bestimmtes Operon zeigt, das für die 16S-Positionsnotation verwendet wird?

Bearbeiten Geben Sie hier die Bildbeschreibung ein

Abbildung 2. Hypervariable Regionen innerhalb des 16S-rRNA-Gens in Pseudomonas. Die aufgetragene Linie spiegelt Schwankungen in der Variabilität zwischen ausgerichteten 16S-rRNA-Gensequenzen von 79 Stämmen vom Pseudomonas-Typ wider ... ( Bodilis et al., 2012 )

Sind Sie sicher, dass sie sich in der Reihenfolge am Primer unterscheiden? Die Sequenzen der Strukturteile der Gene sind offenbar nahezu identisch. Haben Sie GenBank überprüft?
@David Ich habe das nicht selbst überprüft, aber hier ist eine relevante Referenz ... or the same strain may have multiple copies of the 16S rRNA gene that differ by 5% for some regions (such as Escherichia coli K12 [12])... (Nguyen et al., 2016)
@David Während sich die Primer tatsächlich in kurzen konservativen Regionen zwischen hypervariablen Regionen befinden, sind letztere äußerst variabel. Ich habe eine Abbildung hinzugefügt, die diese Variation über mehrere Pseudomonas - Stämme hinweg darstellt. Daher spielt es keine Rolle, ob die Primer in konservativen Regionen lokalisiert sind oder nicht, wichtig ist, dass sie auf Regionen abzielen, die sowohl in der Sequenz als auch in der Länge variieren können.

Antworten (1)

Wie Sie zu Recht betonen, ist das Entwerfen eines optimalen Primerpaars für die 16S-rRNA-Sequenzierung eine knifflige Angelegenheit, da selbst die weniger variablen Regionen zwischen verschiedenen Stämmen und Arten nicht gleich sind. Sambo et al. (2018) haben sogar eine Bioinformatik-Software zum optimalen Design von Primern für die 16S-rRNA-Sequenzierung für mehrere Bakterien entwickelt.

Wir schlagen hier ein rechnerisches Verfahren zur Optimierung der Auswahl von Primersätzen vor, basierend auf einer Mehrzieloptimierung, die gleichzeitig: 1) die Effizienz und Spezifität der Zielamplifikation maximiert; 2) maximiert die Anzahl verschiedener bakterieller 16S-Sequenzen, die mit mindestens einem Primer übereinstimmen ; 3) minimiert die Unterschiede in der Anzahl der Primer, die zu jeder bakteriellen 16S-Sequenz passen. Unser Algorithmus kann auf jede gewünschte Amplikonlänge angewendet werden, ohne die Rechenleistung zu beeinträchtigen.

Innerhalb derselben Art gibt es Diversität in den 16S-rRNA-Genen, dh die verschiedenen Kopien sind keine exakten Duplikate ( Větrovský & Baldrian, 2013 ).

Geben Sie hier die Bildbeschreibung ein Větrovský & Baldrian (2013)

Interessanterweise haben die verschiedenen rRNA-Operons in E.coli unterschiedliche Promotoren und werden sogar unter Stressbedingungen unterschiedlich exprimiert ( Kurylo et al., 2018 ).

Kitahara et al. (2012) fanden heraus, dass aus Bodenproben isolierte 16S-rRNA-Gene anstelle des ursprünglichen E.coli -Gens sein Wachstum unterstützen könnten. Mit anderen Worten, E.coli ist sehr robust gegenüber Mutationen in seiner 16S-rRNA.

Nach Gegenselektion wurden etwa 200 Klone von KT103-Derivaten (die pRB103 trugen, dessen 16S-rRNA-Gen durch Fremdgene ersetzt wurde) erhalten, aus denen 33 nicht-redundante 16S-rRNA-Gene (A01–H03) identifiziert wurden. Durch mehrfaches Alignment von E. coli 16S rRNA und unseren metagenomisch gewonnenen 16S rRNA-Sequenzen wurde festgestellt, dass mindestens 628 (40,7 %) der 1.542 Nukleotide variabel waren, was auf eine ausgeprägte Mutationsrobustheit der 16S rRNA hinweist. Bemerkenswerterweise zeigten die in dieser Studie erhaltenen funktionellen 16S-rRNA-Sequenzen (mit Ausnahme von A10 und F02, die zu 99,0 % mit E. coli-16S-rRNA identisch waren) nur 80,9–89,3 % Identität mit E. coli-16S-rRNA, was deutlich unter dem angegebenen Wert lag bisher (Proteus vulgaris 16S rRNA, 94 % Identität zu E. coli 16S rRNA)


Zu deiner Frage

Aber das Problem ist, dass es 7 verschiedene rRNA-Operons hat: rrnA, rrnB, rrnC, rrnD, rrnE, rrnF, rrnG. Haben Sie eine Referenz, die ein bestimmtes Operon zeigt, das für die 16S-Positionsnotation verwendet wird?

Ich glaube nicht, dass einer von ihnen als Referenz gilt. Die vollständige E. coli 16S-rRNA-Sequenz, die im NCBI gemeldet wird, scheint einen "Konsens" verschiedener gemeldeter Sequenzen zu berücksichtigen:

[5], [7] enthalten aktualisierte Sequenzdaten für die Originalarbeit desselben Labors [4]. Es gab zu viele Diskrepanzen zwischen [4] und [5], [7], um jede Revision in unserer Seitentabelle aufzulisten. Die gezeigte Sequenz stammt aus [7]. [4], [5], [7] weisen auf eine Reihe von Cistron-Heterogenitäten hin. Es besteht jedoch Unsicherheit hinsichtlich der Zuordnung dieser verschiedenen Heterogenitäten zu bestimmten Cistrons. Die von [4], [5], [7] verwendete RNA-Methode ergibt den Mittelwert aller in der Zelle vorhandenen Cistrons [7]. Die Heterogenitäten werden nach ihren relativen Anteilen in Haupt-, Neben- und unbestimmte Arten eingeteilt. Die gezeigte Sequenz entspricht den Hauptarten. Die Heterogenitäten wurden als Variationen in der Standorttabelle annotiert. Es ist nicht bekannt, welcher der Reste 'c' (Base 633) oder 'a' (Base 641) einer Deletion unterzogen wird, was zu der Nebenkomponente 'atctg' führt. [7] schlägt die Existenz von einem oder zwei mutierten Cistrons unter den bekannten sieben Cistrons der ribosomalen RNA vor.Mit Ausnahme einer einzelnen Basendeletion ist diese Sequenz identisch mit der aktuellen 16S-rDNA-Sequenz für das E.coli-rRNB-Gen.

Die NCBI-Seite listet auch verschiedene Polymorphismen und Basenmodifikationen in der 16S-rRNA innerhalb und zwischen verschiedenen Stämmen/"Spezies" auf.

NCBI hat auch mehrere Teilsequenzen. Als ich nach P. aeruginosa und B. subtilis suchte , konnte ich nur eine oder zwei vollständige Sequenzen finden (der Rest war teilweise). Darüber hinaus gab jeder Eintrag den Stamm an, von dem er erhalten wurde. Daher gehe ich davon aus, dass es keine einzelne Referenzsequenz gibt.

Ich schätze, dass die Leute die verschiedenen Varianten bei der phylogenetischen Analyse berücksichtigen (oder einfach nur nach konservierten "Signatur" -Sequenzen für eine bestimmte Art suchen). Ich bin mir sicher, dass es Rechenalgorithmen gibt, um die Klassifizierung optimal durchzuführen (siehe Chatellier et al., 2014 ). Da ich auf diesem Gebiet keine Expertise habe, kann ich zur Routinepraxis nichts abschließendes sagen. Tatsächlich wird noch an der Verbesserung der Analyse geforscht (z. B. Yang et al., 2016 und Sambo et al., 2018 ).

Ich habe zwar keinen Zugriff auf die Originalarbeit von Ehresmann et al. (1972), die die Quelle dieser Sequenz zu sein scheinen, deutet die Vorschau darauf hin, dass ihre Methodik nur eine Konsenssequenz erzeugen kann.