Wie viel genomische Variation findet man normalerweise innerhalb einer bestimmten Bakterienart?

Wenn ich die genaue Ausgangsposition (z. B. 1152471) der kodierenden Sequenz eines bestimmten Gens im Genom eines Bakteriums finde, ist das Genom des Bakteriums im Allgemeinen stabil genug, sodass ich erwarten kann, dieselbe Position in einem anderen Mitglied zu finden der gleichen Sorte?

Wenn Sie die Referenzsequenz aus einer Datenbank verwenden, ist es nicht unbedingt der Fall, dass Sie für eine zufällig ausgewählte Zelle ein Basis-für-Basis-Replikat haben. Wenn Sie zwei klonale Zellen aus einer Bakterienkolonie auswählen würden, wären alle diese Zellen aus einem einzigen Vorläufer hervorgegangen, sodass zwischen den beiden Zellen ein hohes Maß an Homologie bestehen würde, aber sie wären wahrscheinlich nicht für alle genau gleich Basis im gesamten Genom.
Vorsichtig sein! Da bakterielle Genome kreisförmig sind und wir ihre Nukleotidsequenz als linear aufschreiben müssen, muss der "Bruchpunkt" des Kreises nicht unbedingt an genau derselben Stelle für zwei Genome in der Datenbank liegen (wie es irgendwie basiert auf die Baugruppe, wo ein Bruch wäre, es sei denn, Sie schaffen es, mit einem vollständig zirkulären Genom zu enden und können sich entscheiden). Obwohl sich die fragliche Sequenz möglicherweise nicht geändert hat, könnte sich das fragliche Nukleotid daher immer noch an einer anderen "Position" befinden. Und ansonsten: das kommt darauf an. Einige Genome sind stabiler als andere. Einige Gene sind es auch.
Es gibt Bakterien mit linearem Chromosom. microbewiki.kenyon.edu/index.php/…
Ja, aber sind das die Arten, mit denen Sie arbeiten?

Antworten (3)

Die genetische Variation innerhalb von Bakterienarten kann viel größer sein, als man erwarten würde.

Erstens kann es schwierig sein, diese Frage quantitativ zu beantworten, da es schwierig ist, nur zu testen, ob zwei Stämme Teil derselben Bakterienart sind: Die "Goldstandard" -Methode ist tatsächlich experimentell und beinhaltet die DNA-DNA-Hybridisierung des gesamten Genoms (mit einem Cutoff von 70 % Verwandtschaft). Moderne Sequenzierungsansätze haben gezeigt, dass dies normalerweise einer durchschnittlichen Nukleotididentität (ANI) von etwa 95 % entspricht (siehe hier ).

Ein ANI von 95 % bedeutet jedoch nicht, dass die Genome zu 95 % identisch sind: Es bedeutet, dass von den gemeinsamen Sequenzen erwartet wird, dass 95 % der Nukleotide gleich sind. Der Prozentsatz der Sequenzen, die überhaupt geteilt werden, kann viel, viel geringer sein. Beispielsweise verglich diese Veröffentlichung 61 sequenzierte Stämme von E. coli . Von den ~15.000 Genen, die in mindestens einer Genomsequenz beobachtet wurden, wurden nur 6 % der Gene in allen Stämmen beobachtet. Variabel vorhandene Gene machen etwa 80 % eines typischen E. coli - Genoms aus. Dies ist ein hohes Maß an Variabilität, aber nicht unverschämt: eine Analyse von nur neun P. putidaGenome zeigten zum Beispiel einen Kern von höchstens 33% ( Ref ).

Wenn also ein Gen tatsächlich in zwei Stämmen derselben Bakterienart vorhanden ist, dann ist es wahrscheinlich hoch konserviert. Aber es gibt auch kaum eine Garantie dafür, genau denselben Gensatz in zwei Stämmen derselben Art zu finden. Das bedeutet, dass Sie nicht naiv Chromosomenkoordinaten von einem Stamm nehmen und auf einen anderen anwenden können: Sie müssen tatsächlich herausfinden, welche Sequenzen in Ihren Genome einander entsprechen.

Wenn alle Ihre Proben beispielsweise E. coli K12 MG1655 sind, wird es nur einen sehr geringen Unterschied zwischen der veröffentlichten Sequenz und Ihrer Sequenz geben. Wenn Sie einen anderen E.coli-Stamm haben, können Sie sich nicht darauf verlassen, dass es überhaupt keine Indels zwischen den beiden Stämmen gibt.

Die Position eines Gens auf einem bakteriellen Chromosom wird willkürlich bestimmt, sodass Sie nicht erwarten würden, dass kodierende Sequenzen notwendigerweise dieselben numerischen Werte haben. Denken Sie daran, dass die Transkriptionsmaschinerie der Bakterien Promotoren in der genetischen Sequenz verwendet, um zu bestimmen, wo die Transkription beginnen soll, sodass der tatsächliche Startort keine Rolle spielt – es ist ziemlich einfach für zufällige Mutationen, ein paar Basenpaare zwischen mehreren Genen hinzuzufügen oder zu entfernen!

Stattdessen würden Sie im Genom einer nahe verwandten Art nach der genetischen Sequenz des Gens suchen, an dem Sie interessiert sind. Da viele Genome durch die Identifizierung von Genen eng verwandter Arten annotiert werden, ist es möglich , dass zwei eng verwandte Genome an genau derselben Stelle beginnen, aber Sie sollten auf keinen Fall davon ausgehen, dass dies immer der Fall sein wird.

nicht wahr ... Gene in Bakterien erfahren ein gewisses Maß an Positionserhaltung