Sind SNPs oder SSR-Kopienzahlvariationsmutationen stärker ausgeprägt?

Ich versuche, ein Gefühl dafür zu bekommen, wie Mutationen vorherrschend auftreten. Ich habe verschiedene Zahlen gesehen, die zumindest auf den ersten Blick widersprüchlich erscheinen, und ich war neugierig, ob jemand eine Klärung dazu hätte.

Laut Shastry, „ SNP Alleles in Human Disease and Evolution “ ( Journal of Human Genetics 47:561–566, 2002),

In zwei zufällig ausgewählten menschlichen Genomen sind 99,9 % der DNA-Sequenz identisch. Die restlichen 0,1 % der DNA enthalten Sequenzvariationen. Die häufigste Art einer solchen Variation wird als Einzelnukleotid-Polymorphismus oder SNP bezeichnet.

Jedoch laut Nevo, „ Genetic Diversity “ ( Encyclopedia of Biodiversity , 2001),

Bezeichnenderweise erfahren SSRs Mutationen mit deutlich höheren Raten als nicht repetitive Sequenzen: 10 2 Zu 10 3 pro Locus, pro Gamete, pro Generation, was zu ihrem hohen Polymorphismus führt.

Außerdem laut Kashi und King, „ Simple Sequence Repeats as Advantageous Mutators in Evolution “, ( TRENDS in Genetics 22(5):257),

Mutationen, die die Anzahl der Wiederholungen verändern, treten typischerweise mit Raten auf, die um Größenordnungen größer sind als Einzelnukleotid-Punktmutationen.

Wenn also Variationen in Organismen hauptsächlich auf SSRs zurückzuführen sind und dies hauptsächlich auf Kopienzahlvariationen zurückzuführen ist, wäre es dann richtig zu sagen, dass Kopienzahlvarianten in SSRs die dominierende Form der Variation sind, oder übersehe ich etwas? Welche ist richtig oder welche Quelle ist maßgeblicher oder gibt es eine aktuellere Überprüfung, die ich konsultieren sollte?

HINWEIS - Ich habe das Wort "Mutationen" zum Fragentitel hinzugefügt, um klarer zu machen, wonach ich frage.

Antworten (2)

Ich mag die Antwort von @mgkrebbs, ich denke, dass sie die meisten Höhepunkte trifft, aber ich habe vor ein paar Jahren eine Rezension zu diesem Thema geschrieben, in der wir speziell Schätzungen zur Mutationslast verschiedener Mutationsklassen zusammengestellt haben (siehe Tabelle 1).

Die Gruppe von Yaniv Erlich ging direkt auf die Frage ein , die Sie zu beantworten versuchen, und sie schätzten, dass Mikrosatelliten etwas mehr Mutationen pro Generation beitragen als Substitutionen:

Diese Vorhersagen deuten darauf hin, dass die Last von de novo STR [SSR]-Mutationen mindestens 75 Mutationen pro Generation beträgt, was mit der Last aller anderen bekannten Variantentypen konkurriert.

Die meisten Schätzungen der diploiden Gesamt-Substitutions-Mutationsraten liegen zum Vergleich bei ~50/Generation.

Wenn Sie jedoch an der Gesamtzahl der Varianten interessiert sind, müssen Sie auch eine unglaublich komplexe Architektur struktureller Varianten in praktisch jedem Genom berücksichtigen, einschließlich Plasmiden, Viren und Transposons. Wenn Sie also von der „dominanten Form der Variation“ sprechen, müssen Sie wirklich etwas konkreter werden. Pro Locus oder sogar pro Mutationsklasse sind STRs/SSRs wahrscheinlich „dominant“, aber es ist schwer zu argumentieren, dass zB 1 STR-Mutation wichtiger ist als ein Transposonsprung oder eine Chromosomen-Aneuploidie oder eine zentromerische Satellitenkontraktion.

Ich würde empfehlen, die verlinkten Artikel zu lesen, um etwas mehr Kontext zu erhalten.

Mir ist nicht ganz klar, worauf Sie hinauswollen, wenn Sie fragen, wie prominent oder dominant diese beiden Arten von Variationen sind. Aber schauen wir tiefer.

Guichouxet al. (1) sagen:

Es gibt zwei Hauptunterschiede zwischen SSRs und SNPs. Erstens sind SNPs im Genom der meisten Arten zahlreicher als SSRs. Im Durchschnitt gibt es im menschlichen Genom alle 100–300 bp einen SNP (Thorisson et al. 2005), verglichen mit einem SSR-Locus alle 2–30 kb (Webster et al. 2002), je nachdem, wie SSRs sind definiert (Kelkar et al. 2010). Dies kann für genomweite Assoziationsstudien wichtig sein, aber nicht unbedingt für andere Anwendungen. Zweitens unterscheidet sich die Mutationsrate pro Generation zwischen den beiden Markertypen drastisch. SSRs haben Mutationsraten im Bereich von 10 3 Zu 10 4 pro Locus pro Generation (Ellegren 2000), im Vergleich zu ca 10 9 für SNPs, dh mehrere Größenordnungen niedriger. Infolgedessen sind SNPs typischerweise diallelisch: Beim Menschen sind < 0,1 % der SNPs triallelisch (Lai 2001). Im Gegensatz dazu haben SSR-Loci im Allgemeinen einen hohen Allelreichtum, oft mehr als 10 Allele.

Basierend auf diesen Zahlen treten SNPs vielleicht 80-mal so häufig auf wie SSRs. Ist das prominenter?

Ein SSR ist größer als ein SNP und deckt (per Definition) vielleicht einhundert bis mehrere hundert Basen gegenüber einer Basis ab. Ein SSR-Locus tritt auch in mehreren Varianten auf, z. B. mit einer Kopienzahl aus einem breiten Bereich, im Gegensatz zu nur zwei möglichen Varianten, die normalerweise für einen SNP-Locus auftreten.

Die Mutationsraten sind wesentlich unterschiedlich, offenbar typischerweise 5 Größenordnungen häufiger für SSRs als für SNPs. Beachten Sie jedoch, dass die Mutationsrate die Häufigkeit von Varianten, die in den Genomen vorhandener Organismen zu sehen sind, nicht direkt beeinflusst: Die vorhandenen Varianten sind ein Ergebnis der Filterung von Mutationen durch Selektionskräfte.

Beachten Sie auch, dass alle Basen einer Mutation unterliegen, wodurch ein SNP entsteht, aber SSR-Mutationen treten nur dort auf, wo bereits eine repetitive Sequenz existiert. (Außerdem wird die Mutationswahrscheinlichkeit nur dann signifikant, wenn die vorhandene Sequenz mehr als ein paar Wiederholungen aufweist, da der Mutationsmechanismus davon abhängt.)

Eine Hauptfrage ist jedoch, was ist die Bedeutung der Variation? Interessieren Sie sich für Variationen, nur weil sie einzelne Genome innerhalb einer Population markieren, oder interessieren Sie sich für die Variation der Phänotypen von Individuen? Einige genetische Loci sind für den Phänotyp irrelevant und andere können den Phänotyp in geringerem oder größerem Maße beeinflussen. SNPs können überall auftreten, daher kann davon ausgegangen werden, dass sie eine "faire" Chance haben, den Phänotyp zu beeinflussen. Andererseits können SSRs nur dort auftreten, wo sich wiederholende Sequenzen auftreten können (und bestehen bleiben, wo sie selektive Kräfte überleben). Bei SSRs kann eine variierende Kopienzahl in einigen Zusammenhängen, wie z. B. proteinkodierenden Sequenzen, größere Phänotypeffekte haben als ein SNP und daher stärkeren Selektionskräften unterliegen.

Meiner Ansicht nach sind sowohl SSRs als auch SNPs wichtig und es ist nicht besonders produktiv, sich über die allgemeine Bedeutung oder Dominanz des einen gegenüber dem anderen Gedanken zu machen.

Referenz:

(1) Guichoux, Erwan & Lagache, Lelia & Wagner, Stefanie & Chaumeil, Philippe & Léger, Patrick & Lepais, Olivier & Lepoittevin, Camille & Malausa, Thibaut & Revardel, Emmanuelle & Salin, Franck & Petit, Rémy. (2011). Aktuelle Trends in der Mikrosatelliten-Genotypisierung. Ressourcen zur Molekularökologie. 11. 591-611. 10.1111/j.1755-0998.2011.03014.x.

Der Grund, warum ich daran interessiert bin, ist, dass ich denke, dass die Natur und das Tempo der Evolution mit dem Mechanismus der Mutation verknüpft sind. Ich denke, es gibt eine Relevanz für die Modellierung in der Populationsgenetik. Wenn ich das richtig verstehe, sagen Sie, dass es weit mehr SNPs gibt als Kopienzahlvarianten von SSRs. Auf einer Basis pro Basenpaar überwiegen SSRs, aber da sie weniger und weiter auseinander liegen, bedeutet dies möglicherweise nicht mehr tatsächliche SSR-Mutationsinstanzen pro Generation, aber es hört sich so an, als ob es SSRs um etwa eine Größenordnung begünstigen könnte ( 4 Größenordnungen weniger im Genom gegenüber 5 Größenordnungen wahrscheinlicher)