Was bedeuten rs id, Allel codiert 0 und Allel codiert 1?

Also, für ein Projekt, an dem ich gearbeitet habe (andere Geschichte), habe ich mir das HapMap-Projekt und seine kostenlosen Online-Dateien angesehen. In ihrer README-Datei sprechen sie darüber, dass es für jede Legendendatei für jedes Chromosom/jede Region eine rs-ID, eine mit 0, 1 codierte Allele und eine Basenpaarposition gibt.

Nachdem ich das eine Weile angestarrt habe, ist es ziemlich offensichtlich, dass die Position der Basenpaare bedeutet, wo sich jedes Nukleotid entlang der genetischen Sequenz befindet ... ist das richtig?

Und was bedeuten rs id und die anderen Wörter? Jede Hilfe wäre sehr willkommen!

Hier ist der Link zur README-Datei, in demselben Verzeichnis befinden sich die Dateien über die Teilnehmer, nur einschließlich SNPs (Snips!).

Link zur README-Datei des HapMap-Projekts

Sequenzdatenverbindung des HapMap-Projekts (Phase 2)

Antworten (1)

rs id ist die Referenz-SNP-Cluster-ID , siehe hier . Es ist im Grunde eine eindeutige Kennung.

Diese Tabelle stammt aus Ihrem Link:

rs              position        0       1
rs11089130      14431347        C       G  
rs738829        14432618        A       G  
rs915674        14433624        A       G

Die Allelcodes sind die 3. und 4. Spalte. Ein SNP ist eine Stelle, an der eine andere Base in verschiedenen Versionen desselben Gens gefunden wird (verschiedene Versionen von Genen sind Allele). Für einen bestimmten SNP werden die verschiedenen Allele als 0- oder 1 -Allel bezeichnet. In der Tabelle hat also das erste SNP, rs11089130, zwei Allele: Allel 0 hat ein C an der SNP-Position (14431347), während Allel 1 ein G an dieser Position hat. Der Allelcode impliziert keine biologische Bedeutung.

Ich bin mir nicht sicher, was passieren würde, wenn es drei Allele an einem SNP gäbe, aber vermutlich gäbe es dann auch einen als 2 codierten SNP .

Bearbeiten: Allel 0 ist der Rest aus dem Referenzgenom. Allel 1 ist der untersuchte Rest, das SNP.

0 ist also das Standard-Allel und 1 das mutierte Allel?
@higgs241 0ist der Rest, der im Referenzgenom gefunden wird, und 1ist der Rest, der in anderen gefunden wird. Bitte beziehen Sie sich nicht auf "mutierte Allele", Variation ist die Norm ...
@terdon ist das Referenzgenom für jeden registrierten SNP gleich? Ich meine, wenn Sie bei jedem SNP, der mit einer rsID registriert ist, das Allel 0 nehmen würden, würden Sie am Ende das genetische Profil einer bestimmten Person erhalten? Scheint nicht: Ich habe in en.wikipedia.org/wiki/Reference_genome gelesen, dass "das menschliche Genom des Genome Reference Consortium (Build 37) von dreizehn anonymen Freiwilligen aus Buffalo, New York, stammt". Wird das Genom als Referenz für die 0/1-Markierung von SNPs verwendet? Und was tun, wenn es in dieser Personengruppe Polymorphismus gibt? Vielleicht könnte ich eine neue Frage stellen...
@bli Auf der WP-Seite, auf die Sie verlinken, scheint es ziemlich klar zu sein, dass das Referenzgenom ein Kurationskonstrukt ist und daher nicht einem Individuum entspricht. Tatsächlich enthält die Seite diesen Satz: "Das ABO-Blutgruppensystem unterscheidet sich zwischen Menschen, aber das menschliche Referenzgenom enthält nur ein O-Allel (obwohl die anderen Allele kommentiert sind)."
@Alan Boyd Ja, ich hätte die Seite weiterlesen sollen. Es gibt also dieses "GRC-Humangenom (Build 37)", das eine künstliche haploide Referenz ist. Ist dies die Referenz für alle registrierten SNP? Es könnte sein, aber ich habe keine Gewissheit. Ein Grund für meine Zweifel ist folgender: Kann es vorkommen, dass ein neuer SNP in einem Teil des Genoms identifiziert wird, der in diesem Referenzgenom noch nicht vorhanden ist? Ich vermute, dass dies selten wird, aber als sich diese Referenz in früheren Bauphasen befand, könnte dies passiert sein.