Ich dachte, dass dies nur unterschiedliche Formate derselben Daten seien.
Aber es scheint, dass es keine Möglichkeit gibt, SNP-Daten (Single Nucleotide Polymorphism) in STR-Daten (Short Tandem Repeat) umzuwandeln. Habe ich recht?
Soweit ich weiß, sind SNPs im Grunde ein "Unterschied" zwischen einer menschlichen Basis-DNA (Teile, die sich nie ändern) und einer gegebenen DNA. Während STRs DNA-Stränge sind, die sich zwischen Individuen unterscheiden.
Aber wenn es genug SNPs gibt (dh alle), wäre es trivial, STRs abzuleiten, oder?
Beispielsweise testet 23andMe derzeit das gesamte mitochondriale Genom. Bedeutet das, dass man STRs leicht ableiten kann?
Die Lösung liegt im Namen!
SNP : Einzelnukleotid-Polymorphismus
Der Name sagt uns, dass es sich um eine Veränderung handelt, die ein einzelnes Nukleotid betrifft und dass es mehrere davon geben kann ( Polymorphismus könnte als multiple Formen umgeschrieben werden ).
Von der SNP-Wikipedia-Seite :
[Ein SNP] ist eine DNA-Sequenzvariation, die auftritt, wenn sich ein einzelnes Nukleotid – A, T, C oder G – im Genom (oder einer anderen gemeinsamen Sequenz) zwischen Mitgliedern einer biologischen Spezies oder gepaarten Chromosomen in einem Menschen unterscheidet.
Wenn Sie also beispielsweise 8 Personen nehmen und ihr Gen XYZ sequenzieren, finden Sie möglicherweise an einem bestimmten Locus (=Position) auf dem Gen:
Einzelperson 1: AAGGTG C AGCAGTC
Einzelperson 2: AAGGTG T AGCAGTC
Einzelperson 3: AAGGTG T AGCAGTC
Einzelperson 4: AAGGTG T AGCAGTC
Einzelperson 5: AAGGTG C AGCAGTC
Einzelperson 6: AAGGTG C AGCAGTC
Einzelperson 7: AAGGTG T AGCAGTC
Einzelperson 8: AAGGTG T AGCAGTC
Die fett hervorgehobene Position ist ein SNP. In diesem Fall haben wir nur entweder C oder T (und dies erzeugt 2 verschiedene Allele für Gen XYZ).
Diese Seite der University of Utah enthält eine sehr klare Animation zu SNPs.
STR : kurze Tandemwiederholung
Dies sind kurze wiederholte Sequenzen. Sie sind im Tandem , das heißt, einer nach dem anderen.
STR bestehen aus wenigen (2-6) Nukleotiden, die mehrere (5-100) Mal wiederholt werden. Diese Seite der University of Arizona
gibt beispielsweise das Beispiel D7S280, eine STR mit der Sequenz (GATA) n (dh GATA wird n-mal wiederholt).
1 aatttttgta ttttttttag agacggggtt tcaccatgtt ggtcaggctg actatggagt
61 tattttaagg ttaatatata taaagggtat gatagaacac ttgtcatagt ttagaacgaa
121 ctaacgatag atagatagat agatagatag atagatagat agatagatag atagacagat
181 tgatagtttt tttttatctc actaaatagt ctatagtaaa catttaatta ccaatatttg
241 gtgcaattct gtcaatgagg ataaatgtgg aatcgttata attcttaaga atatatattc
301 cctctgagtt tttgatacct cagattttaa ggcc
In diesem Fall bestehen Variationen zwischen Individuen in der Häufigkeit, mit der die Sequenz wiederholt wird.
CACT CACT CACT
Genau, man könnte (3 mal) und jemand anderes CACT CACT CACT CACT
(4 mal)
haben . SNPs sind Mutationen in einer einzigen Base.
Amory
Verrückter Wissenschaftler
Vanuan
Amory