Ich weiß nicht viel über Genetik. Für ein Kunstprojekt suche ich nach einem menschlichen Genom.
Ich habe das gelesen:
Nur etwa 0,1 % des Genoms unterscheidet sich zwischen Individuen, was etwa 3 Millionen Varianten (auch bekannt als Mutationen) im durchschnittlichen menschlichen Genom entspricht. Das bedeutet, dass wir eine „Diff-Datei“ nur der Stellen erstellen können, an denen sich ein bestimmtes Individuum vom normalen „Referenz“-Genom unterscheidet. In der Praxis geschieht dies normalerweise in einem .VCF-Dateiformat, das in seinem einfachsten Format etwa so aussieht:
chr20 14370 rs6054257 GA 29 PASS 0|0
Wo jede Zeile ~ 45 Bytes verwendet und Sie dies mit den ~ 3 Millionen Varianten in einem bestimmten Genom multiplizieren, erhalten Sie eine .VCF-Dateigröße von etwa 135.000.000 Bytes oder ~ 125 Megabytes.
Ist das korrekt?
Kennen Sie eine Datenbank, um eine VCF-Datei oder ähnliches herunterzuladen? Es wäre großartig, wenn Sie einen Link zu der oben genannten Datei bereitstellen könnten!
Haben Sie versucht, im 1000-Genome-Projekt herumzustöbern?
Versuchen Sie es mit diesem Link
ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/pilot_data/release/2010_07/exon/snps/
AMR
Krake