Wo finde ich eine Datei, die die genetischen Unterschiede beim Menschen auflistet?

Ich weiß nicht viel über Genetik. Für ein Kunstprojekt suche ich nach einem menschlichen Genom.

Ich habe das gelesen:

Nur etwa 0,1 % des Genoms unterscheidet sich zwischen Individuen, was etwa 3 Millionen Varianten (auch bekannt als Mutationen) im durchschnittlichen menschlichen Genom entspricht. Das bedeutet, dass wir eine „Diff-Datei“ nur der Stellen erstellen können, an denen sich ein bestimmtes Individuum vom normalen „Referenz“-Genom unterscheidet. In der Praxis geschieht dies normalerweise in einem .VCF-Dateiformat, das in seinem einfachsten Format etwa so aussieht:

chr20 14370 rs6054257 GA 29 PASS 0|0

Wo jede Zeile ~ 45 Bytes verwendet und Sie dies mit den ~ 3 Millionen Varianten in einem bestimmten Genom multiplizieren, erhalten Sie eine .VCF-Dateigröße von etwa 135.000.000 Bytes oder ~ 125 Megabytes.

Ist das korrekt?

Kennen Sie eine Datenbank, um eine VCF-Datei oder ähnliches herunterzuladen? Es wäre großartig, wenn Sie einen Link zu der oben genannten Datei bereitstellen könnten!

Möglicherweise müssen Sie Ihre Zahl überdenken, diese 0,1%-Zahl ist möglicherweise etwas niedrig ... Wenn Sie sich für die Genetik interessieren, interessiert Sie möglicherweise diese Antwort, biology.stackexchange.com/a/41975/16651 . Außerdem sind die Datenbanken des NCBI für die Öffentlichkeit zugänglich und Sie sollten in der Lage sein, alles herunterzuladen, was Sie wollen.
Technisch gesehen (und in SI- und IEC-Begriffen ) sind 135.000.000 135 Megabyte (MB) oder ungefähr 129 Mebibyte (MiB).

Antworten (1)

Haben Sie versucht, im 1000-Genome-Projekt herumzustöbern?

Versuchen Sie es mit diesem Link

ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/pilot_data/release/2010_07/exon/snps/