Warum hat dieses Projekt Informationen in DNA binär und nicht in Basis 4 codiert?

Question

Warum hat dieses Projekt Informationen in DNA binär und nicht in Basis 4 codiert?

Benutzer22821

Ich habe einen Artikel über Harvard-Wissenschaftler gelesen, die 700 TB Daten in DNA-Strängen kodieren. Aber sie haben die Informationen zur Basis 2 kodiert, also repräsentieren T und G beide 1 und C und A repräsentieren beide 0. Aber warum binär? Warum haben sie nicht einfach Basis 4 verwendet?

EDIT: hier der Link

Maljam

Ganz einfach, weil siliziumbasierte Computer grundsätzlich mit binären Informationen arbeiten und diese speichern. Selbst wenn wir also an die Daten in Basis-4 denken wollten, müsste der Computer immer noch in Binär konvertieren

Antworten (1)

Warum hat dieses Projekt Informationen in DNA binär und nicht in Basis 4 codiert?

Ganz einfach, weil siliziumbasierte Computer grundsätzlich mit binären Informationen arbeiten und diese speichern. Selbst wenn wir also an die Daten in Basis-4 denken wollten, müsste der Computer immer noch in Binär konvertieren

RM · Answer 1

In dem Forschungsartikel über die Bemühungen geben sie die folgende Erklärung für das Verdoppeln von Nukleotiden, anstatt dass jedes Nukleotid für zwei Bits steht:

Dies ermöglicht es uns, Nachrichten auf viele Arten zu codieren, um Sequenzen zu vermeiden, die schwer zu lesen oder zu schreiben sind, wie z. B. extreme GC

In der Praxis wählten sie zufällig aus, welche Base des Paares es war (also ein GC-Gehalt von 50 %), während sie Homopolymerläufe von mehr als drei nicht zuließen.

Ihr Schema verwendet auch Strichcodes und Adressen als "Inhaltsverzeichnis"/"Index"/"Seitenzahlen". (Die Daten wurden nicht auf einem einzigen langen DNA-Stück gespeichert, sondern auf einer großen Anzahl kürzerer Fragmente.) Durch ein leicht flexibles Codierungsschema können sie möglicherweise vermeiden, diese Anmerkungselemente in den Inhalt einzufügen.

Darüber hinaus würde ein leicht flexibles Codierungsschema es ihnen ermöglichen, die versehentliche Codierung eines Textes mit einem Teil des Genoms eines ausgewählten Agenten zu vermeiden. (Das heißt, Sie möchten keinen Teil des Pockengenoms synthetisieren, wenn Sie Ihren Roman aufbewahren. Wenn Sie die verwendeten Nukleotide ändern können, können Sie dies vermeiden.)

Interessant. Als ich die Frage zum ersten Mal las, ging ich fälschlicherweise davon aus, dass sie nur zwei Basen in der synthetischen DNA verwendet hatten, und ich fragte mich, ob sie C wegen seiner spontanen Desaminierung zu U vermieden hatten. Dies scheint für eine Langzeitlagerung besser zu sein. Frage mich, warum sie das nicht getan haben. Vermutlich etwas Strukturelles.

Warum hat dieses Projekt Informationen in DNA binär und nicht in Basis 4 codiert?

Benutzer22821

Maljam

Antworten (1)

RM

David

So führen Sie ein DNA-Strukturalignment in Pymol durch

Was ist das einfachste eukaryotische Genom?

Unterschied in den genetischen Anweisungen zwischen Mann und Frau [Duplikat]

Was bedeutet "~mitochondriale DNA ~bp lineare DNA"?

Inwieweit ist es möglich zu verstehen, ob ein Bakterium ein Protein produzieren kann? (nur in silico!)

DNA-zu-Binär-Entfernungsberechnung [geschlossen]

Wo passt die DNA in die Chomsky-Hierarchie? [geschlossen]

wo die relative Häufigkeitsverteilung synonymer Codons zu finden ist

Tool zum Nukleotid-Alignment mit allen Nukleotid-Codes (zB R, Y, W, S, etc.)?

Was ist der Unterschied zwischen Sequenz, Reads und Contigs von genetischem Material?