DNA als digitales Speichermedium; Sequenzen aus Sicherheitsgründen algorithmisch vermieden (oder sollten)?

Sicherheit für die Umwelt ist wahrscheinlich auch hier impliziert, aber der Fokus sollte auf den Menschen liegen, die möglicherweise mit großen Mengen synthetischer DNA in Kontakt kommen, die zur Verschlüsselung von Informationen als Datenträger verwendet wird.


Die Idee, DNA als digitales Speichermedium zu nutzen, ist nicht neu. Zwei Papiere sind unten aufgeführt, aber es gibt noch viele andere.

Kürzlich wurde das Konzept durch die Nachricht von einem „Film“, der mit CRISPR-Cas kodiert wird, weiter hervorgehoben. Ein Video der Harvard University erklärt den Prozess:

In diesem Video erklären die Forscher George Church und Seth Shipman vom Wyss Institute und der Harvard Medical School, wie sie eine neue, auf dem CRISPR-System basierende Technologie entwickelt haben, die die chronologische Aufzeichnung digitaler Informationen, wie Stand- und Bewegtbilder, in lebenden Bakterien ermöglicht. Bildnachweis: Wyss Institute an der Harvard University

Weitere Informationen finden Sie unter: https://wyss.harvard.edu/taking-cells ...

Unten: ein GIF, das die Originaldaten zeigt, und der "Film", der aus der Aufzeichnung in DNA interpretiert wird. Aus der Los Angeles Times :

Geben Sie hier die Bildbeschreibung ein

DNA-DVR? Wissenschaftler haben einen kurzen Film eines galoppierenden Pferdes in die DNA lebender Bakterien hochgeladen und konnten ihn mit einer Erfolgsquote von 90 % abrufen. (Seth Shipman)

Die unmittelbare Anwendung in der Arbeit des Harvard Wyss Institute scheint (nach meinem Verständnis des Videos) die In-situ- Datenerfassung zu sein, bei der für ein Experiment relevante Informationen in der DNA von am Experiment beteiligten Zellen aufgezeichnet werden. Der Einsatz von Bewegtbild ist also eine Möglichkeit, den Kernpunkt der „chronologischen Erfassung digitaler Informationen“ zu verdeutlichen.

Andere Anwendungen beinhalten die DNA selbst, die außerhalb von lebenden Zellen gespeichert ist, einfach als Massenspeichermedium.

FRAGE: Ich frage mich, ob es Sequenzen gibt, die wahrscheinlich als Standardverfahren aus Sicherheitsgründen algorithmisch vermieden werden (oder sollten), wenn DNA als digitales Speichermedium verwendet wird. Die DNA kann eher von IT-Personal als von ausgebildeten Biologen gehandhabt oder versendet oder auf andere Weise nicht mit der gleichen Sorgfalt behandelt werden, mit der synthetische DNA heute von Forschern gehandhabt wird.

Einige andere Diskussionen über DNA als Speichermedium:

Next-Generation Digital Information Storage in DNA , Church, Gao, Kosari, 2012. doi:10.1126/science.1226355

Auf dem Weg zu einer praktischen Informationsspeicherung mit hoher Kapazität und geringem Wartungsaufwand in synthetisierter DNA haben Goldman et al. 2013. doi: 10.1038/natur11875


Weitere Hintergrundinformationen zur Arbeit mit zeitlich codierten Daten finden Sie in den hervorragenden Antworten auf die Frage Was bedeutet es, „ein Bild und GIF in die DNA von Bakterien zu schreiben“?

Bearbeiten: Ich werde hier einen Kommentar zitieren, nur um sicherzustellen, dass das Wort Sicherheit nicht als Datenintegrität oder die Sicherheit der Bakterien falsch interpretiert wird :

Wenn wir von Sicherheitsproblemen im Zusammenhang mit der Handhabung biologischer oder biomolekularer Proben sprechen, ist es die Sicherheit von Menschen, um die wir uns Sorgen machen. Sicherheitsregeln, Sicherheitsverfahren, Sicherheitskurse, Schutzbrillen, diese dienen der Sicherheit des Menschen, nicht der Sicherheit der Probe.

Eine identische oder nahezu identische Frage dazu wurde schon einmal gepostet, aber ich kann sie nicht finden, vielleicht wurde sie gelöscht. Nur zur Erinnerung, falls es noch jemand findet...
@BryanKrause Es gibt eine gelöschte Frage, die ähnlich war. Hier habe ich einige Ihrer hilfreichen Vorschläge verwendet und auch das weniger relevante Material entfernt, das ablenkend zu sein scheint. Bitte behaupten Sie jedoch nicht, dass ich beweisen muss, dass DNA gefährlich ist, bevor ich fragen kann, ob DNA mit Vorsicht behandelt werden würde.
Ah okay das war deine Frage. Haben Sie das dort zitierte Papier? Es könnte die Kirche sein, die Sie hier haben, das kommt Ihnen bekannt vor. Ich meine mich an das Papier zu erinnern, das genau dieses Problem beschreibt. Ich frage mich, welche Antwort Sie über das hinaus erwarten, was sie gesagt haben.
@BryanKrause Ich meine mich zu erinnern, dass es einen Satz in dieser fünf Jahre alten Zeitung gibt. Das Gebiet der Molekularbiologie bewegt sich schnell, daher ist es in Zukunft nicht das letzte Wort zu diesem Thema. Gibt es etwas an dieser Frage, das Sie beunruhigt? Können Sie es für ein oder zwei Tage so lassen und sehen, ob einige informative Antworten gepostet werden? Vielleicht selbst eins posten? Bei Stackexchange geht es darum, Antworten für sich selbst zu bekommen, aber auch Antworten zu generieren, die von vielen gelesen werden können.
Ich werde versuchen, eine Antwort zu schreiben, wenn ich mehr Zeit habe, aber die beiden Antworten hier sind Beispiele dafür, warum ich Sie nach der Kirche gefragt habe. Keiner der Verfasser dieser Antworten scheint Church gelesen zu haben, weil sie alle Probleme ignorieren, die das Papier aufwirft. Wenn Sie diese Informationen in Ihre Frage aufnehmen und deutlich machen, an welchen Themen Sie interessiert sind, erhalten Sie qualitativ bessere Antworten.
Das könnte Sie interessieren
@another'Homosapien' Dort gibt es viele Leckereien zu lesen - ich werde in meiner Frage einen Verweis darauf hinzufügen. Vielen Dank!!
@another'Homosapien' danke für die Bearbeitung - sieht besser aus!
DNA-Daten können theoretisch als Malware verwendet werden: dnasec.cs.washington.edu

Antworten (4)

Ja, es könnte Sequenzen geben, die ein DNA-basiertes System nicht/sehr gut speichern könnte: repetitive DNA-Sequenzen.

Solche Sequenzen bereiten nicht nur beim Sequenzieren ('Lesen von Daten') viele Probleme , sondern sie neigen auch eher dazu, sekundäre Strukturelemente wie Schleifen zu bilden, da repetitive DNA auf verschiedene Arten an sich selbst binden kann. Dies bedeutet, dass sie ähnlich wie natürlich vorkommende Wiederholungen während der DNA-Amplifikation wahrscheinlicher mutieren (die Anzahl der „Kopien“ kann sich ziemlich leicht ändern), was die „Daten“ instabiler macht.

Ein möglicher Weg, dieses Problem zu lösen, wäre die Verwendung spezialisierter Datenformate, die so viel Wiederholung von Daten wie möglich vermeiden (ähnlich wie Zip- oder JPG-Dateien funktionieren).

Ansonsten stimme ich Nathan zu, dass DNA an sich nicht gefährlich ist (da sie außerhalb von Zellen nichts bewirkt und die in der Molekularbiologie verwendeten Bakterien im Allgemeinen harmlos sind, es sei denn, Sie beginnen, sie in großen Mengen zu essen oder sie anderweitig in Ihren Körper zu bringen ). Die Möglichkeit, dass die DNA irgendwie toxische Proteine ​​codieren könnte, ist sehr, sehr gering, und Sie könnten einfach überprüfen, ob die „Daten“ in der DNA sowieso nicht zufällig ein Protein bilden.

Haben Sie die Diskussion über Sicherheitsfragen in dem Papier gelesen, das das OP zitiert? Diese Antwort legt nahe, dass Sie dies nicht getan haben. Biology.SE bevorzugt recherchierte und zitierte Antworten. Obwohl Ihre Antwort einige Links enthält, steht keiner in direktem Zusammenhang mit dem vorliegenden Problem.
Vielen Dank, dass Sie sich die Zeit zum Posten genommen haben. Sie haben tatsächlich eine interessante Frage beantwortet, die ich nicht gestellt habe, aber ich wünschte, ich hätte es getan! Ich habe nach Sicherheit gefragt und Sie haben über Datenintegrität oder -stabilität gesprochen, was wahrscheinlich ein interessanteres Thema ist.
Angesichts der Speichermenge ohne Vermeidungssystem werden Sie schließlich giftige oder gefährliche Proteine ​​kodieren. Aber das System hätte keine molekulare Maschinerie, um es überhaupt in Proteine ​​umzuschreiben, ganz zu schweigen von dem, was für eine ordnungsgemäße sekundäre Verarbeitung erforderlich wäre, damit das Protein aktiv wäre. Wenn sie nun irgendwie anfangen würden, Daten als endgültige Form in Proteinen zu speichern, müssten wir viel vorsichtiger sein.
Daten, die auf einer ausrangierten Diskette (erinnern Sie sich noch?) oder einer Festplatte oder einem USB-Stick auf einer Mülldeponie geschrieben sind, haben keine Hoffnung, dass ihre Daten in die Bakterien auf der Mülldeponie gelangen, aber das Schicksal von Daten, die in DNA gespeichert sind, ist weniger sicher. In DNA, die ohne Sicherheitsregeln geschrieben wurde, kann es Sequenzen geben, die Bakterien oder Phagen nicht unbedingt toxisch, sondern „sehr interessant“ oder sogar hilfreich finden könnten. Das ist ein Zufallsszenario.

Auch wenn DNA-Laufwerke (um es einmal zu nennen) von IT-Profis statt von ausgebildeten Biologen gehandhabt werden, können wir immer noch erwarten, dass die Umgebung sauber genug ist, dass kein Organismus davon beeinträchtigt wird. Wie @nathan in der anderen Antwort betont, kann freie DNA auch nichts alleine tun. Es ist wie ein offenes Buch, aus dem man nichts herausholen kann, wenn man kein Lesegerät (Protein) dafür hat. Es gab keine Berichte, in denen behauptet wurde, dass fremde DNA (bei Menschen zellfreie DNA oder cf-DNA genannt) jemals gesundheitliche Probleme verursacht hätte. Tatsächlich gibt es keine Berichte darüber, dass cf-DNA auch nur von Menschen transkribiert wird. Vielleicht möchten Sie auch einen Blick darauf werfen , um mehr zu erfahren. Wie jedoch @AlanBoyd in Kommentaren darauf hingewiesen hat, können Organismen, die im Menschen leben, dies tunnehmen frei schwebende DNA aus ihrer Umgebung auf. Beispielsweise wurde von Stingl et al ., 2009 gezeigt , dass Heliobacter pylori freie DNA aus seiner Umgebung aufnimmt. In Anbetracht dessen besteht die Möglichkeit, dass DNA-Laufwerke schädlich sein könnten (wenn das Laufwerk zufällig einige Gene enthält, die dem Erreger eine gewisse Antibiotikaresistenz verleihen könnten). Einige Mikroben zeigen ein Phänomen, das als natürliche Kompetenz bekannt istdh sie nehmen einfach Plasmid-DNA aus ihrer Umgebung auf, zerlegen sie durch Restriktionsenzyme und fügen sie ihrem Genom hinzu. Diese Organismen, die im Allgemeinen Geschlechtspillen zur Aufnahme von DNA besitzen, können eine große Bedrohung für die Verwendung von DNA-Laufwerken darstellen, wenn die Benutzer von DNA-Laufwerken bei der Handhabung und Pflege von DNA nachlässig sind, da ein Teil dieser DNA ihnen Antibiotikaresistenz oder -fähigkeit verleihen könnte Menschen zu infizieren. Wir können dies jedoch verhindern, indem wir sicherstellen, dass es keine Erkennungsstellen für Restriktionsenzyme in der DNA des Laufwerks gibt, sodass der Organismus die DNA nicht für die Ligation in sein eigenes Genom schneiden kann.

Das sieht nach dem Beginn einer faszinierenden Antwort aus! Wie ich in diesem Kommentar (und schräg in diesem Kommentar ) erwähnt habe, könnten Sequenzen, die für die Datenintegrität vermieden werden könnten, eine interessantere Frage sein, aber ich habe nach der Sicherheit gefragt. Vielleicht können Sie diese verschiedenen Punkte in Datenintegritäts- und Sicherheitskategorien einteilen oder irgendwie klarstellen, was aus Sicherheitsgründen vermieden werden sollte ?
@another'Homosapien' Mein Verständnis der Frage ist, dass DNA-Sequenzen, die ausschließlich zur Datenspeicherung erstellt wurden, versehentlich biologisch unsichere Elemente enthalten können - ist dies der Fall, und welche Vorsichtsmaßnahmen müssten getroffen werden, um dies zu vermeiden?
Wenn wir über Sicherheitsfragen im Zusammenhang mit der Handhabung biologischer oder biomolekularer Proben sprechen, ist es die Sicherheit der Person, um die wir uns Sorgen machen. Sicherheitsregeln, Sicherheitsverfahren, Sicherheitskurse, Schutzbrillen, diese dienen der Sicherheit des Menschen, nicht der Sicherheit der Probe. Es kann eine Voreingenommenheit geben, dass DNA „sicher“ ist, also muss das Wort über etwas anderes sprechen, und natürlich ist die Datenintegrität interessanter und einfacher zu beantworten. Ich kann diese Frage klonen und erneut speziell nach Sicherheit fragen und diese in Datenintegrität ändern, wenn sie mit allen Antworten hier funktioniert. Was denken Sie?
Oder belassen Sie dies als Sicherheit (und betonen Sie den menschlichen Teil mehr) und klonen Sie die Frage und machen Sie sie zur Integrität, und Sie können den Integritätsteil Ihrer Antwort dorthin verschieben. Was auch immer am entgegenkommendsten für diejenigen ist, die sich die Zeit nehmen, die Antworten zu posten.
Sind Sie bereit, eine Antwort zu posten und aktuelle maßgebliche Quellen zu zitieren, dass "... es praktisch keine Gefahren gibt, mit DNA-Laufwerken zu arbeiten"? Denn das ist es, was ich frage, und ich würde gerne sehen, wie eine Antwort wie diese abschneidet - allgemeine Zustimmung und viele positive Stimmen oder Bedenken und Kritik. Ich frage und suche nach einer richtigen SE-Antwort, weil ich mir nicht sicher bin, also würde ich gerne Perspektiven von denen sehen, die sachkundiger sind als ich, und dann die verlinkten Quellen lesen.
Es beantwortet nicht die Frage, es ist eine Meinung. Verstehst du, warum die Antwort „Mir fallen keine verwandten Probleme ein“ keine Antwort auf eine Anfrage nach einer maßgeblichen Quelle ist? Du sagst, dass du denkst, dass es sicher ist, weil du zufällig keinen Grund kennst, warum es nicht so ist. Ich suche nach wissenschaftlichen Arbeiten, die sich mit dem Sicherheitsproblem befassen, wie es in einer SE-Antwort zu erwarten ist, und ich habe dies in meinem Kommentar im Bounty-Banner noch einmal bekräftigt.
"Keiner der Organismen, die ich kenne, neigt dazu, einfach freie DNA aus ihrer Umgebung aufzunehmen", viele Bakterien wie Helicobacter tun dies - siehe zum Beispiel dieses Papier
@alanboyd Alter, das ist ein sehr netter Punkt, "Bakterien im Menschen könnten DNA aufnehmen". Ich möchte Ihnen diese Idee nicht zugute halten, aber vielen Dank dafür :D
Soll ich eine separate Frage zur Datenintegrität stellen, in der Sie den Teil der Datenintegrität Ihrer Antwort verschieben können, und es besteht eine gewisse Chance, dass dies die akzeptierte Antwort ist?
Bisher haben Sie mir wirklich nur Ihre persönliche Meinung zur Sicherheit geäußert und Ihre Meinung mit ein paar Links zu anderen Themen untermauert, die sich sicherlich nicht auf die DNA-Synthese zur Datenspeicherung beziehen. Dann haben Sie einen viel längeren Abschnitt, der nichts mit der Frage zu tun hat. Dies ist keine gute SE-Antwort auf meine Frage.
Kommentare sind nicht für längere Diskussionen gedacht; diese Konversation wurde in den Chat verschoben .

Ich würde aus zwei Gründen nein sagen.

Erstens kenne ich keine DNA-Sequenzen, die an sich infektiös sind. Man braucht die richtige Zellmaschinerie, um etwas aus ihnen zu machen. Wenn ich mich nicht irre, haben sogar die meisten Prokaryoten unterschiedliche Abwehrmechanismen gegen zufällige DNA-Stücke, die in ihre Systeme eingebaut werden. Sonst hätten sie nie stabile Kerne. Viren und Bakterien usw. müssen Strategien anwenden, um diese Abwehrsysteme zu umgehen.

Der zweite Grund, auch wenn ich mich beim ersten täusche, ist, dass dieses System so konzipiert sein muss, dass es möglichst frei von äußeren Einflüssen ist. Ein System zur Minimierung externer Beeinflussung minimiert zumindest in diesem Fall zwangsläufig auch die Beeinflussung nach außen.

Dies würde nicht von IT-Leuten gehandhabt werden, es sei denn, es wäre irgendwie massiv automatisiert. Wieder keine Ahnung von der endgültigen Form, also schwer zu sagen.

Haben Sie die Diskussion über Sicherheitsfragen in dem Papier gelesen, das das OP zitiert? Diese Antwort legt nahe, dass Sie dies nicht getan haben. Biology.SE bevorzugt recherchierte und zitierte Antworten.
Danke für deine Gedanken. Infektiöse Proteine ​​haben die Wissenschaft vor Jahrzehnten völlig überrascht, und es dauerte eine Weile, bis die Menschen zustimmten, dass dies geschah. Wie Sie jedoch betonen, da DNA in erster Linie Information ist, hat sie wahrscheinlich nicht viel Fähigkeit, selbst molekulare Veränderungen hervorzurufen. Stattdessen muss es normalerweise in eine Transkriptionsumgebung aufgenommen oder in diese gezwungen werden .
@uhoh Genau. Wenn Sie noch nie versucht haben, e. coli in einem Labor, kann ich Ihnen sagen, dass es nicht trivial ist, zumindest für einen Studenten, der es nur ein paar Mal macht. Ich konnte nicht auf das Nature-Papier zugreifen. Wenn es also eine Liste anderer Sicherheitsbedenken gibt, die ich nicht berücksichtigt habe, entschuldige ich mich dafür. Infektion war nur das erste, was mir in Bezug auf Sicherheit in den Sinn kam. Abgesehen davon denke ich, dass alle anderen Sicherheitsprobleme mit Standard-DNA-Sequenzierungsarbeiten zusammenhängen würden, die von der OSHA ziemlich gut gemacht sind.

Ich frage mich, ob es Sequenzen gibt, die wahrscheinlich aus Sicherheitsgründen als Standardverfahren algorithmisch vermieden werden (oder sollten), wenn DNA als digitales Speichermedium verwendet wird.

Ich denke nicht, dass die Sequenzen selbst das Problem sind, sondern das Verfahren, mit dem sie in Bakterien zur Datenspeicherung integriert werden, was meines Erachtens kein direktes Risiko für den Menschen darstellt.

In der Abhandlung von Shipman-Church werden Videorahmendaten in Stücke codiert, die 27 Basen lang sind, unterbrochen durch kurze PAM-Abstandshalter und Strichcodes, um bei der Resequenzierung (für zeitgesteuertes Datenauslesen) zu helfen.

Die größeren 35-Basen-Oligonukleotide werden den Wirtsbakterien durch Elektroporation verabreicht – wodurch die Zellen effektiv geschockt werden, wodurch die Zellmembran geöffnet wird, damit die Oligonukleotide in das vorhandene Cas1/Cas2-System der Bakterien eindringen und sich in das Genom integrieren können.

Elektroporation kann verwendet werden, um Oligos in vitro in menschliche Zellkulturen zu bringen, aber typischerweise nicht in lebende Menschen. Laborsicherheits- und Kontaminationsprotokolle werden verwendet, um den Kontakt mit Reagenzien zu verhindern und das Risiko eines Stromschlags zu begrenzen.

Trotzdem würde es nicht ausreichen, die Leute zu schockieren, da die Sequenzen selbst nicht ausreichen, um das Risiko darzustellen. Die Bemühungen um die CRISPR-Bearbeitung menschlicher Gene in vivo konzentrieren sich typischerweise auf das Cas9-System. Menschliche Zellen exprimieren Cas9 nicht, so dass bakterielles Protein zusammen mit der Zielsequenz abgegeben werden müsste, was Abgabetechniken verwenden würde, die in diesem Artikel nicht verwendet werden (z. B. Injektion oder Abgabe auf Lipidbasis).

Es muss möglicherweise sogar so erfolgen, dass die Immunität gegen das Cas9-Protein umgangen wird, oder es muss auf Stammzellen oder eine andere zellspezifische Population gerichtet werden, um eine gewünschte Wirkung zu erzielen.

Eine 27-Basen-Sequenz könnte theoretisch auf Gene abzielen, die für die Gesundheit entscheidend sind – beispielsweise die Deletion oder Insertion einer 27-Basen-Sequenz innerhalb eines Onkogens oder Tumorsuppressorgens, das beispielsweise mit der CRISPR-Cas9-Plattform bereitgestellt wird. Aber um dies zu verwalten, benötigen Sie ein völlig anderes Protokoll als das, was das Shipman-Church-Papier beschreibt, damit dieses Speichermedium beginnt, die Möglichkeit eines Sicherheitsrisikos für Menschen zu schaffen.


Um zum (bezahlten) Goldman-Birney-Papier zu gehen, speichern sie ihre Daten nicht in Bakterien, sondern synthetisieren einfach DNA-Oligonukleotid-Strings und speichern sie effektiv in Fettklumpen (buchstäblich). Wenn sie Daten abrufen möchten, führen sie eine Shotgun-Sequenzierung mit hoher Abdeckung durch, um die ursprüngliche Sequenz wiederherzustellen.

Daher besteht kein wirkliches Risiko der Inkorporation in menschliche Zellen, abgesehen von der Mikroinjektion, und daher kein wirkliches direktes Risiko, dass Teilsequenzen transkribiert und in pathogene Proteine ​​oder Viruspartikel usw. übersetzt werden.

Während die Sequenzdaten selbst Krankheitserreger enthalten könnten, müsste Ihr IT-Kollege seine eigenen Proteinmaschinen und -protokolle mitbringen, damit etwas Schändliches passieren kann. Die Sequenzierung wird durchgeführt, um den Datenabruf zu beeinflussen, nicht die Transkription/Übersetzung, und die Sequenzierung aktiviert keinen Code in der zugrunde liegenden Sequenz.