Archivierung digitaler Dokumente für eine langfristige Nutzung [geschlossen]

Wie kann ich sicher sein, dass wir in etwa 100 Jahren ein .docx-Dokument lesen können? Ich habe eine große Sammlung von Dokumenten auf meiner Festplatte (darunter Briefe, Lebensläufe und andere Dinge). Ich möchte, dass sie für die nahe Zukunft (10 Jahre) lesbar und zugänglich sind, aber wenn es möglich ist, bis zu 100 Jahre!

Welches Format wäre sinnvoll?

Willkommen bei Lifehacks! Leider gehört das hier nicht wirklich zum Thema. Du könntest es mit Super User versuchen.

Antworten (4)

Dazu gehören 3 Aspekte:

  1. die Daten überleben;
  2. Software existiert, um die Daten zu lesen; und
  3. Hardware vorhanden ist, um die Software auszuführen.

Um sicherzustellen, dass die Daten erhalten bleiben, kopieren Sie sie mehrmals auf mehrere Dinge (USB-Laufwerk, DVD, Cloud usw.). Führen Sie ein Dateivergleichsprogramm wie diff aus, um zu überprüfen, ob der Kopiervorgang ordnungsgemäß funktioniert hat. Die Medien verschlechterten sich im Laufe der Zeit, erstellen Sie daher regelmäßig neue Kopien.

Um sicherzustellen, dass Software vorhanden ist, verwenden Sie Standardformate wie PDF. Vergewissern Sie sich jedes Mal, wenn Sie Ihren Computer wechseln, dass Sie die Dateien weiterhin öffnen und lesen können. Wenn Sie dies nicht können, sprechen Sie mit dem Hersteller der alten Software, um sie auf dem neuen Computer zum Laufen zu bringen. Je nachdem, wie unterschiedlich Alt- und Neusystem sind, kann das teuer werden. Damit ist aber auch sichergestellt, dass Hardware zum Ausführen der Software vorhanden ist.

Ich bewahre alle meine Dateien als PDFs mit TXT-Backups auf. Beide Formate sind auf Mac/Windows/Linux verfügbar, und TXT-Dateien sind zukunftssicher (obwohl PDFs übersichtlicher sind).

Bei der Kompatibilität gilt: Je einfacher, desto besser. Ich möchte zwei Vorschläge machen.

  1. Speichern Sie Ihre Dokumente als reinen Text. Formate wie *.docx von MS Word oder *.pdf von Adobe fügen Formatierungen und viele zusätzliche Informationen hinzu, anstatt nur die Buchstaben zu speichern, aus denen das Dokument besteht. So erhalten Sie zentrierten Text, Tabellen, verschiedene Schriftarten, fett/kursiv/unterstrichen usw. Einfache Textdateien speichern lediglich die (numerischen) ASCII-Codes für alle Zeichen in Ihren Dokumenten – alle Buchstaben, Zahlen, sichtbaren Symbole, Leerzeichen , und Zeilenumbrüche. Wenn Sie einen PC verwenden, verwenden Dateien dieses Formats üblicherweise *.txt und können in der Notepad-Anwendung angezeigt werden.

  2. Speichern Sie Ihre Dokumente als Bitmap-Bilder. Dies nimmt viel Platz in Anspruch, ist aber unglaublich einfach und universell. Bitmap-Bilder sind einfach große Zahlenraster. Jeder Punkt auf dem Raster enthält eine Zahl von 0-255, die die Farbe dieses Pixels im endgültigen Bild darstellt. Die Idee ist also, ein "Foto" von Ihren Textdokumenten zu machen und es im Bitmap-Format zu speichern. (Beachten Sie, dass diese Idee kurzfristig überhaupt nicht praktikabel ist. Die Dateien werden riesig sein und Sie können sie nicht nach Text durchsuchen. Wenn jedoch ein Computer in hundert Jahren eine Bitmap-Bilddatei findet, Ich würde mein ganzes Geld darauf verwetten, dass der Computer ein Programm hat, das es anzeigen kann.)

Ich würde PDF nicht trauen. Es ist ein komplexes Format, das nur deshalb einfach erscheint, weil Adobe Reader-Software für mehrere Betriebssysteme entwickelt hat. (Andere Unternehmen haben inzwischen Reader-Software entwickelt.) Es wäre ratsam, mehrere Formate jeder Datei zu speichern. Ein Format sollte reiner Text sein. Außer Leerzeichen, Tabulatoren und Zeilenumbrüchen gibt es keine Formatierung. Der zweite Teil ist die physische Form. Gutes Papier hält seit Hunderten von Jahren. Aber die NASA hat Lager mit Bändern von frühen Mondmissionen und kein Lesegerät oder nicht einmal die Spezifikationen für ein Lesegerät. Standard-USB ist auf dem Weg nach draußen. Computer sind nicht mit Diskettenlaufwerken ausgestattet, und CD/DVD-Laufwerke sind selten. Ich gehe davon aus, dass Standard-USB-Sticks höchstens noch 10 Jahre verwendbar sind. Es gibt keine Möglichkeit, digitale Informationen zu speichern, die nicht überwacht werden müssen, um sicherzustellen, dass sie noch gültig sind. Wenn das Medium obsolet wird, es kann auf etwas Neues kopiert werden. Das ist übrigens ein Thema, das Bibliothekare interessiert.

PDF ist ein offenes Format: Die Spezifikation ist verfügbar und jeder kann einen PDF-Reader von Grund auf neu erstellen. Es wird auch als Langzeitspeicherformat konzipiert und vermarktet (insbesondere die PDF/A-Variante). Das macht es zu einem guten Kandidaten für die Langzeitlagerung. de.wikipedia.org/wiki/PDF/A
Ich mag die W3C-Philosophie, Inhalt von Präsentation zu trennen: Text und die grundlegendste Struktur des Dokuments befinden sich in einer Datei (HTML), während all die ausgefallenen Dinge in einer anderen (CSS) enthalten sind. Und bei „langfristig“ denke ich an Hunderte von Jahren. Einfacher ist besser. Außerdem ist die Textdatei sehr klein und kann zusammen mit dem PDF verwendet werden.