World Digital Preservation Day! Welttag der digitalen Erhaltung!

Bild: Welttag Digitale Erhaltung

Bild: Versandhaus Quelle, Datenverarbeitung mit Computer IBM Typ 701, 1958; Rechte: J.H. Darchinger/Friedrich-Ebert-Stiftung.

Am 4. November 2021 ist der Welttag der digitalen Erhaltung ausgerufen – der World Digital Preservation Day. Der WDPD findet immer am ersten Donnerstag im November statt und will auf die Notwendigkeit hinweisen, dass wir uns jetzt schon damit beschäftigen müssen, wie wir digitale Daten geeignet aufbewahren, damit uns diese Daten nicht aus Versehen unwiederbringlich verloren gehen.

Die Arbeit, die dazu notwendig ist, ist eine noch eher junge archivarische Disziplin mit einer eigenen Fachsprache. Das macht die Verständigung zwischen dieser Disziplin und ihrer Umwelt nicht immer einfach. Der WDPD hat deshalb das Motto „Breaking Down Barriers“: Wir digitalen Erhalter_innen sollen und wollen Barrieren abbauen und unsere Arbeit verständlich machen.

Hier soll deshalb ein kleiner, praktischer Ausschnitt der Alltagsarbeit in der digitalen Erhaltung beschrieben werden. Dieser Blogbeitrag schaut sich dabei nur die technische Seite an (und davon auch nur einen Ausschnitt) an und ist als Werkstattbericht, nicht als idealtypische Schilderung zu verstehen.

Nehmen wir an, eine Person, die eine wichtige Position in einer Organisation innehatte, übergibt uns (wahrscheinlich zusammen mit einer ganzen Menge Papier) auch eine Festplatte. Darauf finden sich Fotos, Protokolle und Korrespondenz aus der Arbeit in dieser Organisation, die wir aufbewahren wollen.

Was machen wir damit?

Eine grundlegende Maßnahme, um digitale Daten zu sichern, kennen wohl alle: das Back-up. Wir legen also mehrere Kopien der Dateien auf der Festplatte an – so dass, falls eine der Kopien aus welchem Grund auch immer nicht mehr zugänglich ist, noch andere zur Verfügung stehen. Darin besteht nämlich der große Vorteil des Digitalen gegenüber dem Analogen in Bezug auf die Archivierung: Die Möglichkeit der exakten Kopie. Von einer Papierakte kann ich zwar Kopien machen, die werden aber niemals exakt wie das Original sein. Während im digitalen Bereich die Bedeutung von „Echtheit“ entkoppelt ist von dem Speichermedium auf dem die Bits liegen.

Gleichzeitig können digitale Objekte aber auch sehr viel einfacher manipuliert werden als analoge Objekte, ohne dass diese Manipulation danach noch ersichtlich ist. In einem mit Schreibmaschine geschriebenen lässt sich nicht so einfach noch ein Wort einfügen wie in einem Word-Dokument. Die Frage, ob eine Quelle „echt“ ist, also vollständig so, wie der Text ursprünglich geschrieben worden ist oder die Fotografie aufgenommen wurde, bleibt deshalb relevant und wird schwerer nachzuvollziehen.

Technik allein ist hier nicht die Lösung, aber kann diesen Prozess unterstützen. Dazu werden zu den gespeicherten Dateien gleichzeitig Prüfsummen angelegt. Prüfsummen werden auch gern als Fingerabdruck bezeichnet, weil sie eine Datei eindeutig identifzieren – wenn auch nur ein Bit in der Dateispeicherung sich verändert, verändert sich der Fingerabdruck vollständig. Auf dem Bild sieht man als Beispiel zwei sehr simple Text-Dokumente, die nur den Text „Das ist das einfache Dokument“ enthalten – einmal mit und einmal ohne Punkt am Ende des Satzes. Darunter sieht man jeweils die mit dem Algorithmus SHA-256 errechnete Prüfsumme für die beiden Dokumente. Die beiden Prüfsummen sind trotz der minimalen Änderung völlig unterschiedlich.

So lässt sich nachprüfen, ob sich eine Datei verändert hat, egal ob willentlich oder versehentlich, verursacht durch Technik oder einen Menschen. Prüfsummenbildung und -vergleich sind deshalb Routineaufgaben, die die Arbeit in der digitalen Erhaltung ständig begleiten.

Die Dateien sind nun also mehrfach gespeichert und dank der Prüfsummen können wir regelmäßig testen, ob sie noch korrekt sind und andernfalls aus den Kopien ersetzen. Leider heißt das noch lange nicht, dass die Daten auch langfristig lesbar bleiben. Digitale Daten sind für den Menschen erst verständlich, indem sie durch Computer interpretiert werden.

In unserem Beispiel haben wir auf der Festplatte v.a. Fotos und Textdokumente. Bei solchen Dateien ist eine gute Möglichkeit zur digitalen Erhaltung, sie in Formaten zu speichern, die voraussichtlich langfristig verwendet werden. Dazu müssen wir aber erstmal wissen, welche Formate überhaupt vorliegen. Dazu werden zunächst die Formate identifiziert. Dazu gibt es Tools wie z.B. Droid, mit Hilfe derer man erkennen, welche Formate auf einer Festplatte oder in einem Ordner enthalten sind.

Wenn wir die Formate kennen, müssen wir entscheiden, ob sie geeignet sind für die Langzeitarchivierung. Einige Formate werden vor der Ablage im Archiv in ein geeigneteres Format überführt. Textdokumente konvertieren wir z.B. in PDFs, in einer spezifischen, genau für den Archivzweck entwickelten Form.

Die „Originale“, also: die Dateien vor der Konversion, bewahren wir übrigens i.d.R. ebenfalls auf. Und natürlich dokumentieren wir, was wir da tun. Denn wir müssen ja für die Menschen, die (irgendwann) in der Zukunft diese Quellen nutzen wollen, nachweisen, dass die Veränderungen an diesem Dokument mit Absicht geschehen sind und der Bitstream zwar nicht mehr derselbe ist, aber z.B. bei einem Textdokument immer noch derselbe Inhalt und dasselbe Layout erhalten geblieben sind. Auch hier merkt man: Es ist nicht die Technik allein, die die Authentizität einer Quelle sichern kann.

Mit redundanter Speicherung, Prüfsummenbildung, Formatvalidierung und ggf. -konvertierung und Dokumentation sind technische Grundlagen für die digitale Erhaltung gelegt. Damit ist es aber nicht getan – die Inhalte dieses Systems müssen immer weiter beobachtet werden, die Daten im System müssen geordnet und beschrieben werden, damit man Dinge wieder findet und Strukturen erhalten bleiben, das Wissen über die Systeme muss weitergegeben werden… Ein echt langfristiges digitales Archiv ist nur in einem komplexen Zusammenwirken von Menschen und Maschinen möglich.

Wer tiefer in das Thema einsteigen möchte, findet auf der Seite von nestor, dem Kompetenznetzwerk für digitale Langzeitarchivierung, eine hilfreiche Linksammlung. Und wer sich für die Frage interessiert, wie man seine privaten digitalen Materialien sichern kann, findet hier Tipps.

Annabel Walz


Denkanstoß Geschichte

140 Jahre Unfallversicherung – Entstehung, Wirkung und Bedeutung für die Arbeiter:innenbewegung

Darstellung der verschiedenen Aspekte der "Arbeiter-Versicherung" 1911 als Eiche, Wurzeln: Beiträge der Arbeitgeber und Arbeitnehmer, Krone: Krankenversicherung, Unfallsversicherung, Invalidenversicherung

Unser Gastautor Sebastian Knoll-Jung erläutert die Etablierung der Unfallversicherung im Jahre 1884 und dessen Entwicklung bis heute.


weitere Informationen

Gegen Rechtsextremismus! | Denkanstoß Geschichte

„Reichsbürger“ – ein scheinbar neues Phänomen mit langer Vorgeschichte

Junge Männer mit Reichskriegsflaggen, die mit einem Demonstrationszug durch den Wald gehen

Die Wurzeln der sogenannten Reichsbürger, die aktuell vor Gericht stehen, reichen weit zurück. Schon unmittelbar nach dem Ende des Nationalsozialismus…


weitere Informationen

Denkanstoß Geschichte

Der große Berliner Bierboykott von 1894

Vier Karikaturen zum Bierboykott aus dem "Wahren Jacob"

Der Berliner Bierboykott von 1894 war ein Arbeitskampf, der in seiner Bedeutung weit über das lokale Brauereigewerbe hinausging und die Öffentlichkeit…


weitere Informationen

Denkanstoß Geschichte

Das fortschrittliche Erbe der Ukrainischen Volksrepublik (1917-1921) - Teil 4: Sowjetische Ukraine oder demokratisch-sozialistische Ukraine?

Die Mitglieder des Generalsekretariats der Zentralna Rada am 5. Juli 1917. Stehend: Pawlo Chrystjuk, Mykola Stasjuk, Borys Martos. Sitzend: Iwan Steschenko, Chrystofor Baranowskyj, Wolodymyr Wynnytschenko, Serhij Jefremow, Symon Petljura (Quelle/Rechte: Wikimedia/public domain).

Mit einem Text von Vladyslav Starodubtsev über die Ukrainische Volksrepublik von 1917 bis 1921 setzen wir unsere Reihe über die ukrainische Geschichte…


weitere Informationen
nach oben