Die FES wird 100! Mehr erfahren

World Digital Preservation Day! Welttag der digitalen Erhaltung!

Bild: Welttag Digitale Erhaltung

Bild: Versandhaus Quelle, Datenverarbeitung mit Computer IBM Typ 701, 1958; Rechte: J.H. Darchinger/Friedrich-Ebert-Stiftung.

Am 4. November 2021 ist der Welttag der digitalen Erhaltung ausgerufen – der World Digital Preservation Day. Der WDPD findet immer am ersten Donnerstag im November statt und will auf die Notwendigkeit hinweisen, dass wir uns jetzt schon damit beschäftigen müssen, wie wir digitale Daten geeignet aufbewahren, damit uns diese Daten nicht aus Versehen unwiederbringlich verloren gehen.

Die Arbeit, die dazu notwendig ist, ist eine noch eher junge archivarische Disziplin mit einer eigenen Fachsprache. Das macht die Verständigung zwischen dieser Disziplin und ihrer Umwelt nicht immer einfach. Der WDPD hat deshalb das Motto „Breaking Down Barriers“: Wir digitalen Erhalter_innen sollen und wollen Barrieren abbauen und unsere Arbeit verständlich machen.

Hier soll deshalb ein kleiner, praktischer Ausschnitt der Alltagsarbeit in der digitalen Erhaltung beschrieben werden. Dieser Blogbeitrag schaut sich dabei nur die technische Seite an (und davon auch nur einen Ausschnitt) an und ist als Werkstattbericht, nicht als idealtypische Schilderung zu verstehen.

Nehmen wir an, eine Person, die eine wichtige Position in einer Organisation innehatte, übergibt uns (wahrscheinlich zusammen mit einer ganzen Menge Papier) auch eine Festplatte. Darauf finden sich Fotos, Protokolle und Korrespondenz aus der Arbeit in dieser Organisation, die wir aufbewahren wollen.

Was machen wir damit?

Eine grundlegende Maßnahme, um digitale Daten zu sichern, kennen wohl alle: das Back-up. Wir legen also mehrere Kopien der Dateien auf der Festplatte an – so dass, falls eine der Kopien aus welchem Grund auch immer nicht mehr zugänglich ist, noch andere zur Verfügung stehen. Darin besteht nämlich der große Vorteil des Digitalen gegenüber dem Analogen in Bezug auf die Archivierung: Die Möglichkeit der exakten Kopie. Von einer Papierakte kann ich zwar Kopien machen, die werden aber niemals exakt wie das Original sein. Während im digitalen Bereich die Bedeutung von „Echtheit“ entkoppelt ist von dem Speichermedium auf dem die Bits liegen.

Gleichzeitig können digitale Objekte aber auch sehr viel einfacher manipuliert werden als analoge Objekte, ohne dass diese Manipulation danach noch ersichtlich ist. In einem mit Schreibmaschine geschriebenen lässt sich nicht so einfach noch ein Wort einfügen wie in einem Word-Dokument. Die Frage, ob eine Quelle „echt“ ist, also vollständig so, wie der Text ursprünglich geschrieben worden ist oder die Fotografie aufgenommen wurde, bleibt deshalb relevant und wird schwerer nachzuvollziehen.

Technik allein ist hier nicht die Lösung, aber kann diesen Prozess unterstützen. Dazu werden zu den gespeicherten Dateien gleichzeitig Prüfsummen angelegt. Prüfsummen werden auch gern als Fingerabdruck bezeichnet, weil sie eine Datei eindeutig identifzieren – wenn auch nur ein Bit in der Dateispeicherung sich verändert, verändert sich der Fingerabdruck vollständig. Auf dem Bild sieht man als Beispiel zwei sehr simple Text-Dokumente, die nur den Text „Das ist das einfache Dokument“ enthalten – einmal mit und einmal ohne Punkt am Ende des Satzes. Darunter sieht man jeweils die mit dem Algorithmus SHA-256 errechnete Prüfsumme für die beiden Dokumente. Die beiden Prüfsummen sind trotz der minimalen Änderung völlig unterschiedlich.

So lässt sich nachprüfen, ob sich eine Datei verändert hat, egal ob willentlich oder versehentlich, verursacht durch Technik oder einen Menschen. Prüfsummenbildung und -vergleich sind deshalb Routineaufgaben, die die Arbeit in der digitalen Erhaltung ständig begleiten.

Die Dateien sind nun also mehrfach gespeichert und dank der Prüfsummen können wir regelmäßig testen, ob sie noch korrekt sind und andernfalls aus den Kopien ersetzen. Leider heißt das noch lange nicht, dass die Daten auch langfristig lesbar bleiben. Digitale Daten sind für den Menschen erst verständlich, indem sie durch Computer interpretiert werden.

In unserem Beispiel haben wir auf der Festplatte v.a. Fotos und Textdokumente. Bei solchen Dateien ist eine gute Möglichkeit zur digitalen Erhaltung, sie in Formaten zu speichern, die voraussichtlich langfristig verwendet werden. Dazu müssen wir aber erstmal wissen, welche Formate überhaupt vorliegen. Dazu werden zunächst die Formate identifiziert. Dazu gibt es Tools wie z.B. Droid, mit Hilfe derer man erkennen, welche Formate auf einer Festplatte oder in einem Ordner enthalten sind.

Wenn wir die Formate kennen, müssen wir entscheiden, ob sie geeignet sind für die Langzeitarchivierung. Einige Formate werden vor der Ablage im Archiv in ein geeigneteres Format überführt. Textdokumente konvertieren wir z.B. in PDFs, in einer spezifischen, genau für den Archivzweck entwickelten Form.

Die „Originale“, also: die Dateien vor der Konversion, bewahren wir übrigens i.d.R. ebenfalls auf. Und natürlich dokumentieren wir, was wir da tun. Denn wir müssen ja für die Menschen, die (irgendwann) in der Zukunft diese Quellen nutzen wollen, nachweisen, dass die Veränderungen an diesem Dokument mit Absicht geschehen sind und der Bitstream zwar nicht mehr derselbe ist, aber z.B. bei einem Textdokument immer noch derselbe Inhalt und dasselbe Layout erhalten geblieben sind. Auch hier merkt man: Es ist nicht die Technik allein, die die Authentizität einer Quelle sichern kann.

Mit redundanter Speicherung, Prüfsummenbildung, Formatvalidierung und ggf. -konvertierung und Dokumentation sind technische Grundlagen für die digitale Erhaltung gelegt. Damit ist es aber nicht getan – die Inhalte dieses Systems müssen immer weiter beobachtet werden, die Daten im System müssen geordnet und beschrieben werden, damit man Dinge wieder findet und Strukturen erhalten bleiben, das Wissen über die Systeme muss weitergegeben werden… Ein echt langfristiges digitales Archiv ist nur in einem komplexen Zusammenwirken von Menschen und Maschinen möglich.

Wer tiefer in das Thema einsteigen möchte, findet auf der Seite von nestor, dem Kompetenznetzwerk für digitale Langzeitarchivierung, eine hilfreiche Linksammlung. Und wer sich für die Frage interessiert, wie man seine privaten digitalen Materialien sichern kann, findet hier Tipps.

Annabel Walz


Aktuelle Beiträge

Demokratie, Engagement, Rechtsstaat, Kommunalpolitik | Demokratie | Denkanstoß Geschichte | Demokratie und Gesellschaft | Veranstaltung | Livestream-Veranstaltung

Willy-Brandt-Vortrag 2024 - „Freiheit in Zeiten des Wandels“ - Mit Wolfgang Thierse, Bundestagspräsident a. D.

Porträt Willy Brandts mit Logos der Veranstalter und dem Titel der Veranstaltung

10. Dezember, 18 Uhr c.t. | Universität Bonn und im Livestream

 


weitere Informationen

Denkanstoß Geschichte | Veranstaltung

Sozial. Demokratisch. Engagiert. 100 Jahre Friedrich-Ebert-Stiftung

Rot geschrieben 2025. Dahinter 1925 und darunter "Sozial. Demokratisch. Engagiert"

Auftaktveranstaltung zum 100-jährigen Jubiläum der FES | Donnerstag, 21. November 2024, 17.30 bis 19.45 Uhr | Friedrich-Ebert-Stiftung, Godesberger…


weitere Informationen

Flucht, Migration, Integration | Denkanstoß Geschichte | Veranstaltung

Die Optimistinnen

Grafik mit dem Cover von "Die Optmistinnen" und Angaben zu Titel, Ort und Zeit der Veranstaltung

Lesung und Gespräch mit Gün Tank über weibliche Arbeitsmigration |

09.10.2024 | 18.00–19:30 Uhr | Berlin


weitere Informationen
nach oben