Diese Webseite verwendet Cookies
Diese Cookies sind notwendig
Daten zur Verbesserung der Webseite durch Tracking (Matomo).
Das sind Cookies die von externen Seiten und Diensten kommen z.B. von Youtube oder Vimeo.
Geben Sie hier Ihren Nutzernamen oder Ihre E-Mail-Adresse sowie Ihr Passwort ein, um sich auf der Website anzumelden.
Ansprechpartner
PD Dr. Stefan Müller
0228 883-8068
Stefan.Mueller(at)fes.de
Abteilung
Archiv der sozialen Demokratie
Bild: Welttag Digitale Erhaltung
Bild: Versandhaus Quelle, Datenverarbeitung mit Computer IBM Typ 701, 1958; Rechte: J.H. Darchinger/Friedrich-Ebert-Stiftung.
Am 4. November 2021 ist der Welttag der digitalen Erhaltung ausgerufen – der World Digital Preservation Day. Der WDPD findet immer am ersten Donnerstag im November statt und will auf die Notwendigkeit hinweisen, dass wir uns jetzt schon damit beschäftigen müssen, wie wir digitale Daten geeignet aufbewahren, damit uns diese Daten nicht aus Versehen unwiederbringlich verloren gehen.
Die Arbeit, die dazu notwendig ist, ist eine noch eher junge archivarische Disziplin mit einer eigenen Fachsprache. Das macht die Verständigung zwischen dieser Disziplin und ihrer Umwelt nicht immer einfach. Der WDPD hat deshalb das Motto „Breaking Down Barriers“: Wir digitalen Erhalter_innen sollen und wollen Barrieren abbauen und unsere Arbeit verständlich machen.
Hier soll deshalb ein kleiner, praktischer Ausschnitt der Alltagsarbeit in der digitalen Erhaltung beschrieben werden. Dieser Blogbeitrag schaut sich dabei nur die technische Seite an (und davon auch nur einen Ausschnitt) an und ist als Werkstattbericht, nicht als idealtypische Schilderung zu verstehen.
Nehmen wir an, eine Person, die eine wichtige Position in einer Organisation innehatte, übergibt uns (wahrscheinlich zusammen mit einer ganzen Menge Papier) auch eine Festplatte. Darauf finden sich Fotos, Protokolle und Korrespondenz aus der Arbeit in dieser Organisation, die wir aufbewahren wollen.
Was machen wir damit?
Eine grundlegende Maßnahme, um digitale Daten zu sichern, kennen wohl alle: das Back-up. Wir legen also mehrere Kopien der Dateien auf der Festplatte an – so dass, falls eine der Kopien aus welchem Grund auch immer nicht mehr zugänglich ist, noch andere zur Verfügung stehen. Darin besteht nämlich der große Vorteil des Digitalen gegenüber dem Analogen in Bezug auf die Archivierung: Die Möglichkeit der exakten Kopie. Von einer Papierakte kann ich zwar Kopien machen, die werden aber niemals exakt wie das Original sein. Während im digitalen Bereich die Bedeutung von „Echtheit“ entkoppelt ist von dem Speichermedium auf dem die Bits liegen.
Gleichzeitig können digitale Objekte aber auch sehr viel einfacher manipuliert werden als analoge Objekte, ohne dass diese Manipulation danach noch ersichtlich ist. In einem mit Schreibmaschine geschriebenen lässt sich nicht so einfach noch ein Wort einfügen wie in einem Word-Dokument. Die Frage, ob eine Quelle „echt“ ist, also vollständig so, wie der Text ursprünglich geschrieben worden ist oder die Fotografie aufgenommen wurde, bleibt deshalb relevant und wird schwerer nachzuvollziehen.
Technik allein ist hier nicht die Lösung, aber kann diesen Prozess unterstützen. Dazu werden zu den gespeicherten Dateien gleichzeitig Prüfsummen angelegt. Prüfsummen werden auch gern als Fingerabdruck bezeichnet, weil sie eine Datei eindeutig identifzieren – wenn auch nur ein Bit in der Dateispeicherung sich verändert, verändert sich der Fingerabdruck vollständig. Auf dem Bild sieht man als Beispiel zwei sehr simple Text-Dokumente, die nur den Text „Das ist das einfache Dokument“ enthalten – einmal mit und einmal ohne Punkt am Ende des Satzes. Darunter sieht man jeweils die mit dem Algorithmus SHA-256 errechnete Prüfsumme für die beiden Dokumente. Die beiden Prüfsummen sind trotz der minimalen Änderung völlig unterschiedlich.
So lässt sich nachprüfen, ob sich eine Datei verändert hat, egal ob willentlich oder versehentlich, verursacht durch Technik oder einen Menschen. Prüfsummenbildung und -vergleich sind deshalb Routineaufgaben, die die Arbeit in der digitalen Erhaltung ständig begleiten.
Die Dateien sind nun also mehrfach gespeichert und dank der Prüfsummen können wir regelmäßig testen, ob sie noch korrekt sind und andernfalls aus den Kopien ersetzen. Leider heißt das noch lange nicht, dass die Daten auch langfristig lesbar bleiben. Digitale Daten sind für den Menschen erst verständlich, indem sie durch Computer interpretiert werden.
In unserem Beispiel haben wir auf der Festplatte v.a. Fotos und Textdokumente. Bei solchen Dateien ist eine gute Möglichkeit zur digitalen Erhaltung, sie in Formaten zu speichern, die voraussichtlich langfristig verwendet werden. Dazu müssen wir aber erstmal wissen, welche Formate überhaupt vorliegen. Dazu werden zunächst die Formate identifiziert. Dazu gibt es Tools wie z.B. Droid, mit Hilfe derer man erkennen, welche Formate auf einer Festplatte oder in einem Ordner enthalten sind.
Wenn wir die Formate kennen, müssen wir entscheiden, ob sie geeignet sind für die Langzeitarchivierung. Einige Formate werden vor der Ablage im Archiv in ein geeigneteres Format überführt. Textdokumente konvertieren wir z.B. in PDFs, in einer spezifischen, genau für den Archivzweck entwickelten Form.
Die „Originale“, also: die Dateien vor der Konversion, bewahren wir übrigens i.d.R. ebenfalls auf. Und natürlich dokumentieren wir, was wir da tun. Denn wir müssen ja für die Menschen, die (irgendwann) in der Zukunft diese Quellen nutzen wollen, nachweisen, dass die Veränderungen an diesem Dokument mit Absicht geschehen sind und der Bitstream zwar nicht mehr derselbe ist, aber z.B. bei einem Textdokument immer noch derselbe Inhalt und dasselbe Layout erhalten geblieben sind. Auch hier merkt man: Es ist nicht die Technik allein, die die Authentizität einer Quelle sichern kann.
Mit redundanter Speicherung, Prüfsummenbildung, Formatvalidierung und ggf. -konvertierung und Dokumentation sind technische Grundlagen für die digitale Erhaltung gelegt. Damit ist es aber nicht getan – die Inhalte dieses Systems müssen immer weiter beobachtet werden, die Daten im System müssen geordnet und beschrieben werden, damit man Dinge wieder findet und Strukturen erhalten bleiben, das Wissen über die Systeme muss weitergegeben werden… Ein echt langfristiges digitales Archiv ist nur in einem komplexen Zusammenwirken von Menschen und Maschinen möglich.
Wer tiefer in das Thema einsteigen möchte, findet auf der Seite von nestor, dem Kompetenznetzwerk für digitale Langzeitarchivierung, eine hilfreiche Linksammlung. Und wer sich für die Frage interessiert, wie man seine privaten digitalen Materialien sichern kann, findet hier Tipps.
Annabel Walz
Manuel Campos berichtet von seinem Weg aus Portugal nach Deutschland, den Erfahrungen von Migrant:innen in der Bundesrepublik seit den 1970er-Jahren und seinem Engagement in der IG Metall.
Das AdsD hat kürzlich den Teilnachlass Elfriede Eilers erschlossen. Aus diesem Anlass widmen wir uns in unserem aktuellen Blogbeitrag der sozialdemokratischen Politikerin und dem bei uns verwahrten Bestand.
Die Erfahrungen im Umgang mit den Republikanern zeigen, warum es in liberalen Demokratien so schwierig ist, rechtsextreme Parteien zu beobachten und zu verbieten. Der Historiker Moritz Fischer argumentiert in einem Gastbeitrag, warum die Bewertung durch den Verfassungsschutz oft ein Teil des Problems ist.