Langzeitarchivierung – Daten für die Zukunft
Die Deutsche Nationalbibliothek sammelt digitale Publikationen und das schon seit Jahrzehnten. Nicht erst mit dem Gesetz über die Deutsche Nationalbibliothek von 2006 begann dies, denn auch lange vorher waren bereits digitale Publikationen auf Datenträgern im Sammelgebiet. Allerdings sind digitale Publikationen eine besondere Herausforderung, wenn es um die Bewahrung und dauerhafte Verfügbarkeit geht. Warum? Digitale Daten sind im Prinzip ein Strom von Nullen und Einsen, der in Dateien auf Datenträgern abgespeichert ist. Die Herausforderung besteht nicht nur darin, diese Daten so zu sichern, dass keine Null oder Eins verloren geht, sondern auch dafür zu sorgen, dass man mit den Nullen und Einsen später noch etwas anfangen kann. Denn ohne geeignete Umgebung aus Hardware und Software kann man so einem Datenstrom seinen Inhalt nicht entlocken. Leider gibt es immer wieder neue Geräte, neue Systeme, neue Dateiformate und die können mit Altem nicht immer etwas anfangen. Wird man in 50 oder 100 Jahren die Datei noch öffnen und den Inhalt lesen können? Das ist das Kernfrage der digitalen Langzeitarchivierung.
Für die Deutsche Nationalbibliothek und deren zunehmend größer werdenden Sammlungen digitaler Daten war dieses Problem spätestens als Partner beim europäischen Projekt NEDLIB (1998 – 2000) bewusst. Es brauchte ein digitales Langzeitarchiv. Und das wurde schließlich im deutschen Projekt kopal (2004 – 2007) geschaffen. Zusammen mit der SUB Göttingen, der Firma IBM und dem Dienstleister GWDG wurde ein digitales Langzeitarchiv implementiert, das den Anforderungen des dauerhaften Bewahrens vielfältiger und umfangreicher Bestände von digitalen Daten gerecht werden kann. Im Logo des Projekts spiegelte sich die besondere Herausforderung der Nutzbarkeit auch in kommenden Zeiten im Slogan „Daten für die Zukunft“ wieder. Dafür unterstützte das System die sogenannte Migration, das rechtzeitige Konvertierten von alten Dateiformaten in solche, die man in absehbarer Zukunft noch lesen und nutzen kann. Daneben gibt es noch eine andere Erhaltungsstrategie, die sogenannte Emulation. Dabei werden alte Systeme mit Software auf aktuellen Systemen nachgestellt, um die alten Daten wie früher nutzen zu können.
Seitdem wurde das Langzeitarchiv der Deutschen Nationalbibliothek weiter- und neuentwickelt. Inzwischen heißt es koala und ist Teil einer vielfältigen Infrastruktur zur Bewahrung der verschiedensten digitalen Sammlungen. Auch Emulation gibt es jetzt, als Ergebnis eines anderen Projekts mit Namen EMiL. Aber das Ziel bleibt das gleiche, wie vor 20 Jahren: Die Daten für die Zukunft verfügbar und nutzbar zu halten.
111-Geschichten-Redaktion
Zum 111. Jubiläum haben wir, die Beschäftigten der Deutschen Nationalbibliothek, in Erinnerungen und Archiven gestöbert. Von März bis November präsentieren wir hier 111 Geschichten aus der Deutschen Nationalbibliothek.