Nachhaltige Metadaten

Bild: KI-generiert mit ChatGPT (Modell GPT-5.3), 2026. CC0
Bibliothekarische Metadaten sind nachhaltig. Eine Bibliothek erstellt sie, alle anderen nutzen ihre Daten, indem sie sie in ihre eigenen Bibliothekssysteme überspielen oder als Grundlage für ihre eigene Erschließung verwenden. Als Nutzer kann man diese Daten in den Bibliothekskatalogen recherchieren und für eigene Arbeitsergebnisse verwenden. Ob Metadaten von der fachlichen Expertise der Bibliotheksbeschäftigten oder mittels maschineller Prozesse erzeugt wurden – die einen sind fachlich und qualitativ hochwertig, die anderen lernen anhand des Datenmaterials und verarbeiten schnell gigantische Datenmengen. Mensch und Maschine – natürliche und künstliche Intelligenz haben hierbei die Möglichkeit, ihre Fähigkeiten zu kombinieren und immer mehr, immer bessere Daten zu kreieren.
Und vielleicht entsteht dabei so etwas Magisches wie unsere Bibliotheks-TARDIS, die auf der Höhe der Technik angekommen ist und von Wissenschaft, Fantasie und Magie angetrieben wird.
Meaningful Metadata
„Things are only findable if the metadata is meaningful“ (Jason Scott)
Nachhaltige Daten müssen gehegt und gepflegt werden. Wie alles in unserem Kosmos, ist auch auf dem Planet Metadaten alles einem natürlichen Alterungsprozess unterworfen. Nicht nur an uns, auch an den von uns erzeugten Metadaten nagt beständig der Zahn der Zeit.
Die Wissenschaften gewinnen neue Erkenntnisse, soziale Regeln und Betrachtungsweisen ändern sich, Sprache ist fluide – und Katalogisierungsregelwerke, Standards, Erschließungstiefen passen sich aktuellen Bedürfnissen an. Bibliotheken bleiben sich und ihren Aufgaben treu, indem sie das Alte bewahren, sich neuen Wirklichkeiten stellen und beides in ihren Daten abbilden.
Aber wie genau altern bibliografische Metadaten? Betrachtet man sie nicht nur ganz nüchtern als Datensätze, sondern stellt sie sich als kleine Zeitkapseln vor, die in einer TARDIS durch die Zeit reisen, entdeckt man Alterungsprozesse an typischen Symptomen – manche sind subtil, andere offensichtlich:
Bei der Inhaltserschließung:
Bei der inhaltlichen oder sachlichen Erschließung verwenden wir Schlagwörter zur Beschreibung z. B. eines Buches. Die Schlagwörter geben präzise und aussagekräftig den Inhalt eines Buches wieder. Hat man vor Jahren die beiden Schlagwörter Nervensystem und Krankheit verwendet, um Bücher über Nervenkrankheiten zu erschließen, nutzen wir heute das gebräuchlichere Schlagwort Neurologische Krankheit.
Bei der Formalerschließung:
Auch in der Formalerschließung, bei der wir die formalen Daten wie die Namen von Autor*innen, Titel, Verlagsangaben, Seitenzahlen etc. erfassen, gibt es alt und neu. Bis in die 1970er Jahre wurden Katalogeinträge nach einem bibliothekarischen Katalogisierungsregelwerk erstellt, dass so streng war wie es klingt: den sogenannten Preußischen Instruktionen (PI). Man denke hierbei an Zettelkataloge, in denen Katalogkärtchen für Katalogkärtchen nach Büchern gesucht werden musste – die Ordnung innerhalb eines Zettelkastens war also wichtig, wenn man nicht endlos suchen wollte. Bei den PI wurden Namen wie „Carl“ eingedeutscht zu „Karl“ und ein Buchtitel wurde nicht etwa in alphabetischer Reihenfolge (unter Umgehung der Artikel) einsortiert, sondern nach dem Substantivum regens, also dem „regierenden“, dem als am wichtigsten erachteten Haupt-Substantiv in einem Titel. Man hätte die Jubiläumsschrift Hundert Jahre Preussische Instruktionen aus dem Jahr 2000 ergo nach den PI wie folgt im Zettelkatalog gefunden: Instruktionen (1) preussische (2) Jahre (3) hundert (4). An dieser Art des Katalogisierens hatten wohl nur extrem grammatikaffine Bibliothekar*innen und Benutzer*innen ihre Freude. Um es allen etwas leichter und bibliografische Daten digital verarbeitbar zu machen und, etwas später, mit Blick auf die Konversion alter Katalogisate in moderne Onlinekataloge, erarbeitete man in den 1980er Jahren ein neues Regelwerk namens Regeln für die Alphabetische Katalogisierung (RAK), Dieses wurde 2015 wiederum von den Resource Description ans Access (RDA) abgelöst.
Auch veränderte Gepflogenheiten wie Abkürzungen in einer Titelaufnahme (wie „Ill.“ für das ausgeschriebene „Illustrationen“), die Codierung für Sonderzeichen (z.B. für griechische Buchstaben), veraltete Orthografie sowie aktuelle Bedürfnisse wie Angaben über Barrierefreiheit, URN oder Anforderungen daran, mit welcher Software ein Dokument am einfachsten zu öffnen ist, verursachen Veränderungen, die ihrerseits wieder dem Fluss der Zeit unterworfen sind.
Bei Normdaten: auch Normdaten (für Personen, Schlagwörter, Werke, Körperschaften, Konferenzen und Geografika) können veralten. Wenn beispielsweise ein Land seinen Namen ändert, finden wir einen veralteten und einen neuen Datensatz in der Gemeinsamen Normdatei, GND. Als Swasiland 2018 seinen Namen in Eswatini änderte, legten Bibliothekar*innen einen neuen Datensatz für Eswatini an und verknüpften diese reziprok mit dem Datensatz für Swasiland. Je nach Bedarf verwenden wir für Katalogisate der einzelnen Medienwerke und Normdatensätze entweder den alten und/oder den neuen Datensatz entsprechend den Regeln von Resource Description and Access, RDA sowie den Regeln für die Schlagwortkatalogisierung, RSWK.
GND, die gemeinsame Normdatei
Bleiben wir bei den Normdaten – sie sind einfach ein zu cooles Beispiel für Nachhaltigkeit in der Bibliothekswelt! Ist ein Datensatz von einer Bibliothek angelegt worden, können alle anderen Bibliotheken ihn nutzen, ihre Titeldaten damit verknüpfen und bei entsprechendem eigenen Bedarf den Datensatz auch verändern, z. B. um noch fehlende Angaben zu ergänzen.
Die Metadaten in der GND werden also mit der Expertise und dem Erfahrungswissen von vielen Köpfen erstellt – wir kreieren sie für uns und für die Bedürfnisse unserer Kolleg*innen in der deutschsprachigen Kulturlandschaft sowie für die weltweite Community der Bibliotheken und anderen Institutionen von Wissenschaft und Literatur, Kunst und Kultur.
Im Bibliothekskatalog sehen wir in Ausschnitten, wie die Metadaten für einzelne Medienwerke verwendet wurden, und in der GND selbst findet, wer danach sucht, ein weit verzweigtes Wissensnetz miteinander verknüpfter und aufeinander bezogener Daten, die sinntragende Beziehungen eingehen, um optimal das zu beschreiben und such- und findbar machen, was wir in unseren Bibliotheken liebevoll aufbewahren, hegen und pflegen: unsere Medienwerke in allen Farben und Formen, für alle Zeiten.
Und auch am Tempo arbeiten wir, durch den Einsatz automatisierter, maschineller Verfahren, die uns dabei helfen, die steigenden Zahlen an Publikationen, ob analog oder digital, zu bewältigen.
Für alle Veränderungsprozesse, denen Zeitmaschinen und Metadaten ausgesetzt sind, gilt also: sind sie erst einmal da, können – und müssen – Mensch und Maschine sie pflegen, aktualisieren, konvertieren und für Wissenschaft und Forschung und die Neugier, den Wissensdurst und den Entdeckerdrang aller Nutzer such- und auffindbar machen. Der beste Beweis dafür ist unser alter Freund, der Kolophon … ihn fanden wir zuerst in den tönernen Bibliotheken aus uralter Zeit – und nun?
Fun Fact: Kolophon goes digital

Bild: KI-generiert mit ChatGPT (Modell GPT-5.3), 2026.
Wie modern unsere Metadaten heute sein mögen – ihre Geschichte wirft jahrtausendealte lange Schatten. Wissen Sie noch, wie unsere Metadatenreise begann? Ja, richtig, am 31. August 2022 mit dem einführenden Beitrag und dem Kolophon, der ersten bekannten Quelle von Metadaten im antiken Hattusa, in Ninive und der sagenumwobenen Bibliothek von Alexandria.
So treffen wir unseren lieben Bekannten heute, in der Moderne, wieder – statt aus den Regalen aus Assurbanipals Bibliothek in Ninive winkt er uns nun in digitaler Form aus Webseiten entgegen!
Über die Zeit hinweg erfreut er sich noch immer so großer Beliebtheit, dass er nun darüber informiert, welche Mittel genutzt wurden, um einen Webauftritt zu erstellen. So benennt er das CMS System, die Entwickler des Designs und ggf. auch die Programmiersprache. In bewährter Tradition stellt er (häufig, aber nicht immer) eine Ergänzung des Impressums dar.
Ein Stellplatz für unsere TARDIS
Langsam und zögerlich steigen wir aus der Bibliotheks-TARDIS, die uns so treu über alle Stationen dieser Metadatengeschichte transportiert hat. Ein Hauch von Sternenstaub glitzert auf dem tiefen Blau ihrer Oberfläche und spiegelt sich in unseren Augen.
Das Wort TARDIS bedeutet im Lateinischen langsam und wird in der klassischen TV-Serie Dr. Who auch dazu verwendet, all das zu beschreiben, was innen größer ist, als es von außen den Anschein hat. Ein wenig ist es auch so mit den bibliografischen Metadaten. Man kann sie zwar rasend schnell abrufen, aber es braucht Zeit und Expertise, um sie zu kreieren.
Unsere TARDIS parken wir an einem verwunschenen Ort tief in den Büchermagazinen der Deutschen Nationalbibliothek und wann immer Sie das Buch dieser Metadatengeschichte aufschlagen möchten, laden wir Sie zum Einsteigen ein, um das kleine Wunder dieser ganz besonderen Zeitreise noch einmal mit uns zu erleben.
ENDE
Aber Anke und Elke kehren zurück – mit einer Geschichte über den Lesesaal durch Raum und Zeit … stay tuned!






