Personen verbinden – in Katalog und GND
Die Deutsche Nationalbibliothek (DNB) erreichen täglich mehr als 5.000 neue E-Books und elektronische Zeitschriftenartikel. Diese Publikationen liefern die Verlage zusammen mit den bibliografischen Angaben wie Titel, Verlag und Erscheinungsjahr an uns oder wir holen uns diese von deren Servern. Daraus entstehen automatisch die Katalogisate für unseren Online-Katalog.
Ein sehr wichtiges Merkmal einer Publikation sind die Personen, die mit ihr in Verbindung stehen, also beispielsweise Autor*innen, Herausgeber*innen oder Illustrator*innen. Um gleichnamige Personen zu unterscheiden und Publikationen eindeutig einer bestimmten Person zuordnen zu können, erstellen Bibliothekar*innen Personendatensätze in der Gemeinsamen Normdatei (GND). Durch die Verlinkung von GND-Datensätzen mit Katalogisaten von Büchern ordnen sie diese eindeutig einander zu.
Die stetig wachsende Anzahl an Online-Publikationen kann in der DNB nicht manuell bearbeitet werden. Deshalb ist es sinnvoll, bereits andernorts bestehende Zuordnungen maschinell in die eigene Datenbank zu übernehmen. Auch die Katalogisate der gedruckten Bücher profitieren von diesen Verfahren.
Zusammenarbeit zwischen den Bibliotheksverbünden und der DNB
Die Plattform Culturegraph enthält die bibliografischen Daten der deutschen Bibliotheksverbünde, des Österreichischen Bibliothekenverbunds und der DNB. Durch die Bündelung dieser Katalogisate führen wir alle Ausgaben eines Werkes maschinell zusammen und können so Daten zwischen diesen Ausgaben austauschen.
Seit 2021 überträgt ein maschinelles Verfahren die GND-Verlinkungen für Personen in die Ausgaben der Bündel, die den Namen bisher nur als Text enthielten. Auf diese Weise haben wir unsere Daten mittlerweile um mehr als 2 Millionen Verlinkungen angereichert. Und es kommen täglich etwa 700 dazu.
Nutzung von Standardnummern
Außer der GND-Nummer gibt es noch weitere Standardnummern für Personen, beispielsweise ORCID (Open Researcher and Contributor ID) und ISNI (International Standard Name Identifier). Bei vielen Verlagen sind diese Standardnummern in den Metadaten enthalten, die sie an uns abliefern. Seit 2019 reichern wir unsere Katalogdaten und die GND-Datensätze maschinell mit Standardnummern an, indem wir die ORCID-Datenbank mit Culturegraph beziehungsweise der GND abgleichen und die durch ORCID-Nutzer*innen durchgeführten Titelzuordnungen nachvollziehen.
Gibt es für eine*n ORCID-Nutzer*in noch keinen GND-Datensatz, wird automatisch ein Vorschlag generiert. Diesen arbeitet dann ein*e Bibliothekar*in zu einem vollwertigen GND-Datensatz auf.
Ist nun eine Standardnummer sowohl in einem GND-Datensatz als auch in einem Katalogisat vorhanden, werden die Datensätze automatisch miteinander verlinkt. Durch dieses täglich laufende Verfahren sind unsere Daten bisher um mehr als 215.000 Verlinkungen angewachsen. In unseren Katalogisaten sind zur Zeit etwa 2 Millionen Standardnummern enthalten – viel Potenzial für weitere Verlinkungen!
Weitere Informationen
Vorndran, Angela: Hervorholen, was in unseren Daten steckt! Mehrwerte durch Analysen großer Bibliotheksdatenbestände, in: o-bib. Das offene Bibliotheksjournal, 5 (4), 2018, S. 166-180. Online: https://doi.org/10.5282/o-bib/2018h4s166-180
Vorndran, Angela; Grund, Stefan: Metadata Sharing – How to Transfer Metadata Information among Work Cluster Members, in: Cataloging & Classification Quarterly, 59 (8), 2021, S. 757-774. Online: https://doi.org/10.1080/01639374.2021.1989101
Glagla-Dietz, Stephanie; Habermann, Nicole: Standardnummern für Personen. Qualitätsverbesserung durch das Zusammenspiel intellektueller und maschineller Formalerschließung, in: Dialog mit Bibliotheken 32 (2), 2020, S. 20-25. Online: https://nbn-resolving.org/urn:nbn:de:101-2020062250
Gestern geliefert, heute verfügbar - Automatisierung beim Sammeln und Erschließen
In der Deutschen Nationalbibliothek arbeiten wir verstärkt an Automatisierung und setzen Künstliche Intelligenz #KI für die automatische Erschließung ein. Bei täglich mehr als 6.500 eingehenden digitalen Medienwerken erhalten Nutzer*innen dadurch schnell und effektiv Zugang zu den neuesten Veröffentlichungen. Wie funktioniert das? Die Kolleg*innen unseres Referats Automatische Erschließungsverfahren, Netzpublikationen erklären in dieser Serie den Weg von digitalen Medienwerken mit ihren Metadaten in und durch die DNB bis hin zur Erschließung mit Hilfe von Verfahren der KI.
Weitere Beiträge dieser Serie:
- Die Herausforderung eines WebarchivsWas macht das Sammeln von Websites eigentlich so schwierig? Ein kurzer Abriss der Herausforderungen des Webarchivs der DNB.
- Texte erschließen mit KIKI-Lösungen finden, die den Inhalt gesammelter Publikationen mit Schlagwörtern umfassend und präzise beschreiben. Das ist das Ziel des KI-Projekts.
- In der DNB lesen jede Nacht die MaschinenEin Teil der inhaltlichen Erschließung von Medienwerken wird in der Deutschen Nationalbibliothek (DNB) maschinell und vollautomatisiert durchgeführt.
- Text für die MaschineMaschinelle Erschließung braucht maschinenlesbare Texte. Die Textbereitstellung sorgt genau dafür und interessiert sich für PDF-Dateien, Pixelmuster und Silbentrennungen.
- Personen verbinden – in Katalog und GNDImmer mehr Publikationen werden mit maschineller Unterstützung ihren Urheber*innen zugeordnet. In diesem Beitrag erfahren Sie, wie die DNB dazu beiträgt.
- Parallelwelten in der Sammlung der DNBWie findet man eine Parallelausgabe, was ist der Parallelabgleich und wofür brauchen wir ihn? Entdecken Sie Parallelwelten in der DNB!
- Das Webarchiv der DNBWebsites archivieren? Was wird da im Webarchiv so gemacht? Was wird gesammelt und wie nutzt man es? Der Beitrag bringt etwas Licht in ein unbekanntes Terrain.