Personen verbinden – in Katalog und GND

21. Oktober 2023
von Nicole Habermann

Die Deutsche Nationalbibliothek (DNB) erreichen täglich mehr als 5.000 neue E-Books und elektronische Zeitschriftenartikel. Diese Publikationen liefern die Verlage zusammen mit den bibliografischen Angaben wie Titel, Verlag und Erscheinungsjahr an uns oder wir holen uns diese von deren Servern. Daraus entstehen automatisch die Katalogisate für unseren Online-Katalog.

Ein sehr wichtiges Merkmal einer Publikation sind die Personen, die mit ihr in Verbindung stehen, also beispielsweise Autor*innen, Herausgeber*innen oder Illustrator*innen. Um gleichnamige Personen zu unterscheiden und Publikationen eindeutig einer bestimmten Person zuordnen zu können, erstellen Bibliothekar*innen Personendatensätze in der Gemeinsamen Normdatei (GND). Durch die Verlinkung von GND-Datensätzen mit Katalogisaten von Büchern ordnen sie diese eindeutig einander zu.

Die stetig wachsende Anzahl an Online-Publikationen kann in der DNB nicht manuell bearbeitet werden. Deshalb ist es sinnvoll, bereits andernorts bestehende Zuordnungen maschinell in die eigene Datenbank zu übernehmen. Auch die Katalogisate der gedruckten Bücher profitieren von diesen Verfahren.

Zusammenarbeit zwischen den Bibliotheksverbünden und der DNB

Die Plattform Culturegraph enthält die bibliografischen Daten der deutschen Bibliotheksverbünde, des Österreichischen Bibliothekenverbunds und der DNB. Durch die Bündelung dieser Katalogisate führen wir alle Ausgaben eines Werkes maschinell zusammen und können so Daten zwischen diesen Ausgaben austauschen.

Seit 2021 überträgt ein maschinelles Verfahren die GND-Verlinkungen für Personen in die Ausgaben der Bündel, die den Namen bisher nur als Text enthielten. Auf diese Weise haben wir unsere Daten mittlerweile um mehr als 2 Millionen Verlinkungen angereichert. Und es kommen täglich etwa 700 dazu.

Nutzung von Standardnummern

Außer der GND-Nummer gibt es noch weitere Standardnummern für Personen, beispielsweise ORCID (Open Researcher and Contributor ID) und ISNI (International Standard Name Identifier). Bei vielen Verlagen sind diese Standardnummern in den Metadaten enthalten, die sie an uns abliefern. Seit 2019 reichern wir unsere Katalogdaten und die GND-Datensätze maschinell mit Standardnummern an, indem wir die ORCID-Datenbank mit Culturegraph beziehungsweise der GND abgleichen und die durch ORCID-Nutzer*innen durchgeführten Titelzuordnungen  nachvollziehen.

Gibt es für eine*n ORCID-Nutzer*in noch keinen GND-Datensatz, wird automatisch ein Vorschlag generiert. Diesen arbeitet dann ein*e Bibliothekar*in zu einem vollwertigen GND-Datensatz auf.

Ist nun eine Standardnummer sowohl in einem GND-Datensatz als auch in einem Katalogisat vorhanden, werden die Datensätze automatisch miteinander verlinkt. Durch dieses täglich laufende Verfahren sind unsere Daten bisher um mehr als 215.000 Verlinkungen angewachsen. In unseren Katalogisaten sind zur Zeit etwa 2 Millionen Standardnummern enthalten – viel Potenzial für weitere Verlinkungen!

Weitere Informationen

Vorndran, Angela: Hervorholen, was in unseren Daten steckt! Mehrwerte durch Analysen großer Bibliotheksdatenbestände, in: o-bib. Das offene Bibliotheksjournal, 5 (4), 2018, S. 166-180. Online: https://doi.org/10.5282/o-bib/2018h4s166-180

Vorndran, Angela; Grund, Stefan: Metadata Sharing – How to Transfer Metadata Information among Work Cluster Members, in: Cataloging & Classification Quarterly, 59 (8), 2021, S. 757-774. Online: https://doi.org/10.1080/01639374.2021.1989101

Glagla-Dietz, Stephanie; Habermann, Nicole: Standardnummern für Personen. Qualitätsverbesserung durch das Zusammenspiel intellektueller und maschineller Formalerschließung, in: Dialog mit Bibliotheken 32 (2), 2020, S. 20-25. Online: https://nbn-resolving.org/urn:nbn:de:101-2020062250

Gestern geliefert, heute verfügbar - Automatisierung beim Sammeln und Erschließen

In der Deutschen Nationalbibliothek arbeiten wir verstärkt an Automatisierung und setzen Künstliche Intelligenz #KI für die automatische Erschließung ein. Bei täglich mehr als 6.500 eingehenden digitalen Medienwerken erhalten Nutzer*innen dadurch schnell und effektiv Zugang zu den neuesten Veröffentlichungen. Wie funktioniert das? Die Kolleg*innen unseres Referats Automatische Erschließungsverfahren, Netzpublikationen erklären in dieser Serie den Weg von digitalen Medienwerken mit ihren Metadaten in und durch die DNB bis hin zur Erschließung mit Hilfe von Verfahren der KI.

Weitere Beiträge dieser Serie:

  • Die Herausforderung eines Webarchivs
    Was macht das Sammeln von Websites eigentlich so schwierig? Ein kurzer Abriss der Herausforderungen des Webarchivs der DNB.
  • Texte erschließen mit KI
    KI-Lösungen finden, die den Inhalt gesammelter Publikationen mit Schlagwörtern umfassend und präzise beschreiben. Das ist das Ziel des KI-Projekts.
  • In der DNB lesen jede Nacht die Maschinen
    Ein Teil der inhaltlichen Erschließung von Medienwerken wird in der Deutschen Nationalbibliothek (DNB) maschinell und vollautomatisiert durchgeführt.
  • Text für die Maschine
    Maschinelle Erschließung braucht maschinenlesbare Texte. Die Textbereitstellung sorgt genau dafür und interessiert sich für PDF-Dateien, Pixelmuster und Silbentrennungen.
  • Personen verbinden – in Katalog und GND
    Immer mehr Publikationen werden mit maschineller Unterstützung ihren Urheber*innen zugeordnet. In diesem Beitrag erfahren Sie, wie die DNB dazu beiträgt.
  • Parallelwelten in der Sammlung der DNB
    Wie findet man eine Parallelausgabe, was ist der Parallelabgleich und wofür brauchen wir ihn? Entdecken Sie Parallelwelten in der DNB!
  • Das Webarchiv der DNB
    Websites archivieren? Was wird da im Webarchiv so gemacht? Was wird gesammelt und wie nutzt man es? Der Beitrag bringt etwas Licht in ein unbekanntes Terrain.
*Nachweis Beitragsbild auf der Startseite:piqsels.com

Schreibe einen Kommentar

Kommentare werden erst veröffentlicht, nachdem sie von uns geprüft wurden.
Deine E-Mail-Adresse wird nicht veröffentlicht.

Über uns

Die Deutsche Nationalbibliothek ist die zentrale Archivbibliothek Deutschlands.

Wir sammeln, dokumentieren und archivieren alle Medienwerke, die seit 1913 in und über Deutschland oder in deutscher Sprache veröffentlicht werden.

Ob Bücher, Zeitschriften, CDs, Schallplatten, Karten oder Online-Publikationen – wir sammeln ohne Wertung, im Original und lückenlos.

Mehr auf dnb.de

Schlagwörter

Blog-Newsletter

In regelmäßigen Abständen erhalten Sie von uns ausgewählte Beiträge per E-Mail.

Mit dem Bestellen unseres Blog-Newsletters erkennen Sie unsere Datenschutzerklärung an.

  • ISSN 2751-3238