Brückenbauende Vokabeln
Eine BiblioCon-Diskussion über Erwartungen an die Gemeinsame Normdatei (GND) bei der Erschließung von Forschungsdaten.
Durch den Zuwachs von Forschungsdaten an den Universitätsbibliotheken und ihre wachsende Anerkennung als eigene Publikationsform, wächst der Bedarf an qualitätsvoller Erschließung nach den FAIR Prinzipien. Kontrolliertes Vokabular soll nicht nur eindeutige Sucheinstiege liefern, sondern auch das gegenseitige Verständnis über die Grenzen von Fachdisziplinen und Sparten hinaus fördern sowie helfen, im semantic web für Menschen und Maschinen gleichermaßen belastbare Brücken zu bauen. Dabei sind die Voraussetzungen für die Verwendung von Normdaten, wie der GND, bisher wenig thematisiert worden. Eine Podiumsdiskussion im Rahmen der 112. BiblioCon beleuchtete das Thema aus vier Perspektiven.
Zunächst die Forschenden selbst. Sie wollen ihre Forschungsdaten sichtbarer und vernetzer machen. Normdaten sind hierbei eine gute Option. Jedoch fehlt es den Forschenden an Zeit und Wissen, um ebenso selbstständig wie rasch nicht nur bestehende GND-IDs nachzunutzen, sondern auch bei Bedarf neue GND-Datensätze anlegen zu können.
Universitätsbibliotheken oft in Union mit dem Forschungsdatenmanagement der jeweiligen Universität bilden die zweite Gruppe. Sie bringen ihre bibliothekarische Erschließungserfahrung und ihren Zugang zur GND-Kooperative mit. Sie sehen das Potential, GND-Datensätze nicht nur für Publikationen und Forschungsdaten, sondern im gesamten Datenzyklus der Körperschaft als Referenzierungsknoten zu verwenden. Sie erweitern daher ihre Arbeit als GND-Redaktionen auf Forschungsdaten. Doch ihnen stellen sich die Fragen: Sind die GND-Daten nicht nur inhaltlich präzise und verlässlich, sondern auch ausreichend flexibel im schnelllebigen Forschungsalltag? Und wer unterstützt die Mitarbeitenden in den Bibliotheken, die Forschenden zu befähigen, selbst zur GND beizutragen?

Als dritte Partei dann die GND-Agenturen in den Verbundzentralen und darüber hinaus. Sie müssten mögliche Bedarfe aus der Forschung in die geltenden GND-Erfassungsregeln vermitteln und integrieren. Gleichzeitig übernehmen sie in ihrer Rolle als GND-Agentur langfristig Verantwortung für die neuen GND-Datensätze. Wie bereiten sie sich auf diese Aufgaben qualitativ und quantitativ vor? Was fehlt ihnen?
Und schließlich die GND-Zentrale; als Trägerin der organisatorischen und technischen Infrastruktur muss sie die regelkonforme Redaktion und die nachhaltige Pflege der Datensätze sicherstellen. Denn diese beiden Faktoren entscheiden über die Zuverlässigkeit und Verlässlichkeit der Normdaten, ihr wesentlicher Daseinszweck. Ihr Interesse ist folglich, das Funktionieren der Workflows zwischen den Forschenden, der GND-Redaktionen und Agenturen zu fördern. Welche Infrastrukturangebote gibt es, was ist davon bekannt und was braucht es zusätzlich?
Diese Fragen stellten sich die Podiumsteilnehmenden am letzten Tag der Hamburger BiblioCon.
Es diskutierten in alphabetischer Reihenfolge:
- Frank Dührkohp, Verbundzentrale des GBV (VZG) und NFDI4Objects, kommissarisch stellvertretender Leiter des VZG, vertritt die Perspektive der GND-Agenturen.
- Barbara Fischer, Arbeitsstelle für Standardisierung an der Deutschen Nationalbibliothek (DNB AfS) und Text+, Leiterin des DFG-Projektes GND4C, vertritt die Perspektive der GND-Zentrale.
- Eike Spielberg, Universitätsbibliothek (UB) Duisburg-Essen, Leiter des Dezernats Forschungs- und Publikationsdienste, vertritt die Perspektive der Universitätsbibliotheken in der Rolle der GND-Redaktion.
- Dirk Wintergrün, Klassik Stiftung Weimar und NFDI4Objects, Direktor der Querschnittsdirektion Digitale Transformation und Innovationsmanagement, vertritt die Perspektive der Forschenden, die gefordert sind, die GND aktiv zu verwenden.
Moderation
Antje Theise, leitende Direktorin der UB Rostock
Der nachfolgende Beitrag fasst auf der Grundlage einer automatisch erstellten Transkription der Redebeiträge die wesentlichen Eindrücke aus der Diskussion zusammen.
Vom Nutzen der GND bei der Erschließung von Forschungsdaten
Einhellig aufgenommen wurde die Meinung, dass Forschungsdaten schon jetzt den Rang von Publikationen hätten und als solche im Rahmen des Forschungsdatenmangements der Universitätsbibliotheken erschlossen werden müssen. Das bezöge sich nicht allein auf die Metadaten zu den Forschungsdaten, sondern auch tiefergehend und soweit als möglich, innerhalb der Forschungsdaten selbst sollte die GND zum Einsatz kommen. Hier wäre die naheliegende Expertise der Forschenden gefragt, denen entsprechende Hilfestellung zukommen müsste. Positiv vermerkt wurden hierbei die bereits existenten Angebote wie der GND Explorer und der GND Website. Begrüßt wurde die Arbeit an einer verbesserten Zugänglichkeit der GND-Erfassungshilfen über die STA-Plattform, die bis 2025 abgeschlossen sein soll. Allerdings sind diese Angebote noch nicht hinreichend bekannt. Es müsse, so der allgemeine Wunsch, noch einfacher werden, mitzumachen. “Wir müssen einladender werden!”, wie es Frank Dührkohp auf den Punkt brachte.
Ein zentraler Punkt der Diskussion war die begründete Erwartung, dass mittels derart erschlossener Forschungsdaten Grenzen zwischen den wissenschaftlichen Disziplinen besser überbrückt werden könnten. An diesem Punkt vertiefte sich die Diskussion. Es sei ein erheblicher Paradigmenwechsel in der Forschung nach der Ausdiffenzierung von Terminologien und Vokabularien sich im Zuge von linked data auf die semantische Auslegung von Relationen zwischen Termen zu verständigen. “Wir sind in zehn bis fünfzehn Jahren Diskussion von abstrakt gesprochen ontology engineering so weit, dass wir sagen können, … diese Normierung mit Normdaten ist keine Normieren dessen, was du meinst, sondern sie soll dir helfen, in die Nähe dessen zu kommen, was andere vielleicht auch denken.”, erklärte Dirk Wintergrün. Dieses Verständnis von Normdaten zu propagieren, wäre essentiell für die Motivation von Forschenden, sich dem Mehraufwand der Verknüpfung mit Normdaten zu stellen. Verstärkt durch die Aussicht, über die eigenen Fachgrenzen hinaus sichtbarer und damit relevanter zu werden.
Jedoch, wandten sowohl Eike Spielberg als auch Frank Dührkohp ein, erfordere diese Bestimmung der Art der Relation zweier Terme nicht nur Expertise in der jeweiligen Fachdisziplin, sondern auch die Kompetenz, sie in die “Sprache der GND” zu übersetzen. Dirk Wintergrün ergänzte deshalb mahnend, “das bedeutet aber vor allen Dingen eine erhebliche Aufwertung der Funktionsträger auf Seiten der Bibliotheken … sie dürfen sich nicht einfach als Registratoren sehen. … Wenn [in diesem Verständigungsprozess] nicht Forschung, Bibliothekswesen und Rechenzentren enger zusammenstehen und sich als ein Teil der Wissenschaftscommunity verstehen, dann haben wir das Spiel, glaube ich, verloren, dann sind die Bibliotheken irgendwann raus … dann kommen an ihrer Stelle die Künstliche Intelligenz (KI) Befürworter und mit ihnen die Technologieunternehmen.” Wir sprechen also von Kommunikation, Zusammenarbeit, von Arbeitsprozessen und deren Performanz. Und damit rückten die Themen Ressourcen, Aufwände und Zugänglichkeit in den Fokus der Diskussion.
Natürlich wäre ein Mehr an Personal wünschenswert. Auch eine stärkere Gewichtung der Bedeutung von Erschließungsarbeit in der Forschung und den Bibliotheken. Hier herrschte Einigkeit auf dem Podium und im Saal. Gleichzeitig seien aber alle gefordert, ihre Strukturen und Geschäftsgänge zu evaluieren. Wo könne man KI zur Entlastung einsetzen, wie Kolleg*innen befähigen, neue Aufgaben zu übernehmen? Schließlich aber auch dafür Sorge tragen, dass es eine größere Personalkontinuität über Projekthorizonte hinaus gäbe, um erworbene Kompetenz und Vertrauen in der Zusammenarbeit zu bewahren. Zum Beispiel durch die Weiterbeschäftigung von Menschen durch gesicherte Gegenfinanzierung aus Projektmitteln (gewissermaßen als Teil der Programmpauschale), regte Eike Spielberg an.
Im Zentrum steht die Zusammenarbeit
In Bezug auf die Zusammenarbeit und deren Probleme erinnerte Barbara Fischer daran, dass man in der Erörterung sich oft auf die schwierigen Fälle bezöge. Dabei gelte auch in der GND das Pareto-Prinzip. Bei Personen, Körperschaften und Geografika kommt man in geschätzt 80% der Fälle mit 20% Aufwand zu guten Ergebnissen, sei es beim Matchen der eigenen Daten mit der GND – vorausgesetzt man hat genügend Parameter zum Abgleich – oder beim Anlegen neuer regelkonformer Datensätze. Sie regte daher an, pragmatisch vorzugehen, sich zunächst mit der GND und ihren Regeln durch die Nutzung vertraut zu machen und dafür die Tools wie den GND Explorer, die GND Reconciliation und die STA-Plattform anzuwenden. So werde man für die schwierigeren Fälle die entsprechende Kompetenz aufbauen. Die Arbeit in der GND basiere wie die Arbeit in einem Gemeinschaftsgarten auf der Übernahme von Verantwortung, gegenseitigem Respekt und der Wertschätzung der bestehenden Strukturen, aber zugleich von dem Engagement, sich gestaltend einzubringen. Dafür stünde eine entsprechende organisatorische Infrastruktur bereit: Vom Standardisierungsausschuss, über den GND-Ausschuss, die Arbeits- und Interessengruppen bis hin zu den GND-Foren zum Community-Building. Allerdings wandte hier Kathrin Kessen (UB Düsseldorf) aus dem Publikum begründet ein, dass es heutzutage schwer sei, jüngere Kolleg*innen für Gremienarbeit zu begeistern, hier bräuchte es moderneres Vokabular. Überhaupt stellte sich vielen Teilnehmenden die Zusammenarbeit in der GND Kooperative noch zu wenig zugänglich dar. Da wäre noch viel Kommunikationsarbeit zu leisten, wie Reinhard Altenhöhner (SB Berlin) betonte. Genau hier bestünde jedoch die Aufgabe auf einander zu zu gehen: Forschende, NFDI, Bibliotheken, die Verbünde und die GND-Zentrale. Dafür erfordere es mehr als nur Services einzufordern oder anzubieten, sondern tatsächlichen Dialog auf Augenhöhe, eben Zusammenarbeit.
Resümée
Die Notwendigkeit, Forschungsdaten beziehungsweise zumindest die Metadaten zu den publizierten Datensets mittels des Einsatzes der GND interoperabler und nachnutzbarer zu machen, bekräftigte die gesamte Session. Die Diskussion mit dem Publikum oszillierte zusammenfassend zwischen zwei Polen. Auf der einen Seite die am Horizont dräuende KI mit ihren ebenso verlockenden wie bedrohlichen Perspektiven. Da steht die Erwartung insbsondere der Entscheidungsträger und Finanziers, mittels KI ließe sich alles automatisieren und damit enorm viel Arbeit rationalisieren, der Befürchtung der Experten gegenüber, dass Menschen, die den Bibliotheken vertrauen, durch falsche Kategorisierungen, verunsichert und enttäuscht werden könnten, bis hin, dass mit der KI fake news und der Verbreitung von Unwahrheiten Tür und Tor geöffnet werden könnten. Dem kann man durch den verstärkten Einsatz von Normdaten wie der GND in der Erschließung von Forschungsdaten wirkungsvoll entgegnen. Nur – und hier kommen wir zum anderen Pol der Diskussion – für die sachgemäße Erschließung der Forschungsdaten mit der GND fehlt es letztendlich an kompetenten Personal. Diesen Personalmangel allein mit Geld ausgleichen zu wollen, wird nicht reichen. Die Bedeutung der Erschließungsarbeit und Wertigkeit der Normdaten muss noch stärker gegenüber den Entscheidungsträgern und Forschenden kommuniziert werden. Die Zugänge zur Nutzung, Edition und zum Regelwerk also insgesamt der Infrastruktur müssen noch bekannter und attraktiver gemacht werden. Die KI kann helfen, an definierten Stellen, Arbeitsprozesse effizienter zu gestalten, um so Ressourcen für qualitative Entscheidungsprozesse intellektueller Art der Mitarbeitenden frei zu machen. Vor allem aber muss die Zusammenarbeit im Einsatz von GND-Normdaten zwischen den Forschenden aller Sparten, den Bibliotheken und innerhalb der GND Kooperative als elementare Grundlage für die gelingende Organisation von Daten, deren Verdichtung zu Information und Schöpfung neuem Fakten basierten Wissens gefördert werden.
Dieser Aufgabe stellt sich die Deutsche Nationalbibliothek gemeinsam mit ihren Partnern sei es in der GND-Kooperative oder der Nationalen Forschungsdateninfrastruktur gern.
Ein sehr interessanter Beitrag, dankeschön dafür! Tatsächlich lässt sich mit KI eben nicht alles automatisieren – intellektuelle „Man power“ ist bei qualitätsvollen Daten absolut unerlässlich und es wird mE nach weiterhin das qualifizierte (Bibliotheks)-Personal als „Datenmanager“ benötigt werden. Vielleicht eine konservative Sichtweise, aber, wie ich denke, eine, die sich bewährt hat.
Vielen Dank für Ihr Feedback.