Herausforderungen der Philosophiegeschichte

1. September 2025
von Max Beck

Im Rahmen des HERMES-Forschungsstudienprogramms unterstützt die DNB Forschungsprojekte auf Basis ihrer Daten und Bestände, die mit Methoden des Text- und Data-Minings bearbeitet werden. Die Förderung richtet sich dabei vor allem an junge technikaffine Forschende aller Fachgebiete, die sich bereits mit Methoden und Instrumenten der Digital Humanities beschäftigt und praktische Erfahrungen auf dem Gebiet gesammelt haben. Im folgenden Blogbeitrag stellt Dr. Max Beck seine Studie vor:

Die Philosophiegeschichtsschreibung des 20. Jahrhunderts ist komplex und in vielerlei Hinsicht ein noch offenes Unterfangen. Im Zentrum der aktuellen Forschung stehen dabei Fragen nach dem richtigen methodischen Zugang, der Bestimmung der kanonischen Philosoph:innen, der Auswahl der Textkorpora sowie die Herausforderung, die Fülle an relevanten Materialien überhaupt berücksichtigen zu können. Schließlich existieren unzählige veröffentlichte Werke, Briefe, Notizbücher und vor allem Regalmeter an Archivmaterialien, die sich, wenn überhaupt, nur unter erheblichem zeitlichem Aufwand formal und inhaltlich erschließen lassen. Während die Rezeption aller einschlägigen Materialien bei einzelnen Philosoph:innen noch möglich sein mag, ist dies bei Strömungen oder gar Philosophien eines ganzen Jahrhunderts jedoch zumeist illusorisch. Vor diesem Hintergrund bieten digitale Methoden, insbesondere aus dem Bereich der Künstlichen Intelligenz (KI), neue Möglichkeiten, um die philosophiehistorische Forschung produktiv zu unterstützen.

Retrieval-Augmented Generation (RAG)

Einen vielversprechenden Ansatz bietet die sogenannte Retrieval-Augmented Generation (RAG) – ein KI-gestützter Ansatz, der große Sprachmodelle mit gezielter Dokumentenrecherche im Sinne des klassischen Information Retrieval verbindet. Das Verfahren wurde erstmals 2020 von einem Forscherteam bei Meta beschrieben und bislang nur punktuell in den Digital Humanities adaptiert.[1] Im Rahmen einer aktuellen HERMES-Studie an der Deutschen Nationalbibliothek wird untersucht, wie RAG unter Zuhilfenahme der Schnittstellen der Deutschen Nationalbibliothek die Erforschung der Philosophiegeschichte des 20. Jahrhunderts methodisch bereichern kann.

RAG steht für ein Verfahren, das drei Schritte kombiniert: Zunächst wird in einem thematisch relevanten Textkorpus oder Datensatz nach semantisch verwandten Textstellen gesucht. Anschließend werden diese Textstellen mit der ursprünglichen Fragestellung verknüpft und zusammen an ein großes Sprachmodell (LLM) übergeben, das darauf aufbauend eine kontextualisierte Antwort generiert. Der zentrale Unterschied zu generativen Sprachmodellen ohne vorherigen Retrieval-Schritt besteht darin, dass die Antwort nicht allein auf der statistischen Wahrscheinlichkeit sprachlicher Muster basiert, sondern auf der Einbeziehung zitierfähiger Textpassagen. Zudem werden Halluzinationen der Sprachmodelle deutlich reduziert.

Gerade in der historischen Forschung ist dies ein entscheidender Vorteil: Die Verbindung von leistungsfähigen Sprachmodellen mit kuratierten, zitierfähigen Dokumenten eröffnet neue Möglichkeiten, komplexe Argumentationsstrukturen, thematische Entwicklungen und intertextuelle Bezüge sichtbar zu machen. Dies ist selbst an Stellen möglich, an denen beispielsweise hermeneutische Verfahren aufgrund des Umfangs des zu erfassenden Materials an ihre Grenzen stoßen.

Die Schnittstellen der DNB

Auch wenn ein solches System primär auf Basis großer Textmengen wie Gesamtausgaben und Nachlassmaterialien produktive Ergebnisse verspricht, bieten die Schnittstellen der DNB eine vielversprechende Ergänzung. Über die SRU-Schnittstelle und die Datenquellen „authorities“ und „dnb“ werden strukturierte Metadaten bereitgestellt, die als zusätzliche Wissensquelle in das RAG-System eingespeist werden können.[2] Damit lassen sich Antworten um validierte Normdaten, seien es bibliographische oder biographische Daten, anreichern.

Die Datenquelle „authorities“ spiegelt etwa die Daten der Gemeinsamen Normdatei (GND) und erlaubt die eindeutige Identifikation und Verlinkung von Personen, Institutionen und Werken. Das ist insbesondere für KI-gestützte Textanalysen von großer Bedeutung: Wenn etwa ein Sprachmodell in einer philosophischen Quelle den Namen „Heidegger“ erkennt, kann es über die GND-Schnittstelle automatisch mit validierten Informationen wie Lebensdaten, alternativen Namensformen oder Werkverzeichnissen angereichert werden, ohne dass auf unsichere Trainingsdaten zurückgegriffen werden muss.

Eine andere wichtige Datenquelle stellt „dnb“ dar. Diese ermöglicht den Zugriff auf den Katalog der Deutschen Nationalbibliothek, inklusive bibliographischer Metadaten zu Publikationen. Für die Philosophiegeschichtsschreibung des 20. Jahrhunderts ist dies aus zwei Gründen zentral: Erstens verzeichnet die DNB nicht nur Gesamtausgaben, sondern auch deren Varianten, d.h. Erstausgaben, Neuauflagen oder Übersetzungen. Aufgrund des hohen Rechenaufwands und der damit verbundenen finanziellen Kosten lassen sich diese in der Regel nicht vollständig in ein RAG-System integrieren. Ihre Metadaten hingegen sind über die DNB-Schnittstelle leicht zugänglich und können genutzt werden, um etwa die internationale Rezeption eines Werkes zu rekonstruieren. Zweitens erfasst die DNB in vielen Fällen die Inhaltsverzeichnisse von Publikationen, die auch ohne vollständigen Textzugriff an das LLM übergeben werden können, um gezieltere und inhaltlich präzisere Antworten zu generieren. Diese Form der intelligenten Anreicherung durch strukturierte Metadaten erweitert das Analysepotenzial eines RAG-Systems erheblich. Sie erlaubt es, auch ohne vollständige Textdigitalisierung einen differenzierten Blick beispielsweise auf den Publikationskontext und die Wirkungsgeschichte philosophischer Werke zu werfen. Gleichzeitig stellt RAG sicher, dass jede maschinelle Auswertung auf überprüfbare Datenquellen zurückgeführt werden kann – ein entscheidendes Kriterium für den wissenschaftlichen Einsatz von KI in den Geisteswissenschaften.


[1]           https://arxiv.org/abs/2005.11401

[2]           https://www.dnb.de/dnblabapi

Max Beck

Max Beck promovierte an der Friedrich-Schiller-Universität Jena über die Exilerfahrung von Kritischer Theorie und Logischem Empirismus. Seine Arbeitsschwerpunkte liegen im Bereich Digital Humanities und Philosophiegeschichte bzw. Philosophiegeschichtsschreibung des 20. Jahrhunderts.

HERMES – Humanities Education in Research, Methods, and Data wird gefördert vom Bundesministerium für Forschung, Technologie und Raumfahrt aus Mitteln der Europäischen Union.

*Nachweis Beitragsbild auf der Startseite:HERMES, bearbeitet von Friedrich Quaasdorf

Schreibe einen Kommentar

Kommentare werden erst veröffentlicht, nachdem sie von uns geprüft wurden.
Deine E-Mail-Adresse wird nicht veröffentlicht.

Über uns

Die Deutsche Nationalbibliothek ist die zentrale Archivbibliothek Deutschlands.

Wir sammeln, dokumentieren und archivieren alle Medienwerke, die seit 1913 in und über Deutschland oder in deutscher Sprache veröffentlicht werden.

Ob Bücher, Zeitschriften, CDs, Schallplatten, Karten oder Online-Publikationen – wir sammeln ohne Wertung, im Original und lückenlos.

Mehr auf dnb.de

Schlagwörter

Blog-Newsletter

In regelmäßigen Abständen erhalten Sie von uns ausgewählte Beiträge per E-Mail.

Mit dem Bestellen unseres Blog-Newsletters erkennen Sie unsere Datenschutzerklärung an.

  • ISSN 2751-3238