Literarische Übersetzungen in der DNB
Im Rahmen des HERMES-Forschungsstudienprogramms unterstützt die DNB Forschungsprojekte auf Basis ihrer Daten und Bestände, die mit Methoden des Text- und Data-Minings bearbeitet werden. Die Stipendien richten sich dabei vor allem an junge technikaffine Forschende aller Fachgebiete, die sich bereits mit Methoden und Instrumenten der Digital Humanities beschäftigt und praktische Erfahrungen auf dem Gebiet gesammelt haben. Im folgenden Blogbeitrag stellt Marie-Christine Boucher ihre Studie vor:
Im Rahmen eines HERMES-Projekts hat Marie-Christine Boucher von der Universität Bielefeld Daten zu deutschen Übersetzungen fremdsprachiger Werke im Katalog der DNB erhoben. Traditionell wird der Übersetzung als literarischer Praxis und Produktion weniger Aufmerksamkeit geschenkt als originalsprachlichen Texten, was zu einer relativen Unsichtbarkeit des Phänomens führt. Auch in den Katalogdaten und bibliographischen Metadaten wird Übersetzung als Phänomen ausgeblendet, da Übersetzer*innen wie Autor*innen als sonstige Mitwirkende aufgenommen werden – wenn überhaupt. Dennoch ist eine Nationalbibliothek wie die DNB mit ihrem Sammlungsauftrag der ideale Ort, um Big-Data-Analysen zu diesem Phänomen durchzuführen.
Da Übersetzungen nicht ohne weiteres extrahiert werden können, musste dieses Phänomen über eine Annäherung operationalisiert werden. Zwar gibt es die Felder „Originalsprache“ und „Personenname (Nebeneintragung),“ die auf Übersetzungen hinweisen, doch werden diese Daten nicht systematisch erhoben. Eine Änderung der Erfassungsrichtlinien hat jedoch bereits zu Veränderungen geführt (Figur 1). Als Annäherung wurden die Sachgruppen herangezogen, die die Titel einer fremdsprachigen Literatur zuordnen (Sachgruppen 810 bis 891.8, ohne 830), auch wenn die Texte in deutscher Sprache sind. Um nur (fiktionale) literarische Texte zu extrahieren, wurde die Suche auf die Sachgruppe B beschränkt.
Datensatz
Der Datensatz wurde mit Hilfe der vom DNBLab zur Verfügung gestellten Jupyter Notebooks erstellt, die eine Abfrage der SRU-Schnittstelle ermöglichen. Um die Suche zu erleichtern, wurden die Daten für jedes Jahr des Untersuchungszeitraums von 1990 bis 2010 separat heruntergeladen. Vor der Datenbereinigung umfasste der Datensatz für den gesamten Zeitraum 97 420 Titel. Nach der Bereinigung der Publikationsdaten verblieben 96 667 Titel (z.B. wurden Reihen und Zeitschriften mit Publikationsdaten über mehrere Jahre entfernt). Da die Informationen zu den Übersetzungen häufig im Feld „Verfasserangabe“ und nicht im Feld „Originalsprache“ enthalten waren, wurden die Informationen aus dem Feld „Verfasserangabe“ mittels RegEx extrahiert.
Der Datensatz enthält Übersetzungen aus 95 Sprachen. Die größte Gruppe bilden jedoch Übersetzungen, deren Originalsprache unbekannt ist. Die überwiegende Mehrheit der Übersetzungen stammt aus dem Englischen (52 635 Titel, einschließlich Sprachvarianten wie „aus dem amerikanischen/kanadischen/australischen Englisch“), gefolgt von der Gruppe mit unbekannter Originalsprache (19 808 Titel). Die drittwichtigste Originalsprache für Übersetzungen ist Französisch mit 5 552 Titeln. Danach folgen hauptsächlich Sprachen von Nachbarländern:

Von den 96 667 Titeln haben 14.625 als Nebeneintragung einen Namen, dem die Funktion „Übersetzer“ zugeordnet wurde. Aus den 14 625 Titeln ergeben sich 3618 unterschiedliche Übersetzer*innen. 1.797 Personen haben nur einen Titel übersetzt, 1.821 mehr als eine Übersetzung und 811 fünf oder mehr.

Projektziel
Ziel des Projekts ist es, die (Un)Sichtbarkeit von Übersetzung, die in der qualitativen Forschung schon lange ein Thema ist, auch quantitativ zu erforschen. Auf dieser Grundlage kann im Sinne einer big translation history die Geschichte der Übersetzung in Deutschland erforscht werden. Dabei kann u.a. der Einfluss soziokultureller oder politischer Ereignisse auf die Übersetzungslandschaft untersucht werden.
Marie-Christine Boucher
Marie-Christine Boucher ist an der Universität Bielefeld tätig und arbeitet zu Data Literacy, Übersetzungstheorie und literarischer Mehrsprachigkeit.
