„Mapping German fiction in translation“
Ein Projekt zur Visualisierung von Übersetzungen deutschsprachiger Literatur anhand der Metadaten der Deutschen Nationalbibliothek
Als Teil einer Doktorarbeit hat Lisa Teichmann an der McGill Universität einen umfangreichen Datensatz für Übersetzungen deutscher Belletristik in Zusammenarbeit mit Anke Meyer-Heß und Stephanie Palek der Abteilung Digitale Dienste der Deutschen Nationalbibliothek (DNB) auf Grundlage der Metadaten der DNB zusammengestellt und visualisiert. Die DNB ist mit 259.869 katalogisierten Übersetzungen deutscher Literatur eine der umfangreichsten und zudem frei zugängliche Datenquellen für Übersetzungen im deutschsprachigen Raum. Bibliographische Metadaten der Übersetzungen in einem Bibliothekskatalog zu recherchieren, um sie dann zu extrahieren bringt Schwierigkeiten mit sich, da diese oft nicht klar als solche identifizierbar sind. Die Metadaten der Übersetzungen, welche die DNB verzeichnet und die bspw. über den Datenshop bezogen werden können, können jedoch anhand einer Suchanfrage nach der Originalsprache extrahiert werden. Für die Zusammenstellung des Datensatzes wurden alle Werke in der DNB, die einen Vermerk enthalten, dass sie ursprünglich auf Deutsch erschienen sind, mit der Suchanfrage „spo=ger“ („spo“ steht hier für Originalsprache) erstmals identifiziert, dann über den Datenshop bezogen und schließlich als CSV Tabellen extrahiert.
Datensatz
Bisher umfasst der Datensatz, der im April 2021 über den Datenshop der deutschen Nationalbibliothek extrahiert wurde, 35.972 Titel deutscher Belletristik von 6.457 Autor*innen in bis zu 86 Sprachen und deckt einen Zeitraum von 41 Publikationsjahren (1980-2020) ab. Der gesamte Datensatz soll noch bis Ende 2023 zusammen mit einer Dokumentation der Datenqualität unter einer Open Access Lizenz publiziert werden. Darin enthaltene Daten, die für die Analyse wichtig waren, sind u.a. Autor*innennamen, Sprache, Publikationsort und Originaltitel.
Visualisierung in RStudio
Zur Visualisierung und Analyse der Daten als Netzwerk, als geographische Karte und als linguistische Verteilung, wurden mehrere Skripte in der Programmiersprache R entwickelt. Diese können Einsicht darüber geben, welche die meistübersetzten deutschsprachigen Autor*innen sind, welche Sprachen am meisten vertreten sind oder welche Publikationsorte am häufigsten auf der geographischen Karte aufscheinen. Die Skripte befinden sich in einem Github Repository unter einer CC BY 4.0 Lizenz, welches laufend erweitert und überarbeitet wird: https://github.com/lisateichmann/Mapping-German-Fiction-in-Translation
Webapplikation
Zusätzlich wurde eine Shiny Applikation entwickelt, für die das R Skript und ein exemplarischer Datensatz frei zur Verfügung stehen. Es visualisiert die Übersetzungsdaten für sechs Autorinnen (Herta Müller, Ilse Aichinger, Ingeborg Bachmann, Emine Sevgi Özdamar, Verena Stefan, Yōko Tawada) im geographischen Raum und gibt einen statistischen Überblick über den Datensatz.
Webapplikation: https://lt-ladirec.shinyapps.io/GeomappingTranslationsPrototype/
Projektziel
Ziel des Projekts ist es, die im untersuchten Zeitraum in den Daten der DNB enthaltenen Übersetzungen einerseits sichtbar zu machen und andererseits diese den Forscher*innen in den digitalen Geisteswissenschaften zugänglich zu machen. Auf der Basis dieses reproduzierbaren Workflows könnten umfangreichere und vergleichende Studien durchgeführt werden, die auch auf verschiedene Zielsprachen, geographische Regionen oder Nationalbibliotheken angewendet werden können.
Mehr über das Projekt können Sie in der Dissertation lessen: Teichmann, Lisa. „Mapping German fiction in translation in the German National Library catalogue (1980-2020)“, 2023.