XSample

Text und Data Mining auf geschützten Werken durch Auszüge transparent erschließen.

XSample

Projektziele

Das Projekt XSample soll die technischen Voraussetzungen für transparente Forschung mit Text- und Data-Mining-Techniken verbessern. Die auf geschützten Werken erzielten Forschungsergebnisse sollen, im rechtlich erlaubten Rahmen, Dritten zugänglich gemacht werden. Dazu wird im Projekt ein Konzept entwickelt, wie der Zugriff auf Auszüge aus urheberrechtlich geschützten Werken und darauf erzielten Analyseergebnissen technisch und juristisch realisiert werden kann. Ein solches Konzept kann einen zentralen Hinderungsgrund für öffentlich geförderte Text- und Data-Mining-Forschung auf urheberrechtlich geschütztem Material beseitigen und damit eine empfindliche Einschränkung des Potenzials der Digital Humanities überwinden.

Use Cases

Unzuverlässiges Erzählen

Bei diesem Use Case handelt es sich um eine kollaborative Forschungsarbeit aus dem Bereich der Digital Humanities (DH) zum Thema „Unzuverlässiges Erzählen“. Im Mittelpunkt des Use Cases steht ein Textkorpus, das ein breites Spektrum unterschiedlicher literarischer Werke umfasst. Von besonderem Interesse für XSample sind die in verschiedenen Publikationsformaten vorliegenden Werke, die sowohl urheberrechtlich geschützt als auch gemeinfrei zugänglich sind. Neben der eigentlichen Forschungsfrage des Use Cases und technischen, für das Projekt relevanten, Fragestellungen sollen hierbei insbesondere weitere Antworten oder prototypische Lösungen für Service-Fragen gefunden werden. Dies betrifft beispielsweise die Fragen, ob und in welcher Form die Universitätsbibliothek mit ihrem bestehenden Serviceangebot vergleichbare Projekte unterstützen kann bzw. welche neuartigen Serviceleistungen nötig oder denkbar wären.

Wissenschaftssprache in den Geisteswissenschaften

Der zweite Use Case widmet sich der Wissenschaftssprache in den Geisteswissenschaften am Beispiel der Fächer Literaturwissenschaft, Linguistik und Philosophie. Er baut auf den Resultaten von Andresen 2020 (im Erscheinen) auf, die gezeigt hat, dass zahlreiche Unterschiede zwischen den Wissenschaftssprachen von Literaturwissenschaft und Linguistik existieren: In linguistischen Texten werden (unter anderem) mehr Textkommentare (in der vorliegenden Arbeit …) verwendet und Argumentationsschritte expliziter versprachlicht (zu dem Schluss kommen, dass …). Zusätzlich erweitert der Use Case den Fokus auf die Philosophie als zusätzliches Fach und bietet so die Möglichkeit, zunehmend generalisierende Aussagen über „die Geisteswissenschaften“ zu treffen. Als Datengrundlage dient eine Auswahl von wissenschaftlichen Zeitschriftenartikeln.

Urheberrechtliche Fragestellung

Am 15. Januar 2020 wurde ein Diskussionsentwurf zur Anpassung des Urheberrechts an die Erfordernisse des digitalen Binnenmarkts durch das Bundesministerium für Justiz und Verbraucherschutz veröffentlicht, der das TDM neu regelt. Aus Projektsicht wurde eine inoffizielle Stellungnahme mit Änderungsvorschlag abgegeben.

Insbesondere wurde vorgeschlagen, die Möglichkeit der Archivierung in Institutionen nach §§ 60e, f UrhG aufrechtzuerhalten. Grundsätzlich stellt es zwar eine enorme Erleichterung für die Forschungseinrichtungen dar, die Korpora auch selbst speichern zu können. Allerdings ist für ein effizientes Forschungsdatenmanagement eine verlässliche Überprüfbarkeit und Nachnutzbarkeit essenziell, sodass Forschungsdaten von einer zentralen Stelle, wie einer Bibliothek, gesichert werden sollten.

Aufgrund der aktuell unsicheren Rechtslage muss noch der weitere Verlauf abgewartet werden. Es besteht ein fachlicher Austausch mit dem Wissenschaftsministerium Baden-Württemberg.

 

Publikationen

    Finanziert durch

    Laufzeit

    09/2019 - 08/2021 (verlängert bis 31.03.2022)

    Projektpartner

    Ansprechpartner

     

    Universitätsbibliothek

    Dr. Helge Steenweg, Sibylle Hermann

     

    Institut für Maschinelle Sprachverarbeitung

    Prof. Dr. Jonas Kuhn, Markus Gärtner

     

    Karlsruher Institut für Technologie (KIT), Institut für Informations- und Wirtschaftsrecht, Zentrum für angewandte Rechtswissenschaft

    Prof. Dr. Thomas Dreier, Felicitas Kleinkopf

    Zum Seitenanfang