Durchbruch für die Wissenschaft: der Referentenentwurf zur Reform des Urheberrechts

Sprachwissenschaftliche und sprachtechnologische Forschung ist heute ohne die Nutzung großer digitaler Textsammlungen nicht mehr denkbar. Leider behindert das deutsche Urheberrecht die Wissenschaftler bislang massiv, solche Textkorpora auch tatsächlich zu erstellen. In dem seit wenigen Tagen vorliegenden Gesetzentwurf zur Novellierung des Urheberrechts werden nun erstmals die Interessen der Wissenschaft berücksichtigt. Können die Probleme damit gelöst werden?

Vor einigen Tagen haben etliche SciLogs-Autorinnen und Autoren von meinem Mitarbeiter Holger Grumt Suárez Post erhalten. Es ging in dem Schreiben darum, eine Einwilligung dafür zu bekommen, dass wir Blog-Beiträge für Forschungszwecke speichern und anderen Wissenschaftlern in aufbereiteter Form nach Anmeldung verfügbar machen dürfen. Der Hintergrund dieser Aktion besteht darin, dass wir uns für die linguistischen Eigenschaften der Beiträge selbst und der schriftlichen “Gespräche”, der sogenannten Diskurse, interessieren, die ausgehend von dem Blog-Beitrag im Kommentarbereich geführt werden. Was wir ohne zu fragen tun dürfen, ist lediglich, die Blog-Beiträge, die ja über das SciLogs-Portal frei zugänglich sind, auf unserem Server lokal zu speichern, solange wir diese für unsere Forschungen benötigen (§ 52a UrhG). Nach dem derzeit gültigen Urheberrechts dürfen wir unser Korpus allerdings nicht über das Projektende hinaus speichern – etwa für Folgeprojekte – oder die von uns aufbereiteten Korpusdaten über ein linguistisches Repositorium wie beispielsweise CLARIN-D der Forschung zugänglich machen. Genau das wollen wir aber tun, und deshalb haben wir jeden einzelnen SciLogger, der in unserem Referenzjahr 2015 etwas auf den SciLogs geschrieben hat (insgesamt an die 80 Personen), kontaktiert und um Erlaubnis dafür gebeten. Erfreulich viele haben uns, mit tatkräftiger Unterstützung durch den SciLogs-Redakteur Lars Fischer, die Einwilligung dafür schon erteilt.

Keine freie Nutzung freier Inhalte

Einige der Angeschriebenen haben bei uns nachgefragt, warum man denn eine Erlaubnis dafür geben müsse, dass wir die Texte nutzen dürfen, wenn diese doch frei im Netz zugänglich sind. Die Erklärung dafür ist, dass die freie Zugänglichkeit das Urheberrecht der Autoren überhaupt nicht tangiert. Auch ein Musikstück im Radio darf man nicht einfach aufzeichnen und dann über eigene Kanäle verbreiten. Und das Urheberrecht verliert ein Autor auch dann nicht, wenn die Beiträge über das SciLogs-Portal oder sogar einen Verlag verbreitet werden, der Honorare an die Autoren zahlt und sich damit das Recht erwirbt, Kopien der Texte zu verkaufen. Der Verlag erwirbt die Nutzungsrechte an den Texten, nicht aber das Urheberrecht selbst, dieses verbleibt beim Autor. Für die im Urheberrecht vorgesehenen Beschränkungen der Ausübung dieses Rechts, die sogenannten Schranken, muss eine Vergütung gezahlt werden. Wenn die Bücher eines Autors oder einer Autorin etwa in Bibliotheken zur Ausleihe angeboten werden und Leser mithilfe von Kopierern für den Eigenbedarf Kopien davon herstellen, müssen die Bibliotheksbetreiber und die Kopiergerätehersteller Gebühren entrichten, die den Autoren als Urhebern dann anteilig auszuzahlen sind. Dafür gibt es die VG Wort.

Für Sprachwissenschaftler ist das alles mehr als kompliziert. Entweder stellen wir ein schönes Korpus zusammen und müssen es nach Gebrauch wieder löschen, wenn wir uns nicht um Einwilligungen zu einer längerfristigen Nutzung gekümmert haben. Oder wir schreiben die Urheber an und bitten darum, deren Texte nutzen zu dürfen. Dann fallen oftmals die interessantesten Texte wieder aus dem Korpus heraus, weil gerade kommerzielle Anbieter wie etwa Zeitungsverlage die Einwilligung für die wissenschaftliche Nutzung oft verweigern. Darüber hinaus ist selbst mit diesem Vorgehen sehr vieles weiterhin ungeklärt. In unserem eigenen Fall möchten wir zum Beispiel auch die Kommentare zu den Blog-Beiträgen erfassen, natürlich in anonymisierter Form. Ob wir damit gegen das Urheberrecht verstoßen oder nicht, konnte uns bislang niemand sagen. Bei “normalen” Kommentaren ist das wohl nicht der Fall, weil das Urheberrecht eine gewisse “Schöpfungshöhe” für ein Werk fordert. Diese liegt bei einem Beitrag vor, bei einem Kommentar jedoch nicht. Manche Kommentare lesen sich allerdings wie eigenständige Beiträge und sind dann auch schon mal fast so lang. Liegt hier womöglich doch die fragliche Schöpfungshöhe vor? Wie aber holen wir die Einwilligung zur Speicherung des Kommentars ein, wenn dieser unter Pseudonym mit einer falschen Email-Adresse eingestellt worden ist? Wenn wir auf die Erfassung eines solchen Kommentars verzichten würden, dann würden wir vorauseilend zugleich auch unsere grundgesetzlich garantierte Wissenschaftsfreiheit nicht in Anspruch nehmen, wie mir ein juristischer Kollege meiner Uni kürzlich erläuterte. Aber wahren wir andernfalls auch die Persönlichkeitsrechte – ebenfalls ein Grundrecht unserer Verfassung – des Kommentarautors?

Der Referentenentwurf zur Reform des Urheberrechts

All diese Probleme könnten jetzt auf einen Schlag gelöst werden. Vor wenigen Tagen hat das Bundesministerium der Justiz und für Verbraucherschutz den ersten Referentenentwurf eines Änderungsgesetzes für ein reformiertes, modernisiertes Urheberrecht veröffentlicht. Der Entwurf enthält eine kleine Sensation: Mit dem vorher nicht existierenden Paragrafen 60d (Entwurf Seite 10) sollen erstmals die Ansprüche von “Text und Data Mining” geregelt werden. “Um eine Vielzahl von Werken (Ursprungsmaterial) für die wissenschaftliche Forschung automatisiert auszuwerten”, heißt es darin im ersten Absatz, “ist es zulässig, 1. das Ursprungsmaterial auch automatisiert und systematisch zu vervielfältigen, um daraus insbesondere durch Normalisierung, Strukturierung und Kategorisierung ein auszuwertendes Korpus zu erstellen, und 2. das Korpus einem bestimmt abgegrenzten Kreis von Personen für die gemeinsame wissenschaftliche Forschung sowie einzelnen Dritten zur Überprüfung der Qualität wissenschaftlicher Forschung öffentlich zugänglich zu machen.” Der Nutzer dürfe dabei aber nur nicht-kommerzielle Zwecke verfolgen. Damit ist eine neuartige “Text und Data Mining”-Schranke im Urheberrecht vorgesehen. In den Erläuterungen zum Gesetz ist denn auch davon die Rede, dass “[d]ie Reform […] erstmals das Text und Data Mining [regelt], bei dem eine Vielzahl von Texten, Daten, Bildern und sonstigen Materialien ausgewertet werden, um so neue Erkenntnisse zu gewinnen. Die Vorschrift erlaubt insbesondere die mit dieser Methode einhergehenden Vervielfältigungen, sofern diese in urheberrechtlich relevanter Weise das Vervielfältigungsrecht berühren, sowie die Aufbewahrung der ausgewerteten Materialien, insbesondere zur nachträglichen Überprüfung der Einhaltung wissenschaftlicher Standards.”

In die Regelung sind, wie mir scheint, tiefergehende Kenntnisse der Materie eingeflossen. So wird zwar in Absatz 3 von Paragraf 60d gesagt, dass “[d]as Korpus und die Vervielfältigungen des Ursprungsmaterials […] nach Abschluss der Forschungsarbeiten zu löschen” sind und “die öffentliche Zugänglichmachung […] zu beenden” ist. “Zulässig ist es jedoch, das Korpus und Vervielfältigungen des Ursprungsmaterials den in den §§ 60e und 60f genannten Institutionen zur dauerhaften Aufbewahrung zu übermitteln.” Bei diesen Institutionen handelt es sich um Bibliotheken, Archive, Museen und Bildungseinrichtungen. “Die Regelung hat keinen Vorläufer im bisherigen deutschen Recht”, heißt es denn auch selbstbewusst im Begründungsteil des Entwurfs (Seiten 40 bis 42), worauf eine knappe, aber schlüssige Darstellung der Vorgehensweise bei der Kompilierung wissenschaftlicher Textkorpora folgt. Fast schon ein Schreck bekommen habe ich bei der Feststellung, dass “die Inhalte z. B. normalisiert, strukturiert und kategorisiert und in andere technische Formate überführt (etwa durch die Umwandlung von pdf-Dokumenten in XML-Datensätze) [werden]. Hierdurch entsteht das sogenannte Korpus, also die Sammlung der Inhalte, die anschließend ausgewertet wird.” In einer Gesetzesbegründung etwas über meinen langjährigen Forschungsgegenstand, die Extensible Markup Language (XML), lesen zu können, hatte ich nicht für möglich gehalten. “Anschließend”, heißt es weiter im Begründungstext, “kommt die eigentliche Software für das sogenannte Text und Data Mining zum Einsatz; oftmals handelt es sich hierbei um speziell für das jeweilige Vorhaben programmierte Skripts. Die Software ermittelt z. B. statistische Häufigkeiten oder Korrelationen in den Inhalten, die im Korpus aufbereitet sind. Diese Ergebnisse stehen dann für die wissenschaftliche Analyse und Bewertung zur Verfügung.” Wie genau diese Regelung die Realität der korpusbasierten Forschung zu erfassen sucht, wird auch durch die Differenzierung zwischen Ursprungsmaterial (etwa den von uns heruntergeladenen Web-Seiten der SciLogs-Blogs) und den Korpusdaten (bei uns XML-Daten im TEI-Format) zum Ausdruck gebracht (S. 41): “Der Forscher darf solchen Personen das Korpus öffentlich zugänglich machen, nicht hingegen das Ursprungsmaterial.” Man muss dem Leiter des Referats III B 3 des Bundesministeriums für Justiz und Verbraucherschutz, Matthias Schmid, und seinem Team loben dafür, dass sie sich so konsequent für die Belange der Wissenschaft eingesetzt haben in dieser Regelung.

Ende gut, alles gut?

Wird nun also alles gut? Mit dem Referentenentwurf des Gesetzes zur Urheberrechtsreform, im Original “Gesetz zur Angleichung des Urheberrecht an die aktuellen Erfordernisse der Wissensgesellschaft”, geht die Auseinandersetzung der betroffenen Organisationen und Lobby-Verbände erst richtig los. Einen ersten Eindruck kann man sich davon bei der Initiative “Publikationsfreiheit für eine starke Bildungsrepublik” verschaffen. Darin wird der Gesetzentwurf, zusammen mit einigen völlig anderen Regelungen und Vorhaben, in Bausch und Bogen verdammt, indem die Freiheit des Publizierens als bedroht erklärt wird. Die Rechte der Autoren wie auch Freiheit und Bildung unserer Gesellschaft überhaupt werden darin unhinterfragt zu Komplizen der Verlagsinteressen erklärt. Man soll sich durch Name, Position und Institution zur Publikationsfreiheit bekennen, und leider haben dies bis zum heutigen Tag neben zahlreichen Personen aus dem Verlagsbereich auch viele Wissenschaftlerinnen und Wissenschaftler getan – vermutlich ohne nähere Kenntnis der Hintergründe. Die Kritik ist so allgemein in diesem Aufruf, dass zu befürchten steht, dass auch die Regelung in Paragraf 60d der Lobbyarbeit zum Opfer fallen könnte: Natürlich unterstützt auch der Börsenverein des Deutschen Buchhandels diese vom Inhaber des Stuttgarter Ulmer-Verlags initiierte Aktion nach Kräften. Ich hoffe, dass die Wissenschaftsverbände, die wissenschaftlichen Institutionen und die Wissenschaftlerinnen und Wissenschaftler selbst erfolgreich damit sein werden, die wissenschaftsfreundlichen Regelungen der Urheberrechtsreform über das Gesetzgebungsverfahren hinweg zu retten.

[Korrektur am 13.2.: Das Referat III B 3 ist im BMJV zuständig, nicht III B 4.]

_{Beitragsbild: CC0 Public Domain, Bearbeitung: Ausschnitt}

Veröffentlicht von Henning Lobin

www.lobin.de

Henning Lobin ist seit 2018 Direktor des Leibniz-Instituts für Deutsche Sprache in Mannheim (Mitglied der gemeinsam vom Bund und allen 16 Bundesländern finanzierten Leibniz-Gemeinschaft) und Professor für Germanistische Linguistik an der dortigen Universität. Zuvor war er ab 1999 Professor für Angewandte Sprachwissenschaft und Computerlinguistik an der Justus-Liebig-Universität Gießen. Seine Forschungsschwerpunkte bilden die Auswirkungen der Digitalisierung auf die Sprache, Texttechnologie, Grammatik, Wissenschaftskommunikation und Politolinguistik. Er ist Sprecher der Sektion "Geisteswissenschaften und Bildungsforschung" und Präsidiumsmitglied der Leibniz-Gemeinschaft, Mitglied germanistischer Fachbeiräte ua. von DAAD und Goethe-Institut, er war Mitglied des Forschungsbeirats der Stiftung Wissenschaft und Politik und des Fachkollegiums Sprachwissenschaft der DFG. Lobin ist Autor von neun Monografien und hat zahlreiche Sammelbände herausgegeben. Zuletzt erschienen sind Engelbarts Traum (Campus, 2014, polnische Übersetzung 2017, chinesische Übersetzung 2018), Digital und vernetzt. Das neue Bild der Sprache (Metzler, 2018) und Sprachkampf (Duden, 2021). Bei den SciLogs ist Henning Lobin seit 2014 Autor des Blogs "Die Engelbart-Galaxis", nachdem er dort bereits ab 2008 am Gruppenblog "Interactive Science" beteiligt war.

3 Kommentare

Pingback:Durchbruch für die Wissenschaft: der Refer...
Pingback:Die offene Wissenschaft und ihre Feinde » Die Engelbart-Galaxis » SciLogs - Wissenschaftsblogs
Pingback:Digitale Sprachpolitik » Die Engelbart-Galaxis » SciLogs - Wissenschaftsblogs

Durchbruch für die Wissenschaft: der Referentenentwurf zur Reform des Urheberrechts

Veröffentlicht von Henning Lobin

3 Kommentare

Schreibe einen Kommentar Antworten abbrechen