Digitale Sprachpolitik

In den letzten Junitagen wurden von staatlichen Gremien Entscheidungen getroffen, die die Sprachpolitik in eine ganz neue Richtung wenden. Der Deutsche Bundestag und der Rat für deutsche Rechtschreibung haben zum ersten Mal Regelungen verabschiedet, die in Rechnung stellen, dass die Nutzung der Sprache in unserer Zeit auch durch Computer beeinflusst wird. Dies ist erst der Anfang einer digitalen Sprachpolitik. 

Das Aufsehen, das die Abstimmung zur „Ehe für alle“ im Bundestag erregte, hat zwei andere Entscheidungen etwas in den Hintergrund treten lassen. Das „Netzwerkdurchsetzungsgesetz” verpflichtet die Anbieter sozialer Netze ab einer gewissen Größe dazu, gegen Hassrede, Beleidigungen und andere strafrechtlich relevante Formulierung in den Postings vorzugehen und den Behörden über die Verfahrensweisen dabei zu berichten. Im Vorfeld ist der Gesetzentwurf von verschiedenen Seiten heftig kritisiert worden, weil befürchtet wird, dass eine über das Ziel hinausschießende Selbstzensur der Netzwerkbetreiber die Folge sein könnte – und damit einer Beeinträchtigung der Meinungsfreiheit. Weil hohe Bußgelder drohen, werden betroffene Firmen wie Facebook, Google und Twitter zur Durchsetzung dieses Gesetzes auf maschinelle Verfahren setzen, mit denen problematische Beiträge ausfindig gemacht werden können. Dies dürfte auch den Mitgliedern des Bundestages klar gewesen sein. Und genau hier kommt die Sprachpolitik ins Spiel: Das Gesetz vertraut darauf, dass es schon irgendwelche computerlinguistische Verfahren geben wird, mit denen Milliarden von Beiträgen in sozialen Netzen auf verbotene Formulierungen hin durchforstet werden können.

Eine „Korpusschranke“ für die Wissenschaft

Nur 50 Minuten später wurde in der gleichen Sitzung des Bundestages die Reform des Urheberrechts beschlossen. Auch diese war im Vorfeld höchst umstritten, nachdem vor allem die FAZ und der Börsenverein des deutschen Buchhandels gegen den zunächst vorgelegten Entwurf Stimmung gemacht hatten (ich habe hier bereits darüber berichtet). Und so hatte es in letzter Minute auch tatsächlich Änderungen des Gesetzes gegeben, durch die beispielsweise vollständige Zeitungsartikel aus der Nutzung in Semesterapparaten an Unis ausgenommen werden – langfristig vermutlich ein mit Schmackes geschossenes Eigentor.

Ein anderer Teil des Gesetzes ist aber vom Referentenentwurf über den Kabinettsbeschluss bis hin zu den Entscheidungen in Bundesrat und Bundestag unverändert geblieben: die Regelungen zum „Text und Data Mining“. Paragraf 60d des novellierten Urheberrechtgesetzes erlaubt unter dieser Überschrift künftig (die Novelle soll am 1.3.2018 in Kraft treten) den Aufbau von Korpora, also großen Sammlungen urheberrechtlich geschützter Werke für wissenschaftliche Zwecke, und zwar ohne dass die Urheber dieser Nutzung zuvor zustimmen müssen. Diese ganz neue Regelung bildet nun faktisch eine eigene „Korpusschranke“ im Urheberrecht, die ähnlich wie die Nutzung von Werken in Semesterapparaten pauschal zu vergüten ist. Dass die Linguistik und viele andere Disziplinen davon sehr profitieren werden, habe ich schon in einem früheren Scilogs-Beitrag dargelegt. Auch hier hat sich der Gesetzgeber nun auf den Standpunkt gestellt, dass es bei der Auswertung sprachlicher Daten nicht mehr nur auf die menschliche Lesefähigkeit ankommen kann, sondern auch auf die des Computers.

Rechtschreibung für die Sprachverarbeitung

Die dritte Entscheidung, um die es hier geht, wurde nicht in der Bundeshauptstadt getroffen, sondern in der „Hauptstadt der deutschen Sprache“, in Mannheim. Dort hat der Rat für deutsche Rechtschreibung, der mit seinen Vertreterinnen und Vertretern aus den sieben deutschsprachigen Ländern für die amtliche Regelung der Rechtschreibung zuständig ist, seine neuesten Beschlüsse veröffentlicht. Einer der Beschlüsse erlaubt es nun, den Buchstaben Eszett („ß“) nun auch in seiner großen Schreibung („ẞ“) zu verwenden. Technisch ist das kein Problem, da das große Eszett bereits seit 2008 an der Position U+1E9E in Unicode enthalten ist (in dieser Chart in der Mitte der vorletzten Zeile als „Latin Capital Letter Sharp S“) und von Textverarbeitungsprogrammen längst unterstützt wird – wie man hier sieht, auch vom Scilogs-Content-Management-System.

Der Rechtschreibrat hebt in seiner ausführlichen Begründung (S. 7f) nicht auf das Problem der Maschinenlesbarkeit ab, obwohl die durchgängige Großschreibung durch die maschinelle Verarbeitung amtlicher Dokumente veranlasst ist: Die Verwendung von Großbuchstaben verbessert die Erkennungsrate von Schriftzeichen deutlich. In den Feuilletons, wie so häufig angeführt von der FAZ in einem diesmal ganz besonders engstirnigen Beitrag, waren erwartungsgemäß höhnische Kommentare zu der angeblichen Unsinnigkeit dieses Beschlusses zu lesen. Sucht man aber im Internet nach konkreten Problemen, die sich durch das Eszett ergeben, findet man unzählige Beispiele, die auf die Verwendung dieses nur im Deutschen vorkommenden Zeichens bei Personennamen in internationalen Zusammenhängen zurückzuführen sind. In diesem Vielflieger-Forum etwa empfehlen sich Betroffene untereinander den Namenwechsel als einzig sicheren Ausweg aus den Schwierigkeiten bei Passkontrolle und Flugabwicklung, die sie ständig erleben.

Technische Probleme treten an verschiedenen Stellen auf: Eine „unsensible“ Schrifterkennung macht aus einem Eszett ein großes B, und die Ersetzung des Eszett durch Doppel-S in einem Buchungsdokument erhöht bei einem Beamten am Flughafen in Changchun oder Dschidda auch nicht gerade das Vertrauen in den Reisenden. Hinzu kommt, dass es sich bei „GROß“ oder „GROSS“ in der maschinellen Verarbeitung um zwei objektiv unterschiedliche Zeichenfolgen handelt, und Herr oder Frau Groß wird nicht bei jedem für den Sicherheitscheck eingesetzten Software-System auf übergroße Kulanz bei der Registrierung dieses Unterschiedes zählen können. Die offizielle Aufnahme des großen Eszett macht es zumindest amtlich sichtbar, dass es dieses Zeichen im Deutschen gibt und sich die Hersteller von Sprachsoftware darauf einzustellen haben, wenn sie das Deutsche in ihren Systemen berücksichtigen wollen.

Beginn einer digitalen Sprachpolitik

Die erwartete Nutzung von Sprachsoftware zur Erkennung von Hatespeech, die gesetzliche Regelung automatisierter Sprachforschung und die Berücksichtigung der maschinellen Spracherkennung und -verarbeitung in der amtlichen Rechtschreibung – all das sind die Vorboten einer Sprachpolitik, die zu berücksichtigen hat, dass auch Computer als Kommunikationsteilnehmer an der Sprachnutzung und -entwicklung einen immer größeren Anteil haben.

Ergänzung am 6.7.2017: Hier noch ein sehr guter Artikel zur Sinnhaftigkeit des großen Eszett, von einem Typografie-Experten geschrieben. Und hier gibt es diverse Anwendungsbeispiele, die seit Jahren vorliegen, in denen das große Eszett quasi illegal verwendet wurde. Schließlich hier noch ein Artikel, ebenfalls auf typografie.info erschienen, zur Geschichte des Eszett, die keineswegs so klar verlaufen ist, wie manche heute meinen („Das ist doch nur eine Ligatur“).

Beitragsbild: Reichstagsgebäude in Berlin bei Nacht, 2013. Wikipedia, CC BY-SA 3.0, Avda / www.avda-foto.de.

Veröffentlicht von

www.lobin.de

Henning Lobin ist seit 1999 Professor für Angewandte Sprachwissenschaft und Computerlinguistik an der Justus-Liebig-Universität Gießen. Von 2007 bis 2016 leitete er dort das interdisziplinäre Zentrum für Medien und Interaktivität, in dem die Auswirkungen von neuen Kommunikationsformen auf Wissenschaft, Kultur und Bildung untersucht werden. Seine Forschungsschwerpunkte bilden die Texttechnologie, die multimediale Wissenschaftskommunikation und der medienkulturelle Wandel durch die Digitalisierung. Gegenwärtig ist er u.a. Mitglied im wissenschaftlichen Beirat des Instituts für deutsche Sprache in Mannheim und des Fachkollegiums "Sprachwissenschaft" bei der Deutschen Forschungsgemeinschaft. Bei den SciLogs ist Henning Lobin Autor des Blogs "Die Engelbart-Galaxis" und Gast-Autor im Blog "Wissenschaftskommunikation hoch 3" der ACATECH, für die er auch als externer Experte für Fragen der Wissenschaftskommunikation in sozialen Medien fungiert. Lobin ist Autor von sieben Monografien und hat zahlreiche Sammelbände herausgegeben (Bücher bei Amazon, bei Buch.de und im Buchhandel). Zuletzt erschienen: Engelbarts Traum (Campus, 2014).

20 Kommentare Schreibe einen Kommentar

  1. Der FAZ-Feuilleton-Beitrag über das grosse „ß“ ist typisch für das Feuilleton, wo es oft mehr um Gefühlswallungen der Autoren, als um eine Sache geht. Und der Schluss, den der Autor – immerhin verantwortlicher Redakteur für Literatur und literarisches Leben – zieht, ist sachlich eben gerade noch einmal falsch (Zitat): die amtliche Einführung eines großen ß, Eszett oder scharfen S durch einen geeigneten Druckbuchstaben zu ergänzen, der nicht aussieht wie der kleine – das wäre eine Tat gewesen! Doch der Rat hat wieder eine Untat begangen.
    Die Einführung einer neuen Buchstabenform für das grosse ß , die selbst deutsche Bundesbürger (wo man diesen Buchstaben ja vor allem braucht) nicht auf den ersten Anhieb erkannt hätten, das wäre eventuell eine grosse (Zitat)„Tat gewesen“, allerdings eine Tat, die nur gerade für Buchstabenreiter wie Feuiletonschreiber, gross gewesen wäre, nicht aber für Normalbürger, die im Alltag – beispielsweise bei der Grenzüberquerung -, damit ihre Probleme haben.

    Offensichtlich gibt es ganz unterschiedliche Lebenswelten und die Lebenswelt des literarischen Lebens (für den der FAZ-Autor zuständig ist) hat mit dem Alltag der meisten anderen wenig zu tun.
    Nun, einige werden es vielleicht schön finden, dass literarisches Leben ganz andere Probleme hat und andere Höhepunkte sieht und anstrebt, als nichtliterarisches Leben.

  2. Bei dem »diesmal ganz besonders engstirnigen Beitrag« im Feuilleton der FAZ handelt es sich um eine Glosse. Was man im Zweifelsfall daran erkennen kann, dass der Beitrag unter der Rubrik „Glosse“ veröffentlicht ist.

    Jetzt müsste man natürlich noch wissen, was eine Glosse ist.

    Wer das nicht weiss, sollte sich vielleicht erst einmal diesbezüglich kundig machen, bevor er sich völlig unangemessen darüber echauffiert.

      • @Henning Lobin / 3. Juli 2017 @ 12:20

        Wenn Sie kein überzeugenderes Beispiel für einen „ganz besonders engstirnigen Beitrag“ vorweisen können als — ausgerechnet — eine Glosse, dann ist die ganze Angelegenheit womöglich doch deutlich weniger dramatisch. als es Ihre markige Wortwahl suggeriert. Etwas mehr Gelassenheit scheint mir hier angebracht.

        Im übrigen wäre eine Bestimmung für die zulässige Schreibweise von Namen in amtlichen Dokumenten letztlich als ein Verwaltungsakt zu sehen, und nicht als eine Frage von Orthographie.

        Und eine OCR Software, die ein `ß‘ als ein `B‘ liest, wird garantiert die gleiche Schwierigkeit mit einem `ẞ‘ haben. Die Fehler bei der digitalen Erfassung von Texten werden durch das famose neue Zeichen gewiss nicht weniger, eher wäre schon das genaue Gegenteil zu erwarten.

        • „Im übrigen wäre eine Bestimmung für die zulässige Schreibweise von Namen in amtlichen Dokumenten letztlich als ein Verwaltungsakt zu sehen, und nicht als eine Frage von Orthographie.“
          Die Festlegung von Verwaltungsvorschriften ist genau die Aufgabe des Rechtsschreibrats. Da aber die Passämter und Konsularabteilungen sämtlicher deutschsprachiger Länder nicht in diesem vertreten sind, wird es mit der Durchsetzung in Ausweisdokumenten schwierig.

          „Und eine OCR Software, die ein `ß‘ als ein `B‘ liest, wird garantiert die gleiche Schwierigkeit mit einem `ẞ‘ haben. Die Fehler bei der digitalen Erfassung von Texten werden durch das famose neue Zeichen gewiss nicht weniger, eher wäre schon das genaue Gegenteil zu erwarten.“
          Das ist keineswegs sicher. Ein neuer Buchstabe kann typografisch besser auf die mögliche Verwechslung mit einem anderen abgestimmt werden. Die typografische Umsetzung, die wir bisher in einigen Computerfonts finden, ist eher als ein Platzhalter zu verstehen. In OCR-optimierten Fonts habe ich das große Eszett bislang noch nicht gesehen.

          • @Henning Lobin / 5. Juli 2017 @ 11:46

            Laut Statut des Rats für deutsche Rechtschreibung kann dieser lediglich begründete Vorschläge erarbeiten, die dann regelmässig den „zuständigen staatlichen Stellen“ in den Mitgliedsländern unterbreitet werden. Eine Verpflichtung zur Umsetzung dieser Vorschläge besteht seitens der Mitgliedsländer offensichtlich nicht, denn gerade das `ß‘, egal ob gross oder klein, interessiert in der Schweiz und Liechtenstein doch herzlich wenig.

            Alle tatsächlichen oder vermeintlichen ß-Probleme wären durch die Abschaffung des antiquierten `ß‘ wesentlich effektiver lösbar als durch die Einführung eines zusätzlichen `ẞ‘. Das wäre dann mal ein vernünftiger Vorschlag gewesen, zumal der proof of concept für die Praktikabilität doch längst erbracht ist.

  3. Henning Lobin schrieb (2. Juli 2017):
    > […] den Buchstaben Eszet („ß“) nun auch in seiner großen Schreibung („ẞ“) zu verwenden […]

    Der Buchstabe ist mir eher als „Eszett“ bekannt;
    zumal „Eszet“ eine eigenständige Bedeutung hat.

    > […] dass auch Computer als Kommunikationsteilnehmer an der Sprachnutzung und -entwicklung einen immer größeren Anteil haben.

    Sicher jedenfalls auf der Schokoladenseite der Schriftkultur. …

  4. Übrigens sind Computer keine Kommunikationsteilnehmer. Dies sind ausschließlich Menschen. Computer sind lediglich vergrößerte Füllfederhalter.
    Menschen verhalten sich indirekt proportional zu ihrem Bildungsgrad mehr oder weniger dumm.
    Das ist immer deutlicher zu erkennen.

    • Da bin ich anderer Meinung. Zwar hält es sich mit einer eigenständigen Teilhabe an der Kommunikation in den in diesem Beitrag dargestellten Fällen tatsächlich in Grenzen, aber die automatische Textgenerierung greift derzeit immer mehr um sich, etwa im Nachrichtenbereich. Auch manches andere, was wir im Netz zu lesen bekommen (etwa in sozialen Netzen), ist mittlerweile automatisch generiert. Und denken Sie nur an die ganzen Sprachassistenten auf den Smartphones und an Geräte wie Amazon Echo oder Google Home – das sind in meinen Augen veritabler Kommunikationsteilnehmer, die die Sprachnutzung definitiv beeinflussen werden. Man denke mal an ein Kleinkind, das zusammen mit einem Echo-Gerät von Amazon aufwächst…

  5. An dieses bedauernswerte Kleinkind möchte ich lieber nicht denken.
    Alle Fälle, die Sie aufführen, sind Beweis dafür, daß Menschen kommunizieren, nämlich gelangweilte Programmierer (und/oder ihre ebenfalls gelangweilten Auftraggeber), die, um ihre Lebensberechtigung unter Beweis zu stellen, immer neue Programme entwickeln, für die immer krampfhafter nichtvorhandene Anwendungsgebiete gesucht werden.
    Der Mensch kommuniziert, nicht der Computer. Diese bekommen peinlichst genau Anweisungen, wie und wann sie welche Worte zu welchem Zweck an uns richten sollen.
    Mir sträuben sich die Nackenhaare, wenn ich daran denke, wer diese Anweisungsgeber sind und wie es kam, daß wir sie uns (offenbar ganz freiwillig) ausgesucht haben.

    • Ganz so peinlichst genau, wie Sie meinen, sind Sprachanwendungen mittlerweile nicht mehr programmiert. Der große Boom bei den natürlichsprachlichen Schnittstellen, wie er in den letzten paar Jahren zu verzeichnen ist, ist auf den erfolgreichen Einsatz von Lernverfahren zurückzuführen. Diese werden zwar auf Sprachdaten trainiert, die von Menschen stammen. Was dann allerdings als ein riesiges Parameterbündel für künstliche Neuronale Netze dabei herauskommt, ist weder vorherzusagen noch von Menschen deutbar.

  6. Weil hohe Bußgelder drohen, werden betroffene Firmen wie Facebook, Google und Twitter zur Durchsetzung dieses Gesetzes auf maschinelle Verfahren setzen, mit denen problematische Beiträge ausfindig gemacht werden können. Dies dürfte auch den Mitgliedern des Bundestages klar gewesen sein. Und genau hier kommt die Sprachpolitik ins Spiel: Das Gesetz vertraut darauf, dass es schon irgendwelche computerlinguistische Verfahren geben wird, mit denen Milliarden von Beiträgen in sozialen Netzen auf verbotene Formulierungen hin durchforstet werden können.

    Eine „Korpusschranke“ für die Wissenschaft

    Nur 50 Minuten später wurde in der gleichen Sitzung des Bundestages die Reform des Urheberrechts beschlossen. Auch diese war im Vorfeld höchst umstritten, nachdem vor allem die FAZ und der Börsenverein des deutschen Buchhandels gegen den zunächst vorgelegten Entwurf Stimmung gemacht hatten (ich habe hier bereits darüber berichtet).

    Sicherlich ein Tiefpunkt demokratischen Seins, wieder einmal ein : bundesdeutscher.

    Die im dankenswerterweise bereit gestellte Verquickung von Einschränkung der freier Verlautbarung von Meinung und Reduktion von wissenschaftlichem Zitat ist bemerkenswert.

    Unnötig.


    Was voneinander unabhängig bearbeitet werden kann, ist voneinander unabhängig zu bearbeiten.

    Dr. Webbaer weist gerne darauf hin, dass vorreiterisch, doitsche Sonderwege meinend, wieder einmal die Freiheit der Meinungsäußerung angegriffen wird und zwar derart, dass privatwirtschaftliche Topoi des Webs durch Strafzahlungen bedroht werden, sogenannte Social Media, wenn sie womöglich in der BRD Strafbares zur Publikation zulassen.
    Wobei anfällige Zahlungen in Millionenhöhe bereit stehen, so dass Verantwortliche bei den o.g. Social Media diese Zahlungen bestmöglich zu vermeiden suchen werden, also so (notgedrungen, wirtschaftlich sinnhaft) zens(ur)ierend werden :
    -> https://de.wikipedia.org/wiki/Netzwerkdurchsetzungsgesetz

    Herr Dr. Henning Lobin bleibt gebeten zu erklären, warum er hier in seinem dankenswerterweise zur Verfügung gestellten Text gemischt hat.

    MFG
    Dr. Webbaer

    • *
      Die [] dankenswerterweise bereit gestellte Verquickung von Einschränkung der freie[n] Verlautbarung von Meinung und Reduktion von wissenschaftlichem Zitat ist bemerkenswert.

    • Nun, ich habe „gemischt“, weil die drei erwähnten Sachverhalte, wie ja auch explizit im Text angesprochen, alle mit maschineller Sprachverarbeitung zu tun haben. Dies ist das verbindende Element der drei, zugegeben, rechtlich sehr unterschiedlichen Regelungen, die beschlossen wurden. Sie sollten mir wohl erlauben, Sachverhalte in einem Blog-Beitrag aus einer gewissen Perspektive zu betrachten, ohne dabei zugleich alle anderen ansprechen zu müssen. Auch für das Urheberrecht gibt es massenweise Aspekte, die zu diskutieren wären und weit über „wissenschaftlichen Zitat“ (falls Sie das hier überhaupt meinen) hinausgehen. Ich fürchte, dass Sie sich damit arrangieren müssen, dass in anderer Leute Artikel nicht alle Aspekte, die Sie interessieren, angesprochen werden.

      • War halt eine Blöd-Nachricht, Herr Dr. Henning Lobin :
        -> ‚Weil hohe Bußgelder drohen, werden betroffene Firmen wie Facebook, Google und Twitter zur Durchsetzung dieses Gesetzes auf maschinelle Verfahren setzen, mit denen problematische Beiträge ausfindig gemacht werden können. Dies dürfte auch den Mitgliedern des Bundestages klar gewesen sein. Und genau hier kommt die Sprachpolitik ins Spiel: Das Gesetz vertraut darauf, dass es schon irgendwelche computerlinguistische Verfahren geben wird, mit denen Milliarden von Beiträgen in sozialen Netzen auf verbotene Formulierungen hin durchforstet werden können.‘ [Artikeltext]

        Wie vermischt auch immer…


        Sie hätten hier, als Linguist, also als sprachlich erfahrene Kraft, hier im Negativen aufsteifen müssen. [1]

        Insofern setzte es hier einige Minuspunkte.

        ‚Maschinellen Verfahren‘, die ‚problematische Beiträge‘ meinen und i.p. ‚Sprachpolitik‘ auszusortieren wären, ‚computerlinguistische Verfahren‘ meinend; weil Sie vom Fach sind und sich in diesem Zusammnenhang i.p. großes deutsches scharfes Eszett bemüht haben, anscheinend : kompensatorisch, setzt es weitere Minuspunkte.

        Derart anzumerken bleibt uncool :
        -> ‚(…) erwartete Nutzung von Sprachsoftware zur Erkennung von Hatespeech (…)‘


        Und zwar weil AI nicht sogenannte Hatespeech erkennen kann und auch deshalb [1] nicht, weil sogenannte Hatespeech freie Meinungsäußerung bedeutet, kein juristisch stabiler Begriff ist.
        Und insofern weder von der AI, noch von Kräften in sogenannten Call-Centern, darauf läuft es hinaus, erkannt werden kann.

        Zudem soll Hass in freiheitlich-aufklärerischen Gesellschaftssystemen ausgedrückt werden können, dafür sind sie als freiheitlich-aufklärerisch da.

        Womöglich wissen Sie dies nicht, Herr Dr. Lobin, womöglich kennen Sie nicht die allgemein aus liberaler Sicht anerkannten Grenzen der freien Meinungsäußerung, Dr. W hilft hier gerne bei :

        A) Nicht gehen Aufrufe zur Gewaltanwendung.

        B) Nicht gehen Aufrufe zu Gesetzesverstößen. [2]

        HTH („Hope to Help“)
        Dr. Webbaer

        [1]
        Die Sprache ist den Gebrauchenden (erst einmal) frei.

        [2]
        Auch hier wird unter Liberalen gelegentlich gegensätzlich diskutiert, der Staat darf abär aus Sicht einiger so nicht angegriffen werden, im liberalen Sinne.
        Dass in der BRD linksradikale „Eingriffe“ hier gepflegt bis promoviert werden, um „böse“ Konservative und Liberale anzugreifen, ist hier bekannt.

        • *
          ‚Maschinelle[] Verfahren‘, die ‚problematische Beiträge‘ meinen und i.p. ‚Sprachpolitik‘ auszusortieren wären, ‚computerlinguistische Verfahren‘ meinend; weil Sie vom Fach sind und sich in diesem Zusamm[]enhang

  7. Pingback: Links der Woche – Enno Park

Schreibe einen Kommentar




Bitte ausrechnen und die Zahl (Ziffern) eingeben

E-Mail-Benachrichtigung bei weiteren Kommentaren.
-- Auch möglich: Abo ohne Kommentar. +