Suchen, ohne gefunden zu werden

BLOG: Datentyp

Informatik, Daten und Privatsphäre
Datentyp

Das Gespräch auf der Party stockte. Wir unterhielten uns gerade über Charlie Chaplin, als plötzlich die Frage im Raum stand: Gibt es eigentlich einen Farbfilm mit Chaplin? Ratlose Gesichter. Ein Gast bietet sogar eine Wette an. Früher wechselte man in solchen Situation irgendwann das Thema oder man bat den Gastgeber um sein Filmlexikon. Dazu musste man aber sicher sein, dass er eins besaß, denn wer wollte ihn schon in Verlegenheit bringen?! Manchmal wachte man mitten in der Nacht auf, wenn einem etwas wieder einfiel, auf das man während des Gesprächs partout nicht gekommen war. Heute enden solche Situation anders: Jemand greift in die Tasche und holt sein Smartphone mit mobilem Netzzugang heraus – einige Wischbewegungen später wissen alle Bescheid. Fortschritt oder Stimmungskiller? Da gehen die Meinungen auseinander, aber einig sind sich wohl alle, dass Smartphones das Leben vieler Besitzer verändern.

Schwere Knochen

Erinnern sich noch die älteren Leser an die frühen Neunziger? Da konnte man klischeehaft erleben, wie ein solariumgebräunter Jungmanager seine alte Studentenkneipe betrat und mit großer Geste etwas auf die Theke legte, was aussah, wie ein Backstein mit Zifferntasten. „Ich muss immer erreichbar sein.“, war der Begleitspruch – und der Besitzer betrachtete sein mobiles Telefon als Statussymbol, obwohl dieses außer Ballast und verrauschten Gesprächen nichts zu bieten hatte. Der hohe Preis sorgte für erhofften Status. Im Laufe der Jahre wurden aus unhandlichen Telefonen kleine günstige Begleiter mit beeindruckender Rechenkapazität für jedermann. 

Mobile Superrechner

Ein modernes Smartphone verfügt im Jahre 2011 über eine Rechenleistung, die den legendären Heimcomputer C64 aus den Achtzigern um den Faktor 100.000 übertrifft. Der Preis ist in etwa derselbe. Anders sieht es aus, wenn wir ein solches Smartphone mit dem Pionier-Rechner ENIAC (Electronic Numerical Integrator and Computer) vergleichen. Die Steigerung der Rechenleistung übersteigt den Faktor 100.000 deutlich, der Preis ist zudem geringer, denn ein ENIAC kostete bereits Ende der 1940er eine halbe Million Dollar, zudem wog er 27 Tonnen und benötigte eine Stellfläche von fast 200 qm. Das Gewicht war unproblematisch, denn eine Leistungsaufnahme von bis zu 175kW verhinderte ohnehin jede mobile Nutzung.

Wo bin ich?

Smartphones rechnen aber nicht nur schnell, sie können sich auch orten. Das geschieht meistens energiesparend mit dem Abgleich von Identifikationsmerkmalen erreichbarer WLANs mit einer zentralen Datenbank, die via Internet abgefragt wird. Die genauere aber weniger akkuschonende GPS-Positionierung kommt ergänzend zum Einsatz und kann auch der Aktualisierung der Datenbank dienen; dann hilft ein Smartphone solidarisch dem Anderen. 

Zentralisiertes Wissen

„Smart“ ist neben dem Telefon die Nutzung zentraler Rechenressourcen, auf die es zugreift; so können wir Kalender verwalten, Gegenstände oder gesprochene Wörter erkennen lassen – oder das Filmlexikon zu Chaplin befragen. 

Mit einem Smartphone können wir Fakten recherchieren, die wir nie behalten konnten; wir müssen sie auch nicht mehr lernen, wenn sie überall verfügbar sind – mit dem mobilen Helfer kann auch der geschmähte Kunde der Drogerie vor Ort bei Jauch die Millionenfrage beantworten. 

Betsy Sparrow veröffentlichte mit ihren Kollegen eine Studie, die nachweist, dass wir uns Informationen nicht mehr merken, wenn wir wissen, dass wir sie uns rasch aus dem Internet beschaffen können. Eine solche Entwicklung ruft Warner wie Frank Schirrmacher auf den Plan, der kritisch fragt, wie groß die Macht einer amerikanischen Suchmaschine denn sei, wenn die Menschen ihr so sehr vertrauten, dass sie ihr ihr Gedächtnis opferten. Er fordert daher europäische Suchmaschinen, die uns aus der Abhängigkeit befreien. Andere stellen diese Konzentration auf das Können (denn wissen kann dank Smartphone jeder) als Segen dar: Gunter Dueck schrieb dazu auf Scilogs: „Wo das Wissen überall frei da ist, kann nun überall das Können wachsen.“

Die befreite Hirnkapazität ist nicht allein auf Faktensammlungen zurückzuführen. Suchmaschinen arbeiten mit komplexen Algorithmen, die Zusammenhänge zwischen Informationen herstellen, Tippfehler korrigieren, Aktualität bewerten, vermutete Interessensgebiete des Suchenden berücksichtigen und unerwünschte Werbung abwehren. Insgesamt acht ausfallsichere Rechenzentren in den USA und Europa sorgen bei Google dafür, dass wir meist nicht einmal eine halbe Sekunde auf die Antwort warten müssen. Der Stromverbrauch aller Dienste (Suchmaschine und Smartphone-Dienste eingeschlossen) entspricht nach einem Bericht der New York Times derzeit einer Stadt mit 200.000 Einwohnern. Das ist tatsächlich wenig, wenn wir es in Beziehung zur Nutzerzahl setzen. Unser PC verbraucht deutlich mehr Strom als unser rechnerischer Anteil an den zentralen Servern des Internet.

Brisante Logbücher

Für Wissenschaftler wäre ein Zugriff auf die Logs der Suchmaschinen äußerst spannend, denn die benutzten Suchbegriffe, angereichert mit weiteren Informationen zu den Nutzern (wie dem aktuellen Aufenthaltsort), ließen sich zu vielfältigen empirischen Untersuchungen nutzen. Suchmaschinenbetreiber geizen jedoch mit solchen Daten – und das aus gutem Grunde. 2007 veröffentlichte AOL Suchanfragen von über einer halben Million Nutzer, die einen Zeitraum von drei Monaten betrafen. Obwohl die Nutzernamen mit zufälligen Zahlen pseudonymisiert wurden, konnten durch geschickte Auswertung der Daten manche Anfrage einer konkreten Person zugeordnet werden, was in einzelnen Fällen einen erheblichen Eingriff in die Privatsphäre der Betroffenen darstellt: Patienten suchten beispielsweise nach Hintergundinformationen zu Diagnosen. 

M. Götz et al. schlagen daher ein Verfahren ZEALOUS vor, das eine Weitergabe der Suchmaschinen-Logs an Wissenschaftler ermöglicht, ohne dass sensible Informationen über die Nutzer übermittelt werden. ZEALOUS sieht dabei vor, Suchbegriffe, die nur von wenigen Nutzern verwendet werden, aus der Menge der Suchanfragen eines Nutzers vor der Weitergabe zu streichen. Zudem werden die Daten verrauscht, indem zufällig gezogene Werte auf die Häufigkeiten der Begriffe addiert werden. Auf diese Weise soll eine Auswertung der Daten, die Suchbegriffe bestimmbaren Personen zuordnet, verhindert werden.

Verlorene Wette

Die Gräfin von Hongkong“ von 1967 war übrigens der letzte Film und der einzige Farbfilm, im dem Charlie Chaplin spielte. Aber „zählt“ der, um eine Wette zu verlieren? Denn Chaplin hatte nur einen Cameo-Auftritt. Diesen Streit auf einer Party kann weder Suchmaschine noch Smartphone schlichten.

Ulrich Greveler

”The purpose of computing is insight, not numbers.” (Richard Hamming) Ulrich Greveler studierte in Gießen Mathematik und Informatik, arbeitete sechs Jahre in der Industrie im In- und Ausland, bevor er als Wissenschaftler an die Ruhr-Universität nach Bochum wechselte. Seit 2006 lehrt er Informatik mit dem Schwerpunkt IT-Sicherheit an der Fachhochschule Münster (bis 03/2012) und der Hochschule Rhein-Waal (seit 03/2012). Sein besonderes Interesse gilt datenschutzfördernden Technologien und dem Spannungsverhältnis zwischen Privatsphäre und digitaler Vernetzung.

2 Kommentare

  1. Erinnern sich noch die älteren Leser an die frühen Neunziger?

    Ich erinnere mich sogar an kofferähnliche Geräte. Mitten im Kino wurde er angerufen. Aber die Stafe folgte auf dem Fuße. Das ganze Kino hat gelacht.

  2. Suchmaschinen auswerten.

    Danke für den schönen Beitrag! Suchbegriffe mit Ortsdaten wären wirklich eine wertvolle Datenbasis für Forschungsaktivitäten, aber ZEALOUS ist doch etwas kompliziert. Es wäre einfacher, wenn die Forscher ihre Auswertungsalgorithmen den Suchmaschinenbetreibern übermitteln. Dann benötigte man dafür einen Standard, den Google oder andere bereitstellen könnte. Die Treffer oder Statistiken würden dann als Rückgabewerte zur Verfügung gestellt.

Schreibe einen Kommentar