Jake Porway, Gründer von Datakind

© Kris Krüg, Poptech

Science
10/16/2013

Datenskandal: "Regierungen haben uns immer abgehört"

Die eigenen Daten völlig unter Verschluss zu halten, ist praktisch unmöglich geworden, meint Datenwissenschaftler Jake Porway im Gespräch mit der futurezone.

Der New Yorker Datenwissenschaftler Jake Porway unterstützt wohltätige Vereine, aber auch Unternehmen und Regierungsbehörden mit seiner Organisation DataKind, um durch die Analyse von Daten gesellschaftliche Verbesserungen zu erzielen. Die futurezone hat mit Porway in New York gesprochen.

futurezone: Was genau macht DataKind?
Wir wollen, dass sozial ausgerichtete Organisationen bzw. Leute, die die Welt verbessern möchten, Zugang zu denselben Daten-Spezialisten mit all ihrem Know-how haben, die an der Wall Street oder im Silicon Valley erfolgreich sind.

Und wie stellen Sie das an?
Die meisten Datenwissenschaftler, die wir für diese Projekte organisieren, arbeiten gratis in ihrer Freizeit. Geld motiviert sie im Normalfall nicht, da sie ohnehin bestens verdienen. Vielmehr reizt es sie, ihre Fähigkeiten einmal für einen guten Zweck einzusetzen. Sonst sitzen sie ja tagaus, tagein im Büro und analysieren, wie man Leute am besten zum Anklicken einer Online-Werbung bewegen kann.

Wie sehen solche Projekte aus, die Datakind betreut?
Sehr verschieden. In Chicago hat die Feuerwehr mit Bränden wegen überhitzter Heizdecken zu kämpfen. Wir haben die Einsatzdaten mit demografischen Informationen verknüpft und einen Plan ausgearbeitet, in welchen Stadtteilen die Behörden stärker informieren müssen. In New York wiederum konnten wir nachweisen, dass das regelmäßige Schneiden von Bäumen die Gefahr von Personen- und Sachschäden bei Sturm um 22 Prozent senkt.

Woher kamen die Daten?
New York City hat etwa 600.000 Bäume. Seit den 90er-Jahren wird vermerkt, wo und wann ein Baum gepflanzt oder geschnitten wurde und welche Sturmschäden er aushalten musste. Die Daten sind da, wenn auch oft in ungeordneter Form und verschiedenen Datenbank-Formaten. Vereinen, aber auch Behörden und Unternehmen fehlen naturgemäß die Ressourcen, daraus etwas zu machen.

Und was war die Erkenntnis?
Es mag banal klingen, aber vorher wusste die Behörde nicht, ob das Schneiden der Bäume überhaupt etwas bringt. Indem Straßenzüge mit einer ähnlichen Bepflanzung und ähnlichen Häusermerkmalen verglichen wurden, konnte man feststellen, dass das regelmäßige Schneiden der Bäume tatsächlich zu 22 Prozent weniger Notfallseinsätzen wegen abgebrochener Äste, umgestürzter Bäume sowie Gebäude- und Personenschaden führt. Die Analyse hat gezeigt, dass das Steuergeld für den Baumschnitt offenbar gut eingesetzt ist.

Die beiden Beispiele sind faszinierend, klingen aber auch ein bisschen wie Erste-Welt-Probleme. Gibt es noch andere Beispiele?
In ländlichen Regionen in Indien können sich viele Leute einen Arztbesuch nicht leisten oder wohnen zu abgelegen, um in ein Spital zu kommen. Die medizinische Versorgung passiert dort vielfach über Sozialarbeiter, die per SMS mit Ärzten in Kontakt sind und so das Verschreiben von Medikamenten koordinieren. In einem Projekt wurde versucht, diesen Vorgang durch einen Datenalgorithmus zu vereinfachen. Anstatt stunden- und tagelang auf die Rückmeldung des Arztes warten zu müssen, kann das Computerprogramm bei gewissen, eindeutigen Symptomen auf Basis bisher analysierter Krankenfällen dem Sozialarbeiter ein Medikament vorschlagen.

Der Datenwissenschaftler ersetzt den Arzt?
Ich bin der erste, der sagt, dass eine Diagnose eigentlich Arztsache ist. Wenn wir durch solche Maßnahmen - etwa das Verschreiben von Antibiotika oder ähnlichem - die medizinische Versorgung in bestimmten Gegenden der Erde drastisch verbessern können und Leute nicht an Lungenentzündungen sterben, weil sie tagelang keine medizinische Betreuung bekommen, wäre das in jedem Fall ein großer Fortschritt. Natürlich muss das Risiko minimiert bzw. die Zuverlässigkeit der Datenanalyse entsprechend hoch sein.

Ist das Grundproblem von Big Data nicht weiterhin, dass einige große Konzerne auf den Daten sitzen und am Ende nur sie davon profitieren?
Es ist richtig, dass der überwiegende Großteil der Daten weggesperrt bleibt. Mir als Datenwissenschaftler tut so etwas in der Seele weh , weil ich weiß, wieviele gute Dinge man damit machen könnte. Man könnte Rezessionen besser vorhersagen und entsprechend entgegen steuern oder die Sterblichkeitsrate bei Jugendschwangerschaften senken - allein dadurch, dass man Facebook-Status-Updates analysiert. Es bleibt zu hoffen, dass Unternehmen künftig ihre Datenschätze öfter zur Verfügung stellen bzw. für einen guten Zweck "spenden".

Warum sollten sie das tun? Auch würde man ihnen vermutlich vorwerfen, die Daten an Dritte herauszurücken.
Es braucht natürlich ganz strenge Vorgaben, in welcher Form und wie Daten anonymisiert einem wissenschaftlichen Non-profit-Projekt geliehen werden können. In den meisten Fällen sollte es so sein, dass Personen ihre bei einem Unternehmen gespeicherten Daten selber einer guten Sache zur Verfügung stellen können. Die Unternehmen könnten image-mäßig auch profitieren, wenn mit der Analyse ihrer Daten gesellschaftliche Verbesserungen oder ein Durchbruch in der Krebsforschung erzielt werden kann - um ein Beispiel zu nennen. Im Moment geschieht das allerdings noch nicht allzu oft.

Viele fürchten, dass derartige Datenanalysen aber auf Kosten der Privatsphäre gehen.
Natürlich kann man spannende Erkenntnisse auch aus anonymisierten Daten gewinnen. Gleichzeitig muss man aber auch sehen, dass der Schutz der eigenen Daten zunehmend schwierig bis praktisch unmöglich geworden ist.

Auch wenn man sich von Plattformen wie Facebook und öffentlichen Postings im Internet fernhält?
Ein Experiment in den USA hat gezeigt, dass man in acht von zehn Fällen den Namen einer Person herausfindet, wenn man nur Geburtsdatum, Geschlecht und Postleitzahl dieser Person kennt. Das alles sind jetzt nicht unbedingt Angaben, wo bei uns die Alarmglocken schrillen, selbst wenn wir unsere Privatsphäre schützen wollen. Für eine eindeutige Zuordnung einer individuellen Person reichen diese Daten aber allemal.

Das heißt, die Privatsphäre im Datenzeitalter ist tot?
Ich habe diesbezüglich meine Meinung revidieren müssen. Ich dachte immer, dass man sensible Daten vielleicht bei einer neutralen Non-profit-Organisation sicher hinterlegen oder über private Server speichern sollte. Firmen würden dann von uns temporären Zugriff auf die Daten bekommen. Das ist natürlich weiterhin eine Alternative. Angesichts all der Sensoren und Kameras um uns herum und den technischen Möglichkeiten zweifle ich aber immer stärker daran, dass ein tatsächlicher Schutz möglich ist. Allein durch die Bewegung, wie jemand ein Handy aus der Hosentasche zieht, ist ein Mensch praktisch individuell erkennbar.

Aber ist es nicht dennoch gefährlich, dass Firmen wie Google oder Facebook so viel über uns aus erster Hand wissen?
Vielleicht bin ich naiv, aber Firmen werden sich hüten, diese Informationen zu missbrauchen. Natürlich verwenden sie es, um auf unheimliche Art und Weise uns Werbungen unter die Nase zu reiben, die genau auf uns zugeschnitten sind. Aber sie kommen nicht zu unserem Haus und stehlen die Kinder oder rauben uns aus. Denn wenn sie wirklich etwas Schlimmes mit den Daten anstellen und so etwas öffentlich wird, ist ihr Geschäft ganz schnell ruiniert.

Viele würden angesichts der Datenskandale durch NSA und andere Geheimdienste ohnehin sagen, dass die wahre Gefahr nicht von Unternehmen, sondern der eigenen Regierung ausgeht.
Ja, und dafür brauchen die Regierungen Facebook, Google und Foursquare im Prinzip gar nicht. Die Regierungen haben uns immer abgehört und wissen auch seit den 1970er-Jahren, wie sie Daten mit Hilfe des Computers sammeln und auswerten können. Da hat sich gar nicht so viel geändert. Sie werden damit Gutes tun oder sie gegebenenfalls missbrauchen, wie sie es auch bisher schon getan haben.

Aber hat die Daten-Auswertung - gerade auch durch die mächtigen Big-Data-Werkzeuge - nun nicht eine neue Qualität?
Vielleicht steuern wir auf eine Kultur zu, wo alles öffentlich ist. Das mag erschreckend klingen. Gleichzeitig ist es dadurch für eine Regierung zunehmend schwieriger, dass sie jemanden mundtot machen kann. Wenn meine Identität in der Gesellschaft öffentlich etabliert ist, kann man diese auch nicht so einfach verschwinden lassen. Auch das Stehlen meiner Identität - etwa für kriminelle Geschäfte - wird dadurch erschwert.