© Pop Tech/Kris Krüg

Big Data

„Echte Anonymität im Web gibt es nicht“

futurezone: Was ist eigentlich ein Datenwissenschaftler?
Porway:
Ja, darüber wird gerade eine hitzige Debatte geführt. Im Wesentlichen versteht man darunter einen Statistiker, der Programmierkenntnisse besitzt oder einen Programmierer, der sich mit Statistik auskennt.

Welche der beiden Fähigkeiten ist wichtiger, um ein guter Datenwissenschaftler zu sein?
Meiner Meinung nach sind drei Komponenten notwendig. Die Computer-Kenntnisse braucht man, um die ganzen Daten aus dem Web zusammenzukratzen und in eine Form zu bringen, die man weiterverarbeiten kann. Statistik und mathematische Fähigkeiten sind unablässig, um Modelle zu erarbeiten und zu erkennen, was wirklich wichtig ist. Die dritte und vielleicht wichtigste Komponente ist das kritische Denken.

Was ist damit gemeint?
Nur weil man über die entsprechenden Werkzeuge verfügt, die Daten durchrennen lässt und dann Ergebnisse erhält, ist man noch lange kein guter Datenwissenschaftler. Man muss vielmehr kritisch hinterfragen: Ist es wirklich das, was wir beantwortet haben wollten? Ist der Schluss, den wir aus dem Datenmaterial gezogen haben, wirklich der richtige?

Wie wird man ein Datenwissenschaftler? Gibt es entsprechende Studiengänge?

Da stehen wir noch am Anfang. Auch in den USA gibt es gerade einmal ein paar Unis, die entsprechende Lehrgänge anbieten. Andererseits brauchen wir dafür wohl auch keine neuen Campusse, in Wahrheit sollte die Ausbildung in traditionellen Statistik-Studiengängen angesiedelt sein. Aus Business-Sicht sind ausgebildete Leute in dem Bereich aber definitiv notwendig. Denn das Tamtam um Big Data ist derzeit groß, gleichzeitig weiß aber noch kaum jemand, was man damit anfangen soll.

Datenschützer, aber auch viele User sehen es zunehmend kritisch, dass einige wenige Konzerne wie Google, Facebook, Microsoft und Apple über eine derartige Konzentration an persönlichen Daten verfügen. Ist diese Sorge berechtigt?
Das Geschäft mit den persönlichen Daten sorgt für Verunsicherung, weil man als Kunde nicht mehr durchblickt. Wenn ich mir um 1,40 Dollar zwei Äpfel kaufe, weiß ich, was ich damit bekomme. Ich weiß, wie viel 1,40 Dollar wert sind und wie lange ich dafür arbeiten muss. Bei Google und Facebook ist das nicht so: Ich weiß zwar, dass ich für die Hergabe meiner Daten deren Produkte gratis benutzen kann, gleichzeitig weiß man aber nicht, wie viel die eigenen Daten eigentlich wert sind.

Bräuchte es klarere Regeln, was mit persönlichen Daten gemacht werden darf?
Es ist gut, dass sich mittlerweile mehrere Initiativen für einen besseren Datenschutz und mehr Transparenz gebildet haben. Denn derzeit ist vieles ungeklärt. Als User weiß ich einfach nicht, was passiert, wenn ich mein Geburtsdatum auf einer Seite angebe. Heißt das, dass diese Info meinen Freunden mitgeteilt werden darf, damit sie wissen, wann ich Geburtstag habe? Oder darf man diese Information mit anderen persönlichen Daten von mir zusammenfügen und meiner Versicherung weitergeben, die dann neue Beitragszahlungen vorschreibt?

Viele Big-Data-Projekte wollen durch die gewonnenen Erkenntnisse einen Beitrag für gesellschaftliche Verbesserungen wie den Kampf gegen Armut und Krankheiten leisten. Sind Big Data und Datenschutz aber überhaupt vereinbar?
Ja, denn selbst mit geschützten, anonymisierten Daten lassen sich tolle Erkenntnisse gewinnen, die als Grundlage für gesellschaftlich relevante Projekte dienen können. Man denke nur an die ganzen Daten, die von Regierungen und Behörden im Rahmen von Open-Data-Initiativen frei zur Verfügung gestellt werden. Es gibt viele Möglichkeiten, persönliche Daten in einem großen Datenpool zu anonymisieren.

Dennoch: Was ist an der

Aussage
des Greenplum-Managers Dave Menninger dran, man müsse sich zwischen der Ausrottung von Kinderlähmung und dem größtmöglichen Schutz von Daten entscheiden?
In Wahrheit ist es wohl so, dass es echte Anonymität im Web leider nicht gibt und wir uns dessen zu jeder Zeit bewusst sein müssen. Das hat auch der Fall des Wired-Redakteurs Mat Honan gezeigt, dessen digitale Identität durch das Kombinieren von Daten seines Apple- und Amazon-Accounts

wurde. Umso wichtiger ist es daher, so viel zu anonymisieren, wie es nur geht. Datenwissenschaftler muss man dahingehend schulen, dass sie persönliche Daten respektieren. Es muss ihnen klar sein: Hinter den Zahlen und Ziffern des Datenmaterials stecken immer noch echte Menschen.

Machen neue Datenanalyse-Tools Management-Fähigkeiten wie einen intuitiven Geschäftssinn obsolet oder sind Daten doch nicht immer alles? Steve Jobs hat entgegen sämtlicher Analysten- und Expertenmeinungen sowohl beim iPhone als auch beim iPad unvorhergesehene Erfolge gefeiert.
Die trockene Antwort eines Datenwissenschaftlers lautet: Alle Leute, die davon ausgegangen sind, dass Steve Jobs scheitern wird, hatten wohl keine ausreichend guten Modelle und Datensätze bzw. haben das Ganze von der falschen Seite betrachtet. Andererseits kann man natürlich auch so argumentieren: Wenn Computer die ganze Analyse übernehmen, werden zunehmend Leute gefragt sein, die kreativ denken und einen Trend intuitiv erkennen können. Denn diese Fähigkeiten sind es, die uns Menschen einzigartig machen und von Maschinen unterscheiden.

Die Menschheit ist Jahrtausende ohne Big-Data-Tools ausgekommen und hat sich – zumindest technologisch gesehen – dennoch weiterentwickelt. Ist Big Data jetzt der nächste Evolutionsschritt oder doch ziemlich überbewertet?
Seit Anbeginn des Lebens geht es immer um die gleichen Fragen: Wo kommen wir her? Wie kann man ein gutes Leben führen, wie sichert man sich Essen, Wasser und ein Dach über dem Kopf, wie kommuniziert man am besten, wie organisiert man sich als Gesellschaft? Mithilfe der neuen Technologien könnten wir bei der Beantwortung dieser Fragen einen wichtigen Schritt weiterkommen.

Das heißt, die Datenwissenschaftler können uns bald alle Antworten zum Ursprung der Menschheit und des Universums liefern?
Warum wir auf diesem Planet sind oder existieren, werden wir so bald vermutlich weiterhin nicht beantworten können. Datenwissenschaft bedeutet aber dennoch eine fundamentale Veränderung. Denn Entscheidungsträger ohne Datenmaterial sind nur Personen mit einer Privatmeinung. Aber wenn ich Dinge messen und evaluieren kann, ist die Chance viel höher, dass weniger emotional und meinungsgefärbt entschieden wird. Entscheidungen – etwa, ob ein Hochgeschwindigkeitszug durch eine bestimmte Gegend geführt werden soll und was es für die Menschen vor Ort bedeutet - stärker auf Daten zu basieren anstatt auf Rhetorik fände ich einen riesigen Schritt nach vorne.

Mehr zum Thema

  • Big Data soll Malaria und Polio ausrotten
  • App sucht nach digitalem Doppelgänger

Jake Porway ist der Gründer der in New York angesiedelten Organisation Datakind, die Datenwissenschaftler und NGOs sowie Sozialprojekte zusammenführt. Über Datenanalyse sollen konkrete gesellschaftliche Verbesserungen erreicht werden. Die futurezone sprach mit Porway am Rande der Veranstaltung "

The Human Face of Big Data
" in London.

Hat dir der Artikel gefallen? Jetzt teilen!

Martin Jan Stepanek

martinjan

Technologieverliebt. Wissenschaftsverliebt. Alte-Musik-Sänger im Vienna Vocal Consort. Mag gute Serien. Und Wien.

mehr lesen
Martin Jan Stepanek

Kommentare