Big Data: Kundeninfos als Goldgrube
Nach Virtualisierung, Green IT und Cloud Computing könnte Big Data in diesem Jahr der neue IT-Trendbegriff werden. Speichergigant EMC lässt auf der derzeit stattfindenden EMC World jedenfalls keinen Zweifel daran, dass der Umgang mit riesigen, unstrukturierten Datenmengen ganz oben auf der Unternehmensagenda steht. Aber auch andere IT-Größen wie IBM und Yahoo haben das Potenzial längst erkannt. Denn die Analyse dieser riesigen Datenpools verspricht Geschäfts- und Gewinnoptimierung für Unternehmen.
100-Millionen-Dollar-Analyse
Durch den Einsatz der Greenplum-Analysetools von EMC und das Zusammenführen verschiedener Datensätze habe sich T-Mobile innerhalb weniger Tage einen Einblick im Wert von 100 Millionen Dollar verschaffen können, erklärte EMC-Präsident Pat Gelsinger in seiner Keynote am Montag. Der Konzern fand durch die Analyse der mehreren Hundert Terabyte umfassenden Datensätze heraus, welche Faktoren zu Kundenunzufriedenheit und Vertragskündigungen geführt hatten und welche Gegenmaßnahmen ergriffen werden müssen.
Doch nicht nur die strukturierten Daten, die von Unternehmen nach vordefinierten Parametern in Datenbanken erfasst werden, stellen ab einer gewissen Größe ein Problem dar. Vielmehr handelt es sich bei 90 Prozent der im Netz anfallenden Daten um unstrukturierte, lose Informationen, die nur schwierig in Zusammenhang gebracht und ausgewertet werden können. Doch genau diese 90 Prozent an ungeordnetem Datenmaterial, das von Usern im Netz "produziert" wird, versprechen essenzielle Einblicke in das Kundenverhalten.
Analyse-Technologie Hadoop
Als wichtige Technologie, um derartige Datenpools zu bearbeiten, gilt die von Yahoo als Open Source freigegebene Entwicklung Hadoop. Diese wird neben Yahoo auch von Facebook und Twitter verwendet. Kommerzielle Weiterentwicklungen werden unter anderem von IBM und dem Start-up Cloudera angeboten, letzteres arbeitete bisher eng mit EMC zusammen. Mit der auf der EMC World
33 Sekunden für 16 Milliarden Datensätze
Wie leistungsstark moderne Analysetools heute bereits sind, demonstrierte EMC-Präsident Gelsinger live auf der Bühne. So glich das Greenplum-System eine Datenbank von 16 Milliarden Verkaufsartikeln mit 56 Millionen Kunden ab und brauchte dafür gerade einmal 33 Sekunden. "Wenn Sie als Elektromarkt-Verantwortlicher wissen wollen, ob Sie in einer bestimmten Stadt eher Blu-rays als DVDs im Weihnachtsgeschäft bewerben sollen, können Sie das in Echtzeit mit einem Klick herausfinden", so Gelsinger.
Automatisierte Personalentscheidung
In einer weiteren Demonstration zeigte der EMC-Präsident, wie derartige Auswertungstools auch bei Personalentscheidungen eingesetzt werden könnten. Potenzielle Bewerber werden anhand der über sie im Web vorhandenen und zusammengetragenen Daten bereits vom System vorsortiert und anhand definierter Parameter bewertet.
Dass ausgerechnet ein junger Bewerber mit einem unseriösen Bild, das von einer Plattform wie Facebook stammen könnte, vom System nicht für das Jobinterview berücksichtigt wurde, erntete im Saal Gelächter. Für ein Nachdenken über die tatsächlichen Implikationen einer derartigen Lösung blieb angesichts der rasant gestalteten Keynote keine Zeit. Manchen wird die in erster Linie als Auflockerung gedachte Demonstration aber dennoch zu denken gegeben haben.
Datenschutz kaum auf der Agenda
Während die EMC-Manager auf der EMC World nicht müde wurden, auf die wirtschaftliche Bedeutung derartiger Datenauswertungstools hinzuweisen, blieben Datenschutzfragen eher ein Randthema. "Natürlich ist das auch innerhalb von EMC ein Thema, wie mit welchen Daten umgegangen werden kann und darf", meint der für EMEA Nord zuständige EMC-Manager Adrian McDonald im Gespräch mit der futurezone. "In erster Linie sehen wir uns jedoch einfach als Anbieter, der diese Technologien als Teil des eigenen Geschäftsmodells zur Verfügung stellt." Man werde die öffentliche Diskussion jedoch weiter verfolgen und könne das eigene Angebot auch jederzeit adaptieren.