© Antje Delater/pixelio.de

Crowdsourcing

Amazon-Dienst Mechanical Turk rekrutiert Spammer

Die Ergebnisse gehen auf eine Studie des Informatikprofessors Panos Ipeirotis von der Stern School of Business der New York University zurück, der gemeinsam mit zwei seiner Studenten die Arbeitsaufträge neuer Mitglieder am Crowdsourcing-Marktplatz Mechanical Turk unter die Lupe nahm. Erwartet hat Ipeirotis das Ausmaß nicht, "ganz und gar nicht", so der Professor. "Wenn überhaupt, dann habe ich vielleicht mit zehn Prozent derartiger Fälle gerechnet".

Ipeirotis beschränkte sich bei seinen Untersuchungen auf zwei Monate - September und Oktober 2010 - und fand 1733 Neuzugänge unter den sogenannten „Requestern“. Insgesamt boten diese 5841 Human Intelligence Tasks (HITs) zur Erledigung an. 2390 Stück davon waren jedoch Spam. Jeder dritte neue Requester postete überhaupt nur Spam-Aufgaben, die zu erfüllen waren. Die Palette ist wenig originell: eine erfundene Bewertung auf Yelp posten; ein Twitter-Konto eröffnen und einem anderen folgen; sich durch die Werbeschaltungen einer Website klicken.

Die Human Cloud
Als Amazon Ende 2005 Mechanical Turk aus der Taufe hob, schien das Konzept geradezu futuristisch: ein nahezu unbeschränkter Jobmarkt, der an keine bestimmten Arbeitszeiten gebunden ist. Requester bräuchten ihre Aufträge, die für Computer zu schwierig und für Menschen einfach zu lösen sind, nur in die hungrige Human Cloud zu werfen und würden Turker Fotos mit den richtigen Stichworten versehen, rassistische Kommentare aus Foren entfernen oder Texte ins Chinesische übersetzen. Die Realität ist weniger rosig. Die meisten HITs werden mit wenigen Cent entlohnt, nennenswertes Geld lässt sich selten verdienen. Dass es kaum jemand über einen Stundenlohn von zwei bis drei Dollar schafft, setzt der Arbeitsmoral und Qualität zu.

Amazon hält sich bedeckt
Was Spam ist und was nicht, ließ Ipeirotis in seiner Studie Turker bewerten. In sieben Kategorien sollten sie HITs einteilen. Und auch dabei hatten Spammer ihre Finger im Spiel. Eine „geradezu lächerliche Menge“ an Klassifizierungen enthielt x-beliebige Daten. Auch als die Wissenschafter strengere Teilnahmebedingungen verlangten - zumindest 1000 bereits ausgeführte HITs mit 99 Prozent Erfolgsrate - waren noch Spammer darunter.

Amazons PR-Abteilung kommentiert die Entwicklung nicht. Ipeirotis entschloss sich, das Online-Warenhaus einige Wochen vor Veröffentlichung der Studie zu warnen: „Aber sie haben nicht einmal reagiert“, erzählt er. Als er die Erhebung publizierte, meldete sich Amazon schließlich: „Sagen wir einmal so“, sagt der Informatiker, „sie waren nicht glücklich.“

Spammer nichts Neues
Noch scheint sich Amazon darauf zu verlassen, dass Turker das Problem über die Kennzeichnung von Spam selbst regeln. Allerdings sind Spammer auf Mechanical Turk nicht Neues. Schon 2009 beschwerten sich Arbeiter im Forum Turker Nation: „Ich habe das Gefühl, dass ich mehr damit beschäftigt bin, zwielichtige HITs zu kennzeichnen als tatsächliche welche zu lösen“, schreibt einer. Ein Administrator entgegnete seinerzeit, dass Amazon die Sache ernst nehme, die betreffenden Konten schließe und die dazugehörigen HITs „links, rechts und in der Mitte“ entferne. Ein Trend schien sich damals schon abzuzeichnen: „Es gibt eine deutliche Zunahme an Spam-Meldungen - entweder, weil (Turker) sorgfältiger berichten oder es einfach mehr zu berichten gibt", kommentierte der Administrator.

Eine Lösung des Problems wäre aus Sicht von Ipeirotis denkbar einfach: nach bestimmten Schlagwörtern suchen. Das sei nicht komplizierter als bei E-Mail-Spam: „Solche Schlagwörter sind sehr vorhersehbar“.

Marktplatz in Gefahr
Ipeirotis, der an einer wirtschaftlichen Fakultät forscht und unterrichtet, sieht das Wachstum des Marktplatzes in Gefahr. „Turker arbeiten nur mehr sehr ungern mit neuen Anbietern“, sagt er. Requester, die ernsthafte Aufgaben ausschreiben, könnten sich dadurch zurückziehen. „Alles, was Marktteilnehmer zögern lässt, schadet dem Wachstum“, so Ipeirotis.

Zahlen die Spammer eigentlich? „Ich weiß es nicht. Ich habe nur ein Gefühl, dass manche zahlen, andere nicht", vermutet der Wissenschafter. An entsprechende Tiefendaten ließ Amazon ihn nicht heran. „Wenn Amazon dazu keine Stellung nimmt, werden wir die Antwort wohl nie herausfinden“, sagt er und fügt hinzu, „sei denn, ich beginne selbst, Spam-HITs auszuführen.“

Nicht ohne Ironie ist, dass Amazon in Anleitungsvideos auf seiner Websites die Requester anweist, Anti-Spamsoftware zu verwenden, bevor diese Turker etwa Kommentare in einem Forum klassifizieren lassen. Bekanntlich seien 50 Prozent Spam, heißt es da. Und Requester könnten sich viel Arbeit ersparen.

Mehr zum Thema

Hat dir der Artikel gefallen? Jetzt teilen!

Kommentare