Digital Life
15.01.2014

Wikipedia will Datenschutz transparenter machen

Die Wikipedia bekommt eine neue Datenschutzrichtlinie und will die Erfassung von Daten transparenter regeln. Beobachter warnen vor dem gläsernen Wikipedia-Autor.

Wie Wikipedia mit seinen Nutzerdaten umgeht, das wird bis zum heutigen Mittwoch in einer neuen Datenschutzrichtlinie diskutiert. Die derzeit noch gültige Datenschutzrichtlinie ist bereits sechs Jahre alt. Die neue Version soll nicht nur knapper und besser verständlich werden. Sie soll vor allem den aktuellen Stand der Technik widerspiegeln. Die Wikimedia-Foundation sieht sich dabei vor allem in der Pflicht, den Umgang mit den Daten transparenter zu regeln, aber nicht unbedingt einzuschränken.

Erfassung personenbezogener Nutzerdaten

Daten wie die sekundengenaue Uhrzeit von Textänderungen, die IP-Adresse des Autors oder dessen Nutzername, falls er über ein Nutzerkonto verfügt, sind wichtig für die Wikipedia. Zum einen kann sie so nachweisen, wann Änderungen vorgenommen wurden, was bei urheberrechtlichen Fragen eine wichtige Rolle spielen kann. Zum anderen kann sie auch überprüfen, ob Autoren verbotenerweise mehrere Nutzerkunden verfügen und über diese versuchen, Texte zu manipulieren. Dafür greift sie mit Analystools auf nichtöffentliche Daten wie die IP-Adresse eines angemeldeten Autors zu.

Auf diese nichtöffentlichen Daten darf allerdings nicht jeder zugreifen. Zu den neuen Regeln gehört es etwa, dass nur volljährliche Personen, die sich mit einem Lichtbildausweis identifizieren und eine Geheimhaltungsvereinbarung unterzeichnen, die Daten auswerten dürfen. Wenn Strafverfolger auf die Daten zugreifen, will die Wikimedia die Betroffenen innerhalb von fünf Tagen benachrichtigen. Auch Entwickler von Open-Source-Software für die Wikimedia dürfen auf die Daten zugreifen, sie müssen allerdings Geheimhaltung versprechen.

Wikimedia will also nicht weniger Daten im Sinne der Datensparsamkeit erfassen, aber die bestehende Erfassung transparenter regeln. Außerdem will sie Missbrauch und auch Ausspähung vorbeugen. Im Zuge der Snowden-Enthüllungen ist sie etwa dazu übergegangen, angemeldete Nutzer mit HTTPS-Verbindungen zu schützen. Damit kann von außen nicht mehr herausgefunden werden, wer unter welchem Pseudonym oder unter einer bestimmten IP-Nummer Änderungen vornimmt. Allein iranische und chinesische Nutzer müssen darauf verzichten, weil ihr Staat einen Zugriff auf die verschlüsselten Verbindungen blockiert.

Big Data bei Wikipedia

Die Daten, die während der Erstellung und Änderung eines Wikipedia-Artikel generiert werden, können von einer Reihe von Analyse-Tools analysiert werden. Vor allem der „Deep User Inspector“ sorgt in der deutschsprachigen Community für Unbehagen, da er die Daten eines Nutzers so auswerten kann, dass Rückschlüsse auf dessen Identität möglich werden.

Ein Appell, der von 120 Wikipedia-Autoren unterstützt wird, fordert die Wikimedia Foundation auf, die Nutzung solcher Big-Data-Analysetools grundsätzlich von der Zustimmung des jeweiligen Nutzers abhängig zu machen. Außerdem soll die Auswertung der Nutzerdaten außerhalb von Wikimedia-Servern verhindert werden. Dies ist möglich, wenn die Daten über die API-Schnittstelle ausgelesen werden oder wenn Kopien der Wikipedia auf anderen Servern erstellt werden. Die Wikimedia Foundation lehnt dies jedoch ab, da die Daten grundsätzlich für das technische wie soziale Funktionieren der Wikipedia lebensnotwendig seien. Was die Zustimmung der betroffenen Nutzer bei Datenauswertungen anbelangt, will sie jedoch die Nutzungsbestimmungen des Tool-Servers überarbeiten.

Der gläserne Autor

Das Blog Wiki-Watch sieht jedoch noch eine andere Gefahr: Den gläsernen Wikipedia-Autor. So möchte die Wikimedia Foundation künftig noch mehr Daten über jeden angemeldeten Autor sammeln: Mit Zählpixel, Javascript und Cookies soll dann die Nutzung der Wikipedia noch persönlicher gestaltet werden. So will man in Erfahrung bringen, „welche Artikel du auf deiner Beobachtungsliste verfolgst, damit wir dir ähnliche Artikel empfehlen können, die dich auch interessieren könnten“. Auch könne man so feststellen, „ob eine Seite besucht wurde, was wiederum mit personenbezogenen Informationen wie deiner IP-Adresse verknüpft werden kann.“ Ein neuer Leitfaden zur Datenspeicherung beschreibt überdies den genauen Umgang mit den Daten. So sollen etwa die IP-Adressen von Besuchern und Nutzern nach 90 Tagen gelöscht werden. Daten zu Nutzeraktivitäten hingegen sollen unbegrenzt gespeichert werden. Bis zum 14. Februar darf die Community den Entwurf kommentieren.

Die Datenschutzbestimmungen unterliegen im Übrigen US-amerikanischem Recht. Dem europäisch-amerikanischen Safe-Harbor-Abkommen will die Wikimedia Foundation nicht beitreten, da sie nicht garantieren kann, in allen Punkten den Anforderungen des Abkommens entsprechen zu können. Offenbar meint die Wikimedia Foundation, dass dies ein freiwilliger Akt wäre. Tatsächlich ist er notwendig, wenn die Daten europäischer Nutzer legal ausgewertet werden sollen. Offenbar ist das aber noch niemandem aufgefallen.