© Sunlight Labs

Open Data
12/09/2010

Offene Daten für mehr Demokratie

Tom Lee, Direktor der US-amerikanischen Sunlight Labs im FUTUREZONE-Interview: über brave Beamte, Geheimhaltung aus Prinzip und E-Mails, die manchmal doch noch ausgedruckt, redigiert und wieder eingescannt werden müssen.

Die Sunlight Labs sind der technische Arm der Sunlight Foundation, einer 2006 gegründeten NGO mit Sitz in Washington, die sich für mehr Transparenz bei Regierung und Behörden einsetzt. Über den Zugang zu bisher weggesperrten Daten sollen US-Bürger unter anderem wieder mehr Kontrolle über die Verwendung ihrer Steuergelder erhalten. 15 Programmierer und Designer arbeiten bei den Sunlight Labs an der Aufbereitung und Daten und Entwicklung von Software, damit es einfacher werde "sich sozusagen in die Demokratie einzuklinken", sagt Tom Lee, neuer Direktor der Sunlight Labs.

Tools für alle Fälle

Dazu unterhalten die Sunlight Labs eine Vielzahl an Projekten, wie etwa Congress API, ein Interface für unterschiedlichste Daten über den Gesetzgeber. Auf die Bundesstaatenebene heruntergebrochen heißt das Vorhaben Open State. Hier würde es besonders an Transparenz fehlen: "Bei genauen Ausgaben ihres Bundesstaates sind die Leute auf Lokalzeitungen und Quellen im Web angewiesen", erläutert Lee.

Das Projekt Data Commons soll politische Einflussnahme aufdecken. Zu den Daten zählen Aufzeichnungen über Wahlkampfspenden und Verbindungen zwischen Politikern und Lobbyisten. Data Commons ist Grundlage für eine Reihe an Projekten, darunter das Textanalysetool Polygraft. Dieses lässt sich mit Artikeln füttern, in denen es Namen von Politikern, Unternehmen und Lobbyisten erkennt und deren Verbindungen zueinander es am Rand des Textes darstellt. Um schließlich auch Programmierer außerhalb der eigenen Organisation für das Thema Open Data zu gewinnen, veranstaltet Sunlight Labs Software- und Designwettbewerbe.


FUTUREZONE: Die Kongresswahlen waren der erste wichtige US-Urnengang, seit Open Data zum großen Thema wurde. Gleichzeitig war die Wahlkampffinanzierung so intransparent wie nie. Das muss Sie doch enttäuschen.

>>
Tom Lee: Das ist enttäuschend. Jeder, der den Einfluss von Geld auf das politische System der USA ernst nimmt, musste eine ganze Serie an Enttäuschungen einstecken, und das geht seit Jahrzehnten so. Das Citizens United-Urteil und seine Konsequenzen bedeuten allerdings ein neues Tief für den Fortschritt unserer Demokratie. Aber ich glaube nicht, dass uns das für die wichtigere Frage von Open Data demoralisieren muss. Wahlkampffinanzierung ist eine ganz spezifische Fragestellung, wenngleich eine extrem wichtige. Aber es sagt nicht unbedingt viel darüber aus, wie der Staat mit anderen Arten öffentlicher Daten verfährt.


FUTUREZONE: Open Data bedeutet Bürgern mehr Macht an die Hand zu geben. Prinzipiell waren für US-Wähler im zu Ende gegangenen Wahlkampf ja die meisten Fakten verfügbar. Dennoch war dieser weit davon entfernt, von Fakten dominiert zu sein. Kann Open Data eine objektivere öffentliche Diskussion herbeiführen?

>>
Lee: Das ist der Traum, und es wäre wunderbar, ihn wahr werden zu sehen. Aber es wichtig, realistisch zu bleiben was die Zeit betrifft, die jeder hat, um bestimmte Themen zu recherchieren. Es ist auch gar nicht nötig, dass jeder Bürger für sich die bestmöglichen Fakten analysiert, damit das Ganze positive Auswirkungen auf die Gesellschaft hat. Es macht bereits einen Unterschied, dass Informationen frei verfügbar sind und von Interessierten aufbereitet werden. Objektives, hochqualitatives Datenmaterial verbessert die öffentliche Diskussion insgesamt, auch wenn einzelne Aspekte dabei vielleicht frustrierend sind.


FUTUREZONE: Sprechen wir über Datenformate. Das US-Finanzministerium stellt den Terminplan von Finanzminister Timothy Geithner als PDF online. Bevor die E-Mails der Obersten Richterin Elena Kagan ins Web durften, wurden sie ausgedruckt, redigiert und erneut gescannt. Warum ist der Übergang zu Rohdaten so schwierig?

>>
Lee: Das hat eine Reihe an Ursachen. Für die meisten öffentlichen Bediensteten ist die Publikation von Daten zweitrangig in ihrem Job. Sie haben eine Hauptaufgabe, und die müssen sie erledigen. Es gibt zwar Tools, die ihnen bei der Datensache helfen, aber die sind zumeist dazu ausgelegt, dass Menschen das Ergebnis nutzen (und nicht Software, Anm.). PDFs sind ein gutes Beispiel. Sie sind in Wahrheit für Präsentationen gemacht, die visuelle Formatierung steht im Mittelpunkt. Sobald eine Tabelle in einem PDF vorkommt, wird es schwierig, die Daten zu extrahieren, um sie dann über ein Script oder eine automatisierte Technik weiterzuverarbeiten. Da muss zuvor noch viel Arbeit hineingesteckt werden. Es ist also eine Frage von Kapazität, Zuständigkeit und technischer Schulung.

Bei Geithner und Kagan kommt noch ein zusätzlicher Schritt hinzu: die Daten müssen auf sensible Informationen hin untersucht und redigiert werden. Und dafür fehlt es wirklich an Software. Die einfachste Art des Redigierens war es daher, die ganzen Dokumente auszudrucken, bestimmte Stellen mit schwarzem Magic Marker oder was sonst dazu verwendet wurde, herauszustreichen und die Seiten als PDFs einzuscannen. Dabei kommt dann ein Bild eines Dokuments mit Zeichen heraus. Das wiederum in eine Repräsentation von Buchstaben und Zahlen umzuwandeln, ist ein schwieriger Prozess.


FUTUREZONE: Sie schreiben in Ihrem Blog, dass der Staat nicht ausreichend Anreize für Offenheit hat. Wie ließe sich das ändern?

>>
Lee: Im Großen und Ganzen bemühen sich öffentliche Bedienstete und machen gute Arbeit. Sie reagieren einfach auf Anreize, mit denen sie konfrontiert sind. Wir haben das Problem, dass der Staat für sich zu viel Geheimhaltung beansprucht. Geheime Dokumente Jahre später zwecks Freigabe durchzuarbeiten, ist außerdem ungemein teuer. Wir müssen also die Anreize der Beamten verändern. Das könnte zum Beispiel Transparenz sein: man würde über ein Dashboard oder eine öffentliche Metrik darstellen, wie viele geheime Dokumente über den Schreibtisch eines Beamten wandern, verbunden mit einem Ziel, die Anzahl der Einstufung "geheim" zu verringern.

Nehmen Sie die Veröffentlichung der Kriegstagebücher (durch Wikileaks, Anm.). Abgesehen von Informationen über afghanische Bürger, die mit dem US-Militär zusammenarbeiten, gab es meinem Verständnis nach nur wenig wirklich Sensibles darin. Aber die Dokumente waren von vorneherein als geheim eingestuft. Die gesamte Herangehensweise an geheime Dokumente zu ändern, wäre eine andere Möglichkeit. Ich glaube es ist eine Mischung aus solchen Dingen und nichts allzu Glamouröses. Der glamouröseste Teil davon ist, dass die Regierung das Thema wichtig nimmt.


FUTUREZONE: Ihr Vorgänger Clay Johnson meinte Mitte 2009, dass die von der Obama-Regierung initiierte Website Data.gov ein guter Anfang sei, aber heiklere Daten fehlen. Wie steht es damit inzwischen?

Lee: Ich glaube, dass auf Data.gov natürlich mehr gemacht werden sollte. Und wir müssen dafür kämpfen, das zu erreichen. Ich glaube aber auch, dass man nicht einfach nur relevantere Daten verlangen sollte ohne dies genauer zu spezifizieren. Die Regierung bemüht sich wirklich, wichtige Daten ausfindig zu machen. Die Open Data Community muss ihrerseits auch mitteilen, was sie wirklich braucht.


FUTUREZONE: Michael Gurstein vom Center for Community Informatics Research nennt in einem Blogeintrag ein Beispiel aus Indien, wo Open Data gegen die arme Bevölkerung verwendet wurde. Gurstein fordert, zuerst den Zugang zu den Daten zu demokratisieren und erst dann Rohdaten in Web zu stellen. Was sagen Sie dazu?

>>
Lee: Wir müssen natürlich Themen wie die digitale Kluft und soziale Gerechtigkeit beachten, wenn wir Daten veröffentlichen. Auch ist nicht nur der Zugang zu Technologie, sondern auch jener zu Bildung und Zeit relevant. Aber es gibt dabei eben Grenzen, und die wird es noch lange geben. Auch darüber müssen wir uns im Klaren sein. Das indische Beispiel ist interessant. Es kommt ziemlich nahe an den schlimmsten Fall dessen heran, was Open Data anstellen kann. Allerdings glaube ich nicht, dass Open Data hier das Problem ist. Was passierte war, dass ein Markt - wenn wir es so nennen -, der bereits existierte, nämlich arme Leute von ihren Grundstücken zu vertreiben, plötzlich effizienter funktionierte. Man konnte die notwendigen Informationen auch davor schon über lokale Büros zusammensammeln und so das System für sich ausnutzen. Ich bin sicher, dass das auch schon passiert ist - aufgrund der höheren Kosten nur seltener. Doch nicht die Menge an plötzlich verfügbaren Informationen war Schuld, sondern das System selbst.

In der Welt der Computersicherheit gibt es den Begriff "Security through obscurity", was so viel bedeutet wie, dass nichts sicher ist, sobald jemand davon weiß. Die Landbesitzer haben gewissermaßen von "Security through obscurity" profitiert - ich sage das jetzt nicht, um jemanden die Schuld zuzuschieben. Das System verließ sich darauf, dass die Leute unzureichenden Zugang zu Informationen haben. Es ist wichtig, dass die zugrunde liegenden Systeme richtig designt sind und man nicht anstatt dessen versucht, den Informationsfluss zu kontrollieren.


FUTUREZONE: Open Data im Jahr 2020: was wünschen Sie sich?

>>
Lee: Dass Daten, die jetzt noch zurückgehalten werden oder nur gegen Entgelt zu haben sind, schließlich doch im öffentlichen Sektor landen. Ich wünsche mir auch, dass Daten zu informierten politischen Entscheidungen herangezogen werden. Der Traum von Open Daten ist es eigentlich, ein exakteres Bild der Gesellschaft und der Welt bekommen und bessere Lösungen für Probleme zu finden.

Mehr zum Thema:

"Offene Daten stärken den Wirtschaftsstandort"

(Alexandra Riegler)