Zur mobilen Ansicht wechseln »

Test Offenes Datenportal des Bundes: Best of Beta.

Foto: Screenshot data.gv.at
Für das vor kurzem präsentierte Open Data Portal des Bundes gab es viel Applaus. Das futurezone Open Data Blog hat das Angebot getestet und überprüft, inwieweit das Portal den zehn Open-Data-Prinzipien entspricht.

Vor kurzem präsentierte der Bund sein Open Government Data Portal (data.gv.at). Das vom Bundeskanzleramt initiierte und vom Bundesrechenzentrum (BRZ) umgesetzte Portal listet nicht personenbezogene öffentliche Verwaltungsdaten, die in Österreich zur Weiterverwendung freigegeben wurden, an zentraler Stelle auf. Das Open Data Blog der futurezone hat gemeinsam mit Open-Data-Experten nachgesehen, inwieweit das Angebot den zehn Open-Government-Data-Prinzipien entspricht.

Die zehn Prinzipien offener Regierungsinformationen der Sunlight Foundation gelten international als Kriterienkatalog für Open-Government-Data-Angebote (OGD) und verstehen sich als Zielvorstellungen.

1.) Vollständigkeit

Ziel: Die veröffentlichten Datensätze sollten so vollständig wie möglich sein, sie sollten Rohdaten eines Datensatzes ebenso enthalten, wie Metadaten, Formeln und Erklärungen, die den Benutzern erlauben, die Ausrichtung der verfügbaren Information zu verstehen und jedes Datenelement mit dem größtmöglichen Detailreichtum zu untersuchen.

Data.gv.at: Zu diesem Zeitpunkt - und vor allem in Abwesenheit einer entsprechenden Gesetzgebung - kann nicht erwartet werden, dass alle Datensätze zu einem Thema erschöpfend aufbereitet werden. Jedoch sollte bei den ausgewählten Daten auf die Auffindbarkeit und die Weiterverarbeitbarkeit geachtet werden. Nichtsprechende Datensatzbezeichnungen (zB: STAT_META_VK_002) und nicht vorhandene Felddokumentationen machen einen erheblichen Teil der Daten, die etwa von der Statistik Austria abrufbar wären, unauffindbar und schwer verständlich.

2.) Primärquellen

Ziel: Open Government Data sollten sich aus Primärquellen speisen. Dies schließt die ursprünglichen Quelldokumente ein.

Data.gv.at:  Besonders bei den originär dem Bund stammenden Datensätzen, wird nicht bis zu den eigentlichen Quellen "vorgearbeitet". So stellt etwa ein bloßer Link auf die, in HTML-Seiten der von der Statistik Austria redaktionell verarbeiten Daten, keine Bemühung in Richtung der Primärquellen dar. Die Daten sind in vielen Fällen in HTML-Dateien "gefangen" - dies entspricht im übrigen auch nicht dem fünften Prinzip der Maschinenlesbarkeit.

3.) Zeitliche Nähe

Ziel: Veröffentlichte Datensätze sollten der Öffentlichkeit innerhalb eines angemessenen Zeitraums zur Verfügung stehen. Echtzeit-Updates würden den Nutzen maximieren, den die Öffentlichkeit aus diesen Informationen ziehen kann.

Data.gv.at: Da das Portal erst kurze Zeit online ist, ist keine Bewertung möglich. Es werden aber in den Metadaten Updatezyklen pro Datensatz angeführt.

4.) Leichter Zugang

Ziel: Zugänglichkeit meint die Leichtigkeit, mit der Informationen eingeholt werden können. Hürden zum automatisierten elektronischen Zugang beinhalten den Zugang zu Daten nur über ausgefüllte Eingabemasken oder Systeme, die browserorientierte Technologien erfordern (z.B. Flash, Javascript, Cookies oder Java Applets). Im Gegensatz dazu macht das Herunterladen sämtlicher gespeicherter Daten auf einmal und Angebote, bestimmte Daten über eine Programmierschnittstelle (API) abzurufen, die Daten zugänglicher.

Data.gv.at: Besonders bei den originär dem Bund entstammenden Datensätzen, sind immer wieder Formulare und Abfragemasken "zwischen" Quellenlink im Katalog und eigentlichen Daten geschaltet. Damit sind diese Daten wiederum technisch hinter uneinheitlichen Masken "versteckt".

5. ) Maschinenlesbarkeit

Ziel: Informationen sollten strukturier in etablierten (offenen) Dateiformaten angeboten werden, die leicht maschinenlesbar sind. Dateien sollten von einer Dokumentation begleitet werden, die sich auf das Format bezieht und auch darauf, wie man es in Bezug auf die Daten verwendet (Stichwort: Provenance und Attribute zu Datensätzen von beispielsweise einem angebotenen CSV File).

Data.gv.at: Die Daten des Rechtsinformationssystems (RIS), des Bundesministeriums für Wirtschaft und Arbeit (BMWA), der Stadt Wien, der Open Commons Region Linz und des Landes Tirol sind großteils maschinenlesbar. In den restlichen Datensätzen finden sich allerdings XLS-, PDF- und HTML-Dateien, die nicht oder nur mit erheblichen Aufwand maschinenlesbar gemacht werden können.

6.) Diskriminierungsfreiheit

Ziel: Im weitesten Sinn bedeutet diskriminierungsfreier Zugang, dass jede Person zu jeder Zeit auf die Daten zugreifen kann, ohne sich identifizieren zu müssen oder eine Rechtfertigung für ihr Handeln abgeben zu müssen.

Data.gv.at: Entspricht voll und ganz den Grundsätzen.

7.) Verwendung offener Standards

Ziel: Die Forderung nach der Nutzung gemeinsam entwickelter (offener) Standards bezieht sich auf das Eigentum an den verwendeten Formaten. Wenn zum Beispiel nur eine einzige Firma ein Programm herstellt, mit dem man eine Datei lesen kann, in der Daten gespeichert sind, ist der Zugang zu diesen Informationen abhängig von der Nutzung des Verarbeitungsprogramms dieser Firma. Zum Beispiel ist Microsoft Excel ein recht weit verbreitetes Tabellenkalkulationsprogramm, dessen Benutzung Kosten verursacht.

Data.gv.at: Während bei der technischen Umsetzung des Portals auf Open-Source-Software gesetzt wurde, ist diese Konsequenz bei den Datenformaten abhanden gekommen. Vielfach finden sich XLS-Dateien (die zum Ausdruck und nicht zur Weiterverwendung optimiert wurden) in den Angeboten des Bundesportals.

8.) Lizenzierung

Ziel: Das Auferlegen von ‘Nutzungsbedingungen‘ wirken als Hürden für die öffentliche Verwendung von Daten. Maximale Offenheit bedeutet aber auch, dass öffentliche Informationen klar als Werk der Regierung auszuweisen sind und sie ohne Nutzungsbeschränkungen gemeinfrei verfügbar zu machen.

Data.gv.at: Die Nutzungsbedingungen sind mit den zuliefernden Ministerien und Stellen offenbar nicht abgestimmt. Für Daten, die im Katalog noch als CC-BY gekennzeichnet sind (entsprechend der Empfehlung der Cooperation OGD Österreich), stellt sich bei Recherche heraus, dass diese auf der Quellenseite mit ausschließlichen Copyrights (C) ausgewiesen sind (z.B.: Statistik Austria, AMS, ...).

9.) Dauerhaftigkeit

Ziel: Die Möglichkeit, Informationen über lange Zeit hinweg zu finden wird als Dauerhaftigkeit bezeichnet. Informationen sollten in Archiven permanent online verfügbar sein. Um eine gute und vor allem nachhaltige Verwendung durch die Öffentlichkeit zu fördern, sollten einmal online gestellte Informationen mit angemessener Versionskontrolle und dauerhafter Archivierung online bleiben. Businessmodelle, welche auf nicht dauerhaft vorhandene Daten aufbauen, sind meist zum Scheitern verurteilt.

Data.gv.at: Da es sich bei den angebotenen Daten oft um keine Primärquellen handelt, sondern "nur" auf die Onlinepräsenzen der Ministerien gelinkt wird, ist mit jedem Relaunch oder CMS-Wechsel eine "Verlust" der Daten möglich bzw. müssten die Verlinkungen seitens der Verwender nachgezogen werden, was zusätzlichen Aufwand verursacht.

10.) Nutzungskosten

Ziel: Für die Nutzung der Rohdaten sollten keine Gebühren erhoben werden. Dies verunmöglicht jedoch nicht, dass die Verwaltung für zusätzliche Services und Daten die Gestehungskosten weiterverrechnen.

Data.gv.at: Obwohl wie bei "Lizenzierung" ausgeführt, die angegeben Lizenzen z.T. widersprüchlich sind, ist davon auszugehen, dass keine Nutzungskosten auf Daten, die am Portal gelistet sind eingehoben werden.

Fazit

Es gibt noch einiges zu tun, um das Open Data Portal des Bundes, das sich derzeit noch im Beta-Betrieb befindet, als nationales Open Government Data Portal zu etablieren. Die ersten Schritte sind aber getan.

Mehr zum Thema

(futurezone) Erstellt am 30.04.2012, 11:00

Kommentare ()

Ihr Kommentar Kommentare aktualisieren
Bitte Javascript aktivieren!