© Andy Rain, apa

Semantisches Web
07/22/2014

BBC: "Ohne gute Metadaten sind Inhalte nutzlos"

Die BBC nutzt semantische Webtechnik zur Organisation von Inhalten und gibt Datenmodelle zur allgemeinen Nutzung frei. BBC-Daten-Architektin Sofia Angeletou im Interview.

von Patrick Dax

Sportler oder Sportereignisse, Politiker und Wahlen oder Musiker und Bands. Um die Menge an Informationen des täglichen Nachrichtenstroms zu bewältigen, setzt das öffentlich-rechtliche Medienunternehmen auf semantische Webtechnik. Inhalte werden mit Hilfe von Linked Data in Zusammenhänge gestellt und miteinander in Beziehung gesetzt. Dafür ist unter anderem Sofia Angeletou zuständig, die bei der Semantics-Konferenz, die am 4. und 5. September in Leipzig stattfindet, über Linked Data bei der BBC referieren wird. Die futurezone hat mit der Datenarchitektin über die Bedeutung von Metadaten für Medienunternehmen gesprochen.

futurezone: Was macht die BBC mit semantischen Technologien, wie zum Beispiel Linked Data?
Sofia Angeletou: Semantische Webtechnik ermöglicht es unseren Nachrichten- und Programmredakteure Inhalte in Zusammenhänge zu stellen. Sie können Nachrichten oder Programme beispielsweise bestimmten Themen, Personen oder Orten zuordnen. Sie können also Inhalte mit Anmerkungen versehen.

Was bringt das dem Publikum?
Eine von vielen Möglichkeiten sind etwa automatisch generierte Seiten zu Politikern, Bands oder Sportereignissen, auf denen entsprechende Inhalte gesammelt werden.

Seit wann arbeitet die BBC mit Linked Data?
Wir haben bei der Fußball-Weltmeisterschaft 2010, die in Südafrika stattfand, begonnen, mit Linked Data zu arbeiten. Dadurch konnten etwa Seiten zu einzelnen Teams automatisch generiert werden. Davor mussten sie von Redakteuren händisch zusammengestellt werden. Eine Fußball-Weltmeisterschaft, bei der 32 Mannschaften teilnehmen, ist noch überschaubar. Bei den Olympischen Spielen in London, bei denen mehr als 11.000 Athleten teilnahmen, hat sich der wahre Nutzen herausgestellt. Es wäre unmöglich gewesen, Seiten für jeden einzelnen Athleten händisch zusammenzustellen. Das war nur durch das automatische Erstellen dieser Indexes möglich.

Wie sind die Journalisten in diese Prozesse eingebunden?
Jedem Produkt, das Linked Data verwendet, ist ein Daten-Architekt zugeordnet, der für die Datenmodelle verantwortlich ist. Er erklärt den Journalisten welche Möglichkeiten sie haben und wie sie die Daten nutzen können und wie ihr Publikum mit diesen Daten interagieren kann. Der Aufbau solcher Modelle ist ein im hohen Maße kollaborativer und interdisziplinärer Prozess, bei dem Jouranlisten eine sehr wichtige Rolle spielen.

Wie sehen solche Prozesse im Detail aus?
Konkret geht es dabei etwa um den Aufbau von Ontologien. Ontologien sind im wesentlichen Diagramme, mit denen bestimmte Bereiche dargestellt werden. Nehmen wir zum Beispiel den Sport. Da gibt es zum Beispiel Sportarten, Teams und Wettbewerbe, an denen diese Teams teilnehmen. Es gibt Orte, an denen diese Wettbewerbe stattfinden, und Orte, an denen die Teams beheimatet sind. Das sind alles Elemente oder Einheiten aus denen sich ein bestimmter Bereich zusammensetzt. In den Ontologien werden auch die Beziehungen zwischen den einzelnen Elementen dieser Bereiche dargestellt.

Nutzen Sie diese Modelle auch, um Inhalte zu empfehlen?
Wir haben einige Forschungsinitiativen, die sich mit Empfehlungen auseinandersetzen. Ontologien sind dabei sehr wichtig. Aber auch andere Faktoren, wie etwa die Analyse von Nutzeraktivitäten spielen in diesen Bereich hinein. Unsere Forschungen dazu befinden sich aber noch in einer frühen Phase.

Die BBC gibt diese Ontologien auch zur allgemeinen Weiterverwendung frei.
Wir wollen es Personen, Organisationen und Unternehmen ermöglichen unsere Daten zu verwenden. Die Ontologien sind ein erster Schritt in diese Richtung. Wer will, kann diese Ontologien in seine Systeme integrieren. und kann so auch mit unseren Daten kommunizieren. Es können aber auch nur Teile der Ontologien verwendet und auch für eigene Zwecke adaptiert werden. Wir werden in Zukunft aber auch noch weitere Daten freigeben.

Welche Rolle spielen Open Data bei der BBC?
Die BBC wird durch Gebühren finanziert und ist dazu verpflichtet, der Öffentlichkeit so viel wie möglich zurückzugeben. Wir haben auch ein Memorandum of Understanding mit verschiedenen Organisationen aus dem Open Internet-Bereich unterzeichnet.

Wie wichtig sind Metadaten für Medienunternehmen wie die BBC?
Sehr wichtig. Ohne gute Metadaten sind Inhalte nutzlos, denn sie werden nicht gefunden. Welchen Wert haben Inhalte, die nicht abgerufen werden? Gute Metadaten tragen dazu bei, dass der Zugang zu Inhalten verbessert wird.

Wie verändern semantische Technologien die Rolle der BBC im medialen Ökosystem?
Unsere Journalisten und Redakteure sind sehr an diesen Methoden interessiert, weil sie sehen, dass semantische Technik ihnen bei ihrer Arbeit hilft und dazu beiträgt, dass sie ihr Publikum erreichen.