Science 10.03.2013

Semantic Web: Auswege aus der Sprachverwirrung

Was für die einen ein CX-7 ist, ist für andere schlicht ein Sportwagen. Zwischen dem Sprachgebrauch von Unternehmen und ihren Kunden liegen oft Welten. Semantische Technologien sollen dabei helfen, die "babylonische Sprachverwirrung" aufzulösen.Sie kommen auch bei Apples Spracherkennungssoftware Siri oder IBMs Supercomputer Watson zum Einsatz.

X1S, H4, DSRL oder Sparschiene. Ob bei Autos, Smartphones, Kameras oder Fahrkarten, Kunden, die Produkte suchen, haben es nicht einfach und müssen sich nicht selten in das Vokabular der Hersteller einlernen. "Vor allem die technisch orientierten Firmen haben noch nicht ganz verstanden, dass sich nicht jeder für ihr Vokabular interessiert", sagt Andreas Blumauer von der Wiener Semantic Web Company. Verständigungsschwierigkeiten bestehen aber nicht nur zwischen Unternehmen und Kunden, sondern auch innerhalb von Firmen. "In großen Konzernen hat jedes Produkt im Schnitt sieben verschiedene Namen", sagt Blumauer: " Ein und dasselbe Produkt wird in der Marketing-Abteilung, im Verkauf oder in der Forschungs- und Entwicklung unterschiedlich bezeichnet. Mitarbeiter sitzen an einem Tisch, und wissen bei Besprechungen oft nicht wovon die Rede ist."

Das Wiener Unternehmen, das internationale Konzerne und Organisationen zu seinen Kunden zählt, setzt bei der Auflösung der Sprachverwirrung auf semantische Technologien:  "Wir wollen die Vielfalt durchaus unterstützen, sie aber in die verscheidenen Lebens- und Denkwelten übersetzen", sagt Blumauer.

Wissensmodelle
Vereinheitlicht wird nicht der Name, sondern das Konzept dahinter. Begriffe werden nach Bedeutungen gruppiert. Zwischen verwandten Themen werden inhaltliche Zusammenhänge hergestellt. Auf diese Art werden Produkten unterschiedliche Bezeichnungen zugeordnet und mit Zielgruppen und Produktionsstandorten in Zusammenhang gesetzt.

Beim Aufbau der Wissenmodelle erfolgt mithilfe entsprechender Tools in den Unternehmen selbst und kann mittels Programmierschnittstellen in unterschiedliche Unternehmensdatenbanken eingebunden werden. "Für einen Würstelstand zahlt sich so ein Aufwand nicht aus,  Für große Unternehmen mit zehntausenden Kunden und einem umfangreichen Produktportfolio aber sehr wohl", sagt Blumauer.

Kundenwünsche verstehen
Das Wissensmodell wird nicht nur auf unternehmensinterne Daten und Inhalte angewandt, sondern hilft auch dabei Feedback von Kunden zu analysieren und so Kundenwünsche besser verstehen zu können. Suchbegriffe, die auf der Unternehmens-Website eingegeben werden, werden dabei ebenso analysiert wie Postings in Online-Netzwerken wie Twitter oder Facebook.

"Unternehmen sind an Social Media stark interessiert, weil da sehr viel erhoben werden kann", sagt Blumauer. So werden beispielsweise auch Twitter-Hashtags in Wissensmodelle integriert und mit Produkten in Verbindung gesetzt. Ein Autohersteller werde etwa neben Hashtags zur Fahrzeugkategorie (etwa Sportwagen, Familienwagen, Kleinwagen) auch Produktbezeichnungen und Modelle der Konkurrenz in seinen Wissensgraphen aufnehmen.

"Man versucht die Bedürfnisse der Kunden zu verstehen und seine Ausdrucksweisen und Begriffe zu verwenden", sagt Blumauer. Die auf diese Art gewonnenen Erkenntnisse fließen auch in die Entwicklung neuer Produkte ein. "Es geht darum, herauszufinden, was Kunden wollen und diese Informationen an verschiedene Abteilungen im Unternehmen weiterzueleiten, die dann dafür Lösungen suchen."

Google Knowledge Graph
Solche Wissensmodelle kommen etwa auch bei Google zum Einsatz. Anfang Dezember schaltete der Suchmaschinenprimus seinen Knowledge Graph, der davor nur für den englischsprachigen Raum verfügbar war, auch für für die deutschsprachige Google-Suche frei.

Googles Datenbank beinhaltet zwar bereits mehr als 500 Millionen Personen, Orte oder Dinge, die in dem Knowledge Graphen zueinander in Beziehung gesetzt werden, im Vergleich zum Weltwissen ist sie aber allenfalls rudimentär. Wissensgraphen für Unternehmen, die weit geringere Datenmengen verarbeiten, lassen sich dagegen rasch erstellen. Ein Automobilhersteller habe im Vergleich dazu etwa ein Vokabular von rund 100.000 Begriffen, sagt Blumauer.

Aber auch bei Spracherkennungssystemen wie Apples Siri oder IBMs Supercomputer Watson, der im Gesundheitsbereich eingesetzt wird, kommen solche semantischen Technologien zum Einsatz. "Da stehen riesige Wissensgraph dahinter", sagt Blumauer:  "Netzwerke von Dingen, die semantisch miteinander verknüpft sind." Bei solchen semantischen Systemen werden nicht mehr nur Wortfolgen durchsucht. Der Computer erkennt Bedeutungen und Beziehungen und kann im Gegensatz zu herkömmlichen Suchmaschinen auch Fragen verstehen und beantworten.

"Dem Computer Fragen stellen"
"Wenn ich etwa frage, `wann kommt der nächste Rex?`, dann weiss das System, dass wahrscheinlich der Regionalexpress und nicht ein Hund gemeint ist", sagt Blumauer. Grundvoraussetzung dafür sei, dass beide Bedeutungen auch im Wissensgraphen hinterlegt sind. Das System versuche  aus dem Zusammenhang zu erkennen, was gemeint sein könnte. "Wenn es um den Zeitfaktor geht, wird wahrscheinlich der Zug gemeint sein", erläutert Blumauer. Gehe es um Befindlichkeiten, wie etwa bei der Frage "Wie geht es dem Rex?", seien wahrscheinlich Lebewesen gemeint.

Auch Googles Knowledge Graph soll künftig vollständige Fragen verstehen. Wenn man miteinander rede, verwende man ja auch nicht nur einzelne Schlagwörter, meint Blumauer: "Wir müssen uns daran gewöhnen, dass wir auch dem Computer Fragen stellen können."

Mehr zum Thema

  • Google bringt Knowledge Graph nach Österreich
  • Suchloses Finden
  • Theseus: "Bessere Suchergebnisse als Google"
( futurezone ) Erstellt am 10.03.2013