Science

Google & Co.: Noch viele Probleme bei Echtzeitübersetzung

Seit den 1950er-Jahren wird intensiv an der maschinellen Übersetzung geforscht. Technologiekonzerne wie Google und Microsoft wollen die jahrzehntelang belächelte Utopie nun endlich Realität werden lassen. Microsoft experimentiert bei seinem Videotelefonie-Dienst Skype mit Echtzeitübersetzung von englischen und spanischen Gesprächsteilnehmern. Und Google will seine Übersetzungs-App „Translate“ so überarbeiten, dass die Sprache bei Handytelefonaten erkannt und von der Software in Echtzeit in eine andere Sprache übersetzt wird.

Weg bleibt steinig

Computerlinguisten bewerten die aktuellen Errungenschaften positiv, warnen aber vor verfrühter Euphorie. „Es ist in der Tat bemerkenswert, was sich allein in den vergangenen 30 Jahren im Bereich maschineller Übersetzung getan hat. Die größten Erfolge, die unter anderem durch die statistische Auswertung von vorhandenem zweisprachigem Material erreicht wurden, basieren allerdings auf schriftlicher Sprache“, sagt Ernst Buchberger vom Institut für Artificial Intelligence an der Medizinischen Universität Wien, im Gespräch mit der futurezone.

Gesprochene Sprache sei ungleich komplexer, da neben der immer noch nicht perfekt funktionierenden Spracherkennungssoftware auch der Kontext berücksichtigt werden müsse, um den Sinn zu verstehen. „Das ist das fundamentale Problem maschineller Übersetzungen“, sagt auch die Computerlinguistin Miriam Butt von der Universität Konstanz. „Es ist für einen Computer nicht trivial zu verstehen, ob mit dem mehrdeutigen Wort Bank das Finanzinstitut oder eine Sitzgelegenheit gemeint ist.“

Der oder die Clyde?

Auch in diesem Fall kann Übersetzungssoftware durch die statistische Auswertung von gesammelten Texten die wahrscheinlichste Variante errechnen – etwa wenn Bank im Sinne von Kreditinstitut meist in einem Atemzug mit Begriffen wie Geld oder Finanzen verwendet wird. Die statistische Auswertung stößt aber auch schnell an Grenzen. So gehen sowohl Google als auch Microsoft fälschlicherweise immer davon aus, dass Clyde ein Männername ist, auch wenn der zu übersetzende Satz ("The girl Clyde, who went for a ride...") eindeutig von einem Mädchen handelt.

Bing Translator
Ein weiteres Problem ist, dass die derzeit besten Ergebnisse durch den Abgleich von parallelen Text-Datenbanken erzielt werden - wie sie etwa durch die vorgeschriebene Zweisprachigkeit in kanadischen Parlamentsniederschriften gegeben sind. Auch Wikipediaeinträge und Zeitungstexte, die in verschiedenen Übersetzungen online zu finden sind, bieten wertvolle Datenpunkte. Das bedeutet allerdings, dass Sprachen wie Englisch, Deutsch oder Französisch maschinell gut erfasst sind, für exotischere Sprachen aber kaum Datenmaterial existiert.

"Minderheitensprachen werden künftig wohl noch stärker als bisher verschwinden", glaubt folglich auch Buchberger - allein deshalb, weil auch nicht das Geld und die Ressourcen aufgebracht werde, um immer wichtiger werdende Übersetzungstools entwickeln zu können.

Lernende Maschinen

Damit Übersetzungssoftware noch besser wird, muss sie ständig mit Text und Gesprächsaufzeichnungen befüttert werden. Denn nur durch die ständige Analyse und den Abgleich können bessere Algorithmen und Modelle entwickelt werden. "Es ist natürlich nicht unproblematisch, dass alles, was wir auf Twitter und Facebook schreiben oder über Skype besprechen, vermutlich im Hintergrund aufgezeichnet und ausgewertet wird", gibt auch Computerlinguistin Butt zu bedenken.

Aufgrund der Vielfalt von über 6000 Sprachen sei ein Universal-Translator kaum realisierbar bzw. noch sehr weit entfernt, ist Butt überzeugt. Vor praktisch unlösbare Aufgaben werden Maschinen zudem bei der Übersetzung von aus dem Rahmen fallenden Texten gestellt, wie etwa bei Poesie oder Literatur. "Wie misst man die Qualität einer Übersetzung? Diese Frage ist gerade bei Literatur hochspannend. Man denke nur etwa an die vielen existierenden Shakespeare-Übersetzungen und die Diskussion darüber, welche nun die beste oder schönste sei", sagt Buchberger.

Klicken Sie hier für die Newsletteranmeldung

Hat dir der Artikel gefallen? Jetzt teilen!

Martin Jan Stepanek

martinjan

Technologieverliebt. Wissenschaftsverliebt. Alte-Musik-Sänger im Vienna Vocal Consort. Mag gute Serien. Und Wien.

mehr lesen