Digital Life
06.02.2018

Warum Google Translate nichts versteht

Douglas Hofstadter widmet sich in einem Essay der Frage, warum Googles Übersetzungwerkzeug trotz "Deep Learning" seichte Ergebnisse liefert.

Douglas Hofstadter (hier im Gespräch mit der futurezone) beschäftigt sich seit Jahrzehnten mit Intelligenz, sowohl biologischer als auch technischer Natur. Von den Fortschritten lernfähiger Systeme ist er beeindruckt, noch sieht er die Menschen aber zumindest in einigen Bereichen klar im Vorteil. Das gilt etwa für das Übersetzen von Texten in eine andere Sprache, wie Hofstadter in einem Essay im Magazin "The Atlantic" beschreibt. Google Translate hat in den vergangenen Jahren unbestritten große Fortschritte gemacht. Die Zeiten, in denen selbst einfache Sätze zu unverständlichem Gebrabbel verunstaltet wurden, sind vorbei. Das liegt auch daran, dass Google neuronale Netzwerke einsetzt, die Beziehungen zwischen Wörtern statistisch analysieren können.

Diese Deep-Learning-Algorithmen haben die Ergebnisse der Textübersetzungen besser gemacht. 96 Sprachen bietet das durch Deep-Learning verstärkte Google-System mittlerweile an. Hofstadter las in Medienberichten, dass Übersetzern das Google-Translate-bedingte Aussterben drohe und beschloss, sich selbst ein Bild von den Fähigkeiten der Übersetzungsmaschine zu machen. Der Mann spricht mehrere Sprachen und unterzog Google Translate einer Prüfung in den Sprachen Englisch, Französisch, Deutsch und Chinesisch, die er alle in seinem Repertoire hat.

Versteht nichts

Seine Ergebnisse bestärkten die Vermutung, die er schon vorher hegte: Die Textanalyse der Google-Algorithmen ist vielschichtiger geworden, von echtem Verstehen ist das System aber noch weit entfernt. Der englische Satz "In their house, everything comes in pairs. Ther's his car and her car, his towels and her towels, and his library and hers." wird bei Google Translate in Französisch zu "Dans leur maison, tout vient en paires. Il y a sa voiture et sa voiture, ses serviettes et ses serviettes, sa bibliotheque et les siennes."

Googles Übersetzungssoftware ist hier in eine Falle getappt, weil es nicht berücksichtigt, dass im Französischen die Possesivpronomen nicht mit dem Besitzer, sondern mit dem Objekt in Einklang gebracht werden. In der Übersetzung geht der Sinn des Satzes damit komplett verloren. Zudem hat der Algorithmus das letzte "hers" als Plural statt als Singular aufgefasst. Hofstadter hat den Satz daraufhin korrekt ins französische übertragen: "Chez eux, ils ont tout en double. Il y a sa voiture à elle et sa voiture à lui, ses serviettes à elle et ses serviettes à lui, sa bibliothèque à elle et sa bibliothèque à lui." An einer Übersetzung dieses Ergebnisses ins Englische scheitert Google Translate aber ebenfalls: "At home, they have everything in double. There is his own car and his own car, his own towels and his own towels, his own library and his own library."

Keine Erfahrungen

Hofstadter führt diese Fehler darauf zurück, dass Menschen über eine Vielzahl an Informationen über die Dinge wie Paare, Häuser, Besitztümer, Eifersucht und andere Dinge verfügen. Google Translate verfügt hingegen über keinerlei Erfahrungen. Es handelt Ketten aus Wörtern ab, die aus Buchstaben bestehen und hat keinen Begriff davon, dass diese Wörter für Dinge oder Konzepte stehen. Hofstadter glaubt, dass es prinzipiell möglich wäre, ein System zu erschaffen, das solche Dinge berücksichtigt. Dieses Programm wäre aber ganz anders aufgebaut als Google Translate.

Hofstadter hat die maschinelle Übersetzung noch weiteren Tests unterzogen. Das deutsche Textfragment "Nach dem verlorenen Krieg sahen es viele deutschnationale Professoren, inzwischen die Mehrheit in der Fakultät, gewissermaßen als ihre Pflicht an, die Hochschulen vor den “Ungeraden” zu bewahren; am schutzlosesten waren junge Wissenschaftler vor ihrer Habilitation. Und Wissenschaftlerinnen kamen sowieso nicht in frage; über wenig war man sich einiger." aus dem Buch "Sie nannten sich der Wiener Kreis", übersetzt Hofstadter selber so: "After the defeat, many professors with Pan-Germanistic leanings, who by that time constituted the majority of the faculty, considered it pretty much their duty to protect the institutions of higher learning from “undesirables.” The most likely to be dismissed were young scholars who had not yet earned the right to teach university classes. As for female scholars, well, they had no place in the system at all; nothing was clearer than that."

Statistik ist nicht genug

Google Translate schlägt hingegen diesen Text vor: "After the lost war, many German-National professors, meanwhile the majority in the faculty, saw themselves as their duty to keep the universities from the “odd”; Young scientists were most vulnerable before their habilitation. And scientists did not question anyway; There were few of them." Es ist eindeutig erkennbar, dass Google Translate hier an seine Grenzen stößt. Hofstadter hebt vor allem Googles Verwendung des Wortes "odd" hervor. Google Translate kommt aufgrund statistischer Analyse zum Ergebnis, dass "ungerade" praktisch immer im Sinn von "nicht teilbar durch zwei" verwendet wird. Deshalt wählt es das englische "odd". Hofstadter hingegen hat verstanden, worum es in dem Text geht und eine elegante Lösung gefunden. Der letzte Satz der Google Übersetzung gibt in keiner Weise den Sinn des Originals wieder.

In Hofstadters Versuchen mit chinesischem Text schneidet Google Translate noch schlechter ab. Aber auch bei Übersetzungen zwischen europäischen Sprachen erfüllt das Übersetzungsprogramm Hofstadters Erwartungen nicht. "Einige Leser könnten auf die Idee kommen, ich hätte handverlesene Textpassagen verwendet, um Google Translate schlechtzumachen. Das ist nicht der Fall. Beinahe jeder Absatz aus Büchern, die ich derzeit lese, hat zu Übersetzungsfehlern in allen Formen und Farben geführt, darunter auch sinnlose und unverständliche Sätze", schreibt Hofstadter. Erst wenn der Tag komme, an dem eine Übersetzungsmaschine einen kunstvollen Roman in englischen Versen schreibe und dabei präzise das Versmaß einhalte, ohne auf Witz, Pathos und Ausdruck zu vergessen, werde er sich geschlagen geben.