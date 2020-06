Der Such-Konzern aus Mountain View ist jene IT-Firma, die – neben IBM und Microsoft - die größten Anstrengungen in Sachen Spracherkennung unternimmt. Seit 2008 wird Suche via Sprache angeboten – in Form einer iPhone-App sowie in Android und dem Chrome-Browser integriert. Auch Mike Cohen, der ehemalige Gründer vom führenden Anbieter von Sprach-Software Nuance, arbeitet mittlerweile für den Konzern. Der Unterschied zum Rivalen: Während bei Apple die Suchanfragen sehr spezifisch sind, muss Google jede nur erdenkliche Anfrage verstehen und ausführen können. Google kann dafür einerseits auf seine Expertise bei der Text-Suche zurückgreifen. Man weiß, wie, wann und wonach Leute im Netz suchen, was bei der Sprach-Analyse berücksichtigt wird.

Google sammelt Sprach-Proben aus allen Regionen der Welt

Andererseits begegnet Google der Herausforderung mit brutaler Rechengewalt. Es geht nicht darum, Sprache zu verstehen, sondern deren Daten zu analysieren. Dafür hat der Konzern die weltweit wohl umfangreichste und größte Datenbank an Wortschnipseln mit geschätzten 14 Millionen Wörtern aufgebaut. Seit dem Start des Voice-Diensts werden die Anfragen der Nutzer – anonymisiert – protokolliert, mitgeschnitten und die Informationen zur Verbesserung des Systems verwendet. Zusätzlich beschäftigt das Unternehmen weltweit kleine Teams von Wissenschaftlern, die alle Regionen der Erde bereisen, um Worte, Sätze und Phrasen aufzuzeichnen. Schließlich fließen noch die Ergebnisse des Digitalisierungsprojekts Google Books ein. Denn dabei geht es nicht nur um den Erhalt von wertvoller Literatur, sondern vor allem um das Analysieren und Verstehen von Sprachen.

Geschäftige Gespräche um Nutzerbedürfnisse

Dass hinter diesen enormen Anstrengen keine altruistischen Motive stecken, darf man vermuten. Im Fall von Apple werden die Daten zur Analyse gesammelt – und zwar auch jene, die über Sprachbefehl bei Google eingegeben werden. Darauf aufbauend soll das Service verbessert werden. Parallel gibt es eine Schnittstelle (API), an der Dritt-Unternehmen, wie etwa Restaurant-Verzeichnisse oder Ticket-Shops, andocken können.

Erfolg ist ungewiss

Ob nun Apple oder Google, entscheidend für den Erfolg ist laut Wissenschaftler Tutschku vor allem das Zusammenspiel von Mensch und Technologie. Nutzer seien durch Google konditioniert, Anfragen in prägnanten Schlagworten zu formulieren. Das seien Gedankenabläufe, die man sich antrainiert hat. Ob Nutzer daher mit dem iPhone wie mit einer Person sprechen, ist fraglich. Zudem führe die Eingabe von Text in vielen Situationen meist schneller zum Ziel als das Formulieren und automatisierte Verstehen eines Satzes. Tutschku sieht Sprachbefehle daher auch langfristig nicht als Ersatz bestehender Eingabemethoden. „Der Name Personal Digital Assistant ist von Apple gut gewählt. Assistenz-Systeme sollen den Nutzer ja lediglich unterstützen und ihn nicht entmündigen.“