Produkte
04.01.2017

Warum Spracheingabe Touch ablösen soll

2017 könnte das Jahr der Sprachassistenten werden. Dabei setzt sich vor allem das relativ junge Alexa von Online-Händler Amazon durch. Doch Sprachsteuerung birgt auch Risiken.

Alexa, Cortana, Siri: Hinter den klingenden Namen stecken die wohl derzeit gefragtesten Gesprächspartner der Welt. Jeden Tag wickeln die persönlichen Assistenten von Amazon (Alexa), Microsoft (Cortana) und Apple (Siri) Millionen Anfragen ab. Mal sind es einfache Aufgaben, wie das Erstellen eines Termins im Kalender, das Suchen nach einem Restaurant in der Nähe oder das Starten der Lieblings-Playlist. Doch was 2011 als Apples Siri mit derart simplen Funktionen begann, hat sich mittlerweile zu einer ernstzunehmenden Alternative zu Touch entwickelt. Wozu mein Smartphone aus der Tasche holen, wenn ich es „rufen“ und per Sprache bedienen kann?

Alexa wird zum Standard

Dieser Trend wird vor allem auf der Consumer Electronics Show (CES) in Las Vegas, der wichtigsten Messe für Unterhaltungselektronik, deutlich. Waschmaschine, Luftreiniger, Staubsaugerroboter, Herd, Kühlschrank, Fernseher, Heizung und viele andere Geräte bekommen Sprachsteuerung spendiert. Dabei dominiert vor allem ein Hersteller: Amazon. Obwohl „Alexa“ erst vor zwei Jahren ihr Debüt feierte, scheint sich die persönliche Assistentin des Online-Händlers zu einem Branchenstandard zu entwickeln.

Apple hat seinen Vorsprung binnen kürzester Zeit verspielt. Während Apple nur sehr wenigen Entwicklern erlaubte, Funktionen für Siri anzubieten, öffnete sich Amazon komplett. Mittlerweile sind mehr als 6200 sogenannte „Skills“ im Amazon Store zu finden, die dem Sprachassistenten neue Fähigkeiten verleihen. Die Hartnäckigkeit macht sich bezahlt: Sobald Alexa auf einem bestimmten Gerät zu finden ist, ist auch der Online-Händler vertreten. Wenn die Waschmaschine also vorschlägt, neues Waschmittel zu kaufen, ist Amazon bereits zur Stelle.

Chatbots bereiten auf Sprachsteuerung vor

Neben der zunehmenden Vernetzung der Geräte ist auch die Spracherkennung deutlich besser geworden. Früher musste man einen Befehl oftmals wiederholen, bis er richtig erkannt wurde, heute haben Alexa und Co. schon das Niveau von Menschen erreicht. „Wir haben in den vergangenen 30 Monaten mehr Fortschritte erzielt als in den vergangenen 30 Jahren“, so Shawn DuBravac, Chefökonom des US-Elektronik-Branchenverbandes Consumer Technology Association (CTA). DuBravac rechnet damit, dass „Sprache der Kleber der nächsten Computer-Generation“ sein wird, ähnlich wie es bei Touch-Eingabe bei Smartphones und Tablets der Fall war.

Auch der Hype um sogenannte Chatbots begünstigt die Sprachassistenten. Die Computerprogramme, die einfache Konversationen über Messenger-Apps führen können, werden bereits intensiv zur Beratung eingesetzt. So können beispielsweise Austrian-Kunden mittels Chatbot Flüge buchen und allgemeine Fragen stellen. Diese Funktionalität kann relativ einfach auch auf Sprachassistenten übertragen werden.

Fragwürdiges Kindermädchen

Selbst das Betreuen von Kindern soll, so wünschen es sich die Hersteller, künftig der Sprachsteuerung überlassen werden. So hat Spielzeugproduzent Mattel mit „Aristotle“ ( Aristoteles) einen smarten Lautsprecher für das Kinderzimmer vorgestellt. Im Kern setzt es auf Amazons Alexa, doch Mattel hat dem Lautsprecher eine eigene Persönlichkeit verpasst.

Das digitale Kindermädchensoll den Nachwuchs per Mikrofon und Kamera überwachen und es mit Einschlafgeschichten, beruhigenden Melodien und Spielen unterhalten. Obwohl der Hersteller versichert, dass das 300 US-Dollar teure Gadget sicher sei, sollten Eltern skeptisch bleiben. Im Vorjahr wurden zahlreiche vernetzte Spielzeuge gehackt, unter anderem auch die berühmt-berüchtigte „Hello Barbie“ mit Spracherkennung und WLAN.

Unsicher und wenig vertrauenswürdig

Insbesondere die Themen Sicherheit und Datenschutz sind bei Sprachsteuerung umstritten. Denn obwohl die Systeme relativ genau verstehen, was gesprochen wurde, können sie vorerst Stimmen nicht voneinander unterscheiden. So könnten beispielsweise Unbefugte relativ einfach auf Kosten anderer einkaufen gehen. Obwohl die meisten Systeme erst nach einer bestimmten Phrase, beispielsweise „Hey Siri“, mit der Aufzeichnung beginnen, sind die Mikrofone bereits davor aktiv, um das Codewort verstehen zu können.

Die Herstellerbetonen stets, dass sie die Aufzeichnungen nicht speichern und nur dann, wenn Begriffe nicht korrekt erkannt wurden, diese auswerten. Datenschützer befürchten auch, dass man sich künftig nicht mehr sicher sein könnte, wer eigentlich zuhört. So könnten, ähnlich wie in George Orwells „1984“, Ermittler künftig statt dem Telefon oder Internetzugang die Mikrofone der Sprachsteuerung anzapfen. Das ist in gewisser Form bereits der Fall: Vergangene Woche fragte die US-Polizei bei Amazon an,weil ein Mordopfer einen smarten Amazon-Lautsprecher zuhause hatte. Amazon lehnte eine Zusammenarbeit ab.