B2B
16.04.2015

„Spracherkennung ist immer noch sehr rechnerintensiv“

Die Wiener Firma Speech Processing Solutions zeichnet für Philips-Diktierlösungen verantwortlich. Durch die Cloud ergeben sich völlig neue Software- und Service-Möglichkeiten.

Am Anfang, in den 50er-Jahren, standen Philips-Diktiersysteme mit Band, seit 1996 wird mit dem SpeechMike eines der weltweit am häufigsten verkauften Diktiermikrofone vertrieben. Hinter dem SpeechMike und entsprechender Software- und Hardware-Lösungen, welche das Transkribieren und Verarbeiten der Aufnahmen erleichtern sollen, steckt die 2012 von Philips verkaufte Firma Speech Processing Solutions, die seit jeher in Wien ihr Hauptquartier hat.

Diktieren in der Cloud

War der Fokus lange Zeit auf Hardware, will das Unternehmen nun vermehrt mit Services punkten. Im Mittelpunkt steht dabei die Plattform SpeechLive, die den gesamten Diktier-Workflow in die Cloud verschiebt. „SpeechLive ermöglicht es Usern, ihre Diktate von überall auf der Welt hoch- und herunter zu laden bzw. diese zur weiteren Bearbeitung mit anderen zu teilen“, sagt Erik Domaracki, Product Manager von Speech Processing Solutions, im Gespräch mit der futurezone. Auch die Transkription kann über die Cloud erfolgen – über eigene Schreibkräfte oder einen externen Service namens SpeechScribe, den die Firma seit kurzem anbietet.

„Der größte Vorteil der Cloud ist, dass die lokale Software-Installation auf Rechnern entfällt, was gerade in Unternehmensnetzwerken sonst mit einem beträchtlichen Zeitaufwand verbunden ist. Die Plattform ist webbasiert, im Prinzip kann man nach wenigen Minuten starten und auch problemlos neue oder temporäre Berechtigungen für weitere Personen freischalten“, erklärt Domaracki. Da die Diktierlösung vor allem von Ärzten in Praxen und Krankenhäusern sowie von Juristen in Kanzleien eingesetzt werde, seien teilweise bis zu mehrere Dutzend Personen involviert.

Verschlüsselung

Bedenken hinsichtlich Sicherheit und Datenschutz versucht das Unternehmen mit einer Reihe von Maßnahmen zu zerstreuen. Ein wesentlicher Punkt ist die Verschlüsselung der Inhalte. „Die Diktate werden bereits während der Aufnahme verschlüsselt, dann ein weiteres Mal wenn sie versendet werden sowie beim Abspeichern in unserem Online-Speicher“, sagt Domaracki. Rechtlich gesehen gebe es jedenfalls kein Verbot, Daten in der Cloud zu speichern. Die Lösung sei zudem von Philips in einem strengen Prüfungsverfahren zertifiziert worden.

Bei der dahinterliegenden Cloud-Plattform setzt das Unternehmen auf Microsofts Cloud-Lösung Azure. Diese habe man gewählt, weil sie die meisten Optionen in puncto SQL-Services und Storage geboten habe, aber auch, da Microsoft über geografisch zuordenbare Datencenter verfüge. „Somit können wir den Anforderungen von Kunden entsprechen, die ihre Daten nicht außerhalb der eigenen Landesgrenzen speichern wollen“, ergänzt Wolfgang Spannlang, Senior Product Manager bei Speech Processing Solutions.

Zukunft der Spracherkennung

Auch im Bereich der Spracherkennung könnte die Cloud und die damit verbundene Server- und Rechenpower für gänzlich neue Möglichkeiten sorgen, wie Sprachassistenten von Apples Siri bis zu Googles Spracherkennung und Microsofts Cortana bereits erkennen lassen. „Brauchbare Spracherkennung existiert bereits seit Mitte, Ende der 90er-Jahre, das Problem ist aber auch heute immer noch, dass die Technologie sehr rechnerintensiv ist“, sagt Spannlang. Über die flexible Skalierung in der Cloud könne man dieses Problem in Zukunft allerdings in den Griff bekommen.

Derzeit kann die Spracherkennungssoftware Nuance, die auch für Siri verantwortlich zeichnet, mittels entsprechender Schnittstelle an das System von Speech Processing Solutions angedockt werden. Eine vollständige Integration in die Cloud-Lösung sei für die Zukunft aber vorstellbar, so die Produktmanager.

Disclaimer: Das Interview mit Speech Processing Solutions fand am Rande einer von Microsoft organisierten Diskussionsveranstaltung zum Thema "So sicher ist die Cloud" statt, bei der die futurezone als Medienpartner berichtete.