Female hands typing on laptop keyboard and holding smartphone

© Getty Images/iStockphoto / Milkos/iStockphoto

Apps
10/27/2019

Nie wieder tippen: Speech-to-Text-Apps für iOS und Android

Diktieren statt tippen kann ich vielen Fällen Zeit und Mühe sparen. Viele Apps leisten hier mittlerweile sehr gute Arbeit.

von Amir Farouk

Texte verfassen, ohne einen Finger rühren zu müssen. Von Autoren bis Schülern gibt es sicher viele, die davon träumen. In Sachen Nutzung ist das Konzept gleich aus mehreren Gründen noch nicht allzu stark verbreitet. So funktionierte das Diktieren von Nachrichten auf Smartphones anfangs eher mäßig. Spracheingaben lieferten zu oft falsche Ergebnisse und sorgten am Ende für jede Menge Frust und noch mehr Aufwand. Außerdem konnten nur die wenigsten Anbieter kontinuierlich zuhören. Die vollumfängliche Abhängigkeit von einer etwaigen Netzwerkverbindung erschwerte entsprechende Einsätze zusätzlich.

Dank großer Weiterentwicklungen im Bereich Sprachassistenz und künstlicher Intelligenz hat sich hier glücklicherweise einiges getan. Die Erkennung von Worten stellt heutzutage nur noch selten ein Problem dar. Gleichzeitig lernen Sprachassistenten und Diktierapps durch künstliche Intelligenz beim Zuhören auch noch mit und verbessern sich laufend. Ein Umstand, der Speech-to-Text-Apps qualitativ auf ein ganz neues Level gehoben hat.

Dragon Anywhere

Laut dem Anbieter der Diktierservice mit der höchsten Erkennungsgenauigkeit, ist Dragon tatsächlich einer der beliebtesten Services in diesem Feld. Der simple Aufbau in Kombination mit einer Handvoll Features, die den Betrieb erleichtern, machen die App zu einem runden Speech-to-Text Angebot. Im Grunde sieht Dragon Anywhere nicht viel anders als eine handelsübliche Notiz-App aus. Im Dashboard werden sämtliche Texte einzeln gesammelt. Dort können sie auch verwaltet und gegebenenfalls auf Inhalte durchsucht werden.

Was Dragon Anywhere aber besonders macht, ist die fehlende Längenbeschränkung. Statt ständige Unterbrechungen für eine etwaige Verarbeitung in Kauf nehmen zu müssen, hört uns Dragon bis zur Besinnungslosigkeit zu. Laut Entwickler liegt die Erkennungsrate der App bei 99 Prozent. Außerdem lernt die Anwendung bei jedem gesprochenen Wort kontinuierlich mit.

Branchenspezifische Termini lassen sich außerdem extra hinterlegen, um fehlende Worte reibungslos integrieren zu können. Im Zusammenspiel mit dem professionellen Desktop-Tool von Dragon, können sämtliche Text dann auch reibungslos über Cloud-Dienste geteilt und auch synchronisiert werden.

Dragon Anywhere ist kostenlos für iOS und Android erhältlich. Zur vollumfänglichen Verwendung ist ein Abonnement für 14,99 Euro im Monat oder 149,99 Euro im Jahr notwendig.

Just Press Record

Wer auf fokussierte Apps steht, wird mit Just Press Record eine Freude haben. Die Anwendung setzt auf ein einfaches und optisch äußerst aufgeräumtes Bedienkonzept. Statt überbordender Einstellungsmöglichkeiten oder übertriebenen Visualisierungen gibt es hier reine Speech-to-Text-Verarbeitung. Aus dem Dashboard heraus kann über den auffällig roten Aufnahmeknopf die Transkription gestartet werden. Just Press Record verwandelt sich dann in eine Sprachaufnahme-App und hört einfach nur zu.

Transkribieren in Echtzeit ist leider nicht möglich. Stattdessen wir sämtlicher Input als Audio-File gespeichert und erst im Nachhinein in Text verwandelt. Möchten wir nur bestimmte Stellen aus einer Aufnahme verwenden, können diese direkt danach herausgeschnitten werden. Beschränkungen bei der Aufnahme gibt es nicht. Über die entsprechenden Knöpfe kann jederzeit pausiert und gestoppt werden.

Sämtliche Aufnahmen inklusive erstelltem Text werden dann im Dashboard gesammelt und bleiben dort abrufbar. Hier können dann sowohl die Audioquelle sowie die dazugehörige Transkription abgerufen werden. Besitzer einer Apple Watch können auch diese in Kombination mit Just Press Record nutzen, um unkompliziert Texte zu diktieren. Die angefertigten Aufnahmen werden dann automatisch auf dem Smartphone weiterverarbeitet.

Just Press Record ist um 5,49 Euro für iOS erhältlich.

Speechnotes

Auch Speechnotes setzt auf ein möglichst einfaches und kompaktes Konzept. Das Design erinnert auch hier eher an eine klassische Notiz-App, die sonst mit der Tastatur befüllt wird. Aufgenommen wird ganz einfach über das Mikrofon-Symbol. Beim Start beginnt Speechnotes mit dem Zuhören und wandelt das Gehörte on-the-fly in lesbaren Text um. Automatische Groß- und Kleinschreibung sind standardmäßig aktiv und auch Interpunktion lässt sich ansagen.

Wer das Gerät aber sowieso die ganze Zeit in Händen hält, kann Satzzeichen auch bequem über eine eigens abgespeckte Tastatur einfügen, um beispielsweise den Redefluss nicht zu stören. Im Hintergrund der App werkelt Googles hauseigener Spracherkennungsdienst. Mit ein Grund, warum die App lediglich für Android verfügbar ist. Da Googles Spracherkennung auch vom Internet abhängig ist, ist das Offline-Arbeiten zwar möglich aber nur bedingt empfehlenswert.

Die Genauigkeit der Ergebnisse leidet nämlich unter einer fehlenden Netzwerkverbindung. Auch beim Datenschutz hat der Einsatz Vor- und Nachtteile. Zwar muss nicht einem unbekannten Hersteller durchwegs vertraut werden, Google kommt aber immerhin mit den Daten in Kontakt. Ein Umstand, der nicht bei allen Nutzern auf Gegenliebe stößt.

Speechnotes ist kostenlos für Android erhältlich.

Transcribe

Um sich von den vielen auf dem Markt verfügbaren Speech-to-Text Apps abheben zu können, braucht es auch mal ein paar Extra-Features. Transcribe versucht es hier unter anderem mit dem Verschriftlichen von Medieninhalten und einer eigenen künstlichen Intelligenz. Die nicht einmal 100 Megabyte große Anwendung bietet ein äußerst übersichtliches Dashboard, in dem alle Notizen und andere Inhalte gesammelt werden.

Dazu zählen unter anderem auch Videos und Sprachmemos. Wer beispielsweise ein Interview mit der Smartphone-Kamera aufzeichnet und dieses transkribieren möchte, kann Transcribe einfach damit füttern. Die App ackert sich dann eigenständig durch das bereitgestellte Video und wirft nach vollendeter Arbeit ein dazu passendes Textdokument aus. Dasselbe gilt auch für Sprachmemos, die unkompliziert importiert werden können und dann automatisch in Text verwandelt werden.

Transcribe ist kostenlos für iOS erhältlich.

SayHi und iTranslate Converse

Wenn es um Features geht, haben auch iTranslate Converse und SayHi etwas Besonderes zu bieten. Im Gegensatz zu all den anderen Speech-to-Text-Apps fixieren diese sich nämlich nicht auf eine einzige Sprache. Stattdessen sind die Apps auch für mehrsprachige Konversationen und Diktate geeignet. Um Sprache aufzunehmen, muss lediglich der helle Knopf im Hauptbildschirm gedrückt werden. Sobald wir fertig sind, lassen wir ihn einfach wieder los. Statt mühselig jedes Mal die Sprache wechseln zu müssen, übernimmt iTranslate aber auch die Sprachwahl.

Das Switchen zwischen Deutsch und Englisch muss als nicht jedes Mal per Hand erfolgen. Die Übersetzung der jeweiligen Sprachen findet immer in Echtzeit statt. Langes Warten auf Transkription und Übersetzung gibt es hier also nicht. Sämtliche Aufzeichnungen können am Ende exportiert werden, um die Texte dann etwa in einer Notiz-App ablegen zu können. Ein eigenes Dashboard zur Verwaltung gibt es hier, aufgrund des Fokus auf Echtzeit-Übersetzungen, nicht.

SayHi ist kostenlos für iOS und Android ernhältlich. iTranslate Converse ist kostenlos für iOS erhältlich.

Fazit

Den Status der fehleranfälligen Technologie haben Speech-to-Text-Apps schon lange abgegeben. Sowohl die kostenlosen als auch die kostenpflichtigen Anbieter leisten sehr gute Arbeit und verwandeln gesprochene Inhalte fast durchwegs in entsprechende Texte. Die vielen verschiedene Extra-Features wie etwa Übersetzung und Transkription von Videos erleichtern die Arbeit zusätzlich.