© Helmut Lunghammer / Lunghammer/TU Graz

Science
07/08/2019

Wie man ohne Kehlkopf sprechen kann

Ein elektronisches Gerät der TU Graz gibt Menschen ohne Stimmbänder eine natürlich klingende Stimme

von Martin Stepanek

Die Diagnose Kehlkopfkrebs hat für Betroffene weitreichende Folgen. Wenn der Kehlkopf entfernt werden muss, fehlt nicht nur die „Weiche“, die beim Schlucken die Luftröhre verschließt. Durch die dann nicht mehr vorhandenen Stimmbänder verlieren die Patienten auch die Möglichkeit, zu sprechen. Dieser Verlust hinterlässt bei vielen nicht nur ein Trauma, sondern führt oft auch zu sozialer Isolation.

Einfache Sprechhilfe

Im Rahmen des Projekts „HumanEVoice“ entwickeln Wissenschaftler der TU Graz eine elektronische Sprechhilfe, die nicht nur menschlicher als bestehende Lösungen klingt, sondern auch einfacher zu bedienen ist. Elektronische Sprechhilfen existieren seit den 1960er-Jahren in praktisch unveränderter Funktions- und Bauweise. Dabei wird ein Gerät mit einer vibrierenden Membran an den Hals gehalten.

Die dadurch erzeugten Schallwellen bringen das Gewebe im Rachen- und Mundraum ähnlich der Stimmbänder zum Schwingen. Artikuliert man nun mit Zunge und Mund, ist das Gesprochene über den künstlich angeregten Ton hörbar.

Schlechte Qualität

„Da die Geräte üblicherweise nur eine bestimmte Frequenz erzeugen, klingt das Sprechen allerdings monoton und unnatürlich. Dazu kommt, dass diese Ersatzstimmen im Normalfall tief und männlich klingen, was gerade für betroffene Frauen ein zusätzliches soziales Stigma bedeutet“, erklärt Projektleiter Martin Hagmüller vom Institut für Signalverarbeitung und Sprachkommunikation der TU Graz.

So kann es etwa zu Problemen kommen, wenn sich Frauen am Telefon  für Bankgeschäfte ausweisen müssen  und als Mann identifiziert werden. „Vielen ist der männliche Stimmklang in der Öffentlichkeit einfach auch peinlich. Elektronische Sprechhilfen werden von Frauen daher kaum benutzt“, sagt Hagmüller.

Natürliche Stimme

Gemeinsam mit der Forscherin Anna Katharina Fuchs und der Genderexpertin Corinna Bath von der TU Braunschweig suchten die Projektentwickler in den vergangenen drei Jahren nach Wegen, wie man eine natürlichere menschliche Sprachmelodie erzeugen kann, die auch Eigenheiten von Frauenstimmen reproduziert.

„Einfach die Frequenz zu erhöhen, um die Stimme weiblicher klingen zu lassen, ist leider nicht die Lösung. Denn die Stimme hört sich dann noch künstlicher und unangenehm mechanisch an. Auch die Durchsetzungskraft und Hörbarkeit nimmt mit zunehmender Tonhöhe ab“, erklärt Hagmüller.

Weibliche Eigenheiten

Um Stimmen mit einem möglichst menschenähnlichen Klang zu erzeugen, setzen die Forscher auf künstliche Intelligenz. Die Software wird mit Aufnahmen gesunder Stimmen gefüttert und berechnet die Parameter für einen natürlichen Stimmklang. Frauenstimmen etwa klingen in der Regel etwas behauchter, weil die Stimmbänder länger als bei Männern geöffnet bleiben.

Darüber hinaus müssen auch die sogenannten Formanten berücksichtigt werden. Das sind die Resonanzkörper in Mund und Rachen, die eine Tonhöhenveränderung bewirken können, wenn die Stimmbänder fehlen. Auch die Sprachmelodie, die kulturell geprägt ist, wird bei der Simulation von der Software berücksichtigt.

Raspberry Pi als Herzstück

Herausgekommen ist bei dem von der Forschungsförderungsgesellschaft (FFG) unterstützten dreijährigen Projekt ein erster Prototyp, der wesentliche Verbesserungen zu bestehenden elektronischen Sprechhilfen aufweist. Das Herzstück bildet der Minicomputer Raspberry Pi, der den Stimmklang während des Sprechens in Echtzeit analysiert und dem Vorbild gesunder Stimmen anpasst.

Beim Schallgeber, der den Rachenraum zum Klingen bringt, setzen die Forscher auf modernere Technologie, die wesentlich kleiner und energieeffizienter arbeitet. Damit soll Betroffenen, die viel sprechen, das Akku-Wechseln nach wenigen Stunden erspart werden. Anders als bestehende Lösungen, die stets mit der Hand an den Hals geführt werden müssen, kann der Prototyp zudem mittels Halsband getragen werden. Damit bleiben beide Hände für Tätigkeiten frei.

Drahtlose Bedienung

Das Ein- und Ausschalten des Geräts soll zudem drahtlos erfolgen. Im Moment gibt es dafür einen Taster, der bedient werden kann. Künftig wäre aber denkbar, den Ein- und Ausschalter in einem Ring zu verbauen.

Als herausfordernd hat sich weiterhin die Lautstärke erwiesen. Damit die künstliche Stimme auch in höheren Tonlagen und in lauteren Umgebungen besser hörbar ist, kommen kleine Verstärkermodule zum Einsatz. Die für die Zielgruppe auf dem Markt verfügbaren Geräte seien aber nicht auf dem Letztstand der Technik, erklärt Projektleiter Hagmüller, der in diesem Bereich  auf bessere Produkte hofft.

„Fast wie früher“

In ersten Testversuchen konnten Betroffene eine persönliche Stimme finden, die ihrem Klangideal am nächsten kam und auch für Außenstehende angenehm klang. „Dass die Ehefrau einer Testperson sagte, jetzt klinge ihr Mann ja fast wie früher, hat uns sehr berührt“, teilt Hagmüller eine besonders vielversprechende Erfahrung.

Der Forscher hofft nun, dass der Prototyp mit einer ambitionierten Firma bis zur Serienreife weiterentwickelt werden kann. Neben den etablierten Unternehmen, die bereits im Bereich elektronische Sprechhilfe tätig sind, sieht Hagmüller vor allem auch Start-ups als potenzielle Partner.

Sprechen ohne Stimmbänder

Es gibt drei verbreitete Methoden, wie Menschen ohne Kehlkopf bzw.  ohne Stimmbänder sprechen können:

Eine etablierte Methode ist die sogenannte Ruktusstimme, die auch Speiseröhrenstimme genannt wird. Dabei wird Luft geschluckt und ähnlich wie beim Rülpsen wieder nach oben befördert. Geschieht dies kontrolliert, lassen sich praktisch ohne technische Hilfsmittel Wörter und Sätze formulieren. Abgesehen davon, dass sich manche Betroffene für diese Art der Erzeugung in der Öffentlichkeit schämen, ist die Ruktusstimme für manche schwierig zu erlernen. Auch können mit ihre meist nur kurze Sätze mit wenigen Worten formuliert werden. Ein Vorteil ist, dass  beide Hände beim Sprechen frei bleiben.

Als zweite Variante wird ein Ventil zwischen Luftröhre und Speiseröhre platziert. Diese Stimmprothese kann Luft von der Lunge in den Rachenraum umleiten und bei Zuhalten der künstlichen Halsöffnung (Tracheostoma) einen Ton in der Speiseröhre zum Sprechen erzeugen. Das Ventil ist allerdings anfällig für Verunreinigungen und kann undicht werden. Zudem muss es in Abständen von wenigen Monaten ausgetauscht werden. Da die  im Rachenraum erzeugten Schwingungen eine tiefe Frequenz aufweisen, klingt die Stimme  entsprechend rau und tief, was gerade für betroffene Frauen unangenehm sein kann.

Als dritte Methode haben sich elektronische Sprechhilfen etabliert. Diese Geräte imitieren die menschlichen Stimmbänder, indem sie Schallwellen von außen durch den Hals in den Rachen leiten und ihn dadurch zum Schwingen bringen. Auf Basis dieser Tonerzeugung können  schließlich Worte und Sätze formuliert werden. Bestehende Lösungen sind allerdings meist unhandlich, haben eine kurze Akkudauer und simulieren männlich klingende Stimmen. Diese Nachteile will die TU Graz beheben.

Diese Serie erscheint in redaktioneller Unabhängigkeit mit finanzieller Unterstützung der   Österreichischen Forschungsförderungsgesellschaft (FFG).