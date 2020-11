Während der Corona- und anderen Krisen wird wieder mehr telefoniert. Egal ob bei Telefonaten im Homeoffice, oder bei Interviews im TV, meistens klingen Stimmen dabei verzerrt. Man merkt jedenfalls sofort, wenn es sich um ein Telefonat handelt. Doch wie kommt der typische Telefonklang zustande und warum ist die Sprachqualität im Jahr 2020 oft noch derartig mies?

Frequenzbereich

"Der typische Telefonklang liegt hauptsächlich an der Einschränkung der Frequenzbandbreite", erklärt Martin Hagmüller vom Institut für Signalverarbeitung und Sprachkommunikation der TU Graz. "Von dem, was man in der direkten Kommunikation hört, wird beim Telefonieren nur ein Teil übertragen." Statt eines Frequenzumfangs von 15 bis 20 Kilohertz hört man beim Telefonieren meist weniger als 4 kHz. Im analogen Fernsprechnetz wurden Frequenzen von 300 Hertz bis 3,4 kHz übertragen.

Darüber hinausgehende Frequenzen wurden dagegen nicht als wichtig genug betrachtet, um Sprache korrekt verstehen zu können. Manche Laute kann man dadurch aber schwerer unterscheiden, etwa die Buchstaben "S" und "F". Der Frequenzbereich bis 3,4 kHz blieb trotz technischer Neuerungen, etwa der Einführung von digitaler Telefonie (ISDN) oder später der Internettelefonie (Voice over IP), weitgehend erhalten. Bei letzterer werden keine direkten Verbindungskanäle zwischen zwei Gesprächspartnern aufgebaut, sondern Sprache wird zerlegt und in Form von Datenpaketen über das Internet verschickt.

Bandbreite und Codec

"Die Sprachqualität hängt stark davon ab, welche Audiobandbreite zur Verfügung steht", sagt Hagmüller. Netzbetreiber wägen dabei selbst ab, wie viel Bandbreite sie für ein Telefongespräch freigeben, denn: "Bandbreite kostet Geld." Zwei Trends würden eigentlich zu einer Qualitätsverbesserung beitragen: Leistungsfähigere Übertragungstechnologien (etwa Glasfaser) sowie effizientere Technologien, um Sprache zu komprimieren.

Internettelefonie ist heute der gängige Weg, um Telefongespräche zu führen, sowohl im Festnetz als auch im Mobilfunk. Um Sprache in Daten umzuwandeln, werden sogenannte Codecs verwendet. "Die sind ganz auf Sprache ausgelegt, weshalb Musik am Telefon auch viel schlechter klingt", sagt Hagmüller. Bei den effizienteren Verfahren werden Artikulation (Lautbildung) und Stimmbandschwingungen getrennt. Die Stimmbandschwingungen bilden den Charakter der Stimme. "Je mehr Informationen ich über die übermitteln kann, desto natürlicher hört es sich an."

Verhandlungssache

Bei der Internettelefonie stehen viele Codecs zur Verfügung. Sie werden abhängig vom Übertragungsweg und Fähigkeiten der verwendeten Geräte gewählt. Einige Codecs unterstützen einen größeren Frequenzumfang. Die 3,4 kHz bleiben in vielen Fällen aber der kleinste gemeinsame Nenner. Der jeweils verwendete Codec kann auch mitten in einem Telefonat wechseln, etwa weil sich der Handyempfang verschlechtert. "Das hört man, wenn plötzlich die Qualität abnimmt", sagt Hagmüller.

Außerdem kann es zu Paketverlusten kommen. Dann entstehen z. B. Lücken in der Stimmwiedergabe, die automatisch überbrückt werden. "Das hat oft einen metallischen Klang." Manchmal kommen Datenpakete auch geringfügig verspätet an. Hagmüller: "Das hört sich an, als ob der Gesprächspartner plötzlich schneller redet." Dabei muss lediglich der Datenpaket-Rückstand aufgeholt werden.