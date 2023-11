10.11.2023

Durch Künstliche Intelligenz lassen sich manche Geräusche herausfiltern, während andere weiterhin gut hörbar sind.

Kopfhörer mit aktiver Geräuschunterdrückung können ganz schön gefährlich sein. Vielleicht überhört man ein herannahendes Auto, wenn man die Straße überquert. Oder die Mutter, die einen ruft, weil man etwas ausgefressen hat, und man daher nicht flüchtet. Forscher*innen haben daher eine Künstliche Intelligenz entwickelt, die bestimmte Geräusche durchlässt, während andere unterdrückt werden. 20 Geräuschklassen können ausgewählt werden "Semantisches Hören" nennt das Team von der University of Washington das System. Die Kopfhörer übertragen die aufgenommenen Audiosignale an ein angeschlossenes Smartphone, das zunächst alle Umgebungsgeräusche ausblendet. Über Sprachbefehle oder eine Smartphone-App können die Träger*innen dann 20 Geräuschklassen auswählen, die sie trotz Geräuschunterdrückung hören möchten. Als Kategorien gibt es etwa Sirenen, Babygeschrei, Sprache, Staubsauger und Vogelgezwitscher. Die ausgewählten Geräusche werden dann über die Kopfhörer wiedergegeben. All das passiert in Echtzeit.

"Zu verstehen, wie ein Vogel klingt und ihn aus allen anderen Geräuschen in der Umgebung herauszufiltern, erfordert eine Echtzeit-Intelligenz, die die heutigen Kopfhörer mit Geräuschunterdrückung nicht bieten können", sagt der Hauptautor der Studie, Shyam Gollakota, in einer Aussendung. "Die Herausforderung besteht darin, die Geräusche, die die Träger*innen der Kopfhörer hören, mit ihrem visuellen Sinn zu synchronisieren. Man kann die Stimme einer Person nicht erst nach 2 Sekunden hören, nachdem sie mit einem gesprochen hat. Das bedeutet, dass die Algorithmen Töne in weniger als einer Hundertstelsekunde verarbeiten müssen." Cloud-KI wäre zu langsam Aufgrund dieses Zeitdrucks müssen die Daten auch am Smartphone verarbeitet werden. Die Daten in die Cloud zu schicken und sie dort von Servern auswerten zu lassen, würde zu viel Zeit in Anspruch nehmen. Da Geräusche aus unterschiedlichen Richtungen und Entfernungen in den Ohren der Menschen ankommen, muss das System diese Räumlichkeit ebenso darstellen können, damit die Menschen die Geräusche sinnvoll zuordnen können.