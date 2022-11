Meta stellte die Technologie am 25. Oktober in einem Paper namens “ High Fidelity Neural Audio Compression ” vor. In einem Blogeintrag geben die Forscher*innen Einblicke in ihren Ansatz. Die Kompression besteht aus 3 Teilen : dem Encoder, der “Vector Quantizer” und dem Decoder.

Der Encoder wandelt zunächst die unkomprimierten Daten in ein Signal mit niedriger Framerate um. Der Quantizer komprimiert dann die Datei, wobei jene Informationen behalten werden, die später zum Wiederaufbau des ursprünglichen Signals gebraucht werden. Das Signal des Quantizers wird dann versendet oder gespeichert. Der Decoder wandelt die komprimierten Daten dann mithilfe eines neuronalen Netzwerks auf einer einzelnen CPU wieder in Echtzeit in das ursprüngliche Audiosignal um.

Kompression von 48Hz Stereo-Audiosignale

Eine perfekte, vollkommen verlustfreie Übertragung ist allerdings nicht möglich. “Der Schlüssel zur verlustbehafteten Komprimierung besteht darin, Änderungen zu identifizieren, die für den Menschen nicht wahrnehmbar sind”, schreiben die Forscher:innen.

Die Nutzung von neuronalen Netzwerken ist dabei nicht neu. Die Meta-Wissenschaftler*innen konnten die Methode aber erstmals auf 48Hz Stereo-Audio anwenden - ein typisches Format, in dem Musik im Internet verbreitet wird.

Methode könnte Bandbreite einsparen

Noch befindet sich das Projekt allerdings in der Forschungsphase. In Zukunft könnte damit allerdings einiges an Bandbreite eingespart werden. Das sind gute Nachrichten, besonders für Mobilfunker, deren Netze bereits unter der Last verschiedener Streamingangebote ächzen.