Neuer Audio-Codec soll 10 Mal kleiner als MP3 sein
Facebook-Mutter Meta stellte kürzlich eine neue Methode für Audiokompression vor. Der auf künstlicher Intelligenz basierende “EnCodec” soll Audiodateien 10 Mal kleiner komprimieren als das MP3-Format. Meta will damit die Qualität von Sprachanrufen bei schlechter Verbindung verbessern. Das Format könnte aber auch für Musik eingesetzt werden.
Audio-Kompression mit 3 Schritten
Meta stellte die Technologie am 25. Oktober in einem Paper namens “High Fidelity Neural Audio Compression” vor. In einem Blogeintrag geben die Forscher*innen Einblicke in ihren Ansatz. Die Kompression besteht aus 3 Teilen: dem Encoder, der “Vector Quantizer” und dem Decoder.
Der Encoder wandelt zunächst die unkomprimierten Daten in ein Signal mit niedriger Framerate um. Der Quantizer komprimiert dann die Datei, wobei jene Informationen behalten werden, die später zum Wiederaufbau des ursprünglichen Signals gebraucht werden. Das Signal des Quantizers wird dann versendet oder gespeichert. Der Decoder wandelt die komprimierten Daten dann mithilfe eines neuronalen Netzwerks auf einer einzelnen CPU wieder in Echtzeit in das ursprüngliche Audiosignal um.
Kompression von 48Hz Stereo-Audiosignale
Eine perfekte, vollkommen verlustfreie Übertragung ist allerdings nicht möglich. “Der Schlüssel zur verlustbehafteten Komprimierung besteht darin, Änderungen zu identifizieren, die für den Menschen nicht wahrnehmbar sind”, schreiben die Forscher:innen.
Die Nutzung von neuronalen Netzwerken ist dabei nicht neu. Die Meta-Wissenschaftler*innen konnten die Methode aber erstmals auf 48Hz Stereo-Audio anwenden - ein typisches Format, in dem Musik im Internet verbreitet wird.
Methode könnte Bandbreite einsparen
Noch befindet sich das Projekt allerdings in der Forschungsphase. In Zukunft könnte damit allerdings einiges an Bandbreite eingespart werden. Das sind gute Nachrichten, besonders für Mobilfunker, deren Netze bereits unter der Last verschiedener Streamingangebote ächzen.