© Adobe

Software

VoCo: Adobe demonstriert erstmals "Photoshop für Audio"

Adobe hat im Rahmen seiner Konferenz "Adobe Max" in San Diego erstmals seine neue Audio-Software demonstriert, mit der Sprachaufnahmen bearbeitet werden können. Die dahinter stehende Technologie trägt vorerst den Namen VoCo ("Voice Conversion") und wurde im Vorfeld bereits als "Photoshop für Audio" bezeichnet. In einem knapp sieben Minuten langen YouTube-Video ist zu sehen, wie in Echtzeit Aufnahmen des Comedians Jordan Peele bearbeitet werden. So wird aus dem Satz "Ich habe meine Hunde und meine Frau geküsst" mit wenigen Handgriffen der Satz "Ich habe Jordan dreimal geküsst".

Das Bearbeiten ist relativ einfach, die in der Aufnahme gesagten Wörter werden erkannt und können in einem Texteditor bearbeitet werden. So ist es möglich, Wörter nach Belieben zu entfernen, hinzuzufügen oder den Satz umzustellen. Dazu werden die Sprachaufnahmen in Phoneme zerlegt, der kleinsten bedeutungsunterscheidenden sprachlichen Einheit. Auf Basis der gesammelten Phoneme wird ein Sprachprofil erstellt, mit dem sich dann nahezu nach Belieben eigene Aufnahmen produzieren lassen. Dafür benötigt man jedoch eine zumindest 20 Minuten lange Aufnahme der Person.

Angst vor Missbrauch

Die Software soll neue Möglichkeiten eröffnen, beispielsweise die synthetische Produktion von Sprachaufnahmen oder das einfache Entfernen von Versprechern und Pausen beim Einsprechen von Beiträgen. Adobe will zudem Missbrauch vorbeugen und spricht bereits jetzt von "Wasserzeichen und Erkennungsmerkmale", anhand derer eine mit VoCo erstellte Aufnahme einfach erkannt werden kann.

Wann und in welcher Form die Software auf den Markt kommen wird, ist vorerst unklar.

Hat dir der Artikel gefallen? Jetzt teilen!

Kommentare