Simultan kann die KI allerdings noch nicht übersetzen.

Simultan kann die KI allerdings noch nicht übersetzen.

© Getty Images

Digital Life

Keine Fremdsprachen mehr nötig: KI wird zum Wunder-Übersetzer

HeyGen ist die nächste Künstliche Intelligenz, die für ordentliches Aufsehen sorgt. Das Programm ist nämlich in der Lage, jemanden in einer fremden Sprache sprechen zu lassen. Das Ganze sieht verblüffend und täuschend echt aus, wie bereits in zahlreichen Videos zu sehen ist. Ein populärer Clip, der gerade die Runde macht, zeigt Lionel Messi.

Der argentinische Fußballstar ist bekannt dafür, dass es keine Aufnahmen von ihm gibt, in der er Englisch spricht. In dem KI-generierten Video gibt der Fußballer nun eine Match-Analyse in englischer Sprache zum besten - alles von der Software erstellt, versteht sich.

➤ Mehr lesen: Ich habe 16 Bilder-KIs getestet, damit ihr es nicht tun müsst

So funktioniert HeyGen

Die Software von HeyGen ist eine generative KI. Um die Stimme der Nutzer*innen zu imitieren, benötigt die KI Daten, aus denen sie lernen kann. Deshalb müssen Videos mindestens 30 Sekunden lang sein - eben damit die KI Zeit hat, die Stimme zu erlernen. Außerdem erkennt die Künstliche Intelligenz das Gesprochene und gibt die Aussagen in einer anderen Sprache wieder. Bislang stehen 8 Sprachen zur Verfügung, mit denen die KI im Vorfeld durch Audiodaten trainiert wurde, um eine möglichst natürliche Aussprache zu erreichen.

Dass das Programm die Stimme der gefilmten Person nachahmt, die Aussprache anpasst und die Lippenbewegungen darauf abstimmt, lässt die Videos täuschend echt aussehen. Ein genauer Blick auf den sprechenden Mund zeigt allerdings einige Ungenauigkeiten. Auch eine Simultanübersetzung ist (noch) nicht möglich.

➤ Mehr lesen: Ich habe 18 KI-Textgeneratoren getestet, damit ihr es nicht tun müsst

Fremdsprachen selbst ausprobieren

Wer geduldig ist, kann die Künstliche Intelligenz von HeyGen selbst ausprobieren. Das Programm ist in eingeschränktem Funktionsumfang und in einer Beta-Version öffentlich zugänglich. Es muss lediglich ein passendes Video hochgeladen werden.

In den Clips muss eine Person mindestens 30 Sekunden lang reden. Ein Video darf aber auch nicht länger als 2 Minuten dauern. Die Warteschlange ist inzwischen allerdings auf mehrere Hunderttausend angewachsen, was eine lange Wartezeit bedeutet. Abrufbar ist die Sprach-KI unter labs.heygen.com.

Hat dir der Artikel gefallen? Jetzt teilen!

Kommentare