Das Wort „IMAGEN“ in grünen, pflanzenartigen Buchstaben auf einem offenen Buch.

Googles neueste KI-Software macht aus Texten HD-Videos

06.10.2022

Die Software kann unter anderem HD-Videos in den Stilen berühmter Maler*innen erstellen.

Dieser Artikel ist älter als ein Jahr!

Google hat am Donnerstag die Entwicklung von Imagen Video angekündigt. Das ist ein Programm, das aus Texten Videos mit einer Auflösung von 1280 x 768 Pixel bei 24 fps erstellt. Generell könne Imagen Video laut Google Inhalte in verschiedenen Stilen erstellen. Laut dem Forschungsbericht des Konzerns umfasst die auf künstliche Intelligenz (KI) basierte Software mehrere Fähigkeiten, etwa das Erstellen von Videos basierend auf den Werken berühmter Maler*innen wie Vincent van Gogh.

Auch kann die KI rotierende 3D-Objekte erstellen, welche die Struktur des Objektes beibehalten, unabhängig davon, aus welchem Winkel es angezeigt wird. Zudem gibt es unterschiedliche Animationsstile und Beleuchtungsarten. Derzeit befindet sich die Software allerdings noch in der Forschungsphase.

Problematische Daten herausgefiltert

Auf der Website von Imagen Video werden mehrere Videobeispiele präsentiert. Fährt man mit der Maus über ein Video, wird einem die jeweilige Eingabe angezeigt, die für die Erstellung des Videos verwendet wurde. Zu sehen ist etwa das Video mit dem Textfeld „Schmelzende Eiscreme tropft von der Waffel“

Eine Collage mit verschiedenen Bildern, darunter ein Eis, Bienen, ein Teddybär und eine Giraffe. — © Screenshot/Google/Imagen Video

Als Trainingsdaten nutzt der Generator laut Google den öffentlich verfügbaren LAION-400M-Datensatz sowie 14 Millionen Video-Text-Paare und 60 Millionen Bild-Text-Paare. Das Programm wird aktuell auch trainiert, „problematische Daten“ herauszufiltern. Dazu zählen Daten, welche die Erstellung von pornografischen oder gewalttätigen Inhalten erlauben, aber auch von stereotypischen und rassistischen.

Aktuell sind diese Inhalte noch enthalten. Erst nachdem diese Mängel behoben sind, soll der Generator oder sein Quellcode veröffentlicht werden. Das dürfte allerdings noch dauern.