Googles neueste KI-Software macht aus Texten HD-Videos
Dieser Artikel ist älter als ein Jahr!
Google hat am Donnerstag die Entwicklung von Imagen Video angekündigt. Das ist ein Programm, das aus Texten Videos mit einer Auflösung von 1280 x 768 Pixel bei 24 fps erstellt. Generell könne Imagen Video laut Google Inhalte in verschiedenen Stilen erstellen. Laut dem Forschungsbericht des Konzerns umfasst die auf künstliche Intelligenz (KI) basierte Software mehrere Fähigkeiten, etwa das Erstellen von Videos basierend auf den Werken berühmter Maler*innen wie Vincent van Gogh.
Auch kann die KI rotierende 3D-Objekte erstellen, welche die Struktur des Objektes beibehalten, unabhängig davon, aus welchem Winkel es angezeigt wird. Zudem gibt es unterschiedliche Animationsstile und Beleuchtungsarten. Derzeit befindet sich die Software allerdings noch in der Forschungsphase.
Problematische Daten herausgefiltert
Auf der Website von Imagen Video werden mehrere Videobeispiele präsentiert. Fährt man mit der Maus über ein Video, wird einem die jeweilige Eingabe angezeigt, die für die Erstellung des Videos verwendet wurde. Zu sehen ist etwa das Video mit dem Textfeld „Schmelzende Eiscreme tropft von der Waffel“
Als Trainingsdaten nutzt der Generator laut Google den öffentlich verfügbaren LAION-400M-Datensatz sowie 14 Millionen Video-Text-Paare und 60 Millionen Bild-Text-Paare. Das Programm wird aktuell auch trainiert, „problematische Daten“ herauszufiltern. Dazu zählen Daten, welche die Erstellung von pornografischen oder gewalttätigen Inhalten erlauben, aber auch von stereotypischen und rassistischen.
Aktuell sind diese Inhalte noch enthalten. Erst nachdem diese Mängel behoben sind, soll der Generator oder sein Quellcode veröffentlicht werden. Das dürfte allerdings noch dauern.
Kommentare