Produkte

Konkurrenz für DALL-E: Google zeigt Text-zu-Bild-Generator

Das Rennen um die Vorherrschaft in Sachen KI ist eröffnet. Nachdem mehrere Entwickler bereits verblüffend leistungsstarke Text-zu-Bild-Generatoren auf den Markt gebracht haben, schickt nun auch Google eine eigene KI ins Rennen. Das Programm mit dem Namen "Muse" soll hochwertige Bilder in Rekordtempo aus Textbausteinen erstellen können, heißt es seitens Google Research.

Schnellere Ergebnisse

Muse sei „signifikant effizienter“ als existierende Generatoren wie etwa Stable Diffusion, DALL-E 2 oder Midjourney, so der Techkonzern. Die Bild-KI übertreffe mit 1,3 Sekunden Generierungszeit pro Bild das bis dato schnellste Programm, Stable Diffusion 1.4. Dieses benötigt 3,7 Sekunden, um ein Bild zu erstellen.

Die Ergebnisse von Muse stünden jenen der Konkurrenz dabei um nichts nach. Sogar dem hauseigenen Bild-zu-Text-Generator "Imagen" könne Muse angeblich problemlos das Wasser reichen. 

Bildbearbeitung möglich

Muse ist in der Lage, Bilder nicht nur zu generieren, sondern sie auch zu bearbeiten. Innerhalb eines Bildes können Objekte im Programm per Textbefehl einfach ausgetauscht oder verändert werden, erklärt Google Research. 

Diese und andere Funktionen der KI scheinen gut anzukommen. In einem Research Paper erklärt Google, dass Tester*innen die Bilder von Muse in rund 70 Prozent der Fälle für passender hielten als jene von Konkurrent Stable Diffusion 1.4. Der Google-Generator soll zudem in der Lage sein, überdurchschnittlich gut vorgegebene Wörter in Bilder zu integrieren oder bestimmte räumliche Kompositionen umzusetzen. 

Ob Google die KI künftig öffentlich zugänglich macht, wie dies bei DALL-E oder Midjourney derzeit der Fall ist, ist noch unklar. Googles erste Bild-KI Imagen ist aktuell als Beta-Version in den USA verfügbar. 

Bilder können in Muse mit Textbefehlen einfach bearbeitet werden.

Klicken Sie hier für die Newsletteranmeldung

Hat dir der Artikel gefallen? Jetzt teilen!