Lange galten Text-zu-Bild-Generatoren als Zukunftsmusik. Nun kann jeder die Anwendung im Netz gratis verwenden.

Die KI-Anwendung "Stable Diffusion" verwandelt die wildesten Fantasien in wenigen Sekunden in Bilder.

© Stable Diffusion/futurezone

Digital Life

Stable Diffusion: Arnold Schwarzenegger küsst Putin auf der ISS

Es klingt wie Zauberei: Man tippt eine absurde Wortfolge ein, drückt die Eingabetaste und bekommt Bilder ausgespuckt, die das Geschriebene abbilden. Ein mittelalterliches Porträt eines Stegosaurus, ein Schwarzweißfoto von Julia Roberts beim Ballett, Arnold Schwarzenegger wie er Putin auf der ISS küsst. Kaum etwas ist KI-Anwendungen wie Stable Diffusion, Midjourney und Dall-E zu ausgefallen.

Sie alle sind Bildgeneratoren, die mit Künstlicher Intelligenz Grafiken herstellen können. Stable Diffusion sticht hier allerdings heraus. Das Programm steht, samt erzeugten Kunstwerken, der Allgemeinheit frei zur Verfügung, sogar für kommerzielle Zwecke. Nutzer*innen können ab sofort auf der Webseite „Hugging Face“ nach Lust und Laune Bilder generieren.

Die futurezone hat das Programm selbst getestet:

So funktioniert‘s

Das Programm wird mit einer Vielzahl an Bildern gefüttert, anhand derer das Programm „lernt“. Dabei nutzt es einen Vorgang namens "Diffusion“. Ein Muster mit willkürlichen Punkten wird bei diesem Prozess so weit verändert, bis ein Bild entsteht, das der Texteingabe entspricht. 

In der Beta-Phase testeten zahlreiche User*innen das System ausgiebig. 20.000 Tester*innen produzierten 1,7 Millionen Bilder pro Tag.

"Julia Roberts dancing in Vienna" - Die Gesichter bekannter Personen zeigt die KI meist verzerrt. 

Deepfake-Gefahr

Eine derartige Anwendung birgt auch Gefahren. So könnten mit der Software beispielsweise Deepfakes erstellt oder gesellschaftliche Stereotype reproduziert werden.

Die Entwickler*innen vieler solcher Text-zu-Bild-Generatoren sind sich der moralischen Hürden ihrer Technologie zum Teil bewusst. Die meisten verzichten deshalb bewusst darauf, echte Personen darzustellen. Stable Diffusion ist hier eine Ausnahme und generiert auch Promis, wenn auch oft etwas maskenhaft.

Dafür werden aber keine pornografischen oder gewalttätigen Inhalte dargestellt. Die futurezone berichtete ausführlich über das Für und Wider der neuen Anwendung.

"Unsichere Inhalte" werden von Stable Diffusion nicht angezeigt, die Eingabe war: "Skeleton in a red robe sits on a golden throne, surround it by Gustav Klimt"

Hat dir der Artikel gefallen? Jetzt teilen!

Kommentare