OpenAI stellt DALL-E 3 vor: Was der neue Bildgenerator besser kann
Dieser Artikel ist älter als ein Jahr!
Mit Bildgeneratoren lassen sich im Netz in wenigen Sekunden künstlich generierte Bilder erstellen. Die Bildgeneratoren Midjourney und Stable Diffusion waren bisher im Vergleich führend, wenn es darum ging, die besten Bilder mit künstlicher Intelligenz (KI) zu erstellen. DALL-E 2, zuletzt im November 2022 veröffentlicht, hinkte immer ein wenig hinterher. So hat der Bildgenerator gerne manche längere Befehle „verschluckt“ und bei der Bilderzeugung einfach ignoriert.
➤ Mehr lesen: KI-Bildgeneratoren: Was sie können und wie man sie verwendet
Statt prompts kann man jetzt ChatGPT nutzen
Nun hat OpenAI mit DALL-E-3 eine neue Version seines Bildgenerators vorgestellt, um im KI-Rennen um die besten Bilder wieder aufzuholen. Die neue Version kann jetzt laut OpenAI Kontext besser erkennen, aber hat auch einen weiteren Vorteil: ChatGPT ist direkt integriert. Man kann also ChatGPT mit einem längeren, flüssigen Text befehlen, einen passenden „prompt“ (= Befehl) für DALL-E-3 zu schreiben, aufgrund dessen der Generator dann ein Bild generiert. Als „prompt“ bezeichnen die Entwickler*innen der KI-Modelle das Texteingabefeld, um der KI Bilder zu entlocken.
Durch die Integration von ChatGPT sollen jetzt noch mehr Menschen befähigt werden, künstliche Bilder zu generieren, weil kein „prompt Engineering“ mehr erlernt werden müsse, heißt es in einem Bericht von The Verge. Natürlich kann man aber auch weiterhin selbst prompts eingeben.
Kostenpflichtige Version kommt zuerst
Die neue Version von DALL-E-3 wird zuerst ein ChatGPT Plus und ChatGPT Enterprise integriert. Für jene Nutzer*innen, die dafür zahlen, steht der neue Bildgenerator ab Oktober zur Verfügung. Es ist derzeit noch nicht bekannt, wann der neue Bildgenerator für alle, die ihn nur gratis nutzen möchten, verfügbar gemacht wird.
OpenAI betont, dass auch Mechanismen integriert worden seien, die verhindern sollen, dass der Bildgenerator „hassvolle Botschaften“ ausspucken kann. Dazu habe man mit einem externen Team zusammengearbeitet, dass der KI beigebracht habe, bestimmte Wörter zu ignorieren, die Gewalt beinhalten. Auch die Namen von einigen Promis landeten auf dieser Blacklist. Ergo: Es ist nicht mehr möglich, Bilder von einigen prominenten Persönlichkeiten zu generieren, wie es etwa mit dem Papst geschehen war.
Um Urheberrechtsstreitigkeiten zu umgehen und Gerichtsverfahren zu vermeiden, will OpenAI auch eine Option für Künstler*innen anbieten, dass ihre Bilder nicht als Grundlage verwendet werden dürfen, um die KI-Generatoren damit zu trainieren. Ergebnisse, die einem bestimmten Stil dann zu nahe kommen, könnten dann geblockt werden, heißt es.
➤ Mehr lesen: Dürfen KI-Generatoren meine Bilder zum Trainieren verwenden?
Kommentare