Ich habe 16 Bilder-KIs getestet, damit ihr es nicht tun müsst
Dieser Artikel ist älter als ein Jahr!
KI-Bildgeneratoren verwandelen Texteingaben in Sekunden zu realistischen oder fantasievollen Motiven. Seit die ersten Bildgeneratoren im Sommer 2022 der Öffentlichkeit zugänglich gemacht wurden, wurden neue Modelle und Tools entwickelt. Ich habe 16 Bildergeneratoren bzw. Bild-Tools ausprobiert.
Zunächst müssen allerdings ein paar Grundregeln festgelegt werden. Es werden nur KI-Tools verwendet, die man im Internetbrowser nutzen kann, also ohne Software herunterzuladen. Bei den meisten Services muss man einen Account erstellen. Hier beschränke ich mich auf einen Login mit einem Google-Account oder einer E-Mail-Adresse. Einzige Ausnahme: die Bilder-KI Midjourney, für die ein Discord-Account benötigt wird. Zudem müssen die Tools zumindest probehalber gratis nutzbar sein.
Von den Bildgeneratoren wurden immer 2 Bilder generiert: einmal mit der Eingabe "Banana with a Cowboy Hat", einmal mit "snowy mountains of the vinschgau valley in south tyrol in the evening sun". Wurden mehrere Bilder ausgegeben, habe ich das meiner Meinung nach beste ausgewählt.
Dall-E
Das Programm Dall-E von ChatGPT-Unternehmen OpenAI gehört zu den bekanntesten Bildgeneratoren. Monatlich erhält man 15 Credits, die man für 15 Bildgenerierungen verwenden kann. Wer mehr benötigt, kann sich auch Credits dazukaufen. 115 Credits kosten 15 Dollar.
Trotz der spärlichen Eingabe "Banane mit Cowboyhut" lieferte Dall-E insgesamt ein gutes Ergebnis ab. Die Banane stellte viele KI vor Herausforderungen - zum einen, weil der Prompt nicht sehr genau ist, zum anderen scheinen sich Landschaftsbilder von Bergen einfach leichter generieren zu lassen.
Stable Diffusion
Für Stable Diffusion ist keine Anmeldung nötig. Ebenso wenig ist die Anzahl der Bilder beschränkt, die man generieren kann. Die Auflösung ist jedoch schlechter als bei Dall-E, das Alpenbild ähnelt eher einem Gemälde als einem Foto. Trotzdem ist es ein nützliches Tool, wenn man schnell ein Bild generieren möchte.
Crayon
Der Bildgenerator Crayon ist in seiner Basisfunktion auch kostenlos, ein Account ist nicht nötig. Die Software basiert auf Dall-E Mini, wurde also mit einem kleineren Datensatz als Dall-E trainiert. Das merkt man, Details sind verwaschen und die Bilder scheinen nicht so fein wie die von Dall-E. Es gibt bessere Alternativen.
Crayon ist allerdings auch mit einer Suche ausgestattet, mit der sich ihre Datenbank an generierten Bildern durchsuchen lässt. Dort finden sich auch sehr gute Bilder, die man verwenden kann. Das Wasserzeichen wird nur in der Bezahlversion entfernt.
Midjourney
Neben Dall-E und Stable Diffusion komplettiert Midjourney die Dreifaltigkeit der großen Bildgeneratoren. Daher mache ich eine Ausnahme, was das Login betrifft. Um Midjourney nutzen zu können, muss man nämlich erst einen Account auf der Messaging-Plattform Discord erstellen.
Die ersten 25 erstellten Bilder sind gratis, danach müssen Abos abgeschlossen werden. Im Basic-Abo für 10 Dollar im Monat erhält man 200 Generierungen. Die Nutzung von Midjourney ist durch den "Umweg" über Discord aufwändiger als bei Dall-E oder Stable Diffusion.
Am 15. März veröffentlichte das Team hinter Midjourney seine neue Version (V5) in einer Alpha-Phase. Das aktualisierte Modell soll besser auf Promts reagieren können sowie über eine verbesserte Bildqualität aufweisen. So sollen etwa mehr Details angezeigt werden, die mit einer größeren Wahrscheinlichkeit auch korrekt dargestellt werden. Wie die Entwickler*innen allerdings selbst angeben, funktionieren kurze Prompts in der neuen Version nicht so gut wie in der alten. Beim Test zeigen sich kaum Unterschiede.
Lexica.art
Auf der Webseite lexica.art kann man zwar auch Bilder generieren lassen (dank einer Einbindung von Stable Diffusion), das Interessante ist aber ebenfalls ihre Bildersuche. Hier werden sogar die Prompts angezeigt, also die Eingaben, aus denen die Bilder generiert wurden. Zudem bietet lexica.art die Möglichkeit, auch nach verschiedenen Stilen zu suchen.
Nightcafe
Auf nightcafe können Bilder sowohl mit Dall-E, Stable Diffusion und 2 weiteren Bildgeneratoren erstellt werden. Nightcafe erlaubt es Nutzer*innen allerdings auch, eigene Fotos - egal ob generiert oder selbst geschossen - in den Stilen berühmter Kunstwerke darstellen zu lassen. So wird aus einer Banane mit einem Cowboyhut eine Banane mit Cowboyhut, wie sie Edvard Munch vielleicht gemalt hätte. 5 Credits stehen kostenlos zur Verfügung, ein Bild kostet je nach Größe und Auflösung 1 bis 4 Credits. Für 6 Dollar im Monat kann man sich 100 Credits kaufen.
Gaugan
Gaugan ist kein klassischer Bildgenerator, denn es lassen sich vorwiegend Landschaftsbilder damit bearbeiten. Die Bedienung des Tools ist umständlich, dafür ist es kostenlos. Entwickelt wurde die künstliche Intelligenz übrigens von Grafikkartenhersteller NVIDIA.
DeepAI
Auch bei DeepAI kann man Bilder aus Text generieren, jedoch deutlich schlechter als bei den bisher vorgestellten Tools. DeepAI bietet jedoch einen Editor an, durch die sich bereits bestehende Bilder durch Sprachbefehle ändern lassen. Der Befehl "Make it in space" wurde beim ersten Bild überinterpretiert, leider wurde der bananige Space-Cowboy vollständig wegretuschiert. Aus den winterlichen Bergen wurden dank "make it summer" ansehnliche grüne Weiden - zwar nicht in perfekter Qualität, aber immerhin.
Artbreeder
Wer hat sich als Teenager nicht gefragt, wie das gemeinsame Kind von sich und dem Schwarm aussehen wird? Genau darauf will Artbreeder eine Antwort liefern. Dabei kann man eigene Profilbilder hochladen (in der Gratisversion maximal 3) und verschmelzen lassen. Über Schieberegler lassen sich noch Merkmale wie Haut- und Haarfarbe, Gesichtsform oder Make-up verändern. Ideal für Verliebte, der Bild-Upload ist jedoch unendlich langsam und dauert mehrere Minuten. Und auch die Benutzerfreundlichkeit der Seite lässt zu wünschen übrig, sie ist alles andere als intuitiv.
Beim Test habe ich ein Foto von mir mit einem bereits bestehenden Beispielbild verschmelzen lassen. Je nach den Einstellungen bei Geschlecht, Alter oder Gesichtsausdruck werden dabei mal mehr oder mal weniger brauchbare Ergebnisse generiert.
Neural.love
Wie bei der KI-App Lensa AI (die futurezone berichtete) ist auch neural.love darauf ausgerichtet, Avatare und Kunst-Porträts einer realen Person zu generieren. Wer die KI mit eigenen Fotos trainieren lassen möchte, muss 10 Dollar zahlen. Bilder aus Text generieren zu lassen ist kostenlos, wer eine anständige Qualität will, muss sich allerdings einige Credits kaufen. Außerdem bietet neural.love auch an, Videos und Audiodateien durch KI-Einsatz zu verbessern.
mage.space
Der Bildergenerator mage.space basiert auf einer älteren Version von Stable Diffusion, die man kostenlos nutzen kann. Wer einen Account erstellt, kann die aktuellste Stable-Diffusion-Version nutzen. Auf verschiedene Stile abgestimmte Modelle gibt es gegen einen Aufpreis von 4 Dollar im Monat. Daneben bietet mage.space auch eine Bilderdatenbank zum Durchstöbern an. Auch hier kann man von den ersichtlichen Prompts einiges lernen.
KREA
Auf der Website KREA werden ebenfalls KI-generierte Bilder mit ihren entsprechenden Prompts angezeigt. Auch verwandte Bilder in ähnlichen Stilen werden dargestellt.
Photoroom
Photoroom ist kein Bildgenerator, sondern nutzt laut eigenen Angaben künstliche Intelligenz, um Bilder zu bearbeiten. Das Tool konzentriert sich darauf, den Hintergrund eines Fotos zu entfernen und andere Hintergründe einzufügen. Das funktioniert auch sehr gut (siehe Beispiel unten).
Außerdem bietet Photoroom die Möglichkeit, gleich auf der Website passende Postings für Instagram, Tiktok oder Facebook zu erstellen. Wer bereits mit Canva vertraut ist, wird sich in Photoroom schnell zurechtfinden. Herunterladen lassen sich die erstellten Werke allerdings nur mit Photorool-Logo, für HD-Downloads ohne Logo muss ein Abo (9,99 Dollar im Monat) abgeschlossen werden.
Stockimg
Das Versprechen von stockimg.ai ist einfach: Das Tool generiert Stockfotos, die dann als Buchcover, Poster, Logo, Artikelbilder und und und verwendet werden können. Um das Tool zu testen erhält man einen Credit, mit dem man dann ein Bild generieren kann. Wer mehr will, muss bezahlen - Minimum 19 Dollar im Monat. Dafür erhält man 500 monatliche Credits. Welches Modell bei stockimg verwendet wird, ist auf der Website nicht ersichtlich.
LeiaPix
LeiaPix.converter gibt 2D-Bildern einen 3D-Look, indem eine minimale Kamerabewegung vorgetäuscht wird. Im Grunde erstellt man damit es ein digitales 3D-Wackelbild, auch als Lentikularbild bekannt. Das Endresultat kann man als Gif-Datei speichern, das Tool ist kostenlos.
Runway.ml
Runway Research ist das Start-up hinter Stable Diffusion und bietet unter runway.ml bereits KI-Tools für Videos an. Einfache Filter entfernen etwa den Hintergrund eines Videos oder ermöglichen eine Bewegungsverfolgung in einer Szene. Die ersten 3 Projekte sind kostenlos (maximal 5 GB), der Videoexport ist auf eine Auflösung von 720p beschränkt. Abonnements mit umfangreicheren Funktionen starten bei 15 Dollar pro Monat.
Runway Research arbeitet an einer Weiterentwicklung ihres Tools GEN-1. Dabei werden reale Szenen komplett mit einem künstlichen Filter überlagert: So hat eine im Wohnzimmer aufgenommene Szene etwa den Anschein, als wäre sie in einem Mayatempel aufgenommen worden. Das Tool ist noch nicht frei verfügbar, man kann sich allerdings in eine Warteliste eintragen.
Am 20. März stellte Runway Research zudem ein Tool vor, das reinen Text in Videos umwandelt. Runway Gen-2 soll laut dem Unternehmen schon "sehr bald" verfügbar sein und gegenüber Gen-1 deutliche Verbesserungen aufweisen. So soll etwa die Bildqualität insgesamt zugenommen und Bildfehler abgenommen haben. Ein genaues Datum, wann man das Tool nutzen kann, gibt es allerdings nicht.
Kommentare