Google hat das Gemini-KI-Video gefaked
Dieser Artikel ist älter als ein Jahr!
Am Mittwoch veröffentlichte Google ein Video, in dem es die erstaunlichen Fähigkeiten seines neuen KI-Modells Gemini herzeigt. Nun stellt sich heraus, dass Google bei dem Video nachgeholfen hat und Gemini in Wirklichkeit gar nicht so unkompliziert funktioniert, wie Techcrunch berichtet. Laut CNBC News ist es ist nicht das erste Mal, dass Google zu schnell zu viel verspricht.
➤ Mehr lesen: Neues KI-Modell: Google Gemini soll ChatGPT in den Schatten stellen
Google verspricht im Video viel
Gleich am Anfang des Videos verkündet Google: “Wir haben die Fähigkeiten unseres neuen mulitmodalen KI-Modells Gemini getestet. Das haben wir auf Video festgehalten”.
Danach sieht man diese “Highlights”. Jemand zeichnet eine Ente und Gemini sagt, was es sieht. Dann wird eine blaue Gummi-Ente in die Kamera gehalten – Gemini reagiert erstaunt und sagt, dass dieses Objekt wie Plastik aussieht. Später schlägt Gemini spontan Quizzes und Spiele vor und spielt Musik ab, als es die Zeichnung von einer Gitarre erkennt.
Google hat getrickst
Der Bloomberg-Journalist Parmy Olson kritisierte als erster, dass Gemini einem Realitätscheck nicht standhalten könne. Er verwendete Standbilder aus dem Video und tippte Text ein, um Gemini zu testen. Der Test zeigte, dass Gemini die Dinge, die im Video gezeigt werden, zwar irgendwie schaffe. Aber so einfach, wie im Video vorgegaukelt wird, ist das nicht.
Stattdessen könne man davon ausgehen, dass es sich in Wirklichkeit um eine Reihe von sorgfältig ausgewählten Beispielen handle, die zusammengeschnitten wurden. Im Video wird aber ein anderer Eindruck erweckt.
Video sollte nur "Inspiration" sein
Allerdings kann man Google auch nicht vorwerfen, diese Tatsache verheimlicht zu haben. Unter dem Video ist sogar ein Blog-Beitrag verlinkt, in dem die einzelnen Anfragen an Gemini und seine Antworten ausführlich erklärt werden. So schnell und unkompliziert, wie das im Video dargestellt wird, ist es aber in der Realität nicht.
Mittlerweile veröffentlichte Oriol Vinyals, ein leitender Google-Mitarbeiter eine Stellungnahme auf X, in der er genauer auf die Vorwürfe eingeht und selbst zeigt, wie das Video gemacht wurde. “Das Video zeigt nur, wie die mit Gemini erstellten multimodalen Benutzererfahrungen aussehen könnten. Wir haben es gemacht, um Entwickler*innen zu inspirieren”, versucht er zu beschwichtigen.
Gemini kann mehr als andere KI-Modelle
Laut Google kann Gemini Text, Bilder, Audio, Video und Code zu erzeugen. Besonders sei an dem KI-Modell, dass es diese Inhalte mischen kann. Man kann Gemini etwa mit Zeichnungen, Landkarten oder Musik konfrontieren und bekommt dann verschiedene, kreative Ergebnisse.
Techcrunch bezeichnete das Demo-Video als “ziemlich überwältigende Machtdemonstration” von Google im Bereich KI. Das Video habe bestehende Zweifel ausgeräumt, dass Google es mit der Konkurrenz ChatGPT von OpenAI aufnehmen könnte. Das Video habe hier Überzeugungsarbeit geleistet. Das es sich nun teilweise als Fälschung entpuppt, ist enttäuschend.
➤ Mehr lesen: Google veröffentlicht ChatGPT-Konkurrenten "Bard"
Kommentare