
Google arbeitet an eigenen Robotern, die dank Gemini erstaunliche Fähigkeiten haben.
Video zeigt, was Google-Roboter dank Gemini bereits können
Googles Abteilung DeepMind entwickelt nicht nur neue KI-Modelle, sondern auch Roboter. In einem Blog-Beitrag erklärte Google kürzlich, dass in seinen Laboren derzeit eine neue Robotergeneration entsteht, die selbst komplexe Aufgaben wie das Zubereiten von Salaten oder das Falten von Origami beherrschen soll – Tätigkeiten, die vielen Robotern bislang Schwierigkeiten bereiteten.
➤ Mehr lesen: Wie lernen humanoide Roboter?
Gemini 2.0. für Roboter
Zum Einsatz kommt dabei eine speziell angepasste Version von Google Gemini, der KI-Technologie, die auch im populären Chatbot verwendet wird. Gemini 2.0 ist für die Robotik optimiert und soll den Maschinen bei der Ausführung gezielter Bewegungen und Handlungen helfen.
Gleichzeitig sollen die Roboter laut den Entwicklern über das umfassende Weltwissen von Gemini verfügen. Dieses Wissen befähigt sie dazu, Objekte, Situationen und gesprochene Anweisungen zu erkennen und zu interpretieren – und auf dieser Grundlage Aufgaben eigenständig zu bewältigen.
Erstaunliche Feinmechanik
Ein Video demonstriert die Fähigkeiten des zweiarmigen Google-Roboters ALOHA. Darin folgt er problemlos sprachlichen Anweisungen: Er erkennt beispielsweise, dass er Bananen in einen transparenten Behälter legen soll, kann einen Zipp-Beutel verschließen und sogar einen Origami-Fuchs aus einem Stück Papier falten – eine feinmotorisch anspruchsvolle Aufgabe. Dank Gemini reagiert das System dabei spontan und interaktiv auf verbale Befehle.
Das Technikportal Hackaday fragt angesichts dieser eindrucksvollen Demonstration, ob es überhaupt noch etwas gebe, das Roboter nie werden können.
➤ Mehr lesen: Im BMW-Werk arbeiten nun menschenähnliche Roboter
Google schummelte bei KI-Fähigkeiten
Zugleich stellt sich die Frage, ob man den im Video gezeigten Szenen vollständig trauen kann. Es wäre nicht das erste Mal, dass Google bei der Präsentation seiner KI-Fähigkeiten etwas nachhilft – wie etwa 2023, als eine Gemini-Demonstration angeblich gesprochene Anweisungen und Zeichnungen zeigte, später jedoch bekannt wurde, dass die Befehle tatsächlich über Texteingabe erfolgten.
Dennoch haben einige KI-Modelle heute tatsächlich vergleichbare Fähigkeiten – es ist also durchaus denkbar, dass das, was Googles Robotik-Abteilung im Video zeigt, ein echter Ausblick auf die nahe Zukunft ist.
Kommentare