KI überall im Alltag: Die 9 wichtigsten Ankündigungen der Google I/O
Am Dienstagabend hat Google seine Entwickler*innenkonferenz I/O eröffnet. Im Gepäck hatte das Unternehmen zahlreiche Neuerungen und natürlich hatte alles mit Künstlicher Intelligenz zu tun.
Wir haben die 9 wichtigsten Ankündigungen der I/O für euch zusammengefasst:
- Project Astra
- KI-Suche
- Video-, Musik- und Bildgeneratoren
- Ask Photos
- Video-Suche mit Lens
- Individuelle “Gems”
- Gemini App für Android
- Gemini für Workspace
- Spam-Anrufe erkennen
1 - Project Astra
Eines der aufregendsten Dinge war “Project Astra”. Dabei handelt es sich um einen KI-Assistenten für den Alltag. Über eine Kamera - etwa mit einem Handy oder einer smarten Brille - kann die KI die gesamte Umgebung erfassen und Fragen dazu beantworten.
In einem Demo-Video war zu sehen, wie eine Anwenderin mit ihrer Handykamera durch ein Büro geht und fragt: "Zeige mir alles, was Töne macht". Das Modell erkennt eine Box auf dem Tisch. Dann schaut sie mit ihrer Handykamera aus dem Fenster und fragt, in welchem Stadtteil sie sich gerade befindet. Auch das kann die KI korrekt beantworten. Verfügbar werden soll diese Live-Video-Funktion auch über die neue Gemini-App (siehe unten). Wann genau,ist aber unbekannt.
Angeteasert wurde in dem Video auch eine smarte Brille, über die die Protagonistin ihre Umgebung filmt. Mehr als das hat Google zu dem Wearable aber nicht verraten.
➤ Mehr lesen: Frühlings-Update für ChatGPT - Premium-Features nun auch in Gratis-Version
2 - Suche voller KI
Das Kernprodukt, die Google-Suche, soll dank KI völlig umgemodelt werden. AI Overview soll direkt relevante Infos zu den gesuchten Themen liefern, ohne dass man sie mühsam händisch zusammensuchen muss.
Als Beispiel nannte Google ein Szenario, in dem man nach einem Yoga-Studio sucht. AI Overview in der Google-Suche liefert dann nicht nur eine Liste der Studios, sondern auch direkt die Zeit, wie lange man zu jedem Studio zu Fuß geht. Zusätzlich aktuelle Angebote und Kartenausschnitte gibt es auf einen Blick. Das alles soll ganz oben auf der Suchseite erscheinen, damit man schnell das Wichtigste im Blick hat.
KI dient hier als Ausbau für den bereits bekannten Knowledge Graph. Jener zeigt schon jetzt direkt Informationen zum jeweiligen Suchbegriff an, ohne dass man eine Webseite besuchen muss.
➤ Mehr lesen: Neue Google-KI kann Struktur von DNA voraussagen
3 - KI-Generatoren für Videos, Musik und Bilder
Googles KI-Modell Gemini kann künftig auch Videos generieren. Mit dem generativen KI-Programm Veo können Videoclips basierend auf Texteingaben erschaffen werden. Als Beispiel, was das Modell kann, demonstriert Google mehrere Prompts und die Videos dazu. Das erinnert alles stark an Sora, das OpenAI bereits im Februar präsentierte.
Music AI Sandbox ist eine Sammlung an KI-Tools, mit der Musik gemacht werden kann. Imagen 3 ist angeblich Googles neues Tool zum Generieren von Bildern. Es soll als erstes derartiges KI-Modell besonders gut im Generieren von Texten, also etwa Schriftzügen, sein. Das ist etwas, mit dem sich aktuelle Bildgeneratoren notorisch schwertun.
4 - Ask Photos
Gemini soll dabei helfen, die eigenen Fotos besser zu durchsuchen. Statt einfach nach Keywords zu suchen, soll man Google Fotos künftig einfach Fragen stellen können.
Zum Beispiel "Wie lautet mein Nummernschild?" oder "Wann hat meine Tochter laufen gelernt?" und Gemini analysiert alle Bilder, um die Frage zu beantworten und die zugehörigen Fotos herauszusuchen. Das funktioniert natürlich nur dann, wenn man sein ganzes Leben in Bildern festhält.
Im Sommer soll das Feature ausgerollt werden, höchstwahrscheinlich aber zu Beginn nur für US-Nutzer*innen. Ob oder wann Ask Photos auch nach Europa kommt bzw. auf Deutsch verfügbar sein wird, war vorher noch unklar.
5 - Video-Suche in Google Lens
Die bereits bekannte Google-Foto-Suche Lens bekommt ein Upgrade für Videounterstützung. Nutzer*innen können ihre Frage an Google einfach anhand eines Videoclips stellen, anschließend wird sie beantwortet.
In der Demo wurde gezeigt, in welcher Situation das helfen kann. Etwa, wenn man nicht weiß, wie man einen Plattenspieler bedient. Filmt man das Problem, das man hat, soll einem Lens direkt zur gewünschten Antwort leiten.
6 - Gems
"Gems" sind persönliche KI-Funktionen für Gemini, die man selbst erstellen kann. Wenn man eine Anwendung will, die einem beim Arbeiten, bei der Freizeitplanung, beim Sport oder bei der Organisation des Alltags hilft, kann man diese einzeln anlegen und schneller auf sie zugreifen. Vergleichbar ist das mit “Custom GPTs”. Google nennt als Beispiele einen Trainings-Buddy für Sport, einen Coding-Partner zum Programmieren oder einen Sous-Chef zum Kochen.
Google hat auch selbst schon ein paar solcher Gems angelegt. “LearnLM” ist z.B. eine auf Bildung spezialisierte Anwendung. Das Gem "Learning Coach" kann dabei helfen, komplexe Themen zu verstehen oder sich etwas zu merken, wie eine chemische Formel. Der Coach kann auch ein Quiz generieren, basierend auf einer Video-Unterrichtseinheit, mit dem Wissen abgefragt wird. Lehrer*innen sollen mit “LearnLM” z.B. Unterrichtsstunden planen können.
Das Gem "Trip Planning" hilft beim Planen von Urlauben. Dabei greift es auf Informationen zurück, die es über den Trip bereits hat, wie Flugdaten. Das hilft z.B., keine sich überlappenden Termine zu buchen. Das setzt natürlich voraus, dass Google Zugriff auf alle nötigen Informationen hat.
➤ Mehr lesen: So bekommt man das alte Google Maps in der Google-Suche zurück
7 - Gemini App für Android
Gemini bekommt eine eigene, neue App. Mit Texteingabe, Sprache und Video über die Kamera kann man mit der KI interagieren. Project Astra, also die Live-Video-Funktion, soll damit nutzbar sein.
Zudem kommt Circle to Search, das bislang nur auf Samsung- und Pixel-Phones verfügbar war, so auf alle Android-Handys. Damit kann man Inhalte direkt auf dem Screen einkreisen und bekommt anschließend Suchergebnisse dazu präsentiert.
Wenig überraschend muss man in Europa auf die App aber noch warten. In 150 Ländern ist sie laut Support-Seite schon verfügbar, kein einziges davon gehört zur EU. Sobald die App verfügbar ist, findet man die Funktion auch im Google Assistant und unter iOS im “Gemini”-Tab in der Google App. Voraussetzung dafür ist ein “Gemini Advanced”-Abo.
8 - KI in Workspace
Geschäftskund*innen, die Google Workspace nutzen, erhalten Unterstützung von Gemini. Eine spezielle Seitenleiste bietet direkt Hilfe an, z.B. beim Durchsuchen von Gmail. Man kann sich Konversationen zusammenfassen lassen und To-Do-Listen oder Erinnerungen erstellen lassen, die auf Inhalten aus E-Mails oder Meetings basieren.
Ein weiteres KI-Feature für Workspace ist das Organisieren des eigenen Gmail-Posteingangs. Wenn man etwa ein freischaffender Fotograf ist, kann man die KI bitten, alle Rechnungen, die man zugesandt bekommen hat, zu organisieren. Der entsprechende Prompt wird in der Sidebar angezeigt.
Künftig können auch ganze Mitarbeiter*innen mit KI erstellt werden. Die "virtual Teammates" haben einen Namen und ihnen können auch bestimmte "Rollen" im Unternehmen zugewiesen werden. Man kann dann etwa direkt über Chat mit ihnen kommunizieren und sie Meetings, Unterhaltungen und Dokumenten hinzufügen. Sie beantworten Fragen zu Projekten, etwa, ob eine bestimmte Aufgabe schon erledigt wurde.
9 - Spam-Erkennung mit KI
Eine interessante Neuerung für Android ist eine automatische Erkennung von Spam-Anrufen. Gemini in der On-Device-Variante Nano kann Anrufe direkt auf Geräten analysieren und die Anwender*innen warnen, wenn es ein Betrugsversuch ist.
Es ist davon auszugehen, dass dieses Feature vorerst nur in den USA und auch nur in Englisch verfügbar sein wird. Aber sogar hier bleibt Google hinsichtlich des Veröffentlichungszeitpunktes vage und spricht von den “nächsten Monaten”. Es ist auch davon auszugehen, dass das ein Feature sein wird, das exklusiv für Pixel-Phones kommt.