Operator: Neue OpenAI-KI übernimmt den Browser

23.01.2025

Das Programm ermöglicht es der KI, Links zu klicken, Formulare auszufüllen und so mit Webseiten zu interagieren.

ChatGPT-Entwickler OpenAI hat mit "Operator" einen neuen KI-Agent vorgestellt. Dieser kann mithilfe eines integrierten Browsers selbstständig mehrstufige Aufhaben erledigen, wie einen Tisch in einem Restaurant reservieren, teilt das Unternehmen mit.

Operator kann wie ein menschlicher Anwender die Inhalte, also die dargestellten Pixel, eines Webbrowsers interpretieren. Dafür werden Screenshots der Webseiten erstellt und analysiert. Zusätzlich kann er Funktionen von Maus und Tastatur nutzen, um die Webseite zu bedienen. Er kann also Links anklicken, aus Seiten scrollen und Formulare ausfüllen.

➤ Mehr lesen: Project Mariner: Googles KI-Tool übernimmt mühsames Browsen

Reservierungen und Shopping

Auf den ersten Blick sieht Operator aus wie ChatGPT. In eine Textzeile tippt man die gewünschte Aufgabe ein, z.B. dass ein Tisch für 2 Personen am Abend um 20 Uhr in einem bestimmten Restaurant reserviert werden soll.

Dafür öffnet Operator den im Programm integrierten Cloud-Browser und versucht, den Tisch über eine bestimmte Webseite zu reservieren. Ist kein Tisch zu dieser Uhrzeit verfügbar, wendet er sich an den Nutzer und schlägt etwa vor, stattdessen einen Tisch um 19.30 Uhr zu reservieren. Stimmt der Nutzer zu, kümmert sich die KI um die Reservierung.

➤ Mehr lesen: So formuliert man einen guten Prompt für KI-Chatbots

3 Bilder

Slideshow ansehen

In einem anderen Beispiel kann das Foto einer Einkaufsliste dafür verwendet werden, online einzukaufen. Man wählt eine Shopping-Plattform und Operator legt automatisch alle Produkte auf der Liste in den Warenkorb. So muss man das nicht selbst erledigen.

➤ Mehr lesen: Kampfansage an Chrome: Edge ist jetzt ein "KI-Browser"

Bei Problemen übergibt Operator dem Nutzer die Kontrolle

Kommt Operator an einer Stelle nicht weiter, soll er Nutzer darüber informieren und die Kontrolle an sie übergeben. Das passiert auch an Stellen, an denen sensible Informationen wie Kreditkartendaten oder Passwörter gefragt sind. Zudem soll das Programm eine Bestätigung einfordern, bevor Aktionen wie das Versenden einer E-Mail durchgeführt werden.

Bestimmte "schadhafte Webseiten und nicht erlaubte Inhalte" sowie Prompts, die kriminelle Aktivitäten unterstützen, wurden ausgeschlossen. Geld-Überweisungen oder Aufgaben, die wichtige Entscheidungen beinhalten wie etwa Online-Bewerbungen, führt Operator nicht durch. Zudem soll Operator schadhafte Aktivitäten wie Phishing-Versuche erkennen und verhindern.

Die Ankündigung fand im Rahmen eines YouTube-Live-Streams statt, der hier angesehen werden kann (startet ab 14:30 Minuten):

Wir würden hier gerne ein Youtube Video zeigen. Leider haben Sie uns hierfür keine Zustimmung gegeben. Wenn Sie diesen anzeigen wollen, stimmen sie bitte Youtube zu.

Zuerst für ChatGPT-Pro-Kunden in den USA

Aktuell ist die limitierte Test-Version von Operator nur für Nutzer in den USA verfügbar. Dafür ist außerdem ein ChatGPT-Pro-Abo nötig, das aktuell 200 Dollar kostet. Später sollen auch "Plus"-Abonnenten Zugriff erhalten.

Wie zu erwarten war wird Operator hierzulande nicht so schnell verfügbar werden. "Europa wird, leider, eine Weile dauern", sagte OpenAI-Chef Sam Altman während des Live-Streams.

Mehr zum Thema

Digital Life

Kommentare

Wir würden hier gerne einen Outbrain Feed zeigen. Leider haben Sie uns hierfür keine Zustimmung gegeben. Wenn Sie diesen anzeigen wollen, stimmen sie bitte Outbrain UK Ltd zu.