Symbolbild ChatGPT
ChatGPT kann jetzt für dich im Internet browsen
Flüge nach New York buchen, Analysen, eine Zusammenfassung von Mails oder Präsentationen erstellen. All das kann der neue ChatGPT-Agent, der kürzlich von OpenAI veröffentlicht wurde.
Damit kann ChatGPT jetzt noch besser Aufgaben mithilfe des Internets für uns erledigen. Um komplexe Aufgaben zu lösen, wurde auch ein eigener Browser im System integriert.
➤ Mehr lesen: Neue Infos zum ersten KI-Gerät von OpenAI aufgetaucht
Operator und Deep Research
ChatGPT hat jetzt zudem seinen eigenen virtuellen Computer und wählt aus einer Toolbox mit verschiedenen Agent-Fähigkeiten aus. Dabei handelt es sich um eine Weiterentwicklung von bisherigen Funktionen wie Operator und Deep Research.
Der Operator von ChatGPT konnte beispielsweise schon bisher mit Websites interagieren. Die Stärke von dem mehrstufigen Web-Reasoning-Tool Deep Research ist hingegen, Informationen aus dem Internet zusammenzufassen.
Kombination von verschiedenen Funktionen
Operator konnte bisher aber keine tiefgehenden Analysen erstellen. Und Deep Research war nicht in der Lage, mit Websites zu interagieren. Deshalb habe OpenAI das Beste aus beiden Tools kombiniert.
Jetzt ist der ChatGPT-Agent mit einem visuellen Browser ausgestattet, der über eine grafische Benutzeroberfläche mit dem Web agiert. Außerdem gibt es einen textbasierten Browser für einfachere Anfragen und einen direkten API-Zugriff. So kann ChatGPT direkt mit anderen Programmen oder Diensten kommunizieren.
Das neue Modell lerne dynamisch, während es die Aufgaben ausführt und hält dabei nicht an einer bestimmten Methode fest, betont das Unternehmen. “Auch der Übergang von einem einfachen Gespräch zu Aktionsanfragen innerhalb desselben Chats ist nun möglich”, heißt es von OpenAI.
➤ Mehr lesen: OpenAI arbeitet an einem sozialen Netzwerk
Beispiele für den Umgang mit dem KI-Agenten
„Wirf einen Blick auf meinen Kalender und informiere mich anhand der neuesten Nachrichten über kommende Kundenbesprechungen“ oder „Analysiere 3 Wettbewerber und erstelle eine Präsentation.” Das sind Beispiele dafür, wie man den verbesserten KI-Agenten laut OpenAI nutzen kann.
Dafür durchsucht das Tool Websites, wählt Daten aus und filtert Ergebnisse. Vor der Ausführung der Aufgaben bittet ChatGPT um Berechtigungen. Darüber hinaus kann man die Aufgaben jederzeit unterbrechen, um die Anweisungen zu präzisieren. Braucht ChatGPT mehr Details zu der Anfrage von Nutzerinnen und Nutzern, fragt das KI-Tool proaktiv nach.
Wie man den neuen KI-Agenten nutzen kann
Den neuen KI-Agenten findet man über das Dropdown-Menü im Abschnitt “Tools”. Dort klickt man auf “Agent Modus” und kann dann die auszuführende Aufgabe eingeben. Man kann so auch abgeschlossene Aufgaben wiederholen lassen.
Der KI-Agent erreicht bei Bewertungen, wie Humanity’s Last Exam, mit einer Genauigkeit von 43,1 Prozent einen neuen Höchstwert. Noch funktioniert aber nicht alles reibungslos. Beispielsweise lasse die Erstellung von Präsentationen noch zu wünschen übrig, gibt auch OpenAI zu. “Wir planen, in regelmäßigen Abständen iterativ erhebliche Verbesserungen vorzunehmen, damit im Laufe der Zeit immer mehr Menschen von ChatGPT profitieren können”, so OpenAI.
➤ Mehr lesen: Strategiewechsel bei OpenAI: jetzt auch TPUs von Google im Einsatz
Nutzung und Sicherheit
Mit den neuen Funktionen gehen auch Risiken einher. Deshalb hat OpenAI die Sicherheitskontrollen vom Operator erweitert und neue hinzugefügt. ChatGPT bittet so zum Beispiel ausdrücklich um Genehmigungen, bevor Aufgaben ausgeführt werden.
Bei Aufgaben, wie dem Absenden von Mails, gibt es einen Beobachtungsmodus. Hier kann man als Anwenderin oder Anwender jeden einzelnen Schritt beobachten und genehmigen. Ist das Risiko bei einer Aufgabe zu hoch, lehnt ChatGPT diese ab. Als Beispiel werden Finanztransaktionen genannt.
OpenAI gibt auch an, den KI-Agenten so trainiert zu haben, dass er Prompt Injection erkennen und abwehren kann. Dabei handelt es sich um böswillige Anweisungen, mit denen versucht wird, das Verhalten des KI-Agenten zu manipulieren. Nicht vertrauenswürdige Anweisungen werden demnach ignoriert.
Wann der KI-Agent verfügbar ist
Der ChatGPT-Agent wird seit 17.7. Ausgerollt. Aktuell ist er nur in Pro-, Plus- und Teams-Abonnements enthalten. Demnächst soll die Verfügbarkeit für Enterprise- und Education-Benutzer folgen.
Pro-Nutzerinnen und -Nutzer können den KI-Agenten nahezu unbegrenzt nutzen. Für andere Abonnentinnen und Abonnenten stehen 50 Aufgaben pro Monat zur Verfügung.
Kommentare