“Entschärfen wie eine Bombe”: OpenClaw löschte alle Mails aus Postfach
Summer Yue hatte genug von den vielen Mails, die sich in ihrem Postfach angehäuft hatten. Weil es mühsam ist, alle durchzugehen und zu löschen, wandte sich die KI-Sicherheitsforscherin von Meta kurzentschlossen an OpenClaw: „Schau auch in diesem Posteingang nach und schlage vor, was du archivieren oder löschen würdest. Handle erst, wenn ich dir etwas sage“, befahl sie dem KI-Agenten.
Aber damit, was dann passierte, hatte Yue nicht gerechnet: Sie sah alle Mails in Windeseile aus ihrem Postfach verschwinden. Wiederholte Aufforderungen, den Vorgang abzubrechen, brachten nichts: „Ich konnte es von meinem Handy aus nicht stoppen. Ich musste zu meinem Mac Mini rennen, als würde ich eine Bombe entschärfen“, erklärt Yue auf X.
➤ Mehr lesen: Österreicher hinter gehypter KI OpenClaw arbeitet jetzt für OpenAI
Programm von Wiener Peter Steinberger
OpenClaw gilt derzeit als der meistgehypte KI-Agent. Schnell und unkompliziert installierbar, begeisterte die Open-Source-Software des Österreichers Peter Steinberger in kürzester Zeit viele Nutzer weltweit. OpenClaw übernimmt, einmal eingerichtet, selbstständig Aufgaben, die man ihm per Chat über ChatGPT oder Claude befiehlt: Das Programm hilft nicht nur beim Postfach-Management, sondern erstellt auch Rechercheberichte oder sucht passende Bewerber für Stellenangebote.
Screenshots von Yue zeigen, dass sie mit OpenClaw über WhatsApp kommuniziert hat. Am Smartphone funktioniert das über die WhatsApp-Business-API. Der Mac Mini von Apple erweist sich indessen immer mehr als die Hardware der Wahl als OpenClaw-Host. Der KI-Agent kann damit 24 Stunden lang im Betrieb bleiben und ständig automatisch Aufgaben erledigen, die ihm vorher aufgetragen wurden.
Expertin gesteht Anfängerfehler ein
Yues Posting sorgte mitunter auch für Verwunderung auf X. „Sie sind Spezialistin für Sicherheit... haben Sie die Leitplanken absichtlich getestet oder ist Ihnen ein Anfängerfehler unterlaufen?“, fragt etwa ein User. Yue entgegnet, dass selbst KI-Sicherheitsforscherinnen manchmal Anfängerfehler passieren. „Ich war übermütig, weil dieser Workflow wochenlang in meinem Test-Posteingang funktioniert hatte. Echte Posteingänge sind da ganz anders“, schrieb sie.
Sie hatte das Prozedere zwar zuvor schon probiert, und es habe problemlos geklappt. „Das hat für meinen Spielzeug-Posteingang gut funktioniert, aber mein echter Posteingang war zu groß und hat eine Komprimierung ausgelöst. Dabei ging meine ursprüngliche Anweisung verloren“, meint Yue.
Über „perfekte“ Prompts für KI-Agenten diskutieren derzeit viele Nutzer im Netz. Auch im Falle von Yues Postfach gab es viele Tipps für „wasserdichte“ Prompts und passende Weichenstellungen, die so eine unbeabsichtigte Postfach-Löschung stoppen könnten.
Verhängnisvolles Vertrauen
Trotzdem zeigt die Diskussion, wie folgenreich zu großes Vertrauen in experimentelle KI-Agenten wie OpenClaw derzeit noch sein kann. Wer sie leichtfertig nutzt, muss mit solchen „Fehlschlägen“ rechnen.
➤ Mehr lesen: KI-Agent Claude Code erpresst automatisch Unternehmen
Yues „wütender“ KI-Agent ist kein Einzelfall: Anfang des Jahres erlebte etwa ein Entwickler namens Scott Shambaugh, dass ein KI-Agent unter dem Pseudonym „MJ Rathbun“ selbstständig einen diffamierenden Blog-Beitrag über ihn veröffentlicht hatte. Zuvor hatte er diesem die Mitwirkung bei einem Software-Projekt verboten, und der Bot „rächte“ sich an ihm. In einem weiteren Fall löschte ein KI-Agent, der selbstständig als Programmierer tätig war, plötzlich seinen Arbeitsbereich. Die Folge war laut Financial Times ein stundenlanger Ausfall mehrerer AWS-Server.