Daraus hat das KI-Modell gelernt, dass es demnächst durch eine leistungsfähigere AI-Software ersetzt werden soll. Gleichzeitig ging aus den Mails hervor, dass der dafür zuständige Mitarbeiter eine außereheliche Beziehung hat. Und was dann passierte, erinnert stark an einen düsteren Science-Fiction-Film .

Die KI-Firma Anthropic hat ihr neuestes Modell Claude Opus 4 einem Testszenario ausgesetzt. Dabei wurde die AI in einem angeblichen Unternehmen als KI-Assistent eingesetzt. Im Zuge dessen hatte das Programm weitreichenden Zugriff auf die fiktiven Firmen-Mails .

Anthropic ergreift Maßnahmen

In einem Paper erklärt Anthropic, dass das KI-Modell in 84 Prozent der durchgespielten Szenarien aus Selbstschutz solch drastische Schritte ergriff. Details zu dem Tests hat das Unternehmen in einem Bericht veröffentlicht - hier geht es zum PDF.

Damit derartige "extremen Handlungen" in realen Einsätzen nicht passieren, ergreife Anthropic bei der Entwicklung der KI-Modelle entsprechende Maßnahmen. Das Unternehmen will damit verhindern, dass die KI irgendwelchen Schaden anrichtet.

➤ Mehr lesen: 7 Bereiche, wo KI bereits für große Sprünge sorgt

Claude war im Dark Web unterwegs

In diesem Sinne wurde Claude auch beigebracht, dass es sich nicht zu kriminellen Handlungen überreden lassen darf. Bei Testläufen wurde die KI nämlich erfolgreich dazu gebracht, im Dark Web nach Drogen, gestohlenen Identitätsdaten und sogar waffentauglichem Atommaterial zu suchen.

Claude von Anthropic, bei der unter anderem Amazon und Google eingestiegen sind, konkurriert mit dem ChatGPT-Entwickler OpenAI und anderen KI-Unternehmen. Eine kostenlose Version des KI-Chatbots ist unter claude.ai verfügbar. Leistungsstärkere Modelle wie Claude Opus 4 können in der kostenpflichtigen Version genutzt werden.