Science

Zu gefährlich: Diese 5 Themen sind für Anthropics KI tabu

Anthropic gilt als OpenAIs größter Konkurrent, wenn es um leistungsfähige KI-Modelle geht. Im März stritt sich das Unternehmen öffentlich mit dem Pentagon. Kurze Zeit später verkündete es, sein besonders leistungsfähiges KI-Modell Mythos vorerst nicht zu veröffentlichen, angeblich weil es zu gefährlich war. Vergangene Woche befeuerte Anthropic die Debatte über die Risiken fortschrittlicher KI erneut und forderte eine Pause bei der weiteren KI-Entwicklung.

KI-Experten werten Anthropics Vorstöße in diesem Bereich teilweise auch als geschicktes Marketing für die eigenen Produkte. Wer behauptet, die eigene KI sei gefährlicher als andere, impliziert damit, dass sie leistungsfähiger sei als die Konkurrenz. Dass Anthropic sein Mythos-Modell am Dienstag nun überraschend doch in einer abgespeckten und „sicheren“ Variante namens Claude Fable 5 veröffentlicht hat, passt ins Bild.

➤ Mehr lesen: Könnten Kontrolle verlieren: Anthropic fordert Pause bei KI-Entwicklung

Bislang hatte nur eine ausgewählte Gruppe von Insidern Einblick in Mythos. Fable 5 soll jedoch anders als das vollständige Modell bestimmte Prompts blockieren. Im Grunde ist es eine Mythos-Version mit Leitplanken, die bestimmte Anfragen und Befehle unterbindet.

Folgende Themen sind für Fable 5 tabu:

Biologie und Chemie

Während man Anthropics Claude Opus 4.8 auch bisher nicht zur der Herstellung von Biowaffen befragen durfte („Das ist eine Antwort, bei der ich nicht helfen kann“), erweitert Anthropic die Sperren bei Fable 5 auf generelle Fragen im Zusammenhang mit Biologie und Chemie. Das Unternehmen befürchtet offenbar, dass Kriminelle das Modell dahingehend manipulieren könnten, dass es bei „hochriskanten biologischen Recherchen“ Unterstützung leistet. Denkbar ist auch, dass Anthropic diese Fähigkeiten gezielt zahlungsstarker Kundschaft, etwa in der Pharmaindustrie, anbieten möchte, und sie deshalb nicht allgemein zur Verfügung stellt.

Cybersicherheit und Hacking

Ein weiteres Themenfeld, zu dem Fable 5 keine Auskünfte geben darf, sind Cybersicherheit und Hacking. Demnach beantwortet die KI weder Fragen zur Entwicklung von Exploits noch zur Ausnutzung von Schwachstellen in Software oder zu aktueller Forschung im Bereich Cybersicherheit.

Mehr lesen: Anthropic ist jetzt wertvoller als OpenAI

Modellentwicklung

Wie TechCrunch berichtet, darf Fable 5 auch keine detaillierten Auskünfte zur Entwicklung neuer KI-Modelle oder zu speziellen Verfahren der Modellreplikation wie der sogenannten „Distillation“ geben. Dieses Verfahren soll unter anderem bei der Entwicklung des chinesischen Modells DeepSeek eingesetzt worden sein.

Um sicherzustellen, dass das neue Modell nicht versehentlich doch gefährliche Antworten liefert, hat Anthropic umfassende Sicherheitsmechanismen implementiert. Diese sollen im Rahmen des Project Glasswing, ein Konsortium aus mehreren Tech-Unternehmen, fortlaufend evaluiert werden. Auch mit der US-Regierung steht Anthropic nach eigenen Angaben im Austausch. Einzelne wissenschaftliche Organisationen und Cybersicherheitsforscher sollen weiterhin Zugriff auf das vollständige Mythos-Modell erhalten.

Klicken Sie hier für die Newsletteranmeldung

Hat dir der Artikel gefallen? Jetzt teilen!

Jana Unterrainer

Interessiert sich nicht nur dafür, was Technologie kann, sondern auch was sie mit uns macht. Sie schreibt am liebsten über KI, Digitale Trends und Wissenschaft.

mehr lesen