Mit Pokémon soll die Anthropic-KI ihre Fähigkeiten beweisen. (Symbolbild)

Anthropic lässt KI Pokémon spielen, um ihre Fähigkeiten zu testen

25.02.2025

Immer wieder wird getestet, wie sich KI-Modelle bei Games-Klassikern schlagen. Claude 3.7 Sonnet spielte Pokémon Red.

In einem Blog-Beitrag erklärte das in Kalifornien ansässige KI-Unternehmen Anthropic, dass es die Fähigkeiten seines neuesten KI-Modells Claude 3.7 Sonnet nun auf kreative Weise getestet hat. Das KI-Modell durfte den Gameboy-Klassiker Pokémon Red spielen und wurde damit gleichzeitig einer Art Benchmark-Test unterzogen.

➤ Mehr lesen: Pokemon TCG Pocket im Test: Kartensammeln ohne Kaufzwang

Bereits des Öfteren wurden Spieleklassiker als spaßige Benchmark-Tests verwendet. In den vergangenen Monaten wurde eine Reihe von KI-Modellen anhand von Spielen wie Street Fighter und Pictionary getestet, berichtet TechCrunch.

Claude navigierte durch das Spiel

Claude 3.7 Sonnet wurde für Pokémon Red mit einem Gedächtnis ausgestattet. Es besitzt eine Bildschirm-Pixel-Eingabe und kann über spezielle Funktionen Tasten drücken sowie durch den Bildschirminhalt navigieren.

Das neue KI-Modell von Anthropic soll wie o3-mini von OpenAI und R1 von DeepSeek „über herausfordernde Probleme“ nachdenken können, wenn es entsprechend viel Rechenpower einsetzt und lange genug Zeit hat.

So schnitten die KI-Modelle bei Pokemon Red ab.

© Anthropic

Es ist nicht das erste Mal, dass Anthropic ein KI-Modell Pokémon spielen lässt. Bereits das Modell Claude 3.0 Sonnet hat dies getan. Allerdings schnitt das neue Modell wesentlich besser ab: Während sein Vorgänger es nicht aus Pallet Town herausgeschafft hatte, wo das Spiel startet, besiegte das neue Modell 3 Pokémon-Arenaleiter.

➤ Mehr lesen: Gamification: Warum Spielen beim Lernen helfen kann

Anthropic teilte nicht mit, wie viel Rechenleistung dafür erforderlich war. Bis zum Sieg über den letzten Arenaleiter machte Claude 3.7 Sonnet jedoch 35.000 Aktionen.