
Mit Pokémon soll die Anthropic-KI ihre Fähigkeiten beweisen. (Symbolbild)
Anthropic lässt KI Pokémon spielen, um ihre Fähigkeiten zu testen
In einem Blog-Beitrag erklärte das in Kalifornien ansässige KI-Unternehmen Anthropic, dass es die Fähigkeiten seines neuesten KI-Modells Claude 3.7 Sonnet nun auf kreative Weise getestet hat. Das KI-Modell durfte den Gameboy-Klassiker Pokémon Red spielen und wurde damit gleichzeitig einer Art Benchmark-Test unterzogen.
➤ Mehr lesen: Pokemon TCG Pocket im Test: Kartensammeln ohne Kaufzwang
Bereits des Öfteren wurden Spieleklassiker als spaßige Benchmark-Tests verwendet. In den vergangenen Monaten wurde eine Reihe von KI-Modellen anhand von Spielen wie Street Fighter und Pictionary getestet, berichtet TechCrunch.
Claude navigierte durch das Spiel
Claude 3.7 Sonnet wurde für Pokémon Red mit einem Gedächtnis ausgestattet. Es besitzt eine Bildschirm-Pixel-Eingabe und kann über spezielle Funktionen Tasten drücken sowie durch den Bildschirminhalt navigieren.
Das neue KI-Modell von Anthropic soll wie o3-mini von OpenAI und R1 von DeepSeek „über herausfordernde Probleme“ nachdenken können, wenn es entsprechend viel Rechenpower einsetzt und lange genug Zeit hat.

So schnitten die KI-Modelle bei Pokemon Red ab.
© Anthropic
Es ist nicht das erste Mal, dass Anthropic ein KI-Modell Pokémon spielen lässt. Bereits das Modell Claude 3.0 Sonnet hat dies getan. Allerdings schnitt das neue Modell wesentlich besser ab: Während sein Vorgänger es nicht aus Pallet Town herausgeschafft hatte, wo das Spiel startet, besiegte das neue Modell 3 Pokémon-Arenaleiter.
➤ Mehr lesen: Gamification: Warum Spielen beim Lernen helfen kann
Anthropic teilte nicht mit, wie viel Rechenleistung dafür erforderlich war. Bis zum Sieg über den letzten Arenaleiter machte Claude 3.7 Sonnet jedoch 35.000 Aktionen.
Kommentare