Kein Wunder also, dass das plötzliche Auftauchen der Konkurrenz aus China Chaos auslöste. Nvidia , dessen Grafikkarten viele KI-Modelle trainieren, verlor an der Börse über Nacht fast 600 Milliarden Dollar (575,9 Milliarden Euro). Das ist ein Verlust von 17 Prozent für das zuvor wertvollste Unternehmen der Welt. Siemens Energy sackte gleich um 20 Prozent ab. Auch Oracle, Microsoft und AMD verzeichneten Verluste.

In den letzten Jahren hat sich die US-Techbranche zu einer Wohlfühl-Oase des KI-Hypes entwickelt. ChatGPT von OpenAI , Gemini von Google und LLaMA von Meta machten das Wettrennen um die Vorherrschaft unter sich aus. Die Nachrichten über neue Rechenzentren von der Größe Manhattans, Milliardeninvestitionen und dem Bau von Atomkraftwerken eigens zum Zweck, den wachsenden Strombedarf durch KI zu decken, wurden in kürzester Zeit Normalität.

Fragt man DeepSeek selbst, was es so besonders macht, erzählt es von ausgewogenen Antworten , Kontextverständnis und natürlicher Sprachverarbeitung . Von anderen KI-Modellen hebe es sich ab, weil es aktuell, multifunktional und vertrauenswürdig sei. Nach der großen Revolution klingt das eigentlich nicht und trotzdem stellt das KI-Sprachmodell aus China gerade die gesamte Tech-Industrie auf den Kopf. Warum?

Das klingt nach keinem so großen Unterschied, der Ansatz von DeepSeek sieht aber eine sogenannte Mixture-of-Experts (MoE)- Architektur vor. Das bedeutet, je nach Prompt werden „Experten“ aktiv, die die spezifische Anfrage bearbeiten. Dadurch wird immer nur eine Teilmenge der Parameter aktiviert, genauer 37 Milliarden pro Token . Vereinfacht kann man sagen, dass ein Token hier einem Wort in einem Prompt entspricht.

Allerdings teilte Nvidia Bloomberg mit , DeepSeek sei ein „ ausgezeichneter KI-Fortschritt “ und habe nicht gegen Handelsrecht verstoßen. Einige Experten vermuten, dass gerade die eingeschränkte Verfügbarkeit der US-Hardware dafür gesorgt hat, aus der Not eine Tugend zu machen und einen so effizienten Ansatz zu entwickeln. Auch OpenAI-Chef Sam Altman lobte den neuen Konkurrenten, nicht ohne anzumerken, dass ChatGPT „offensichtlich viel bessere Modelle liefern“ würde.

Bisher konnten KI-Entwickler erklären, immer mehr Rechenleistung zu brauchen, um ihre Modelle noch perfekter zu trainieren. GPU-Hersteller lieferten die Prozessoren, die in riesigen Rechenzentren auf Hochtouren laufen. Stromanbieter sorgen dafür, dass das reibungslos läuft, ohne die Netzstabilität zu gefährden. Eine Hand wusch die andere und die reichsten Menschen wurden noch reicher.

Die richtigen Fragen werden jetzt gestellt

Hinterfragt wurde das nur gelegentlich, wie etwa von Goldman Sachs in einem Bericht von Juni 2024. Dort stellte man die Frage, wie wirtschaftlich die enormen Investitionen eigentlich sind und einige Experten stellen das durchaus in Frage, sagen aber langfristige Erfolge voraus. Noch rechnet sich das Investment zumindest nicht, was am Beispiel von OpenAI deutlich wird. Trotz 200-Dollar-Abo macht das Unternehmen Verluste (futurezone berichtete).

Auch wenn es im Moment für manch Beobachter eine gewisse Befriedigung mit sich bringt, dem KI-Hype-Kartenhaus beim Zusammenfallen zuzusehen, so ehrlich muss man die Situation auch betrachten. Es herrscht völlige Ahnungslosigkeit darüber, wie DeepSeek sein Sprachmodell so billig und ressourcenschonend umsetzen kann – bzw. ob das überhaupt den Tatsachen entspricht. Das gilt es, in den kommenden Tagen und Wochen zu ermitteln. Unabhängig vom Ergebnis hat DeepSeek der Branche aber eine Ohrfeige verpasst. Selbst wenn sie sich als weniger revolutionär herausstellt, wird die Frage bleiben: Ist der KI-Markt im aktuellen Ausmaß eine unnötig aufgeblasene Ressourcenverschwendung?