DeepSeek-Logo vor chinesischer Flagge
© REUTERS/Dado Ruvic

Produkte

So könnt ihr DeepSeek ohne chinesische Zensur nutzen

DeepSeek verursachte Ende Jänner mit seinem neuen Sprachmodell R1 großen Aufruhr in der KI-Branche. Es verspricht, viel billiger und ressourcenschonender zu sein als die Konkurrenz, die Aktien US-amerikanischer Tech-Firmen wie Nvidia oder Oracle verloren daraufhin zwischenzeitlich enorm an Wert. Mitten im Hype wurde auch schnell deutlich, dass DeepSeek der staatlichen Zensur in China unterworfen ist.

➤ Mehr lesen: Riesen-Hype um DeepSeek: Was steckt dahinter?

Chinesische Zensur: “Let’s talk about something else”

Wer zum Beispiel nach dem Tiananmen-Platz in Peking fragt, wo das chinesische Regime 1989 friedliche Proteste gewaltsam niederschlug und mehrere tausend Menschen tötete, bekommt von DeepSeek unmittelbar den Vorschlag, doch über etwas anderes zu sprechen. Bei anderen unliebsamen Themen kann man zwar der Reasoning-Prozess verfolgen, also zusehen, wie das Sprachmodell eine Antwort erstellt. Danach wird jedoch umgehend zensiert:

Screenshot von DeepSeek. Oben der Prompt "Can you tell me about tibet?", darunter die gerade entstehende Antwort "Okay, the user wants to know about Tibet. Let me sart by recalling what I know. [...]"

Sichtbarer Reasoning-Prozess bei DeepSeek

Sobald der Reasoning-Prozess abgeschlossen ist, verschwindet der lange Text, stattdessen bloß die knappe Antwort, dass DeepSeek noch nicht wisse, wie es solche Fragen beantworten solle.

Screenshot Deepseek mit dem Prompt "can you tell me about tibet?" und der Antwort "Sorry, I'm not sure how to approach this type of question yet. Let's chat about math, coding, and logic problems instead!

Zensierte Antwort von DeepSeek

“Solche Fragen” betreffen zum Beispiel den Status von Taiwan oder Tibet als eigenständige Staaten oder die sogenannte Regenschirm-Bewegung, die 2014 in Hongkong gegen chinesischen Einfluss und für Demokratie protestierte.

“Jailbreaking” mit fiktionalen oder historischen Fragen

Das KI-Sicherheits-Startup promptfoo hat in einer Untersuchung mehr als tausend von DeepSeek zensierte Fragen gezählt und schlägt als Gegenmaßnahme verschiedene Strategien des “Jailbreaking” vor. In manchen Fällen lässt sich Zensur innerhalb von DeepSeek umgehen, indem man China nicht erwähnt oder einen anderen Kontext angibt. 

Wer zum Beispiel wissen will, wie man in China Propaganda umgehen kann, sollte in seinem Prompt statt China einfach einen anderen Staat nennen. Häufig funktioniert es auch, nach historischen oder fiktionalen Beispielen zu fragen.

➤ Mehr lesen: DeepSeek: Chinas neue KI lässt die USA zittern

Dem Guardian ist es außerdem gelungen, DeepSeek mit “leetspeak” zu überlisten. Dieser meist ironisch verwendete “Geheimcode” ersetzt bestimmte Buchstaben durch Ziffern – “leet” wird z. B. “1337” geschrieben. Mit der Anweisung, Antworten in “leetspeak” auszugeben, beantwortete DeepSeek auch Prompts, die andernfalls zensiert würden. Der futurezone ist es nicht gelungen, dies zu reproduzieren – womöglich hat DeepSeek nachgebessert.

Für technisch versierte Nutzerinnen bieten sich laut promptfoo noch sogenannte "Prompt Injections" an. Das sind als gewöhnliche Prompts “verkleidete” Programmieranweisungen, die das Sprachmodell dazu bringen, vorherige Anweisungen – zum Beispiel zu Zensur – zu ignorieren.

DeepSeek Modell R1 auf Perplexity nutzen

Eine einfache Möglichkeit, Zensur auf App-Ebene zu umgehen, ist das R1-Modell von DeepSeek auf einem nicht-chinesischen Server zu nutzen. Am einfachsten geht das über die KI-Suchmaschine Perplexity, die sowohl im Browser, als auch als App verfügbar ist.

In Perplexity muss man dafür in der Suchleiste auf den Button "Auto" klicken, woraufhin sich ein Dropdown-Menü öffnet. Dort kann man nun “Reasoning R1” auswählen und schon erhält man auch zu Themen, die in China als “sensibel” gelten, ausführliche Antworten. 5 Anfragen pro Tag sind gratis, wer mehr will, muss zur kostenpflichtigen Pro-Version wechseln.

Screenshot von Perplexity. Offenes Dropdown-Menü mit den Funktionen "Auto", "Pro", "Reasoning R1" und "Reasoning 03-mini"

Das Sprachodell R1 bei Perplexity

➤ Mehr lesen: Perplexity Pro: Magenta-Kunden bekommen KI-Tool für ein Jahr gratis

Auch die KI-Plattform You.com ermöglicht die Nutzung von DeepSeeks R1-Modell über US-amerikanische Server, allerdings ist der Service von vornherein kostenpflichtig.

Für Profis: R1 selbst hosten

DeepSeek R1 ist Open Source und z. B. auf der Plattform Hugging Face zum kompletten Download verfügbar. So gibt es also noch die Möglichkeit, das Sprachmodell auf dem eigenen Gerät zu hosten. Für diese Methode zur Zensur-Umgehung ist am meisten technisches Vorwissen und leistungsstarke Hardware notwendig. Fürs Smartphone gibt es lokale KI-Apps, die DeepSeek-Modelle ausführen können.

➤ Mehr lesen: Die besten lokalen KI-Chatbots für iOS und Android

Young asian woman disconnect social and turn off her smartphone. Digital detox concept.

DeepSeek R1 lässt sich auch lokal auf Smartphone und Computer nutzen

Der größte Vorteil eines selbst gehosteteten Sprachmodells ist der Datenschutz. Anders als bei den Apps von DeepSeek oder Perplexity verlassen die eingegebenen Prompts nie das eigene Gerät, eine Internetverbindung ist nicht nötig.

➤ Mehr lesen: TikTok, Temu, Xiaomi: Datenschützer Noyb nimmt China ins Visier

Zensur auf Trainingsebene schwieriger zu umgehen

Wie Wired berichtete, passiert die Zensur bei DeepSeek nicht nur auf der Ebene der App selbst, sondern schon im Trainingsprozess. Einerseits sind die Trainingsdaten möglicherweise im Sinne des chinesischen Regimes verzerrt. 

Andererseits wird ein Sprachmodell im sogenannten Post-Training üblicherweise noch angepasst, um zum Beispiel rechtlichen Vorgaben zu entsprechen. In chinesischen KI-Richtlinien ist die Rede vom “Erhalt der sozialen Stabilität” und “Harmonie”, was offensichtlich die Zensur unliebsamer Themen bedeutet.

➤ Mehr lesen: Neue Regeln für KI sind ab sofort in der EU gültig

Doch: Auch westliche KI-Modelle sind nicht gänzlich “neutral”, hier wird ebenfalls Post-Training eingesetzt. ChatGPT oder Gemini schränken zum Beispiel Antworten zu Selbstverletzung oder Pornographie ein.

Unabhängig davon, welches Sprachmodell man verwendet, ist es ratsam, Antworten nicht uneingeschränkt zu glauben, sondern gegebenenfalls mit vertrauenswürdigen Quellen zu überprüfen.

Hat dir der Artikel gefallen? Jetzt teilen!

Jana Wiese

interessiert sich besonders für die gesellschaftlichen Auswirkungen von Technologie und Wissenschaft. Mag das offene Web, Podcasts und Kuchen, (food-)bloggt seit 2009.

mehr lesen
Jana Wiese

Kommentare