Das ist der Grund für den Cloudflare-Ausfall
ChatGPT, X und auch der Internetauftritt des KURIER und der futurezone waren gestern nicht zu erreichen. Stattdessen bekam man eine Fehlermeldung, die auf das Unternehmen Cloduflare zurückzuführen war.
Zu Beginn vermutete man eine Cyberattacke als Ursache, was sich aber als falsch herausstellte. Nun erklärt der CEO des Unternehmens in einem Blogpost, woran es wirklich gelegen hat.
Was ist Clouflare
Wenn jemand eine Webseite im Internet besucht, ist die Wahrscheinlichkeit hoch, dass die Anfrage über die Server des US-Unternehmens Cloudflare geleitet wird. Cloudflare bietet Webseiten ein sogenanntes Content Delivery Network, Internetsicherheitsdienste und DNS-Dienste.
Mehrere Millionen Webseiten zählen zur Kundschaft des in San Francisco beheimateten Unternehmens. Wenn es dort also zu einem Problem kommt, sind viele Websites betroffen. Laut Cloudflare läuft etwa 20 Prozent des Internets über dieses Netzwerk.
➤ Mehr lesen: Riesiger Server-Ausfall legte weite Teile des Internets lahm
Das Botmanagement-System
Cloudflare soll unter anderem sicherstellen, dass Websites auch bei viel Verkehr online und sicher bleiben. Genau das ist gestern aber schiefgelaufen. Laut Matthew Prince, dem CEO von Cloudflare, kam das Problem durch eine Änderung bei den Berechtigungen und schlussendlich durch eine zu große Datei zustande.
Denn Cloudflare nutzt ein Botmanagement-System. Damit sollen Bots bewertet und ihnen gegebenenfalls der Zugriff zu Webseiten verwehrt werden. Beispielsweise werden KI-Bots teilweise blockiert, damit diese Informationen auf den Websites nicht für ihr Training verwendet werden. Um diese Bewertung durchzuführen, nutzt Cloudflare ein Machine-Learning-Model, das auf einer “Feature-Datei” basiert.
➤ Mehr lesen: Massiver Ausfall bei Cloudflare: Weite Teile des Internets offline
Eine wachsende Datei sperrt Besucher aus
“Das Problem wurde durch eine Änderung der Berechtigungen eines unserer Datenbanksysteme ausgelöst, wodurch die Datenbank mehrere Einträge in einer von unserem Bot-Management-System verwendeten „Feature-Datei” ausgab”, erklärt Prince.
Diese Datei verdoppelte sich daraufhin in ihrer Größe und wurde an alle Rechner des Netzwerks weitergegeben. Das führte dazu, dass „das zentrale Proxy-System, das die Datenverarbeitung für unsere Kunden übernimmt, für jeglichen Datenverkehr, der vom Bot-Modul abhängig war“, lahmgelegt wurde”, heißt es in dem Blogpost. Das Ergebnis war, dass nicht die Bots, sondern der echte Traffic lahmgelegt wurde.
➤ Mehr lesen: Warum ohne Amazon große Teile des Internets offline gehen
Cloudflare will Maßnahmen ergreifen
Cloudflare-Kunden, die den Botscore nicht verwenden, blieben online. Der Vorfall verdeutlicht jedenfalls, welche gravierenden Folgen die Abhängigkeit von einzelnen großen Anbietern, wie Cloudflare, haben kann.
Denn es war nicht der erste große Ausfall in diesem Jahr. Vor ein paar Wochen gab es auch Probleme bei Microsoft Azure und Amazon Web Services. Für Cloudflare war das die schlimmste Störung seit 2019. Das Unternehmen kündigt Maßnahmen, wie eine verstärkte Absicherung oder Kill-Switches, also die erzwungene Abschaltung von Funktionen, an.
Kommentare