35 Prozent aller neuen Webseiten sind mittlerweile KI-generiert
Ende 2022 ging ChatGPT an den Start. Und das hat seitdem nicht nur verändert, wie manche Studis ihre Hausübungen schreiben oder Brautpaare ihre Eheversprechen formulieren, sondern vor allem auch Spuren im Web hinterlassen.
Welchen Einfluss KI-generierte Texte auf das Internet als Ganzes haben, haben sich nun 4 Forscher in einer Studie angesehen. Ihr Ausgangspunkt war die „Dead Internet Theory“, d.h. die Annahme, dass KI-Texte z. B. zu einer Abnahme der stilistischen Vielfalt und Faktentreue insgesamt beitragen.
Sie analysierten dafür einen repräsentativen Ausschnitt neuer Webseiten und befragten 853 US-Bürgerinnen und Bürger zu ihrer Wahrnehmung von KI. Die Forscher kamen zu dem Ergebnis, dass der Anteil von KI-gestützten neuen Webseiten im Sommer 2025 – also binnen zweieinhalb Jahren – auf rund 35 Prozent gestiegen war.
➤ Mehr lesen: YouTube will gegen KI-Müll vorgehen, aber KI-Influencer fördern
Internet Archive und KI-Detektor
Das Team vom Imperial College London, dem Internet Archive und der Stanford University nutzte das Internet Archive, um eine Stichprobe des Webs, wie es zwischen August 2022 und Mai 2025 ausgesehen hatte, zu gewinnen. Um herauszufinden, welche dort lesbaren Texte KI-generiert sind, griffen sie auf das KI-Erkennungstool Pangram zurück.
Dies klassifiziert Texte entweder als wahrscheinlich „komplett KI-generiert“, „KI-gestützt“ und „von Menschen geschrieben“. Der Anteil an „komplett KI-generierten“ Webseiten lag im Mai 2025 bei knapp 18 Prozent, Tendenz steigend.
Der Anteil KI-generierter Webseiten nahm seit 2022 deutlich zu.
© Screenshot AI on the Internet
„Ich finde die rasante Geschwindigkeit, mit der KI das Internet erobert, ziemlich atemberaubend“, sagt Co-Author Jonáš Doležal gegenüber 404 media. Nachdem das Web jahrzehntelang von Menschen geformt worden war, sei nun in nur 3 Jahren ein signifikanter Anteil davon durch KI definiert worden.
Kein „Wahrheitsverfall“
Sie konnten zeigen, dass die Vielfalt des Webs – im Sinne einzigartiger Ideen und diverser Standpunkte – im Untersuchungszeitraum abgenommen hat. Außerdem stellten sie fest, dass es durch KI zu einem „Positivity Shift“ gekommen ist. Das bedeutet, dass Text im Internet steriler und künstlich fröhlich geworden ist.
Nicht bestätigt hat sich die Hypothese des Wahrheitsverfalls – es sind statistisch gesehen nicht mehr falsche Fakten zu finden als vorher. Das sei das Überraschendste gewesen, meint Doležal bei 404 media: „Es ist erwähnenswert, dass wir gezielt nach einer Zunahme nachweislich falscher Aussagen gesucht haben, die wir jedoch nicht gefunden haben. Es könne aber durchaus sein, dass KI die Menge an nicht überprüfbaren Behauptungen erhöht, also solche, die nicht mit bestehenden Factchecking-Tools und -Infrastrukturen überprüft werden können. Oder es könnte einfach sein, dass das Internet von vornherein kein besonders wahrheitsgetreuer Ort war.“
➤ Mehr lesen: Warum KI-Chatbots nicht immer die Wahrheit sagen
Wahrnehmung von KI in der Bevölkerung
Auch eine Verwässerung, d.h. weniger Inhalt auf mehr Textlänge, hat nicht stattgefunden. Genauso wenig befinden wir uns in einer stilistischen Monokultur: Die Forscher konnten nicht nachweisen, dass unverwechselbare Schreibstile zugunsten eines generischen Stils verschwinden.
In ihrer Befragung zeigte sich, dass ein Großteil der Teilnehmenden überzeugt davon ist, dass KI negative Effekte auf das Web hat. Die „gefühlte Wahrheit“ unterschied sich teilweise deutlich von ihren statistischen Ergebnissen. So glaubten z.B. mehr als 80 Prozent der Befragten, dass KI zu einer stilistischen Monokultur führt.
Die statistischen Beobachtungen decken sich kaum mit der Wahrnehmung der Befragten.
© Screenshot AI on the Internet
Studie soll fortgeführt werden
Die Daten hinter den Berechnungen sollen in Kürze auf GitHub veröffentlicht werden. Das Team hat sich vorgenommen, die Studie fortzuführen, um nicht nur einen Schnappschuss des Webzustands zu haben.
➤ Mehr lesen: Das Ende des Webs? Warum wir 2026 eine radikale Kehrtwende brauchen
Außerdem wollen sie mehr ins Detail gehen, sagt Co-Autor Maty Bohacek gegenüber 404 media: „Wir wollen untersuchen, welche Arten von Webseiten am stärksten betroffen sind, aufgeschlüsselt nach Kategorie oder Sprache, und generell mehr Differenzierung bieten, wo diese Auswirkungen konkret zu spüren sind.“