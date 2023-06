Wissenschaftler*innen forschen daher intensiv an Möglichkeiten, wie KI-Texte identifiziert werden können. Eine Forschungsgruppe der Universität Kansas soll nun ein Durchbruch gelungen sein. Sie haben ein KI-Modell mit einer Trefferquote von 99 Prozent entwickelt, heißt es in ihrem Bericht .

Von künstlicher Intelligenz (KI) generierte Texte stellen Universitäten und Schulen vor Probleme . Welche Passagen wurden selbst verfasst, welche nicht? KI-Programme wie der Chatbot ChatGPT sind bereits so gut, dass es in vielen Fällen schwer bis unmöglich ist, diese Frage mit Sicherheit zu beantworten.

Texte mit weniger Vielfalt

Zur Identifikation von KI-Texten gibt es unterschiedliche Ansätze. Manche Wissenschaftler*innen setzen auf eine Art digitales Wasserzeichen, andere auf maschinelles Lernen.

Die Gruppe der Universität Kansas geht einen anderen Weg. Sie identifizierte typische stilistische Unterschiede zwischen menschlichen und KI-generierten Texten. Die Merkmale teilten die Forschenden in 4 Kategorien auf: Absatzlänge, Satzlänge, Satzzeichensetzung sowie häufig genutzte Wörter. Diesen Kategorien ordneten sie wiederum 20 spezifische Textmerkmale zu.

Laut dem Forschungsteam sind die Absätze von ChatGPT wesentlich weniger komplex. Die Länge der Sätze variiert nicht so stark, zudem weisen Absätze generell eine geringere Anzahl an Wörtern und Sätzen auf. Menschen verwenden zudem eine größere Vielfalt an Satzzeichen - etwa Fragezeichen, Kommas und Bindestriche - als ChatGPT. Der Bot setzt lieber auf simple Punkte und Anführungszeichen. Auch bei der Wortwahl gibt es unterschiede. Menschen verwenden häufiger Eigennamen von Dingen, was sich in der Häufigkeit an Hauptwörtern niederschlägt.

