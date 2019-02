Ungewöhnlicherweise wurde das Sprachmodell nicht einmal auf diese Anwendungen trainiert. Es sollte lediglich vorhersagen, welches Wort auf ein vorangestelltes Wort folgen wird. Durch den gewaltigen Datensatz im Hintergrund funktioniert das dermaßen gut, dass das Sprachmodell vermeintlich neue Inhalte erstellen kann.

Das Sprachmodell sei allein zwölf Mal größer als die bisher führenden Vertreter, was auch auf die gewaltige Datenmenge im Hintergrund zurückzuführen ist. Als Trainingsdaten wurden mehr als 40 Gigabyte an Text genutzt. Diese wurden über Reddit gesammelt - jeder Link, der mehr als drei Upvotes erhielt, wurde in das Modell aufgenommen. Damit ist der Datensatz mehr als 15 Mal so groß als bei bisherigen Projekten.

"Anderen fallen boshaftere Anwendungen ein"

Obwohl die Forscher viel positives Potenzial sehen, fürchten sie derzeit aber eher den Missbrauch des Sprachmodells, weswegen derzeit nur eine funktional stark eingeschränkte Version von GPT-2 ohne den Datensatz veröffentlicht wurde. „Wir müssen noch experimentieren, um herauszufinden, was man alles damit machen kann“, sagt Jack Clark, Head of Policy bei OpenAI, gegenüber dem Guardian. „Wenn man nicht alle Möglichkeiten eines Modells kennt, muss man es etwas anstupsen, um es herauszufinden. Es gibt viele Menschen, denen viel besser boshafte Anwendungen dafür einfallen als uns.“