Reddit verkauft Inhalte als Trainingsdaten an große KI-Firma
Auf Reddit findet man zu so gut wie jedem Thema Inhalte, die rund 50 Millionen täglich aktive Nutzer*innen erstellen. Für KI-Entwickler*innen stellen sie einen wertvollen Datenschatz dar. Eine nicht genannte, große KI-Firma hat mit Reddit nun einen Vertrag abgeschlossen, mit den Inhalten eigene Software trainieren zu dürfen, wie Bloomberg berichtet. 60 Millionen Euro jährlich ist dem Unternehmen der Deal wert.
Lizensierungsverträge im Kommen
Laut Reuters erfolgt dieses Geschäft kurz vor dem Börsengang von Reddit. Dieser soll im März erfolgen. An dem IPO wird seit 3 Jahren gearbeitet. Wie The Verge berichtet, haben viele KI-Unternehmen ihre Software bislang anhand von frei im Internet verfügbaren Daten trainiert. Das hat Kontroversen ausgelöst, weshalb zuletzt häufiger Lizensierungsverträge abgeschlossen wurden.
➤ Mehr lesen: Dürfen KI-Generatoren meine Bilder zum Trainieren verwenden?
Qualitäten von Reddit-Inhalten
Reddit könnte als "Trainingsplatz" für KI mit besonderen Qualitäten punkten. Die Nutzer*innenschaft des Dienstes ist vielfältig und in vielen Fachgebieten bewandert. Aktuelle Neuigkeiten werden auf Reddit genauso behandelt, wie längst vergangene Geschehnisse, die aus neuen Blickwinkeln betrachtet werden. Die Verlässlichkeit der Informationen steht allerdings auf einem anderen Blatt. Diskussionen auf Reddit driften schnell ins Humoristische ab. Dazu gibt es eine hohe Meinungsvielfalt.