Künstliche Intelligenzen, etwa solche, die aus Text Bilder generieren, müssen zuerst mit Millionen von Bildern trainiert werden, bevor sie zufriedenstellende Ergebnisse liefern. Die Bilder stammen dabei meist aus dem Internet. Da stellt sich die Frage: Ist mein Gesicht auch dabei?

Private Fotos im Datensatz vorhanden

Die Webseite "Have I Been Trained?" gibt Einblicke in eine Datenbank bestehend aus 5,8 Milliarden Fotos, mit der auch die bekanntesten KI-Programme trainiert wurden. Das Tool basiert auf dem sogenannten LAION-5B-Datensatz, der in der Vergangenheit immer wieder kritisiert wurde. So entdeckte ein KI-Künstler erst kürzlich, dass in dem Datensatz auch Fotos aus privaten medizinischen Dokumenten versteckt sind.