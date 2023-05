Neben KI-Sprachmodellen wie ChatGPT gibt es auch KI-Software zur Datenerstellung. So eine entwickelte Mostly AI.

Das bedeutet in der Praxis: Wenn etwa eine Firma oder eine Stadt die E-Bikes trackt, die ausgeliehen werden, sammelt diese Daten über die Personen und die Routen. Benötigt werden allerdings nur die Daten über die Routen, nicht, wer wann wo gefahren ist. Mit der Software von Mostly AI werden die Daten daher umgewandelt und am Ende bleiben nur die relevanten Daten übrig. „Das ist nicht nur spannend für Verkehrs- und Mobilitätsplanung, sondern man könnte etwa auch anhand der Daten entscheiden, wo es sich lohnt, ein Restaurant zu eröffnen, oder sich als Business-Standort anzusiedeln“, sagt Hann.

Medizin, Banken, Versicherungen, Mobilität: Es gibt zahlreiche Bereiche, bei denen personenbezogene Daten für diverse Analysen interessant sein können. Meistens ist es dabei aber völlig irrelevant, wer eine Versicherung abgeschlossen hat, gerade mit einem gesundheitlichen Problem kämpft oder von A nach B fährt. Damit dieser Personenbezug wegfällt, setzen viele Firmen Anonymisierungsverfahren ein. „Traditionelle Anonymisierung zerstört aber die Datenqualität und ist gar nicht so sicher. Oftmals ist es möglich, Individuen zu reidentifizieren“, erklärt Tobias Hann , Geschäftsführer vom Start-up Mostly AI .

„Am meisten Potenzial sehen wir im Gesundheits- und Bankenbereich“, erzählt Hann. Die Software von Mostly AI ist mittlerweile als ausgereiftes Produkt bereits bei zahlreichen Kund*innen im Einsatz. Auch die Stadt Wien setzt auf die Services der Firma. Mostly AI hat nämlich in Wien mit der Entwicklung der Software begonnen, hat sich aber mittlerweile völlig internationalisiert. 50 Mitarbeiter*innen arbeiten von weltweit 25 Standorten aus und es gibt nirgendwo mehr wirkliche Büros. „In Wien arbeiten aktuell 20 Mitarbeiter*innen“, sagt Hann, der selbst aktuell von New York aus das Geschäft betreut.

Frauen benachteiligt: KI-Systeme können helfen

„Der Schutz von personenbezogenen Daten ist auch Unternehmen in den USA ein Anliegen“, so Hann. Die Daten bleiben dabei stets auf den Servern der Kund*innen. Mostly AI stelle nur die Software bereit, heißt es. Auch wenn es bereits ein fertiges Produkt gibt, wird im KI-Bereich fleißig weiter geforscht. „Wir haben ein eigenes KI-Research-Team, das daran arbeitet, zu erforschen, wie man Daten noch flexibler gestalten kann“, sagt Hann.

Mostly AI forscht unter anderem daran, wie mit synthetischen Daten der „Bias“, der echten Datensätzen häufig zugrunde liegt, korrigiert werden kann. Bei KI-Bildern werden etwa sexualisierte Darstellungen von Frauen generiert, weil das Ausgangsmaterial der Bilder, mit denen die KI gefüttert wurde, bereits sexualisiert war. Dasselbe passiert aber auch mit Datensätzen. Wenn bei bestimmten Jobs etwa nur Männer in der Vorstandsebene zu finden waren, lernen KI-Systeme dies aufgrund der historischen Daten nur so kennen und bevorzugen weiterhin Männer in diesen Positionen.

„Synthetische Daten können dabei helfen, ausgeglicheneres Trainingsmaterial für KI-Systeme zur Verfügung zu stellen. Strukturierte Daten können erkennen, welche Daten in der Minderheit vorhanden sind und dieses Defizit ausgleichen“, so Hann. Das System sei derzeit zwar noch nicht produktiv bei Kunden im Einsatz, aber in einer wissenschaftlichen Publikation sei der Vorteil von synthetischer Daten zur Reduktion von „Bias“ bereits aufgezeigt worden, sagt der Geschäftsführer: „Wir haben einen Ansporn, das weiterzuentwickeln und in ein Produkt zu verwandeln.“ In den nächsten ein bis 2 Jahren soll es soweit sein.