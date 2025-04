Dennoch ließ die Zuverlässigkeit zu wünschen übrig. Das Austrian Institute for Health Technology Assessment konnte für diese Art der KI-Programme keinen ausreichenden Nutzen ermitteln. Grund sind auch Überdiagnosen, also das Erkennen von Krankheiten, die gar nicht da sind. “Solche Anwendungen neigen dazu, übervorsichtig zu sein. Die Hersteller wollen auf der sicheren Seite sein und alarmieren lieber zu viel als zu wenig ”, sagt der Mediziner Reinhard Jeindl , der die Übersichtsstudie durchgeführt hat.

Die Lösung sollen sogenannte Symptom-Checker sein. Man beschreibt einem Chatbot in einer App oder im Netz seine Symptome und dieser kommt mit einer passenden Diagnose daher. Bei Unklarheiten kann der Chatbot aktiv nachfragen, um die Genauigkeit der Diagnose zu verbessern. Die ersten Symptom-Checker kamen bereits in den 2000er-Jahren auf, damals funktionierten sie überwiegend auf einer “Wenn-Dann-Logik”. In den 2010er-Jahren wurden die Programme “schlauer”, indem manche von ihnen Künstliche Intelligenz, wie maschinelles Lernen , integrierten.

Symptoma-Gründer Jama Nateqi ist überrascht von der niedrigen Bewertung der Stiftung Warentest. “Wir hätten uns eher gedacht, hier als Testsieger hervorzugehen”, sagt Nateqi zur futurezone. Eine im Test genannte Schwäche, nämlich dass das Programm gleich die Top 30 wahrscheinlichsten Ergebnisse auflistet, sieht der Absolvent der Paracelsus Medizinische Privatuniversität in Salzburg als Stärke. “Wir sind nicht dafür gedacht, dass man am Sonntagabend auf der Couch irgendwelche Symptome eingibt, um zu sehen, ob man am Montag arbeiten gehen soll”, sagt Nateqi: “Symptoma ist eher für Fälle gedacht, die nicht selten jahrelang nach einer Diagnose suchen.” Zudem sei die Liste auf jeden Fall mit dem Arzt abzuklären.

Ähnlich wie die großen Sprachmodelle wie ChatGPT wurde Symptoma mit medizinischer Fachliteratur trainiert. Andere Symptom-Checker basieren Nateqi auf deutlich kleineren Datenbanken beziehen, in denen Symptome beim Training manuell zu den einzelnen Krankheiten zugeordnet werden. Dadurch seien diese Checker sehr strikt: Passe ein Symptom nicht ins Krankheitsbild, falle auch die eigentliche Krankheit aus der Liste der Möglichkeiten heraus.

GPT-4 bereits besser als viele Symptom-Checker

“Künstliche Intelligenz wie GPT-4 haben diese Symptom-Checker bereits überholt”, sagt Nateqi. Mehrere Studien bestätigen dem Chatbot sogar, bessere Diagnosen als Ärzte zu stellen. Selbst diese nutzen die Künstliche Intelligenz bereits, um sich ihre Einschätzungen zu untermauern. Bei einer Befragung von 1.006 britischen Ärzten gaben 20 Prozent an, KI-Programme zu checken - meistens um Arztbriefe auszustellen oder eine zweite Diagnose einzuholen. Bei Letzterem müsse man allerdings sehr vorsichtig sein, sagt Univ.-Prof. Oliver Kimberger von der MedUni Wien: “Die meisten KIs können nicht herleiten, wie sie zu ihrer Erkenntnis kommen, geschweige denn selbstkritisch sein - Vorurteile aus den Trainingsdaten werden auch in die Diagnosen übernommen.”

Ein Problem von ChatGPT sind weiterhin sogenannte Halluzinationen. Die KI wurde nämlich nicht nur ausschließlich mit Gesundheitsdaten trainiert, sondern mit allen Texten zu allen möglichen Themenbereichen. Es kann auch sein, dass der Chatbot eine Diagnose zusammenspinnt, die überhaupt nicht stimmt - diese aber mit Selbstbewusstsein in den Raum stellt. Solche Halluzinationen kommen immer wieder vor. Ein weiteres Problem von “Dr. ChatGPT”: Er ist - anders als etwa Symptoma - nicht als Medizinprodukt registriert. Dafür muss nämlich klinisch bewertet werden, ob das Produkt technisch und wissenschaftlich hält, was es verspricht.

Vormarsch der KI in der Medizin

Es sieht allerdings danach aus, dass Symptom-Checker in Zukunft fester Bestandteil des Gesundheitssystems sein werden. Als Grundsatz der österreichischen Gesundheitsreform, die bis 2028 abgeschlossen sein soll, gilt: „Digital vor ambulant vor stationär“. Darin ist auch festgeschrieben, dass die “Gesundheitskompetenz durch zur Verfügung stellen von qualitätsgesicherten Gesundheitsinformationen und weiterer Services (z. B. Symptom-Checker)” gefördert werden soll. Auch Kimberger ist sich sicher, dass KI-Sprachmodelle ein Werkzeug für Ärzte und Ärztinnen werden. Patientenbriefe voll mit Fachbegriffen könne ChatGPT bereits heute relativ gut in für Patientinnen und Patienten verständliche Sprache übersetzen. Bis Sprachmodelle Diagnosen stellen und menschliche Ärzte und Ärztinnen in ihrer Entscheidungsfindung unterstützen, werde es aber noch eine Weile dauern.

Symptoma-Gründer Nateqi sieht in Zukunft ein Aufkommen an Gesundheitsassistenten, die uns nicht nur sagen, welchen Gesundheitsrisiken wir ausgesetzt sind, sondern auch, wie wir gegensteuern können. “Es wird nicht darum gehen, reaktiv zu sein, sondern in Richtung Prävention gehen. Der Trend hin zu mehr Sensoren und Daten erhöht die Aussagekraft solcher Analysen enorm”, sagt er. In genau diese Richtung geht der IT-Gigant Apple, der mit Health+ einen KI-Coach anbieten will, der zumindest zu einem gewissen Grad einen menschlichen Arzt ergänzen soll. Apple Watch und iPhone zeichnen dafür Gesundheitsdaten auf und geben personalisierte Empfehlungen ab, um seine Gesundheit zu verbessern.

Nateqi sieht solche Lösungen skeptisch, vor allem in Hinblick auf den Datenschutz. “Weil Daten sogar Prognosen über Sterblichkeit ermöglichen, besteht ein enormes Potenzial für Missbrauch und Stigmatisierung. Deshalb sollten solche Daten immer lokal beim Patienten oder Versorger verbleiben”, sagt der Unternehmer. Dass Gesundheitsdaten an Dritte weitergegeben werden, zeigt ein Fall aus dem Jahr 2019. Dabei soll die App Ada Health Nutzerdaten ohne Zustimmung an Facebook und verschiedene Trackingdienstleister weitergegeben haben.