Charité-Studie zeigt Grenzen von Large Language Models in der Präzisionsmedizin auf

Die Behandlung von Krebs wird zunehmend komplexer, bietet aber auch immer mehr Möglichkeiten. Denn je besser man die Biologie eines Tumors versteht, desto mehr Ansätze für die Behandlung gibt es. Um Patient:innen eine auf ihre Erkrankung zugeschnittene, personalisierte Therapie anbieten zu können, ist eine aufwändige Analyse und Interpretation verschiedener Daten nötig. Forschende an der Charité – Universitätsmedizin Berlin und der Humboldt-Universität zu Berlin haben nun untersucht, ob generative Künstliche Intelligenz (KI) wie ChatGPT dabei unterstützen kann. Es ist eines von vielen Projekten an der Charité, in denen die Chancen von KI für die Patientenversorgung analysiert werden.

Können bestimmte Gen-Mutationen nicht mehr vom Körper selbst repariert werden, kann es zu einem unkontrollierten Wachstum von Zellen kommen – ein Tumor entsteht. Entscheidend dafür ist ein Ungleichgewicht von wachstumsfördernden und wachstumshemmenden Faktoren, zum Beispiel durch Veränderungen in Onkogenen. Dieses Wissen macht sich die Präzisionsonkologie zunutze, ein Spezialgebiet der personalisierten Medizin: Überaktive Onkogene werden mithilfe bestimmter Arzneimittel wie niedermolekularen Inhibitoren oder Antikörpern gezielt abgeschaltet.

Damit man weiß, bei welchen Gen-Mutationen die Behandlung ansetzen kann, wird dafür zunächst das Tumorgewebe genetisch analysiert. Die molekularen Varianten der Tumor-DNA, die für eine genaue Diagnose und Therapie notwendig sind, werden ermittelt. Anschließend leiten die Ärztinnen und Ärzte aus diesen Informationen individuelle Therapieempfehlungen ab. In besonders komplexen Fällen ist hierfür Wissen aus verschiedenen medizinischen Bereichen notwendig. An der Charité kommt dann das sogenannte molekulare Tumorboard (MTB) zusammen: Expert:innen der Pathologie, Molekularpathologie, Onkologie, Humangenetik und Bioinformatik analysieren gemeinsam anhand der aktuellen Studienlage, welche Therapien den größten Erfolg versprechen. Ein sehr aufwändiges Verfahren, an dessen Ende eine personalisierte Therapieempfehlung steht.

Können Künstliche Intelligenzen bei der Therapieentscheidung unterstützen?

Kann Künstliche Intelligenz an dieser Stelle unterstützen, fragten sich Dr. Damian Rieke, Arzt an der Charité, Prof. Dr. Ulf Leser und Xing David Wang von der Humboldt-Universität zu Berlin sowie Dr. Manuela Benary, Bioinformatikerin an der Charité. In einer jetzt im Fachmagazin JAMA Network Open* veröffentlichten Studie untersuchten sie zusammen mit weiteren Forschenden die Chancen und Grenzen von Large Language Models wie ChatGPT bei der automatisierten Sichtung der wissenschaftlichen Literatur für die Auswahl einer personalisierten Therapie.

„Wir haben diese Modelle vor die Aufgabe gestellt, personalisierte Therapieoptionen für fiktive Krebspatient:innen aufzuzeigen und dies mit den Empfehlungen von Expert:innen verglichen“, erläutert Damian Rieke. Sein Fazit: „Künstliche Intelligenzen waren prinzipiell in der Lage personalisierte Therapieoptionen zu identifizieren – kamen aber an die Fähigkeit menschlicher Expertinnen und Experten nicht heran.“

Für das Experiment hat das Team zehn molekulare Tumorprofile fiktiver Patient:innen erstellt. Dann wurden ein spezialisierter Arzt und vier Large Language Models damit beauftragt, eine personalisierte Therapiemöglichkeit zu ermitteln. Diese Ergebnisse wurden den Mitgliedern des molekularen Tumorboards zur Bewertung präsentiert – ohne dass diese wussten, woher eine Empfehlung stammt.

Verbesserte KI-Modelle machen Hoffnung auf künftige Einsatzmöglichkeiten

„Vereinzelt gab es überraschend gute Therapieoptionen, die durch die künstliche Intelligenz identifiziert wurden“, berichtet Manuela Benary. „Die Performance von Large Language Models ist allerdings deutlich schlechter als die menschlicher Expertinnen und Experten.“ Außerdem würden Datenschutz und Reproduzierbarkeit besondere Herausforderungen bei der Anwendung künstlicher Intelligenz bei realen Patienten und Patientinnen darstellen, so Benary.

Dennoch sieht Damian Rieke die Einsatzmöglichkeiten von KI in der Medizin grundsätzlich optimistisch: „Wir konnten in der Studie auch zeigen, dass sich die Leistung der KI-Modelle mit neueren Modellen weiter verbessert. Das könnte bedeuten, dass KI künftig auch bei komplexen Diagnose- und Therapieprozessen stärker unterstützen kann – so lange Menschen die Ergebnisse der KI kontrollieren und letztlich über Therapien entscheiden.“

KI-Projekte an der Charité zielen auf bessere Patientenversorgung

Auch Prof. Dr. Dr. Felix Balzer, Direktor des Instituts für Medizinische Informatik, ist sich sicher, dass die Medizin von KI profitiert. Als Chief Medical Information Officer (CMIO) am Geschäftsbereich IT der Charité arbeitet er an der Schnittstelle zwischen Medizin und Informationstechnologie. „Ein besonderer Fokus liegt im Hinblick auf eine effizientere Patientenversorgung auf der Digitalisierung und somit auch auf dem Einsatz von Automation und Künstlicher Intelligenz“, sagt Balzer.

An seinem Institut wird beispielsweise an KI-Modellen zur Sturzprophylaxe im Pflegebereich gearbeitet. Aber auch andere Bereiche der Charité beschäftigen sich intensiv mit der Erforschung Künstlicher Intelligenz: Das Charité Lab für Artificial Intelligence in Medicine befasst sich mit der Entwicklung von Tools zur KI-basierten Prognose nach Schlaganfällen, und das Projekt TEF-Health verfolgt unter der Leitung von Prof. Petra Ritter vom Berlin Institute of Health in der Charité (BIH) das Ziel, die Validierung und Zertifizierung von KI und Robotik in medizinischen Geräten zu erleichtern.

*Benary W, Wang XD, Schmidt M et al. Leveraging Large Language Models for Decision Support in Personalized Oncology. JAMA Netw Open. 2023;6(11). doi:10.1001/jamanetworkopen.2023.43689

Über die Studie

Die Arbeit ist unter der Federführung von Forschenden der Charité und der Humboldt-Universität entstanden. Dr. Damian Rieke (Medizinische Klinik mit Schwerpunkt Hämatologie, Onkologie und Tumorimmunologie sowie Charité Comprehensive Cancer Center), Prof. Dr. Ulf Leser (Stellvertretender Direktor des Instituts für Informatik an der Humboldt-Universität zu Berlin), Dr. Manuela Benary (Bioinformatikerin am Charité Comprehensive Cancer Center und am Berlin Institute of Health in der Charité (BIH)) und Xing Wang (Humboldt-Universität zu Berlin) haben zu gleichen Teilen beigetragen. Gefördert wurde die Studie hauptsächlich durch die Deutsche Forschungsgemeinschaft (DFG), die Deutsche Krebshilfe und den Innovationsfonds des gemeinsamen Bundesausschusses.

Links:

Originalpublikation

Foto: Adobe Stock/ zinkevych