Leistung von GPT-4 bei der automatisierten Entscheidungsfindung für Prostatabiopsien basierend auf mpMRI: eine multizentrische Evidenzstudie

Ming-Jun Shi ,  

Zhi-Xiang Wang ,  

Shuang-Kun Wang ,  

Xuan-Hao Li ,  

Yan-Lin Zhang ,  

Ying Yan ,  

Ran An ,  

Li-Ning Dong ,  

Lei Qiu ,  

Tian Tian ,  

Jia-Xin Liu ,  

Hong-Chen Song ,  

Ya-Fan Wang ,  

Che Deng ,  

Zi-Bing Cao ,  

Hong-Yin Wang ,  

Zheng Wang ,  

Wei Wei ,  

Jian Song ,  

Jian Lu ,  

Xuan Wei ,  

Zhen-Chang Wang ,  

Abstract

Die multiparametrische Magnetresonanztomographie (mpMRI) hat die Erkennung von Prostatakrebs (PCa) erheblich verbessert, dennoch bleiben Entscheidungen über invasive Biopsien bei moderaten Punktzahlen des Prostata-Bildgebungsberichts- und Datensystems (PI-RADS) unklar. Um die Entscheidungsfähigkeit des Generativen Vorgefertigten Transformers-4 (GPT-4) für automatisierte Empfehlungen zur Prostatabiopsie zu untersuchen, wurden 2299 Personen eingeschlossen, die von 2018 bis 2023 in 3 großen medizinischen Zentren eine Prostatabiopsie erhielten, mit vor der Biopsie verfügbarer mpMRI und dokumentierten klinisch-histopathologischen Daten. GPT-4 erstellte strukturierte Berichte anhand gegebener Eingaben. Die Leistung von GPT-4 wurde mithilfe von Verwirrungsmatrizen quantifiziert, und Sensitivität, Spezifität sowie die Fläche unter der Kurve wurden berechnet. Mehrere künstliche Bewertungsverfahren wurden durchgeführt. Für Vergleiche wurden der Wilcoxon-Rangsummen-Test, der exakte Fisher-Test und Kruskal-Wallis-Tests verwendet. Mit der größten Stichprobengröße in der chinesischen Bevölkerung machten Patienten mit moderaten PI-RADS-Scores (Scores 3 und 4) 39,7% (912/2299) aus, definiert als Interessensuntergruppe (SOI). Die Erkennungsraten von klinisch signifikantem PCa entsprechend PI-RADS-Scores 2-5 betrugen 9,4, 27,3, 49,2 und 80,1% jeweils. Fast 47,5% (433/912) der SOI-Patienten wurden histopathologisch als unnötig biopsiert nachgewiesen. Mit Unterstützung von GPT-4 konnten 20,8% (190/912) der SOI-Bevölkerung unnötige Biopsien vermeiden, und es erreichte sogar eine bessere Leistung [28,8% (118/410)] in der heterogensten Untergruppe des PI-RADS-Scores 3. Mehr als 90,0% der von GPT-4 generierten Berichte waren umfassend und leicht verständlich, aber weniger zufriedenstellend in der Genauigkeit (82,8%). GPT-4 zeigte ebenfalls kognitives Potenzial im Umgang mit komplexen Problemen. Darüber hinaus ermöglichte uns die Methode der Gedankenverknüpfung ein besseres Verständnis der Entscheidungslogik hinter GPT-4. Schließlich entwickelten wir eine ProstAIGuide-Plattform, um die Zugänglichkeit für Ärzte und Patienten zu erleichtern. Diese multizentrische Studie hebt den klinischen Nutzen von GPT-4 bei der Entscheidungsfindung für Prostatabiopsien hervor und fördert unser Verständnis der neuesten Implementierungen künstlicher Intelligenz in verschiedenen medizinischen Szenarien.

Keywords

Prostatabiopsie; Generative Pretrained Transformer-4 (GPT-4); Entscheidungsfindung; Prostatakrebs; Multiparametrische Magnetresonanztomographie (mpMRI)

READ MORE