Leistung von GPT-4 bei der automatisierten Entscheidungsfindung für Prostatabiopsien basierend auf mpMRI: eine multizentrische Evidenzstudie

Ming-Jun Shi; Zhi-Xiang Wang; Shuang-Kun Wang; Xuan-Hao Li; Yan-Lin Zhang; Ying Yan; Ran An; Li-Ning Dong; Lei Qiu; Tian Tian; Jia-Xin Liu; Hong-Chen Song; Ya-Fan Wang; Che Deng; Zi-Bing Cao; Hong-Yin Wang; Zheng Wang; Wei Wei; Jian Song; Jian Lu; Xuan Wei; Zhen-Chang Wang

doi:10.1186/s40779-025-00621-3

Leistung von GPT-4 bei der automatisierten Entscheidungsfindung für Prostatabiopsien basierend auf mpMRI: eine multizentrische Evidenzstudie

DOI：10.1186/s40779-025-00621-3

Abstract

Die multiparametrische Magnetresonanztomographie (mpMRI) hat die Erkennung von Prostatakrebs (PCa) erheblich verbessert, dennoch bleiben Entscheidungen über invasive Biopsien bei moderaten Punktzahlen des Prostata-Bildgebungsberichts- und Datensystems (PI-RADS) unklar. Um die Entscheidungsfähigkeit des Generativen Vorgefertigten Transformers-4 (GPT-4) für automatisierte Empfehlungen zur Prostatabiopsie zu untersuchen, wurden 2299 Personen eingeschlossen, die von 2018 bis 2023 in 3 großen medizinischen Zentren eine Prostatabiopsie erhielten, mit vor der Biopsie verfügbarer mpMRI und dokumentierten klinisch-histopathologischen Daten. GPT-4 erstellte strukturierte Berichte anhand gegebener Eingaben. Die Leistung von GPT-4 wurde mithilfe von Verwirrungsmatrizen quantifiziert, und Sensitivität, Spezifität sowie die Fläche unter der Kurve wurden berechnet. Mehrere künstliche Bewertungsverfahren wurden durchgeführt. Für Vergleiche wurden der Wilcoxon-Rangsummen-Test, der exakte Fisher-Test und Kruskal-Wallis-Tests verwendet. Mit der größten Stichprobengröße in der chinesischen Bevölkerung machten Patienten mit moderaten PI-RADS-Scores (Scores 3 und 4) 39,7% (912/2299) aus, definiert als Interessensuntergruppe (SOI). Die Erkennungsraten von klinisch signifikantem PCa entsprechend PI-RADS-Scores 2-5 betrugen 9,4, 27,3, 49,2 und 80,1% jeweils. Fast 47,5% (433/912) der SOI-Patienten wurden histopathologisch als unnötig biopsiert nachgewiesen. Mit Unterstützung von GPT-4 konnten 20,8% (190/912) der SOI-Bevölkerung unnötige Biopsien vermeiden, und es erreichte sogar eine bessere Leistung [28,8% (118/410)] in der heterogensten Untergruppe des PI-RADS-Scores 3. Mehr als 90,0% der von GPT-4 generierten Berichte waren umfassend und leicht verständlich, aber weniger zufriedenstellend in der Genauigkeit (82,8%). GPT-4 zeigte ebenfalls kognitives Potenzial im Umgang mit komplexen Problemen. Darüber hinaus ermöglichte uns die Methode der Gedankenverknüpfung ein besseres Verständnis der Entscheidungslogik hinter GPT-4. Schließlich entwickelten wir eine ProstAIGuide-Plattform, um die Zugänglichkeit für Ärzte und Patienten zu erleichtern. Diese multizentrische Studie hebt den klinischen Nutzen von GPT-4 bei der Entscheidungsfindung für Prostatabiopsien hervor und fördert unser Verständnis der neuesten Implementierungen künstlicher Intelligenz in verschiedenen medizinischen Szenarien.

Keywords

Prostatabiopsie; Generative Pretrained Transformer-4 (GPT-4); Entscheidungsfindung; Prostatakrebs; Multiparametrische Magnetresonanztomographie (mpMRI)

Leistung von GPT-4 bei der automatisierten Entscheidungsfindung für Prostatabiopsien basierend auf mpMRI: eine multizentrische Evidenzstudie

Ming-Jun Shi ,

Zhi-Xiang Wang ,

Shuang-Kun Wang ,

Xuan-Hao Li ,

Yan-Lin Zhang ,

Ying Yan ,

Ran An ,

Li-Ning Dong ,

Lei Qiu ,

Tian Tian ,

Jia-Xin Liu ,

Hong-Chen Song ,

Ya-Fan Wang ,

Che Deng ,

Zi-Bing Cao ,

Hong-Yin Wang ,

Zheng Wang ,

Wei Wei ,

Jian Song ,

Jian Lu ,

Xuan Wei ,

Zhen-Chang Wang ,

DOI：10.1186/s40779-025-00621-3

Abstract

Keywords