Performance de GPT-4 pour la décision automatisée de biopsie prostatique basée sur mpMRI : une étude multicentrique d’évidence

Ming-Jun Shi; Zhi-Xiang Wang; Shuang-Kun Wang; Xuan-Hao Li; Yan-Lin Zhang; Ying Yan; Ran An; Li-Ning Dong; Lei Qiu; Tian Tian; Jia-Xin Liu; Hong-Chen Song; Ya-Fan Wang; Che Deng; Zi-Bing Cao; Hong-Yin Wang; Zheng Wang; Wei Wei; Jian Song; Jian Lu; Xuan Wei; Zhen-Chang Wang

doi:10.1186/s40779-025-00621-3

Performance de GPT-4 pour la décision automatisée de biopsie prostatique basée sur mpMRI : une étude multicentrique d’évidence

DOI：10.1186/s40779-025-00621-3

Abstract

L’imagerie par résonance magnétique multiparamétrique (mpMRI) a considérablement amélioré la détection du cancer de la prostate (PCa), cependant les décisions concernant la biopsie invasive en cas de scores modérés du système de rapport et de données d’imagerie prostatique (PI-RADS) restent ambiguës. Pour explorer la capacité de prise de décision du Generative Pretrained Transformer-4 (GPT-4) pour les recommandations automatisées de biopsie prostatique, nous avons inclus 2299 individus ayant subi une biopsie prostatique entre 2018 et 2023 dans 3 grands centres médicaux, avec un mpMRI disponible avant la biopsie et des dossiers clinico-histopathologiques documentés. GPT-4 a généré des rapports structurés à partir d’invites données. La performance de GPT-4 a été quantifiée à l’aide de matrices de confusion, la sensibilité, la spécificité et l’aire sous la courbe ont été calculées. Plusieurs procédures d’évaluation artificielle ont été menées. Le test de Wilcoxon, le test exact de Fisher et les tests de Kruskal-Wallis ont été utilisés pour les comparaisons. En utilisant la plus grande taille d’échantillon dans la population chinoise, les patients avec des scores PI-RADS modérés (scores 3 et 4) représentaient 39,7 % (912/2299), définis comme le sous-ensemble d’intérêt (SOI). Les taux de détection du cancer de la prostate cliniquement significatif correspondant aux scores PI-RADS 2-5 étaient respectivement de 9,4, 27,3, 49,2 et 80,1 %. Près de 47,5 % (433/912) des patients SOI ont été histopathologiquement prouvés avoir subi des biopsies prostatiques inutiles. Avec l’aide de GPT-4, 20,8 % (190/912) de la population SOI ont pu éviter des biopsies inutiles, et la performance était encore meilleure [28,8 % (118/410)] dans le sous-groupe le plus hétérogène de score PI-RADS 3. Plus de 90,0 % des rapports générés par GPT-4 étaient complets et faciles à comprendre, mais moins satisfaisants en termes de précision (82,8 %). GPT-4 a également montré un potentiel cognitif pour traiter des problèmes complexes. De plus, la méthode de la chaîne de pensée nous a permis de mieux comprendre la logique de prise de décision derrière GPT-4. Enfin, nous avons développé une plateforme ProstAIGuide pour faciliter l’accès tant pour les médecins que pour les patients. Cette étude multicentrique souligne l’utilité clinique de GPT-4 pour la prise de décision en biopsie de la prostate et fait progresser notre compréhension de la dernière mise en œuvre de l’intelligence artificielle dans divers scénarios médicaux.

Keywords

Biopsie de la prostate; Generative Pretrained Transformer-4 (GPT-4); Prise de décision; cancer de la prostate; Imagerie par résonance magnétique multiparamétrique (mpMRI)

Performance de GPT-4 pour la décision automatisée de biopsie prostatique basée sur mpMRI : une étude multicentrique d’évidence

Ming-Jun Shi ,

Zhi-Xiang Wang ,

Shuang-Kun Wang ,

Xuan-Hao Li ,

Yan-Lin Zhang ,

Ying Yan ,

Ran An ,

Li-Ning Dong ,

Lei Qiu ,

Tian Tian ,

Jia-Xin Liu ,

Hong-Chen Song ,

Ya-Fan Wang ,

Che Deng ,

Zi-Bing Cao ,

Hong-Yin Wang ,

Zheng Wang ,

Wei Wei ,

Jian Song ,

Jian Lu ,

Xuan Wei ,

Zhen-Chang Wang ,

DOI：10.1186/s40779-025-00621-3

Abstract

Keywords