Эффективность GPT-4 для автоматизированного принятия решений по биопсии предстательной железы на основе mpMRI: многоцентровое исследование

Ming-Jun Shi ,  

Zhi-Xiang Wang ,  

Shuang-Kun Wang ,  

Xuan-Hao Li ,  

Yan-Lin Zhang ,  

Ying Yan ,  

Ran An ,  

Li-Ning Dong ,  

Lei Qiu ,  

Tian Tian ,  

Jia-Xin Liu ,  

Hong-Chen Song ,  

Ya-Fan Wang ,  

Che Deng ,  

Zi-Bing Cao ,  

Hong-Yin Wang ,  

Zheng Wang ,  

Wei Wei ,  

Jian Song ,  

Jian Lu ,  

Xuan Wei ,  

Zhen-Chang Wang ,  

Abstract

Многопараметрическая магнитно-резонансная томография (mpMRI) значительно продвинула выявление рака предстательной железы (PCa), однако решения о проведении инвазивной биопсии при умеренных баллах системы отчётов и данных визуализации предстательной железы (PI-RADS) остаются неоднозначными. Для исследования способности генеративной предобученной трансформер-4 (GPT-4) к автоматическим рекомендациям по биопсии предстательной железы мы включили 2299 человек, прошедших биопсию предстательной железы с 2018 по 2023 год в 3 крупных медицинских центрах, с доступным mpMRI до биопсии и задокументированными клинико-гистопатологическими данными. GPT-4 создавал структурированные отчёты по заданным подсказкам. Производительность GPT-4 оценивалась с использованием матриц ошибок, рассчитывались чувствительность, специфичность и площадь под кривой. Проведено несколько искусственных процедур оценки. Для сравнений применялись критерий Вилкоксона, точный критерий Фишера и критерий Крускалла-Уоллиса. Используя крупнейшую выборку в китайской популяции, пациенты с умеренными баллами PI-RADS (3 и 4) составили 39,7% (912/2299), определённые как интересующая подгруппа (SOI). Частота выявления клинически значимого PCa при баллах PI-RADS 2-5 составила соответственно 9,4%, 27,3%, 49,2% и 80,1%. Почти 47,5% (433/912) пациентов SOI были гистопатологически подтверждены как подвергшиеся ненужным биопсиям предстательной железы. С помощью GPT-4 20,8% (190/912) пациентов SOI могли избежать ненужных биопсий, причём в самой неоднородной подгруппе с баллом PI-RADS 3 этот показатель был ещё выше — 28,8% (118/410). Более 90,0% отчётов, сгенерированных GPT-4, были комплексными и лёгкими для понимания, хотя точность удовлетворила лишь на 82,8%. GPT-4 также продемонстрировал когнитивный потенциал для решения сложных задач. Кроме того, метод цепочки рассуждений позволил лучше понять логику принятия решений GPT-4. В конечном итоге мы разработали платформу ProstAIGuide для облегчения доступа как врачам, так и пациентам. Это многоцентровое исследование подчёркивает клиническую полезность GPT-4 в принятии решений по биопсии предстательной железы и расширяет наше понимание внедрения современных искусственных интеллектов в различных медицинских сценариях.

Keywords

Биопсия предстательной железы; Генеративный предобученный трансформер-4 (GPT-4); Принятие решений; рак предстательной железы; Многопараметрическая магнитно-резонансная томография (mpMRI)

READ MORE