高文治,何宇輝,夏漫城,鞏艷青,何世明,張建燁,周利群,郭躍先,李學(xué)松
(1.北京大學(xué)第一醫(yī)院泌尿外科,北京 100000;2.河北醫(yī)科大學(xué)第三醫(yī)院泌尿外科,河北省石家莊市 050000)
前列腺癌是泌尿外科最常見(jiàn)的惡性腫瘤之一,在美國(guó)前列腺癌的發(fā)病率已經(jīng)超過(guò)肺癌位居危害男性健康的腫瘤之首,近年來(lái)在我國(guó)的發(fā)病率和病死率呈逐年上升趨勢(shì)。流行病學(xué)調(diào)查資料顯示美國(guó)2020 年新增前列腺癌患者超過(guò)24 萬(wàn)例,死亡達(dá)3.4 萬(wàn)例[1];中國(guó)預(yù)計(jì)新增前列腺癌人數(shù)超10 萬(wàn),死亡人數(shù)超5萬(wàn)[2]。根治性前列腺癌切除術(shù)是前列腺癌的主要治療手段,但術(shù)后生化復(fù)發(fā)率較高,這說(shuō)明前列腺癌根治術(shù)后體內(nèi)仍有殘留的前列腺癌病灶[3]。目前關(guān)于預(yù)測(cè)前列腺癌生化復(fù)發(fā)的單一指標(biāo)都有一定的局限性,為克服此局限性,本文綜合當(dāng)前的研究現(xiàn)狀,收集前列腺癌根治術(shù)后患者的相關(guān)臨床信息作為研究變量,通過(guò)深度學(xué)習(xí)算法確定納入模型的最佳變量組合,采用多種機(jī)器學(xué)習(xí)方法建立前列腺癌生化復(fù)發(fā)預(yù)測(cè)模型,并將得到的模型應(yīng)用于臨床,評(píng)價(jià)模型的準(zhǔn)確性,旨在揭示深度學(xué)習(xí)在前列腺癌生化復(fù)發(fā)中的應(yīng)用價(jià)值,為前列腺癌生化復(fù)發(fā)的預(yù)測(cè)提供新的思路。
1.1 數(shù)據(jù)收集及變量介紹收集2001 年3 月-2016年11月北京大學(xué)第一醫(yī)院泌尿外科接受前列腺癌根治術(shù)后442 例患者的臨床信息,包括患者年齡、身體質(zhì)量指數(shù)(body mass index,BMI)、是否有前列腺癌家族史、既往史、吸煙史、飲酒史、術(shù)前是否行新輔助內(nèi)分泌治療、化驗(yàn)結(jié)果、前列腺特異性(prostate specific antigen,PSA)密度、穿刺前穿刺前總的前列腺特異抗原(total prostate specific antigen,tPSA)、穿刺前游離PSA(free PSA,f PSA)與tPSA 比 值(f/t PSA)、前tPSA、術(shù)前f/t PSA、直腸指診、磁共振結(jié)果、骨掃描、臨床分期、前列腺體積、B 超下結(jié)節(jié)、穿刺陽(yáng)性率、穿刺Gleason 主次要評(píng)分、手術(shù)病理Gleason主次要評(píng)分、前列腺周?chē)居袩o(wú)侵犯、前列腺尖部是否侵犯、精囊是否侵犯、淋巴結(jié)侵犯情況及陽(yáng)性淋巴結(jié)百分率共48 個(gè)變量用于建模,基線資料如表1。本文共納入樣本442 例,其中前列腺癌生化復(fù)發(fā)患者60 例,前列腺癌未生化復(fù)發(fā)382 例。
表1 前列腺癌根治術(shù)后442 例患者臨床信息
1.2 數(shù)據(jù)預(yù)處理
1.2.1缺失值處理 絕大部分患者的臨床信息能夠完整收集,但仍有少部分患者的信息缺失。我們僅納入缺失數(shù)據(jù)小于10%的442 例患者,使用拉格朗日插值法插值填充缺失值的方法,補(bǔ)全所有患者信息[4]。
1.1.2結(jié)局變量 納入的所有患者均接受了前列腺癌根治術(shù),以術(shù)后患者出現(xiàn)術(shù)后較最低PSA 上升>0.2 ng/mL 或PSA 絕對(duì)值>0.4 ng/mL 為“金標(biāo)準(zhǔn)”,若隨訪結(jié)果顯示為術(shù)后較最低PSA 上升>0.2 ng/mL 或PSA 絕對(duì)值>0.4 ng/mL 則為陽(yáng)性樣本,否則為陰性樣本[5]。本文共納入422 例樣本,其中陽(yáng)性樣本60 例,陰性樣本382 例,用于建立模型。
1.3 模型構(gòu)建方法
1.3.1卷積神經(jīng)網(wǎng)絡(luò) 卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks ,CNN)在提取局部特征方面優(yōu)勢(shì)明顯,主要由輸入層、卷積層、池化層、全連接層4 部分。CNN 主要是通過(guò)卷積層數(shù),提取更高層次特征,通過(guò)CNN 提取的特征對(duì)前列腺癌生化復(fù)發(fā)具有特異性和分辨力[6]。
卷積層利用多個(gè)不同卷積核對(duì)輸入前列腺癌根治術(shù)后患者信息變量進(jìn)行計(jì)算,產(chǎn)生新的特征,經(jīng)過(guò)運(yùn)算,從而輸出預(yù)測(cè)生化復(fù)發(fā)結(jié)果。
1.3.2長(zhǎng)短期記憶網(wǎng)絡(luò) 長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory ,LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)中的一種,LSTM 模型包含多個(gè)LSTM 單元,每個(gè)LSTM 單元包含遺忘門(mén)、輸入門(mén)、輸出門(mén)3 種門(mén)結(jié)構(gòu),以及一個(gè)細(xì)胞狀態(tài)更新共同進(jìn)行控制,以此來(lái)保持和更新?tīng)顟B(tài)信息并進(jìn)行傳遞,該方法擅長(zhǎng)處理持續(xù)的數(shù)據(jù)序列,能有效處理臨床數(shù)據(jù)序列,可以很好地實(shí)現(xiàn)對(duì)時(shí)序數(shù)據(jù)的建模[7]。
1.3.3卷積神經(jīng)網(wǎng)絡(luò)模型及雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu) 卷積神經(jīng)網(wǎng)絡(luò)模型及雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)模型(convolutional neural networks-bi long short-term memory,CNN-BiLSTM)是融合卷積神經(jīng)網(wǎng)絡(luò)和雙向長(zhǎng)短期記憶的模型,解決較長(zhǎng)信息的長(zhǎng)期依賴問(wèn)題,同時(shí)有效實(shí)現(xiàn)特征與類別標(biāo)簽相關(guān)性的可解釋性,即在不降低準(zhǔn)確率與不提高誤報(bào)率的同時(shí),讓模型具有自適應(yīng)更新的能力,來(lái)應(yīng)對(duì)預(yù)測(cè)前列腺癌的生化復(fù)發(fā)[8]。
CNN-BiLSTM 模 型 由 輸 入 層、4 個(gè) 卷 積 層、1 個(gè)池化層、2 個(gè)LSTM 層、4 個(gè)全連接層和1 個(gè)輸出層組成。將前列腺癌根治術(shù)后患者數(shù)據(jù)直接作為模型輸入,通過(guò)卷積層循環(huán),從而輸出預(yù)測(cè)生化復(fù)發(fā)結(jié)果。
將該模型與其他常見(jiàn)的CNN 和LSTM 進(jìn)行比較,對(duì)比模型有卷積神經(jīng)網(wǎng)絡(luò)模型及雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(convolutional neural networks-long shortterm memory,CNN-LSTM)、雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(bi long short-term memory,BiLSTM)和卷積神經(jīng)網(wǎng)絡(luò)雙向門(mén)控循環(huán)單元(convolutional neural networks-Area under Curve,CNN-BiGRU),我們采用精確度(precision)準(zhǔn)確度(accuracy)、召回率(recall)、f1 值和曲線下面積(area under curve,AUC)來(lái)評(píng)估模型效能。準(zhǔn)確率是分類正確樣本占樣本總數(shù)的比例,通常情況下,準(zhǔn)確率越高模型越好;精確率是分類正確的正樣本數(shù)占被分類為正樣本的樣本數(shù)的比例,體現(xiàn)了模型的精度,召回率是分類正確的正樣本占總的正樣本的比例,衡量的是查全率,在數(shù)據(jù)集構(gòu)建的模型中常作為重要評(píng)估指標(biāo)。
其中,TP 代表正確地把正樣本預(yù)測(cè)為正,F(xiàn)N 代表錯(cuò)誤地把正樣本預(yù)測(cè)為負(fù),F(xiàn)P 代表錯(cuò)誤地把負(fù)樣本預(yù)測(cè)為正,TN 代表正確地把負(fù)樣本預(yù)測(cè)為負(fù)。
2.1 模型分析為進(jìn)一步提高模型性能,采用五折交叉驗(yàn)證劃分訓(xùn)練集和測(cè)試集,運(yùn)用深度學(xué)習(xí)方法選取雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(bi long short-term memory,BiLSTM)、CNN-BiLSTM、CNN_LSTM、LSTM 等分類器,構(gòu)建前列腺癌生化復(fù)發(fā)預(yù)測(cè)模型。為驗(yàn)證不同算法構(gòu)建的模型性能,采用精確度、準(zhǔn)確度、召回率、F1 值和AUC 共4 個(gè)指標(biāo)對(duì)生化復(fù)發(fā)預(yù)測(cè)模型進(jìn)行評(píng)價(jià)和比較。4 種算法構(gòu)建的模型性能略有差異,使用CNN-BiLSTM 方式建立的模型中準(zhǔn)確率最高76.7%,受試者工作曲線下面積為0.71(表2、圖1)。
表2 不同模型的檢驗(yàn)效能
圖1 各指標(biāo)ROC 曲線
2.2 模型驗(yàn)證為進(jìn)一步驗(yàn)證模型性能,將模型應(yīng)用于臨床研究,采用相同的納入標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn),收集30 例患者,陽(yáng)性15 例,陰性15 例作為測(cè)試集,采用CNN-BiLSTM 算法應(yīng)用相同的參數(shù)進(jìn)行模型評(píng)估。得出結(jié)論,CNN-BiLSTM 模型效果最好,準(zhǔn)確率達(dá)76.7%,受試者工作曲線下面積為0.71。
近些年來(lái),我國(guó)的前列腺癌患者逐年增多,同時(shí)術(shù)后大約25%的患者面臨生化復(fù)發(fā)[9]。預(yù)測(cè)患者的生化復(fù)發(fā),對(duì)指導(dǎo)醫(yī)生調(diào)整治療方案有重要意義。本文旨在運(yùn)用深度學(xué)習(xí)方法,根據(jù)患者信息,可以快速無(wú)創(chuàng)預(yù)測(cè)生化復(fù)發(fā)結(jié)果,同時(shí)減輕患者經(jīng)濟(jì)負(fù)擔(dān)。面對(duì)臨床龐大信息量,如何篩選變量及選擇深度學(xué)習(xí)算法是面臨的主要問(wèn)題。
深度學(xué)習(xí)算法在醫(yī)學(xué)中的應(yīng)用將已有的信息不斷重組,提升性能,屬于多領(lǐng)域交叉學(xué)科。近些年來(lái),深度學(xué)習(xí)基于大數(shù)據(jù)的前列腺癌相關(guān)疾病預(yù)測(cè)愈加成熟,對(duì)于前列腺癌根治術(shù)后生化復(fù)發(fā)的預(yù)測(cè)預(yù)熱成為了目前的一個(gè)熱點(diǎn)[5]。相關(guān)文獻(xiàn)中,大多是構(gòu)建前列腺癌的預(yù)測(cè)模型,如杜超等[10]基于集成算法算法構(gòu)建的前列腺癌預(yù)測(cè)模型,有較高的準(zhǔn)確率預(yù)測(cè)前列腺癌的發(fā)生,準(zhǔn)確率最高可達(dá)79%。曹文哲等[11]基于BP 神經(jīng)網(wǎng)絡(luò)、Logistic 回歸和隨機(jī)森林算法構(gòu)建前列腺癌診斷預(yù)測(cè)模型,準(zhǔn)確率最高可達(dá)77%。但目前關(guān)于前列腺癌術(shù)后生化復(fù)發(fā)的預(yù)測(cè)模型較少,而關(guān)于通過(guò)前列腺癌生化復(fù)發(fā)預(yù)測(cè)患者前列腺癌特性性死亡率患者的意義也很重大。文獻(xiàn)報(bào)道通過(guò)術(shù)前PSA、病理Gleason 評(píng)分、前列腺外擴(kuò)張、精囊浸潤(rùn)、前列腺癌生化復(fù)發(fā)時(shí)間、前列腺癌生化復(fù)發(fā)PSA 水平和PSA倍增時(shí)間這些參數(shù)構(gòu)建并驗(yàn)證了列線圖,預(yù)測(cè)根治性前列腺切除術(shù)后患有前列腺癌生化復(fù)發(fā)的男性在10年時(shí)發(fā)生前列腺癌特異性死亡的風(fēng)險(xiǎn)[11],可用于患者咨詢和前列腺癌臨床試驗(yàn)的設(shè)計(jì)。本研究運(yùn)用CNN、LSTM 與CNN-BiLSTM3 種方法,構(gòu)建前列腺癌生化復(fù)發(fā)預(yù)測(cè)模型,在測(cè)試集中CNN-BiLSTM 方式建立的模型中準(zhǔn)確率達(dá)76.7%。區(qū)別于癌癥基因組圖譜(the cancer genome atlas,TCGA)數(shù)據(jù)庫(kù)等分析,本研究采用北京大學(xué)第一醫(yī)院2001 年3 月-2016年11 月前列腺癌根治術(shù)后患者隨訪數(shù)據(jù),更加具有實(shí)際意義。
但是,由于是本研究是基于臨床數(shù)據(jù)的回顧性研究,客觀上存在樣本量偏小的局限性,我們未來(lái)將進(jìn)一步收集和關(guān)注更多前列腺癌相關(guān)患者信息,以盡可能減小該局限性所帶來(lái)的影響。同時(shí)本研究基于單中心展開(kāi),有一定的局限性,未來(lái)也會(huì)開(kāi)展多中心合作,同時(shí)擴(kuò)大樣本量,提高模型的預(yù)測(cè)準(zhǔn)確性。自變量數(shù)目較多也是模型的一個(gè)局限性,因?yàn)闃?gòu)建模型中樣本量數(shù)目較少,只有通過(guò)擴(kuò)大自變量數(shù)目才能進(jìn)一步提高模型的準(zhǔn)確性,通過(guò)深度學(xué)習(xí)中的算法擬合得出48 個(gè)最佳組合變量構(gòu)建準(zhǔn)確性最高的模型,但自變量數(shù)目過(guò)多在臨床實(shí)踐中的應(yīng)用可操作性降低,后續(xù)在擴(kuò)大樣本量?jī)?yōu)化模型的同時(shí),還需進(jìn)一步調(diào)整自變量數(shù)目,使其更加符合臨床實(shí)際。綜上所述,深度學(xué)習(xí)算法在前列腺癌術(shù)根治術(shù)后生化復(fù)發(fā)的預(yù)測(cè)中,有較高的準(zhǔn)確率,但其臨床應(yīng)用尚待進(jìn)一步研究。