辛仲宏,雷軍強(qiáng),郭 城,張亞萍,陳梓嫻
(蘭州大學(xué)第一醫(yī)院放射科 甘肅省智能影像醫(yī)學(xué)工程研究中心 精準(zhǔn)影像協(xié)同創(chuàng)新 甘肅省國(guó)際科技合作基地,甘肅 蘭州 730000)
宮頸癌(cervical cancer, CC)居于女性惡性腫瘤第二位,嚴(yán)重危害女性健康和生命[1-2];其病因及發(fā)病機(jī)制尚未完全明了,但87.96%的CC患者伴人乳頭瘤病毒(human papilloma virus, HPV)感染,且與其16/18型高度相關(guān)[3]。目前對(duì)國(guó)際婦產(chǎn)科聯(lián)盟(International Federation of Gynecology and Obstetrics, FIGO)Ⅰ期與ⅡA期CC多以手術(shù)治療為主,術(shù)前輔助放射治療(簡(jiǎn)稱放療)或新輔助化療(neoadjuvant chemotherapy, NACT)可提高手術(shù)切除率并改善預(yù)后;對(duì)FIGO分期ⅡB期及以上晚期CC以根治性放療及化學(xué)治療(簡(jiǎn)稱化療)為首選。因此,早期診斷CC并進(jìn)行分期至關(guān)重要。人工智能(artificial intelligence, AI)基于數(shù)學(xué)、計(jì)算機(jī)及神經(jīng)科學(xué)等發(fā)展而來(lái),可通過(guò)計(jì)算機(jī)程序模擬、延伸和拓展人的智能行為,以提供客觀的檢測(cè)、定量、分類及預(yù)測(cè)方法用于臨床輔助診斷[4-5]。深度學(xué)習(xí)(deep learning, DL)為AI新領(lǐng)域,能大批量處理、挖掘、整合高維數(shù)據(jù),自動(dòng)識(shí)別、運(yùn)算圖像信息,在圖像分析領(lǐng)域展示出巨大潛力,用于診斷腫瘤、鑒別診斷、指導(dǎo)治療及預(yù)測(cè)預(yù)后等具有獨(dú)特特有優(yōu)勢(shì)。本文針對(duì)DL用于篩查和診斷CC、指導(dǎo)治療及判斷預(yù)后的現(xiàn)狀、問(wèn)題及前景進(jìn)行綜述。
機(jī)器學(xué)習(xí)(machine learning, ML)通過(guò)計(jì)算機(jī)模擬人類學(xué)習(xí)行為,在無(wú)明確指令的情況下執(zhí)行任務(wù)并進(jìn)行數(shù)據(jù)分析;其常用方法包括logistic回歸、線性回歸、決策樹(shù)、隨機(jī)森林、貝葉斯和K-means聚類分析、多層感知機(jī)及支持向量機(jī)等。DL是ML的主要研究方向,以計(jì)算機(jī)模擬人腦機(jī)制分析數(shù)據(jù),使用分層人工神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)復(fù)雜學(xué)習(xí)模型,包括卷積神經(jīng)網(wǎng)絡(luò)(convolution neural networks, CNN)、深度置信網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)等;其中的CNN可自動(dòng)學(xué)習(xí)傳統(tǒng)圖像分析方法無(wú)法識(shí)別的高維度特征信息,適用于建立醫(yī)學(xué)影像及其解析間的復(fù)雜關(guān)系模型[6],已在多項(xiàng)相關(guān)研究中取得重大進(jìn)展[6-10]。醫(yī)療數(shù)據(jù)中,影像學(xué)數(shù)據(jù)占比較高,且格式標(biāo)準(zhǔn)、易于獲取,是篩查和診斷腫瘤、預(yù)測(cè)療效和評(píng)價(jià)預(yù)后的主要依據(jù)之一。
2.1 篩查與診斷 DL具有快速、高效及客觀等特點(diǎn),在篩查、診斷及分期CC中發(fā)揮著越來(lái)越重要的作用。陰道鏡引導(dǎo)下活檢穿刺對(duì)診斷宮頸上皮內(nèi)瘤變(cervical intraepithelial neoplasia, CIN)至關(guān)重要。目前AI電子陰道鏡輔助診斷系統(tǒng)已取得一定進(jìn)展。DL協(xié)同數(shù)字陰道鏡可自動(dòng)診斷、提高陰道鏡診斷和宮頸活檢的準(zhǔn)確性。HU等[11]經(jīng)7年隨訪篩查CC,共納入9 406名受試者,以其中的99 843幅宮頸圖像為訓(xùn)練集,以病理診斷為金標(biāo)準(zhǔn),所構(gòu)建的DL模型識(shí)別正常、CIN2和CIN3的受試者工作特征(receiver operating characteristic, ROC)曲線下面積(area under the curve, AUC)分別為0.80、0.70及0.69;以342例CC患者進(jìn)行測(cè)試,結(jié)果顯示該模型識(shí)別CIN2及CIN3的AUC為0.91,效能顯著高于傳統(tǒng)宮頸照相技術(shù)、傳統(tǒng)細(xì)胞學(xué)及HPV檢測(cè)。
PATHANIA等[12]開(kāi)發(fā)了以DNA為中心、運(yùn)用DL的數(shù)字化篩查HPV平臺(tái),用于檢測(cè)HPV16/18型的DNA具有極高的敏感度和特異度,甚至可識(shí)別單個(gè)細(xì)胞,且檢測(cè)用時(shí)低于2 min。WENTZENSEN等[13]構(gòu)建了基于活檢金標(biāo)準(zhǔn)訓(xùn)練的p16/Ki-67雙重染色(double staining, DS)載玻片DL平臺(tái),在敏感度相同的前提下,其診斷陽(yáng)性率低于、但特異度高于細(xì)胞學(xué)和手動(dòng)DS檢測(cè);相比巴氏法,基于DL的DS使轉(zhuǎn)診至陰道鏡的比例降低了約1/3(41.9%vs.60.1%),提示基于該平臺(tái)可實(shí)現(xiàn)自動(dòng)化檢測(cè),且特異度較高,有助于避免不必要的陰道鏡檢查。
URUSHIBARA等[14]基于117例CC患者488幅和181例非癌癥患者509幅腹部T2WI構(gòu)建DL模型,并以60例CC患者和60例非癌癥患者的120幅圖像進(jìn)行測(cè)試,結(jié)果顯示DL模型和3名影像科醫(yī)生診斷CC的敏感度分別為0.883和0.783~0.867,特異度分別為0.933和0.917~0.950,準(zhǔn)確率分別為0.908和0.867~0.892,即DL模型的診斷效能與影像科醫(yī)生相當(dāng)甚至更優(yōu)。楊易等[15]提取159例經(jīng)病理證實(shí)CC患者的396個(gè)T2WI影像組學(xué)特征,根據(jù)最終篩選出的11個(gè)特征建立了預(yù)測(cè)早、晚期CC的模型,其在訓(xùn)練集和驗(yàn)證集中的擬合優(yōu)度均較高(χ2=2.68、8.87,P均>0.05),AUC達(dá)0.80,提示基于T2WI的影像組學(xué)模型預(yù)測(cè)CC臨床分期具有較高價(jià)值。早期診斷并擬定治療決策對(duì)改善預(yù)后及生存質(zhì)量至關(guān)重要。DL模型的診斷準(zhǔn)確率取決于訓(xùn)練集數(shù)據(jù)質(zhì)量及算法精度。開(kāi)展大樣本、多中心研究,進(jìn)行規(guī)范化診斷及結(jié)合多種臨床數(shù)據(jù)是DL發(fā)展的方向。
2.2 預(yù)測(cè)淋巴脈管間隙浸潤(rùn)及淋巴結(jié)轉(zhuǎn)移 淋巴脈管間隙浸潤(rùn)(lymph-vascular space invasion, LVSI)包括血管或微血管浸潤(rùn)及淋巴管浸潤(rùn)。早期判斷有無(wú)LVSI和淋巴結(jié)轉(zhuǎn)移對(duì)制定治療方案和預(yù)測(cè)預(yù)后至關(guān)重要。WU等[16]基于894例接受根治性子宮切除術(shù)和盆腔淋巴結(jié)清掃術(shù)的ⅠB期至ⅡB期CC患者的術(shù)前MRI構(gòu)建的DL模型用于預(yù)測(cè)CC淋巴結(jié)轉(zhuǎn)移顯示出良好效能,其AUC為0.844[95%CI(0.780,0.907)]。DONG等[17]基于CC患者術(shù)前CT、組織學(xué)和臨床分期構(gòu)建了術(shù)前預(yù)測(cè)CC淋巴結(jié)轉(zhuǎn)移的DL模型,共提取1 045個(gè)影像組學(xué)特征,其中28個(gè)與淋巴結(jié)轉(zhuǎn)移顯著相關(guān)(P均<0.05),模型預(yù)測(cè)淋巴結(jié)轉(zhuǎn)移的AUC為0.99,內(nèi)部驗(yàn)證準(zhǔn)確率為97.16%,外部驗(yàn)證的AUC為0.90,準(zhǔn)確率為92.00%。
DL模型預(yù)測(cè)LVSI和淋巴結(jié)轉(zhuǎn)移的準(zhǔn)確性來(lái)源于大樣本術(shù)前影像學(xué)資料與術(shù)后病理對(duì)照研究結(jié)果。影像學(xué)無(wú)法明確提示LVSI和淋巴結(jié)轉(zhuǎn)移時(shí),DL能夠識(shí)別傳統(tǒng)圖像分析方法無(wú)法識(shí)別的高維度特征信息。JIANG等[18]納入167例CC患者的2 056幅MRI,包括1 070幅T1WI和986幅T2WI,其中862幅可見(jiàn)LVSI、1 194幅無(wú)LVSI,所構(gòu)建的T1WI DL模型的判斷力高于T2WI模型,二者聯(lián)合預(yù)測(cè)早期CC LVSI的AUC為0.911,敏感度為0.881,特異度為0.752。
2.3 指導(dǎo)放療 基于AI的放療主要包括依據(jù)CC的組織學(xué)特征智能制定放療方案,以及結(jié)合影像學(xué)特征自動(dòng)區(qū)分腫瘤組織與正常組織,實(shí)現(xiàn)精準(zhǔn)勾畫(huà)靶區(qū),避免損傷正常組織。CHEN等[19]納入140例CC患者,將其中100例用于訓(xùn)練、20例用于驗(yàn)證、20例用于測(cè)試,以構(gòu)建的基于CNN的預(yù)測(cè)模型和自動(dòng)優(yōu)化策略確定自動(dòng)調(diào)強(qiáng)放療(intensity modulated radiation therapy, IMRT)的靶區(qū),其靶標(biāo)覆蓋率和計(jì)算劑量與初級(jí)或高級(jí)技師手動(dòng)制定方案相比差異無(wú)統(tǒng)計(jì)學(xué)意義,而劑量均一性略有降低,但多數(shù)危險(xiǎn)器官的平均劑量明顯降低,并使膀胱及直腸的臨床靶區(qū)體積分別降低6.3%及12.3%,直腸及骨髓的平均劑量分別降低1.1 Gy和1.8 Gy,提示自動(dòng)IMRT程序可在不犧牲目標(biāo)劑量的情況下降低劑量、減少正常組織損傷。
RHEE等[20]納入2 254例CC患者的CT圖像構(gòu)建放療靶區(qū)自動(dòng)勾畫(huà)模型,實(shí)現(xiàn)了自動(dòng)勾畫(huà)病變組織及11個(gè)正常結(jié)構(gòu)(7個(gè)危險(xiǎn)器官和4個(gè)骨性結(jié)構(gòu)),其中原發(fā)病變、盆腔淋巴結(jié)、主動(dòng)脈旁淋巴結(jié)的臨床靶區(qū)的戴斯相似性系數(shù)(Dice similarity coefficient, DSC)分別為0.86、0.81及0.76,平均表面距離分別為0.19、0.21及0.27 cm,豪斯多夫距離(Hausdorff distance, HD)分別為2.02、2.09及2.00 cm;在外部測(cè)試集中,該模型勾畫(huà)的80%臨床靶區(qū)、97%危險(xiǎn)器官和98%骨性結(jié)構(gòu)均可接受。秦楠楠等[21]將自動(dòng)勾畫(huà)模型用于100例接受IMRT治療的CC患者CT圖像,其勾畫(huà)臨床靶區(qū)的DSC為0.860,HD為13.9 mm,勾畫(huà)危險(xiǎn)器官(膀胱、直腸和左、右股骨頭)的平均DSC為0.898,平均HD為5.3 mm,且在內(nèi)部和外部數(shù)據(jù)集中均表現(xiàn)良好,臨床適用性較高。隨著算法的進(jìn)一步精準(zhǔn)化,DL將成為指導(dǎo)放療的主要方法之一。
2.4 預(yù)測(cè)預(yù)后 SHEN等[22]基于142例CC患者的18F-FDG PET/CT構(gòu)建DL模型,其預(yù)測(cè)放化療后局部復(fù)發(fā)和遠(yuǎn)處轉(zhuǎn)移的敏感度分別為71%及77%,特異度分別為93%及90%,陽(yáng)性預(yù)測(cè)值分別為63%及63%,陰性預(yù)測(cè)值分別為95%及95%,準(zhǔn)確率分別為89%及87%,能夠較好地預(yù)測(cè)臨床療效。于治療前影像學(xué)資料中獲取預(yù)測(cè)療效信息并制定個(gè)體化治療方案是DL的研究方向,雖然目前基于影像學(xué)數(shù)據(jù)構(gòu)建DL模型用于預(yù)測(cè)CC患者生存期的文獻(xiàn)較少,基于臨床相關(guān)數(shù)據(jù)構(gòu)建的DL模型已在預(yù)測(cè)CC患者預(yù)后方面表現(xiàn)出一定優(yōu)勢(shì)[23-24]。聯(lián)合臨床及影像學(xué)信息共同構(gòu)建預(yù)測(cè)模型將是未來(lái)發(fā)展方向。
DL用于CC診療已取得一定成果,但目前仍屬臨床輔助工具,且面臨以下問(wèn)題:①模型的準(zhǔn)確性、泛化性和魯棒性,模型基于數(shù)據(jù)驅(qū)動(dòng)算法,需要大樣本、高質(zhì)量訓(xùn)練數(shù)據(jù)支撐,但目前缺乏多中心、高質(zhì)量、大樣本訓(xùn)練數(shù)據(jù)集,且圖像質(zhì)量和規(guī)范未能實(shí)現(xiàn)同質(zhì)化;②模型的可解釋性,模型可解釋性越高,輸出結(jié)果越易被用戶理解,隨著模型性能的提高,其結(jié)構(gòu)越來(lái)越復(fù)雜,隨之而來(lái)的可解釋性成為DL發(fā)展的難題之一;③圖像標(biāo)注需要影像科、婦科、病理科、流行病學(xué)專家及AI工程師進(jìn)行跨學(xué)科協(xié)作,存在質(zhì)量一致性與規(guī)范性問(wèn)題;④數(shù)據(jù)安全及個(gè)人隱私,DL數(shù)據(jù)收集涉及醫(yī)學(xué)倫理和法律法規(guī)等多個(gè)領(lǐng)域,如何絕對(duì)保證數(shù)據(jù)安全和嚴(yán)格保護(hù)個(gè)人信息是必須面對(duì)的問(wèn)題。
隨著DL技術(shù)的快速發(fā)展,其在篩查和診斷CC、指導(dǎo)治療、評(píng)估療效及預(yù)測(cè)預(yù)后中必將發(fā)揮重要作用?;贒L技術(shù)和多模態(tài)影像學(xué)構(gòu)建的CC診療模型可為定量評(píng)估CC提供客觀依據(jù)。如何在提高診療效率及醫(yī)療服務(wù)質(zhì)量的同時(shí)減輕醫(yī)生工作負(fù)擔(dān)將成為DL在CC的主要研究方向。