許曉燕,周 永,甘曉晶,余瑩瑩,文 智
(新疆醫(yī)科大學附屬腫瘤醫(yī)院影像中心,烏魯木齊 830000)
據(jù)統(tǒng)計,2018年全球約有209萬肺癌新發(fā)病例,其中176萬人因肺癌死亡[1]。肺腺癌屬于非細胞肺癌,多發(fā)于女性,且近年來復發(fā)率與致死率較高[2]。肺腺癌可分為浸潤性腺癌(IAC)、微浸潤腺癌(MIA)、浸潤前病變,浸潤前病變又可分為原位腺癌、不典型腺瘤樣增生。磨玻璃結節(jié)(GGN)為肺腺癌患者早期CT影像學圖像上常出現(xiàn)的肺部影像學征象[3]。近年來,隨著人們生活水平及健康意識不斷提高、胸部低劑量CT掃描廣泛應用,越來越多GGN被發(fā)現(xiàn),但對其定性診斷較困難,人工智能(AI)輔助診斷系統(tǒng)可快速自動識別及標記肺內GGN并進行定量分析[4]。本研究主要建立基于AI的CT影像學特征預測模型,并驗證其對GGN病例IAC風險的預測意義。
回顧性選取新疆醫(yī)科大學附屬腫瘤醫(yī)院2015年5月-2020年9月GGN病例595例,納入標準:1)因體檢或意外行螺旋CT掃描發(fā)現(xiàn)肺部至少1個GGN,直徑≤30 mm,施行手術;2)符合AI診斷的胸部CT薄層圖像原始數(shù)據(jù)。排除標準:1)病灶直徑>30 mm;2)CT檢查圖像質量不符合要求。依據(jù)相關標準[5]將GGN按病理結果分為浸潤前組(n=107)、微浸潤組(n=124)、IAC組(n=364)。另前瞻性選取2020年10月-2021年5月GGN病例250例進行驗證。
1.2.1 臨床資料調查 調查術后病例資料,1)記錄一般臨床特征,包括性別、年齡、體質量指數(shù)(BMI)、吸煙史、肺癌家族史;2)記錄患者術前腫瘤標志物[癌胚抗原(CEA)、鱗狀細胞癌抗原(SCC)、細胞角蛋白19片段(Cyfra21-1)、胃泌素釋放肽前體(ProGRP)、神經(jīng)元特異性烯醇化酶(NSE)、癌胚抗原153(CA153)]、基因檢測結果[表皮生長因子受體(EGFR)、大鼠肉瘤病毒癌基因(KRAS)、漸變性淋巴瘤激酶(ALK)、酪氨酸蛋白激酶MET、鼠類肉瘤病毒癌基因同源物B1(BRAF)及表皮生長因子受體-2(HER-2)]。
1.2.2 基于AI的CT影像學分析 基于深度學習模型的AI軟件(Dr.wise,1.19.2.16版本)(深睿醫(yī)療公司),由AI自動對GGN進行識別、標記及特征定量分析,記錄每個GGN的定量分析參數(shù)。經(jīng)AI識別軟件自動勾畫病灶進行三維定量測量,得到結節(jié)密度(平均CT值)、2D長徑與短徑、3D長徑與標準徑(mm)、最大面面積、表面積、體積、質量。
采用SPSS 23.0統(tǒng)計學軟件處理數(shù)據(jù),計量資料以均數(shù)±標準差(±s)表示,行單因素方差分析及LSD-t檢驗;計數(shù)資料以率(%)表示,采用χ2檢驗,多因素Logistic回歸法得出風險模型,H-L卡方檢驗模型符合度,受試者工作特征曲線(ROC)反映預測模型區(qū)分能力。以P<0.05為差異有統(tǒng)計學意義。
3組年齡、術前 SCC、Cyfra21-1、ProGRP、NSE、EGFR基因突變率比較,差異有統(tǒng)計學意義(P<0.05)。見表1。
表1 3組臨床資料比較 例/%
3組AI測得的平均CT值、2D長徑與短徑、3D長徑與標準徑、最大面面積、表面積、體積、質量比較,差異有統(tǒng)計學意義(P<0.05)。見表2。
表2 3組AI定量參數(shù)比較(±s)
表2 3組AI定量參數(shù)比較(±s)
注:與浸潤前組比較,# P<0.05;與微浸潤組比較,△P<0.05
項目 浸潤前組images/BZ_135_857_1842_1618_1880.pngIAC組(n=364)平均CT值/Hu-550.48±59.12-513.45±52.67#-465.18±47.96#△2D 長徑 /mm 12.61±1.35 15.13±1.62# 19.44±1.98#△2D 短徑 /mm 9.67±0.98 11.35±1.24# 13.49±1.37#△3D 長徑 /mm 11.45±1.26 12.67±1.35# 14.58±1.56#△3D標準徑/mm 8.79±0.88 10.12±1.18# 11.86±1.25#△最大面面積/mm2 49.24±5.48 86.43±8.79# 106.42±11.45#△表面積 /mm2 263.48±27.98 517.62±54.88# 864.75±89.32#△體積 /mm3 713.24±72.66 1 245.89±159.72# 2 067.35±214.33#△質量 /(×103)-321.02±34.58-563.47±57.56# 842.14±86.95#△
ROC上,表面積預測IAC的敏感度較高,平均CT值的特異度高,2D長徑的曲線下面積大,平均CT值、2D長徑、體積聯(lián)合后對IAC有較好預測價值,敏感度、特異度、曲線下面積分別為0.83、0.84、0.865。見表3、圖1。
圖1 AI定量參數(shù)預測IAC的ROC曲線
表3 AI定量參數(shù)預測IAC的ROC曲線
Cyfra21-1、ProGRP、NSE、EGFR基因突變及IA測得的平均CT值、2D長徑、體積為診斷GGN為IAC的危險因素(P<0.05)。見表4。預測模型 Z=0.287×Cyfra21-1+0.411×ProGRP+0.189×N SE+0.244×EGFR基因突變+0.286×平均CT值+0.417×2D長徑+0.288×體積-8.159,預測IAC、驗證結果的ROC曲線下面積分別為0.882、0.863,無統(tǒng)計學差異(P>0.05),見圖2。驗證組預測IAC發(fā)生率60.40%(151/250),與實際發(fā)生率58.40%(146/250)比較,無統(tǒng)計學差異(P>0.05),有較好符合程度。
表4 GGN病例IAC風險的預測因素
圖2 驗證與預測IAC結果的ROC曲線
GGN為IAC病例肺部常見影像學病變[6]?;贏I的肺結節(jié)篩查系統(tǒng)憑借深度學習記憶及強大圖片識別功能,可充分顯示GGN診斷的內在價值[7]。研究[8]發(fā)現(xiàn),AI中病灶長徑、短徑、最大截面積、體積的定量測定值在病理證實為惡性的GGN及隨訪穩(wěn)定的GGN中有顯著差異,因此基于AI的病灶CT定量參數(shù)測定有助于為GGN預測臨床治療時機。
本研究3組IAC組各項AI測得的參數(shù)最高,與周圍等[9]的報道相近,而預測IAC的臨界值與以往研究不一致,可能與研究樣本量、AI測量方法及評估準確性不同有關。隨密度(CT值)的增高或實性成分增加,反映病灶惡性程度越高[10],HEIDINGER等[11]發(fā)現(xiàn)密度(CT值)與GGN的相關性不大,可能與病灶本身較小、密度較低,內部纖維化或肺泡塌陷等因素對其影響更突出有關。病灶直徑越長則為IAC的可能性越大[12],本研究發(fā)現(xiàn)3D長徑與標準徑、最大面面積與表面積、結節(jié)體積均有較好敏感度、特異度,質量參數(shù)的診斷優(yōu)勢并不明顯優(yōu)于其他單項指標,結合本次聯(lián)合診斷結果,基于AI的平均CT值、2D長徑、體積聯(lián)合對IAC有較好預測價值。
本研究發(fā)現(xiàn)IAC的模型預測IAC的ROC曲線下面積為0.874,該模型IAC預測值與實際發(fā)生率無統(tǒng)計學意義差異,表明基于AI的CT影像學參數(shù)建立IAC預測模型有較好預測意義,與以往研究[13-14]相符。本研究建立的模型驗證組預測IAC發(fā)生率60.40%,與實際發(fā)生率58.40%比較無統(tǒng)計學差異,說明模型符合程度較好。AI有深度學習功能,較人工測量能減少誤差,基于GGN的各種影像征象有利于提高對IAC的鑒別能力[15]。與以往研究不同的是,本研究比較術前血清腫瘤標記物(Cyfra21-1、ProGRP等)、基因檢測(EGFR突變)等指標,進一步豐富了預測內容,得到較好符合度,因此AI閱片聯(lián)合血清腫瘤標記物及基因檢測結果等可降低GGN中IAC漏診率,提高診斷準確性。
綜上所述,基于AI的CT影像學參數(shù)建立IAC模型有較好的診斷功能,經(jīng)驗證其符合度較好。