劉曉鵬 周海英 胡志雄 金權(quán) 王靜 葉波
肺癌是目前國內(nèi)外發(fā)病率及致死率最高的癌癥,應(yīng)用計(jì)算機(jī)斷層掃描(computed tomography, CT)篩查發(fā)現(xiàn)早期肺癌病灶可降低肺癌的死亡率。隨著CT掃描在各地人群中應(yīng)用的增加,發(fā)現(xiàn)了許多可疑的實(shí)性結(jié)節(jié)(solid nodule)、部分實(shí)性結(jié)節(jié)(part-solid nodule)和磨玻璃密度結(jié)節(jié)(ground glass nodule, GGN),如何在大量的影像資料中區(qū)分出真正的早期肺癌病灶,成為影像及臨床醫(yī)生新的工作難點(diǎn),將人工智能的方式應(yīng)用到篩查肺部結(jié)節(jié)可能會有效地幫助解決這一難題。本研究將使用人工智能軟件對10,000例具有臨床病理確診的T1期肺癌患者CT片進(jìn)行重復(fù)讀取,評估人工智能在臨床早期肺癌診斷中的準(zhǔn)確性。
1.1 研究對象 選擇2012年1月-2017年8月期間在上海交通大學(xué)附屬胸科醫(yī)院胸外科及復(fù)旦大學(xué)附屬金山醫(yī)院胸外科手術(shù)的T1期肺癌患者的CT片10,000例作為人工智能學(xué)習(xí)集,其中1 mm和5 mm層厚CT片各5,000例。
納入標(biāo)準(zhǔn):手術(shù)切除的T1期肺癌病灶,其診斷標(biāo)準(zhǔn)為:肺部CT影像提示1 cm≤結(jié)節(jié)直徑≤3 cm,被肺或臟層胸膜包繞,未累及葉支氣管近端以上位置,術(shù)后病理證實(shí)為肺惡性腫瘤[15]。排除標(biāo)準(zhǔn):結(jié)節(jié)無手術(shù)切除病理學(xué)檢查結(jié)果。剔除標(biāo)準(zhǔn):術(shù)后病理提示為轉(zhuǎn)移性腫瘤。
1.2 研究方法
1.2.1 設(shè)備名稱 definition AS,西門子128層螺旋CT?;颊哐雠P,頭先進(jìn)入,以胸骨柄為定位中心,患者深吸氣并屏氣;行胸部CT掃描,掃描參數(shù)調(diào)節(jié):電流100 mA,電壓120 kV,間距5 mm,層厚5 mm,矩陣512×512,螺距為0.993,范圍為從肺尖以上掃描至橫隔以下;發(fā)現(xiàn)病灶后給予靶向掃描,掃描參數(shù):電流260 mA,電壓120 kV,間距1 mm,層厚1 mm,矩陣不變,螺距調(diào)至1.375。
1.2.2 人工標(biāo)記 使用ITK-SNAP 3.4.0標(biāo)記軟件對T1期肺癌的胸部CT片進(jìn)行人工標(biāo)記。標(biāo)記人員為具有讀片經(jīng)驗(yàn)10年以上的呼吸科主治及以上醫(yī)師,結(jié)合術(shù)后病理報告、術(shù)前影像報告,對CT片上每個層面的肺癌結(jié)節(jié)病灶沿邊緣精確圈標(biāo)。
1.2.3 肺癌結(jié)節(jié)的識別特征及分類規(guī)則學(xué)習(xí) 基于深度學(xué)習(xí)技術(shù),應(yīng)用前期與上海交通大學(xué)合作開發(fā)的人工智能系統(tǒng)[16]分別對1 mm和5 mm層厚CT圖像中手工標(biāo)出的肺癌樣本集合進(jìn)行訓(xùn)練,自動學(xué)習(xí)出肺癌結(jié)節(jié)的識別特征及分類規(guī)則。
1.2.4 評價指標(biāo) 根據(jù)95%目標(biāo)特異性及敏感性,95%CI預(yù)估最小樣本量為409例,故另外選擇1 mm和5 mm層厚CT片各500例作為人工智能驗(yàn)證集,其中1 mm和5 mm層厚T1期肺癌胸部CT片各250例,1 mm和5 mm層厚正常影像CT片各250例,利用人工智能分別進(jìn)行讀片測試,重復(fù)2次讀取結(jié)果評價一致性。同時選擇上海交通大學(xué)附屬胸科醫(yī)院和復(fù)旦大學(xué)附屬金山醫(yī)院具有肺部讀片經(jīng)驗(yàn)10年以上的5位主治及以上醫(yī)師對相同驗(yàn)證集CT片進(jìn)行人工讀片,每人使用隨機(jī)雙盲法抽讀100例CT片,比較兩種讀片方法的特異性、敏感性,評價人工智能檢測肺部小結(jié)節(jié)的有效性。
1.3 統(tǒng)計(jì)學(xué)處理 應(yīng)用medcale統(tǒng)計(jì)軟件,人工智能檢測方法的真實(shí)性使用靈敏度、特異度來評價,并計(jì)算陽性似然比、陰性似然比,以陽性似然比≥10,陰性似然比≤0.10認(rèn)為試驗(yàn)具有較高的診斷價值。使用Kappa分析評價人工智能檢測方法的可靠性。以Kappa值=1表示完全一致,Kappa值<0.4時一致性差,0.4-0.75為中、高度一致,Kappa值≥0.75為一致性極好。兩種方法間率的比較采用卡方檢驗(yàn),以P<0.05為有統(tǒng)計(jì)學(xué)差異。
2.1 人工智能檢測方法的真實(shí)性評價 人工智能篩查在1 mm層厚肺結(jié)節(jié)CT片中自動讀片,自動尋找3 cm以下肺癌結(jié)節(jié),敏感性為96.40%(95%CI: 93.28%-98.34%),特異性為95.60%(95%CI: 92.26%-97.78%),陽性似然比為21.91(95%CI: 12.29-39.06),陰性似然比為0.04(95%CI:0.02-0.07),陽性似然比≥10,陰性似然比≤0.10,認(rèn)為試驗(yàn)具有較高的診斷價值。見表1。人工智能篩查在5 mm層厚肺癌結(jié)節(jié)CT片中自動讀片,自動尋找3 cm以下肺癌結(jié)節(jié),敏感性為95.20%(95%CI: 91.77%-97.50%),特異性為93.20%(95%CI: 89.34%-95.99%),陽性似然比為14(95%CI:8.84-22.17),陰性似然比為0.05(95%CI: 0.03-0.09)。陽性似然比≥10,陰性似然比≤0.10,認(rèn)為試驗(yàn)具有較高的診斷價值。見表2。
2.2 人工智能檢測方法的可靠性評價 利用人工智能對1 mm層厚肺結(jié)節(jié)CT片進(jìn)行讀片測試,自動尋找3 cm以下肺癌結(jié)節(jié),重復(fù)2次讀取。結(jié)果顯示,人工智能對1 mm層厚肺結(jié)節(jié)CT片2次讀片Kappa值為0.938,6,Kappa值接近1,提示一致性極好。見表3。利用人工智能對5 mm層厚肺結(jié)節(jié)CT片進(jìn)行讀片測試,自動尋找3 cm以下肺癌結(jié)節(jié),重復(fù)2次讀取。結(jié)果顯示,人工智能對5 mm層厚CT片2次讀片Kappa值為0.926,1,Kappa值接近1,提示一致性極好。見表4。
2.3 將人工智能檢測與人工讀片進(jìn)行比較 5位醫(yī)師對1 mm層厚的相同驗(yàn)證集CT片進(jìn)行人工讀片,對CT片中3 cm以下肺癌結(jié)節(jié)診斷的敏感性為96.00%(95%CI: 92.77%-98.07%),特異性為98.40%(95%CI:95.95%-99.56%),陽性似然比為60(95%CI: 22.69-158.67),陰性似然比為0.04(95%CI: 0.02-0.07)。見表5。對5 mm層厚的相同驗(yàn)證集CT片進(jìn)行人工讀片,對CT片中3 cm以下肺癌結(jié)節(jié)診斷的敏感性為90.80%(95%CI: 86.52%-94.08%),特異性為97.20%(95%CI: 94.32%-98.87%),陽性似然比為32.43(95%CI: 15.61-67.39),陰性似然比為0.09(95%CI:0.06-0.14),見表6。人工智能與人工讀片比較,檢出率有顯著差異,對于正常無結(jié)節(jié)陰性對照,檢出準(zhǔn)確率低于人工讀片,而對于肺癌結(jié)節(jié)病灶,檢出率高于人工讀片(P<0.05)。見表7。在1 mm層面CT片上,人工智能讀片與人工讀片比較,檢出率無顯著差異(P>0.05)。見表7。
表1 人工智能篩查肺癌結(jié)節(jié)(1 mm層厚)Tab 1 Artificial intelligence screening lung cancer nodules (1 mm)
表2 人工智能篩查肺癌結(jié)節(jié)(5 mm層厚)Tab 2 Artificial intelligence screening lung cancer nodules (5 mm)
表3 2次人工智能篩查肺癌結(jié)節(jié)kappa分析(1 mm層厚)Tab 3 Two times of artificial intelligence (AI) screening lung cancer nodules kappa analysis (1 mm)
表4 2次人工智能篩查肺癌結(jié)節(jié)kappa分析(5 mm層厚)Tab 4 Two times of artificial intelligence screening lung cancer nodules kappa analysis (5 mm)
肺癌是目前國內(nèi)外發(fā)病率及致死率最高的癌癥,全世界每年約有60萬的新發(fā)肺癌患者,低劑量CT篩查有助于早期發(fā)現(xiàn)肺癌,可降低20%的肺癌死亡率[1,2]。胸部低劑量螺旋CT的概念于20世紀(jì)90年代初被首次提及,隨之被應(yīng)用于肺癌篩查中[3,4],目前已逐漸成為常規(guī)體檢項(xiàng)目。
國內(nèi)目前建議年齡在40歲以上或有長期吸煙史的肺癌高風(fēng)險人群,每年至少接受一次胸部CT篩查,推廣這種篩查工作的一個主要障礙是CT影像診斷的巨大工作量。早期肺癌多表現(xiàn)為肺部結(jié)節(jié),它們尺寸小、對比度低、形狀異質(zhì)化高,目前絕大多數(shù)的醫(yī)院仍是采用傳統(tǒng)人工或結(jié)合CAD輔助讀片的方式進(jìn)行臨床診斷,篩查工作主要由臨床醫(yī)生及影像醫(yī)生人工完成。但是每位被檢者的胸腔CT圖像至少有100多張,精細(xì)級的掃描甚至多達(dá)600張,工作量巨大,且容易漏診及誤診,所以隨著體檢人數(shù)的快速增長,人工處理的方法越來越難以勝任此項(xiàng)任務(wù)。
表5 人工讀片篩查肺癌結(jié)節(jié)(1 mm層厚)Tab 5 Lung cancer nodules were screened by artificial reading (1 mm)
表6 人工讀片篩查肺癌結(jié)節(jié)(5 mm層厚)Tab 6 Lung cancer nodules were screened by artificial reading (5 mm)
表7 人工智能篩查與人工讀片比較Tab 7 Comparison between artificial intelligence screening and artificial reading
在過去的十多年里,多種針對肺部結(jié)節(jié)CT篩查的計(jì)算機(jī)輔助診斷(computer aided diagnosis, CAD)系統(tǒng)被開發(fā)出來,其中公開的有代表性的系統(tǒng)有ISICAD、SubsolidCAD、LargeCAD、ETROCAD等[5-7,8-14]。這些CAD系統(tǒng)都是基于傳統(tǒng)的機(jī)器視覺算法來檢測肺部結(jié)節(jié),目前主要應(yīng)用于肺部大中結(jié)節(jié)的篩查,并且存在篩查特異性、敏感性均較低的情況[6,9,14]。近年來,市場上也開始研究人工智能應(yīng)用于醫(yī)療行業(yè)的輔助診斷產(chǎn)品,但仍未形成行業(yè)技術(shù)標(biāo)準(zhǔn),也未在臨床進(jìn)行推廣。隨著人工智能的發(fā)展,對于早期肺部小結(jié)節(jié)而言,通過人工智能產(chǎn)生的算法,輔助醫(yī)生來閱片將是未來發(fā)展的方向。
本研究首先收集肺癌術(shù)后患者的CT,再結(jié)合術(shù)后病理報告和術(shù)前CT影像報告,精確找出肺癌病灶,再使用ITK-SNAP 3.4.0標(biāo)記軟件對肺癌結(jié)節(jié)沿邊緣精確圈定,保證學(xué)習(xí)集的陽性金標(biāo)準(zhǔn)。我們的研究結(jié)果提示,利用人工智能讀取5 mm的胸部CT 500例,對于3 cm以下肺癌結(jié)節(jié)的敏感度達(dá)到95.20%,特異性達(dá)93.20%,兩次重復(fù)讀取的Kappa值為0.926,1,提示一致性極好。對于1 mm胸部CT 500例測試,敏感性為96.40%,特異性為95.60%,兩次重復(fù)讀取的Kappa值為0.938,6,一致性極好。而與5位具有10年以上胸部CT閱片經(jīng)驗(yàn)的高年資醫(yī)師相比,同期對1 mm層厚的相同驗(yàn)證集CT片進(jìn)行讀片,人工智能與人工讀片對于肺癌結(jié)節(jié)和陰性對照讀片的檢測率相似,兩者之間比較無顯著差異。而在5 mm層厚的相同驗(yàn)證集CT片比較中,人工智能對肺癌結(jié)節(jié)的檢出數(shù)優(yōu)于人工讀片,敏感性更高,但誤報數(shù)增多,特異性稍差,這是因?yàn)橛薪?jīng)驗(yàn)的閱片人員,很少會對正常CT片產(chǎn)生誤報,但由于5 mm層厚的CT片有可能無法展現(xiàn)早期肺癌的細(xì)節(jié)特征,故人工讀片容易漏診早期肺癌尤其是小于1 cm的病灶。我們將在未來通過不斷增加樣本量,通過人工智能自動學(xué)習(xí)特性,進(jìn)一步改善人工智能篩查的特異性。另外,本項(xiàng)目的人工智能可達(dá)每秒30 mm的讀片速度,平均10 s即可完成一份讀片,大大節(jié)省了讀片時間。因此,我們認(rèn)為,通過人工智能自動學(xué)習(xí)早期肺癌胸部CT圖像,可以達(dá)到較高的早期肺癌識別的敏感性及特異性,輔助醫(yī)生進(jìn)行診斷工作,減輕醫(yī)生工作量。
將來隨著訓(xùn)練樣本的增多,我們研究的人工智能結(jié)節(jié)篩查率及準(zhǔn)確性將不斷得到提高。下一步我們將對結(jié)節(jié)進(jìn)行亞分類檢測,導(dǎo)入美國國立綜合癌癥網(wǎng)絡(luò)(National Comprehensive Cancer Network, NCCN)指南,針對結(jié)節(jié)特性給出治療建議,并且在此基礎(chǔ)上,將人工智能模型嵌入型編程,擬將其制作成可以與PACS影像系統(tǒng)可插拔式對接的儀器,可直接服務(wù)于影像系統(tǒng),即時獲得影像資料并幫助醫(yī)生及患者分析圖像,并在臨床驗(yàn)證該人工智能的有效性,在驗(yàn)證過程中不斷完善其算法模型和與PACS系統(tǒng)對接的兼容性與多樣性,并將其產(chǎn)業(yè)化,以期將此研究成果直接轉(zhuǎn)化應(yīng)用于臨床。