尤 堃,郝鵬翼,吳福理,張 繁,吳 健
基于三維卷積神經(jīng)網(wǎng)絡的肺結(jié)節(jié)假陽性篩查
尤 堃1,3,郝鵬翼1,3,吳福理1,3,張 繁1,吳 健2,3
(1. 浙江工業(yè)大學計算機科學與技術(shù)學院,浙江 杭州 310023;2. 浙江大學計算機科學與技術(shù)學院,浙江 杭州 310058;3. 浙江大學睿醫(yī)人工智能研究中心,浙江 杭州 310000)
從CT影像中檢測肺結(jié)節(jié)在肺癌的早期診斷中至關(guān)重要,而肺結(jié)節(jié)假陽性的篩查是提高肺結(jié)節(jié)檢測準確度的重要一步。為了從大量候選結(jié)節(jié)中快速準確地區(qū)分出真正的肺結(jié)節(jié),設(shè)計了一個3D卷積神經(jīng)網(wǎng)絡(CNN)篩查肺結(jié)節(jié)假陽性。提出了網(wǎng)絡模型,通過恒等映射和殘差單元來加速模型訓練,采用單連接路徑重復利用特征并重組新特征?;谠撃P偷姆谓Y(jié)節(jié)假陽性篩查方法,與基于2D CNN的方法相比,不僅可以省略數(shù)據(jù)切片步驟,而且能夠充分利用CT影像的空間信息; 與其他基于3D CNN的方法相比,具有參數(shù)量小、模型訓練快的優(yōu)點。該方法在LUNA16數(shù)據(jù)集中的假陽性篩查中取得了較高的敏感度。
3D CNN;肺結(jié)節(jié);假陽性篩查
隨著空氣質(zhì)量的惡化、二手煙危害的加深等原因,肺癌已成為世界范圍內(nèi)發(fā)病率及死亡率最高的惡性腫瘤[1]。肺癌中晚期的治療效果不理想,遠期生存率很低,肺癌最常見的早期形態(tài)為肺結(jié)節(jié)(pulmonary nodule),此階段是進行肺癌治療的最佳時期,所以對肺結(jié)節(jié)的檢測和診斷顯得尤為重要[2]。肺結(jié)節(jié)是肺組織內(nèi)部的肉芽腫性疾病,影像與肺部正常組織存在密度差異,其大小由3 ~30 mm不等。使用低劑量螺旋計算機斷層掃描(low-dose spiral computed tomography,LDCT)可以檢測到最小3 mm的肺結(jié)節(jié)。LDCT一次可以產(chǎn)生幾百張軸向影像,篩查肺結(jié)節(jié)需要花費大量時間。此外,根據(jù)肺結(jié)節(jié)的位置和表現(xiàn)形式不同,又可以將結(jié)節(jié)細分為孤立性、血管粘連性、胸膜粘連性、磨玻璃以及空洞性。肺結(jié)節(jié)具有體積小、形態(tài)不規(guī)則、周圍環(huán)境各異的特點,進一步增加了肺結(jié)節(jié)檢測難度[3]。
近二十年來,研究人員不斷探索從醫(yī)學CT影像中檢測肺結(jié)節(jié)的方法。肺結(jié)節(jié)檢測主要分為2個階段,即檢測候選結(jié)節(jié)及在候選結(jié)節(jié)中篩查假陽性(false positive)。假陽性篩查是肺結(jié)節(jié)檢測的關(guān)鍵。候選檢測的主要目的是避免遍歷整個胸腔CT影像,減少檢測的時間成本。檢測通常根據(jù)結(jié)節(jié)類似橢球體的外觀特點,使用基于局部強度分布的方法。例如,TAN等[4]先歸一化CT影像的梯度,再根據(jù)其最小散度值進行聚類。
傳統(tǒng)肺結(jié)節(jié)檢測方法一般手工設(shè)計特征,然后利用此特征訓練檢測模型。例如,JACOBS等[5]根據(jù)強度、形狀、紋理,并結(jié)合肺結(jié)節(jié)周圍的解剖結(jié)構(gòu)信息組成特征。MESSAY等[6]利用形狀、位置、強度信息以及梯度特征組成綜合特征。然而,手工設(shè)計特征的方式成本高,特征表達能力依賴特征描述符的選擇以及參數(shù)設(shè)置,無法很好應對肺結(jié)節(jié)的多樣性。
近幾年,深度卷積神經(jīng)網(wǎng)絡(deep convolutional neural network,CNN)在圖像目標檢測及分類領(lǐng)域取得了極大的成功[7-8]。CNN利用大量數(shù)據(jù)訓練獲取魯棒性和泛化性較好的特征提取能力,其特征表達能力遠強于手工設(shè)計的特征。SETIO等[9]在假陽性篩查階段使用了2D CNN,從不同方向提取了肺結(jié)節(jié)的二維切片,將其作為CNN的輸入,此方法在LIDC-IDRI數(shù)據(jù)集[10](lung image database donsortium-image database resource initiative)上實現(xiàn)了1 FFPS(false positive per scan)下85.4%的敏感度(sensitivity)。ROTH等[11]對三維VOI進行多次二維正交采樣,構(gòu)造2.5D的肺結(jié)節(jié)表達并訓練2D CNN,此方法在90個CT共388個肺結(jié)節(jié)以及86個CT共595個肺結(jié)節(jié)中,3 FPPS下分別達到了70%和83%的敏感度。CIOMPI等[12]將預先訓練的過擬合CNN中最后一個卷積層輸出的特征圖作為對肺結(jié)節(jié)三維結(jié)構(gòu)的二維表達。由于CT數(shù)據(jù)均為三維,基于2D CNN的算法需要對原始數(shù)據(jù)進行切片采樣,并不能充分利用的三維空間信息。
盡管三維醫(yī)學數(shù)據(jù)在臨床實踐中已經(jīng)相當普遍,但3D CNN在肺結(jié)節(jié)檢測上的應用研究依舊處于初級階段,研究成果較少。DOBRENKII等[13]設(shè)計了一種用于肺結(jié)節(jié)假陽性篩查的3D CNN,直接以三維樣本為輸入,在LUNA16 (lung nodule analysis 2016)數(shù)據(jù)集中實現(xiàn)了8 FPPS下85.6%的敏感度。DOU等[14]同樣使用了LUNA16數(shù)據(jù),針對不同的肺結(jié)節(jié)尺寸采取不同尺寸的輸入樣本,分別設(shè)計并訓練了3個3D CNN模型。與2D CNN相比,3D CNN可以編碼更加豐富的多級空間信息,提取更加全面的特征。然而,3D CNN所含參數(shù)量遠高于2D CNN,需要占用更大的內(nèi)存,訓練時間和難度都大大增加。其中,文獻[13]的CNN模型通過1 827輪次才完成訓練。
本文提出了一種用于肺結(jié)節(jié)假陽性篩查的3D CNN,該模型綜合了ResNet[15]重復使用特征、收斂速度快的特點與DenseNet[16]重組新特征的能力。與2D CNN相比,該模型可以省略數(shù)據(jù)切片步驟,充分利用三維數(shù)據(jù)的空間信息,提取更全面的特征表達。同時,與其他3D CNN相比,該模型參數(shù)量少,與文獻[13]中的模型相比,節(jié)省了95.5%的參數(shù)量,參數(shù)利用率更高,訓練難度更低。在LUNA16數(shù)據(jù)集中,實現(xiàn)了8 FPPS下89.97%的敏感度。
通過殘差路徑可以有效解決網(wǎng)絡過深帶來的梯度消失問題,提高優(yōu)化效率和訓練速度。通過分析殘差單元在CNN反向傳播過程中的作用原理,文獻[8]結(jié)合實驗證明了當映射和均為恒等映射時