楊友良,孟文龍,張建舒,陳 波
(華北理工大學(xué) 電氣工程學(xué)院,河北 唐山 063210)
近年來,社會(huì)發(fā)展不斷進(jìn)步,地球的生態(tài)環(huán)境卻不斷惡化。吸煙、由于職業(yè)的原因經(jīng)常接觸致癌因子以及空氣污染等原因都會(huì)使肺癌發(fā)生的危險(xiǎn)性增加。根據(jù)世界衛(wèi)生組織發(fā)布的《全球癌癥報(bào)告》與中華醫(yī)學(xué)會(huì)關(guān)于腫瘤學(xué)的年會(huì)報(bào)告給出的有關(guān)數(shù)據(jù)來看,肺癌的發(fā)病人數(shù)在全球的惡性腫瘤患者中約占19%,居于首位;全球每年新增肺癌患者大約為180萬人,其中大約160萬人因治療無效而死亡,死亡率高達(dá)88%。我國(guó)每年肺癌患者的新增人數(shù)約占世界肺癌患者新增人數(shù)的30%。根據(jù)臨床醫(yī)學(xué)的經(jīng)驗(yàn),如果在早期就能診斷出肺癌并且獲得及早的治療,患者的生存幾率將會(huì)得到大幅度的提高。由于在肺癌早期患者的癥狀不明顯,因此很難被察覺到。癌細(xì)胞發(fā)生擴(kuò)散轉(zhuǎn)移之后,患者才會(huì)感覺到明顯的癥狀,此時(shí)患者已經(jīng)是肺癌晚期階段,錯(cuò)過了治療的最佳時(shí)間點(diǎn),所以早發(fā)現(xiàn)早治療對(duì)肺癌患者具有重大意義。
對(duì)肺結(jié)節(jié)的檢測(cè)分為兩個(gè)步驟,即檢測(cè)候選結(jié)節(jié)及在候選結(jié)節(jié)中去除假陽性結(jié)節(jié)。候選結(jié)節(jié)檢測(cè)是在不考慮假陽性的情況下盡可能地將肺部CT圖像中的疑似結(jié)節(jié)全部提取出來。假陽性肺結(jié)節(jié)的篩除直接影響了肺結(jié)節(jié)檢測(cè)算法的準(zhǔn)確度。通過第一步檢測(cè)所產(chǎn)生的肺結(jié)節(jié)候選區(qū)域中會(huì)存在著大量的非結(jié)節(jié),稱之為假陽性結(jié)節(jié)。篩除假陽性結(jié)節(jié)主要分為兩個(gè)關(guān)鍵步驟:首先是對(duì)真陽性肺結(jié)節(jié)進(jìn)行特征提?。蝗缓笤賹?duì)提取出來的特征進(jìn)行分類。特征提取的方法分為基于傳統(tǒng)機(jī)器學(xué)習(xí)的特征提取和基于深度卷積神經(jīng)網(wǎng)絡(luò)提取兩種方法。
將深度學(xué)習(xí)引入到對(duì)圖像的特征提取中,可以更準(zhǔn)確地對(duì)圖像特征進(jìn)行提取。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)中最普遍也是最關(guān)鍵的一個(gè)訓(xùn)練網(wǎng)絡(luò),自從卷積神經(jīng)網(wǎng)絡(luò)的概念被提出以后,國(guó)內(nèi)外學(xué)者將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到圖像特征提取中的熱情日益高漲。卷積神經(jīng)網(wǎng)絡(luò)對(duì)肺結(jié)節(jié)特征的提取過程是:將肺結(jié)節(jié)的圖片直接傳送到卷積神經(jīng)網(wǎng)絡(luò)模型中,通過網(wǎng)絡(luò)隱含層的自主學(xué)習(xí)將肺結(jié)節(jié)主要特征提取出來。文獻(xiàn)[3]基于OverFeat算法對(duì)疑似肺結(jié)節(jié)的軸向面圖像、二維矢狀面圖像和冠狀面圖像進(jìn)行訓(xùn)練,提取到了4 096個(gè)維度特征作為支持向量機(jī)的輸入對(duì)其進(jìn)行分類。文獻(xiàn)[4]提出一種基于多視角二維卷積網(wǎng)絡(luò)實(shí)現(xiàn)假陽性結(jié)節(jié)的減少,該方法通過多角度切割二維切片從而獲取到更豐富的結(jié)節(jié)特征。文獻(xiàn)[5]采用一種三維卷積神經(jīng)網(wǎng)絡(luò)對(duì)肺結(jié)節(jié)進(jìn)行掃描以降低假陽性的新方法,該網(wǎng)絡(luò)的訓(xùn)練樣本采用三維圖像可以提取到更多的數(shù)據(jù)結(jié)構(gòu),提出了一種較為簡(jiǎn)單且有效的多層次背景信息編碼策略。實(shí)驗(yàn)結(jié)果證明,對(duì)于小尺度肺結(jié)節(jié),采用這種多層次背景信息整合到三維卷積神經(jīng)網(wǎng)絡(luò)中的檢測(cè)方法更為有效。
目前,卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用范圍越來越廣闊,特別是在圖像處理領(lǐng)域。因?yàn)榫矸e運(yùn)算為二維運(yùn)算,只能針對(duì)靜態(tài)圖像進(jìn)行分類識(shí)別,因此,科研人員通過設(shè)計(jì)改進(jìn),基于三維卷積核構(gòu)建出了三維卷積神經(jīng)網(wǎng)絡(luò),其優(yōu)勢(shì)在于三維卷積核和三維池化層可以將包含時(shí)間在內(nèi)的特征信息提取出來。
3D CNN與2D CNN都由輸入層、卷積層、池化層、全連接層和輸出層組成;池化層和卷積層交替設(shè)置;全連接層設(shè)置在輸出層之前,在結(jié)構(gòu)上較為相似。只不過3D CNN除了可以利用平面上的紋理、像素以及形狀等特征,還可以利用三維圖像中的時(shí)間信息、空間信息和上下文關(guān)聯(lián)信息等多重特征,并且卷積層和池化層的輸入、輸出都是三維的特征體。兩種卷積操作如圖1所示。
圖1 三維卷積與二維卷積操作對(duì)比
三維卷積常用于醫(yī)學(xué)圖像領(lǐng)域,三維卷積與二維卷積的運(yùn)算大致相同,只不過三維卷積操作中增加了時(shí)間維度,提取到了視域的信息。三維卷積操作的輸入數(shù)據(jù)是多個(gè)連續(xù)幀構(gòu)成的立方體,和二維卷積相同的是,每一個(gè)三維卷積核只可以在輸入數(shù)據(jù)中提取到一種特征,如果想得到多種不同的特征圖必須使用多個(gè)不同的卷積核。三維卷積核的卷積為:
式中:為激活函數(shù);為可加性偏置;,,代表三維卷積核三個(gè)維度的大??;為上一層第個(gè)特征圖和特征圖上空間坐標(biāo)為(,,)位置上的權(quán)值;代表特征圖上對(duì)應(yīng)的輸出。
三維卷積層對(duì)三維模型進(jìn)行卷積操作之后網(wǎng)絡(luò)中的數(shù)據(jù)量會(huì)劇增,因此研究人員將池化區(qū)域從二維空間擴(kuò)展到三維空間,池化范圍從二維平面擴(kuò)展到三維立體。這樣做的目的是為了減少模型中的網(wǎng)絡(luò)參數(shù)。三維池化也同樣包括平均池化和最大池化,最大池化的計(jì)算公式為:
式中:為輸入的三維向量;代表經(jīng)過最大池化操作后的輸出;,,分別代表三個(gè)方向上的采樣步長(zhǎng)。通過三維池化對(duì)三維卷積后的數(shù)據(jù)進(jìn)行降維,節(jié)省了計(jì)算時(shí)間,還提升了整個(gè)模型的魯棒性。
在進(jìn)行圖像分割時(shí)有時(shí)會(huì)出現(xiàn)擴(kuò)大感受野而造成特征信息丟失的現(xiàn)象發(fā)生,為了解決此問題,提出了空洞卷積的概念。常見的圖像分割算法通常使用池化層和卷積層來增加感受野,但是在增大感受野的同時(shí)也縮小了特征圖尺寸,然后再利用上采樣還原圖像尺寸,特征圖縮小再放大的過程造成了精度上的損失,因此需要一種操作可以在增加感受野的同時(shí)保持特征圖的尺寸不變,從而代替下采樣和上采樣操作。
不同于正常的卷積,空洞卷積引入了一個(gè)稱為“擴(kuò)張率(Dilation Rate)”的超參數(shù)(Hyper-parameter),該參數(shù)定義了卷積核處理數(shù)據(jù)時(shí)各值的間距。擴(kuò)張率也稱為空洞數(shù)(Hole Size)。如圖2a)為普通卷積,圖2b)是擴(kuò)張率為2的空洞卷積,空洞卷積相比普通卷積并無太大區(qū)別,二者學(xué)習(xí)的參數(shù)數(shù)量是一致的,但是因?yàn)橐肓藬U(kuò)張率,空洞卷積中加入了空洞間隔,因此空洞卷積能獲得更大的感受野并且特征圖的分辨率不會(huì)隨著感受野的增大而減小。
圖2 普通3×3卷積與3×3的空洞卷積
本節(jié)提出一種基于3D CNN網(wǎng)絡(luò)的假陽性篩選方法,使用三維網(wǎng)絡(luò)模型避免了對(duì)三維數(shù)據(jù)進(jìn)行特征提取時(shí)出現(xiàn)空間信息損失的現(xiàn)象;由于網(wǎng)絡(luò)輸入數(shù)據(jù)的尺寸較小,通過池化操作在增大感受野的同時(shí)伴隨著分辨率的降低特征圖的尺寸也隨之減小。肺結(jié)節(jié)作為正樣本,本身形態(tài)尺寸較小,特征較為稀少,因此引入空洞卷積代替池化操作,不僅可以擴(kuò)大神經(jīng)元的感受野,并且可以保留內(nèi)部數(shù)據(jù)的空間結(jié)構(gòu),盡可能多地獲取到肺結(jié)節(jié)的相關(guān)特征。
本節(jié)建立了一個(gè)基于3D CNN的肺結(jié)節(jié)假陽性剔除網(wǎng)絡(luò)模型,該網(wǎng)絡(luò)模型的主要任務(wù)是對(duì)輸入的三維候選肺結(jié)節(jié)進(jìn)行一個(gè)二分類,在網(wǎng)絡(luò)模型的下采樣階段提取數(shù)據(jù)特征進(jìn)行學(xué)習(xí),從而實(shí)現(xiàn)分類任務(wù),通過引入空洞卷積操作代替池化操作來保證在特征圖尺寸不至于過小的情況下增大網(wǎng)絡(luò)模型的感受野。網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,其中C為卷積層,DC為空洞卷積層,P為池化層,F(xiàn)C為全連接層。
2002年以來,政府對(duì)石門桂花村進(jìn)行了規(guī)劃和開發(fā),在保持鄉(xiāng)村特色的基礎(chǔ)上,突出生態(tài)休閑。2003年9月底重點(diǎn)建成“古桂觀賞”、“休閑娛樂”、“餐飲服務(wù)”三大區(qū)塊。2005 年,結(jié)合“全面小康建設(shè)示范村”創(chuàng)建和當(dāng)?shù)亓己玫纳鷳B(tài)環(huán)境,建設(shè)生態(tài)度假村,創(chuàng)建“農(nóng)家樂”。二期投入200萬元,景區(qū)面積擴(kuò)大一倍。2011年石門桂花村第三期建設(shè),投入資金500多萬元,建成占地51.3畝的生態(tài)桂花園。同年規(guī)模較大的為桂花酒家(石門桂花村農(nóng)家樂餐飲企業(yè)目前有7家),投資150多萬元在原桂緣草堂的基礎(chǔ)上進(jìn)行改造,進(jìn)一步完善了服務(wù)設(shè)施,增加了鄉(xiāng)村文化元素,確保了石門桂花村特有的鄉(xiāng)村氣息。
圖3 3D CNN網(wǎng)絡(luò)模型
針對(duì)本文所提出的基于3D CNN模型肺結(jié)節(jié)檢測(cè)網(wǎng)絡(luò),實(shí)現(xiàn)步驟為:
1)本文將3D CNN卷積神經(jīng)網(wǎng)絡(luò)模型的原始輸入像素尺寸16×112×112×3改變?yōu)?6×36×36×1,這樣使得3D CNN卷積神經(jīng)網(wǎng)絡(luò)模型在整體的圖片上進(jìn)行窗口滑動(dòng)識(shí)別的同時(shí)進(jìn)行定位,將一個(gè)復(fù)雜的定位問題轉(zhuǎn)化為識(shí)別和定位同步進(jìn)行的問題。同時(shí),使用小像素尺寸的圖片作為輸入也極大地提高了定位的準(zhǔn)確性和模型的運(yùn)算效率。
2)將輸入的圖像依次進(jìn)行兩次卷積操作,對(duì)應(yīng)的卷積核尺寸為3×3×3,且通道數(shù)為32,然后在后續(xù)的3D卷積過程中,考慮到在進(jìn)行特征提取時(shí)會(huì)丟失相應(yīng)的信息,因此將部分池化層由空洞卷積和普通卷積替換,其中空洞卷積的擴(kuò)張率為2,二者卷積核大小均為2×2×2,通道數(shù)為32,再接入dropout層防止過擬合。最終經(jīng)過池化層和全連接層輸出二分類結(jié)果。
本文實(shí)驗(yàn)環(huán)境:操作系統(tǒng)為Ubuntu 16.04,處理器為IntelXeonSilver 4114 CPU,32 GB內(nèi)存,NVIDIA GeForce GTX 1080Ti顯卡,11 GB顯存。深度學(xué)習(xí)框架為TensorFlow,所使用的編譯語言為Python。
本文使用公開的LUNA16數(shù)據(jù)集作為實(shí)驗(yàn)數(shù)據(jù)。LUNA16數(shù)據(jù)集將LIDC-IDRI數(shù)據(jù)集中切片厚度大于2.5 mm的CT圖像以及切片像素不一致或不完整的CT圖像去掉,形成了包含888例胸部CT薄層平掃圖像的數(shù)據(jù)集,且分為10個(gè)子集。
在肺結(jié)節(jié)檢測(cè)任務(wù)中,如果CT圖像中存在肺結(jié)節(jié)則認(rèn)為是陽性(Positive),反之為陰性(Negative)。在實(shí)驗(yàn)中對(duì)CT檢測(cè)結(jié)果為肺結(jié)節(jié)且同時(shí)在數(shù)據(jù)集中也被標(biāo)記為結(jié)節(jié)則稱為真陽性(TP);若在數(shù)據(jù)集中未標(biāo)記為結(jié)節(jié)則稱為假陽性(FP);在實(shí)驗(yàn)結(jié)果檢測(cè)為非結(jié)節(jié)且實(shí)際也為非結(jié)節(jié)則表示為真陰性(TN);實(shí)驗(yàn)結(jié)果表示為非結(jié)節(jié)實(shí)際真結(jié)節(jié)則稱為假陰性(FN)。
假陽性率(False Positive Rate,F(xiàn)PR)又稱為誤診率,是指在實(shí)驗(yàn)檢測(cè)結(jié)果顯示為肺結(jié)節(jié)實(shí)際不是結(jié)節(jié)的數(shù)量占數(shù)據(jù)集中標(biāo)注為非結(jié)節(jié)數(shù)量的比例。
真陰性率(True Negative Rate,TNR)也被稱為特異性,表示在實(shí)驗(yàn)檢測(cè)結(jié)果中顯示為非結(jié)節(jié)并且在數(shù)據(jù)集中也被標(biāo)注為非結(jié)節(jié)的數(shù)量占數(shù)據(jù)集中所有標(biāo)注為非結(jié)節(jié)數(shù)量的比例。
假陰性率(False Negative Rate,F(xiàn)NR)即漏診率,表示在實(shí)驗(yàn)檢測(cè)結(jié)果顯示為非結(jié)節(jié)在數(shù)據(jù)集中被標(biāo)記為結(jié)節(jié)的數(shù)量占數(shù)據(jù)集中標(biāo)記為結(jié)節(jié)數(shù)量的比例。
ROC曲線即接受者操作特征曲線,用來展示二分類器的診斷能力隨著鑒別閾值的變化而變化。ROC曲線是通過繪制真陽性率和不同閾值設(shè)置下的假陽性率的關(guān)系而得到的,AUC是ROC曲線與坐標(biāo)橫軸圍成的面積,歸一化單位后,AUC面積可以表示分類器正確分類正樣本多于正確分類負(fù)樣本的概率,AUC值越大說明算法能夠更好地分類正樣本。
利用3D CNN進(jìn)行假陽性結(jié)節(jié)篩除,3D CNN模型預(yù)測(cè)結(jié)果如表1,圖4所示。
圖4 ROC曲線圖
表1 預(yù)測(cè)結(jié)果
綜上可知:ROC曲線非常靠近左上角,說明模型能較好地判斷結(jié)節(jié)類型,減少漏診和誤診。而AUC表示預(yù)測(cè)的正例置信度大于負(fù)例置信度的概率,AUC越大分類效果越好,0.967的AUC值說明模型對(duì)正例和負(fù)例的分類能力較好。特異性值(TNR)很大,說明對(duì)假陽性的過濾能力強(qiáng),能夠有效地避免誤檢,0.88的敏感度值(TPR)說明模型漏檢的可能性也很小。實(shí)驗(yàn)表明提出的三維卷積神經(jīng)網(wǎng)絡(luò)適用于降低肺結(jié)節(jié)檢測(cè)中的假陽性率。
注:本文通訊作者為孟文龍。