王 駿,邵立偉,黃德皇,黃鈺斌,于澤源,王艷芳,陳慶武,馬 力(通訊作者)
(1中山火炬開發(fā)區(qū)醫(yī)院放射醫(yī)學科 廣東 中山 528400)
(2中山市北京理工大學研究院 廣東 中山 528400)
(3中國科技大學 安徽 合肥 230000)
(4中山仰視科技有限公司 廣東 中山 528400)
肺癌是致死率最高的疾病之一,在美國這種發(fā)達國家5年生存率只有16%,在發(fā)展中國家更低[1]。隨著現(xiàn)代醫(yī)學的進展,研究人員已經證明如果肺癌能夠在早期進行治療,5年平均生存率能達到54%[2]。因此在CAD系統(tǒng)中早期發(fā)現(xiàn)肺結節(jié)成為肺癌診斷和治療的關鍵。
CT是肺癌檢測的常用工具,通過人體組織對于X光的吸收程度不同來提供內部組織的可視化。肺結節(jié)通常具有與正常組織相同的吸收水平,但具有獨特的形狀:與支氣管和血管這樣具有連續(xù)的管道系統(tǒng),在根部粗壯,分支后稀薄的形狀相比,結節(jié)通常為球形和孤立存在。有些肺結節(jié)很小,很難找到。對一個病人進行徹底的檢查,一個有經驗的醫(yī)生也需要大約10分鐘時間。而且肺結節(jié)本身有很多類型,不同類型成長為癌癥的可能性是不同的。對于肺結節(jié)良惡性的判斷,醫(yī)生主要是已經肺結節(jié)的形態(tài)特征,高度依賴于醫(yī)生的經驗[3]。
醫(yī)生期待CAD系統(tǒng)肺結節(jié)檢測方面具有高敏感度和低假陽性率,從而具有較高的參考價值。最近在深度學習方面的進展,給肺癌早期診斷帶來了新的機會。
在數據集方面,大規(guī)模數據集比如L I D C-I D R I[4]等的出現(xiàn)事實上加速了肺結節(jié)檢測方面的研發(fā)。肺結節(jié)的檢測通常包括兩個部分:肺結節(jié)檢測[5-7]和肺結節(jié)分類[7-9]。
本文針對肺結節(jié)分類的任務提出一種適用于肺結節(jié)分類的網絡結構和相應的損失函數。我們設計了以3D-ResNet網絡為基架,將網絡特征和全局特征進行融合,并用XGB[10]進行最終的分類。我們提出的損失函數充分考慮肺結節(jié)良惡性分類指標之間存在的有序性關系以及數據的不平衡性。該損失函數對于類似具有有序性指標分類問題都具有適用性。我們使用上述技術在LIDCIDRI數據集上訓練出的模型,有著高的準確率、召回率、特異度和F1值。
在深度學習技術出現(xiàn)之前,肺結節(jié)的分類方法主要依靠人工提取的特征,包括數據的3D輪廓,形狀,紋理等。相比于傳統(tǒng)特征提取手段而言,深度學習技術基于大規(guī)模數據進行學習,在特征表現(xiàn)學習方面有很大優(yōu)勢,能夠自動涵蓋多種特征,適用性更強。我們提出的深度學習方法,以2個3D-ResNet網絡為基干網絡用于特征提取。特征提取網絡的輸出向量與肺結節(jié)的直徑這個參數用concat方式連接成為一個一維向量作為整體的特征向量輸入到后續(xù)的分類器進行分類。這里我們通過實驗,最終選取XGB作為最后的分類器。
我們使用的肺結節(jié)分類中,良惡性指標為1~5,分數1,2,3為良性,而分數4,5為惡性,分數越高,惡性程度越高,各個分類之間是有序關系。為了讓網絡能夠應對這種類似回歸的分類,學習指標之間的有序關系,我們在cross entropy損失的基礎上,增加了L1損失作為正則化懲罰項。損失函數如下:
其中,λ為超參數,范圍是0到1之間。
我們訓練使用的肺結節(jié)數據來自于數據集LIDCIDRI。我們將其中的肺結節(jié)數據按尺寸分為兩組,當肺結節(jié)直接小于3 mm時,不將它們作為分類對象。只有直接范圍在3 mm以上的結節(jié)被用于訓練。直徑3 mm以上共計5910個。該數據集由四位醫(yī)生獨立標注,不同醫(yī)生對于某個結節(jié)的評估結果不一致。為了保持數據的一致性,我們將標注區(qū)域有重疊的結節(jié),都視為同一結節(jié)。見表1。
表1 直徑≥3mm的結節(jié)分布
我們先對數據進行預處理,以每個結節(jié)的中心為立方體的中心,截取72×72×72塊作為第一個3DRestNet網絡訓練數據,第二個3DRestNet網絡中的16×16×16的塊由72×72×72塊進行resize得到。
因為數據量有限,我們進行了數據增強。首先將72×72×72的數據隨機裁剪成64×64×64的數據,然后對裁剪后的數據進行隨機翻轉、鏡像、旋轉,最后對數據進行標準化處理后輸入網絡中。
我們通過對λ的不同取值進行實驗。實驗結果的統(tǒng)計中我們將1類、2類、3類合并作為良性,4類、5類作為惡性,統(tǒng)計相應的準確率、召回率、特異度和F_1值。結果見表2。
表2 有序多分類-五折實驗平均結果統(tǒng)計
此外,我們將本文中的提出模型的準確率與其他模型的準確率進行了對比。實驗結果如下。
表3 與其他模型的對比
由表2可知,有序多分類模型隨著λ從0到1增加,其各個指標的大致趨勢為先上升后減小,綜合考慮,當λ=0.7時最優(yōu)。此外通過表3可知,對于單模型而言,當λ=0.7時,我們的模型要優(yōu)于Multi-scale CNN、2D CNN Slice-level、2D CNN Nodule-level、Vanilla 3D CNN、Deep 3D DPN,這不僅是由于3D卷積能更好提取3D數據特征以及利用深度殘差網絡能更好提取數據深層特征,更主要的一個原因是我們引入了有序正則項,使我們的模型能更好的學習到數據的有序結構信息,使得信息更加利用充分。
最后我們通過提取結節(jié)數據的全局特征和結節(jié)直徑信息,將其與網絡特征結合,然后用XGB做分類,實驗的結果也表明,當λ=0.7時,比λ=0.0的效果要好,這更充分表明了引入有序正則項對有序分類訓練具有促進作用。
本文提出了一種基于有序多分類的深度學習模型,模型通過有序正則項學習數據之間的有序關系,并通過調整超參數λ得到比較好的結果。實驗表明,引入有序正則項能夠穩(wěn)定地提升分類模型的泛化性能,并取得更好的預測效果[11-14]。我們通過和其他模型的實驗對比,表明我們的有序正則化分類模型的優(yōu)越性。