孔德仕
(四川大學(xué)計算機學(xué)院,成都610065)
乳腺癌發(fā)病率在女性癌癥中占據(jù)首位,并且呈逐年上升趨勢,乳腺腫瘤的良惡性識別對于乳腺癌的診斷及防治研究都具有重要的科學(xué)意義和臨床價值。B超是常見的影像檢測手段,較X 射線檢查、CT、核磁共振等其他方式,其成本更低、效率更高且對人體無危害,因此被廣泛應(yīng)用于乳腺腫瘤的臨床檢驗。但超聲圖像分辨率和對比度較低,并且存在一定的斑紋噪聲,這些造影缺陷導(dǎo)致了醫(yī)生很難通過B 超圖像準確地辨別腫瘤是良性還是惡性的,導(dǎo)致檢測結(jié)果準確度較低,假陽性率較高。
早期的B 超乳腺識別采用SVM 等傳統(tǒng)的淺層機器學(xué)習(xí)方法。該方法首先從原始圖像中提取出紋理、灰度、輪廓形態(tài)等一系列初始特征,接著通過特征工程技術(shù)對初始特征進行篩選保留冗余度低且相關(guān)性高的優(yōu)秀特征,最后將這些特征輸入SVM、邏輯回歸等分類器進行樣本良惡性的識別。淺層機器學(xué)習(xí)方法的初始特征是人工設(shè)計的,很難準確表達樣本特性,這限制了模型的識別準確率。隨著深度學(xué)習(xí)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)也廣泛地應(yīng)用于醫(yī)學(xué)圖像處理領(lǐng)域。但是已有的卷積神經(jīng)網(wǎng)絡(luò)模型直接應(yīng)用于B 超乳腺識別存在一些問題。①難以適用于小樣本數(shù)據(jù)集。不同于自然圖像數(shù)據(jù),帶有準確標簽的醫(yī)學(xué)圖像樣本數(shù)量很少,VGG16、Inception 等多參數(shù)、多層數(shù)的復(fù)雜卷積神經(jīng)網(wǎng)絡(luò)模型很容易出現(xiàn)過擬合,使模型泛化性降低。②低維特征容易損失。在卷積神經(jīng)網(wǎng)絡(luò)中由于多次的卷積及下采樣操作,樣本的低維特征很容易損失,致使最終的識別準確度下降。③魯棒性較差。B 超圖像一般存在符合瑞利分布的乘性噪聲,已有的卷積神經(jīng)網(wǎng)絡(luò)模型抗噪性能較差,當輸入樣本存在較大噪聲時,模型的識別準確率會受到影響,甚至低于基準水平,失去參考價值?;谏鲜鰡栴},本文提出了一種新的神經(jīng)網(wǎng)絡(luò)模 型TA2NN(Transfer Auto-encoder Neural Network with 2 Streams)。該模型對輸入樣本進行了處理,將原始圖像分解為一副高分辨的中心窗口圖像以及一副低分辨率的原始圖像。其次,預(yù)訓(xùn)練了2 個降噪自編碼器,并將其編碼部分遷移到TA2NN 上進行特征提取。實驗結(jié)果表明,TA2NN 較基準方法有著更高的識別率,并且具有很好的魯棒性。
如圖1 所示,TA2NN 是存在2 個支流的多流神經(jīng)網(wǎng)絡(luò)模型。模型的輸入為一幅未經(jīng)過降噪處理的B 超圖像,記作O_IMG。單一的輸入圖像將被分解為2 幅子圖:腫瘤中心區(qū)域圖像C_IMG 以及低分辨率的原始輸入圖像D_IMG。C_IMG 輸入至一個預(yù)訓(xùn)練的降噪自編碼器DAE_C 進行低維特征的提??;D_IMG 輸入至另一個降噪自編碼器DAE_D 進行高維特征的提取。TA2NN 的頂端接入一個全連接的分類器,其輸入為DAE_C 與DAE_D 輸出的特征,輸出為一個區(qū)間為[0,1]的浮點數(shù)OUTPUT,其值大于0.5,識別結(jié)果為良性,反之為惡性。
圖1 TA2NN模型架構(gòu)
臨床上常通過腫瘤內(nèi)部的鈣化情況以及腫瘤邊界輪廓的規(guī)則程度去判別腫瘤是否為惡性。從圖像上觀察腫瘤內(nèi)部呈現(xiàn)大面積的弱回聲,即灰度值明顯低于腫瘤外側(cè)的組織。一些高灰度值的白色斑點,或斑塊等呈現(xiàn)強回聲的白色區(qū)域以某種未知分布出現(xiàn)于腫瘤內(nèi)部區(qū)域。白色區(qū)域大概率為腫瘤的鈣化灶,醫(yī)生可以根據(jù)其數(shù)量及分布,來辨別腫瘤是否為惡性。但由于多數(shù)鈣化灶及乳腺結(jié)節(jié)的直徑小于1 厘米,如果進行多次下采樣提取特征,腫瘤內(nèi)部的鈣化細節(jié)將嚴重損失。因此,以圖像中心剪裁出一副保留原始分辨率的尺寸為原圖像一半的窗口圖像C_IMG,它能夠保留腫瘤內(nèi)部大量的細節(jié)信息。O_IMG 用三階張量進行表示,O_IMG=[W,H,C]。其中W 為圖像的寬度,H 為圖像的高度,C 為圖像的通道數(shù)。C_IMG 可表示為:
相對于腫瘤內(nèi)部信息,腫瘤的邊界輪廓是一種具有平移不變性的空間層次特征,后續(xù)將通過多層的卷積操作及下采樣操作對其進行高維特征提取??紤]到C_IMG 已經(jīng)保留了腫瘤內(nèi)部信息,TA2NN 將原始圖像O_IMG 進行2 倍下采樣獲取降質(zhì)圖像D_IMG:
其 中,D_IMGM為D_IMG 的 某 個像 素 點,NM是D_IMGM在原圖像O_IMG 中對應(yīng)的鄰域,為一個2×2的窗口。低分率的D_IMG 損失了部分腫瘤內(nèi)部細節(jié),但是輪廓較為清晰。D_IMG 能在不影響后續(xù)輪廓特征提取的前提下,將原圖像的尺寸降低了2 倍,提升訓(xùn)練效率的同時能夠在一定程度降低網(wǎng)絡(luò)模型參數(shù)數(shù)量,抑制過擬合。其次,將低質(zhì)量的圖像作為輸入能夠提升模型的魯棒性。
自編碼器(Auto-Encoder)是一種特殊的網(wǎng)絡(luò)模型。它采用有監(jiān)督學(xué)習(xí)的方式去實現(xiàn)無監(jiān)督學(xué)習(xí),輸入一副原始圖像,自編碼器通過一種對稱的網(wǎng)絡(luò)結(jié)構(gòu)將輸入進行復(fù)現(xiàn)。其數(shù)學(xué)表達式為:
自編碼器由一個編碼器encoder 與一個解碼器decoder 組成,θ 為模型中的一系列參數(shù),L(xi,x~i)為輸入與輸出之間的損失,其值越小則表示輸出與輸入越接近,換言之即原圖像的還原程度更高。自編碼器的核心在于encoder 部分,它能夠?qū)⒃紙D像進行壓縮并提取出有效特征,因此基于遷移學(xué)習(xí)的思想,TA2NN 將預(yù)先訓(xùn)練好的encoder 嵌套到網(wǎng)絡(luò)結(jié)構(gòu)中,用以高效地提取乳腺腫瘤的特征。為了提升模型的抗噪能力,在原始輸入中添加了噪聲。
其中z 為添加的噪聲,B 超圖像中的斑紋噪聲一般服從瑞利分布,因此噪聲z 由如下公式產(chǎn)生:
a,b 為兩個常量參數(shù),U(0,1)為一個均勻分布。在1.2 小節(jié)中,闡述了C_IMG 是腫瘤內(nèi)部尺寸較小的細節(jié),因此需要提取低維特征;D_IMG 剛好相反,邊緣輪廓是一種高維的空間層次特征。結(jié)合上述情況,設(shè)計了2 個不同的降噪自編碼器DAE_C 與DAE_D。
DAE_C 的編碼器采用了2 層卷積層以及一個2倍下采樣的最大池化層。卷積操作如下所示。
其中G 為生成的特征映射圖,f 為原始圖像,h 為卷積核(一個3×3 的矩陣)。DAE_D 需要提取高維的邊緣輪廓特征,其深度深于DAE_C 的編碼器,在每一次卷積操作之后都進行了下采樣,增大了感受野,最終能夠獲取到腫瘤的形態(tài)輪廓特征。DAE_C 與DAE_D的網(wǎng)絡(luò)架構(gòu)如圖3 所示。
圖3 降噪編碼器DAE_C與DAE_D
訓(xùn)練集采用來自華西醫(yī)院的B 超乳腺圖像,總共1078 張乳腺腫瘤B 超ROI 圖像,511 張惡性樣本及567 張良性樣本,每幅圖像包含了乳腺腫瘤及其周邊組織。
(1)將乳腺B 超圖像進行預(yù)處理,將其灰度值調(diào)整為0 到1 之間的浮點數(shù),將其灰度值除以255,尺寸調(diào)整為224×224。
(2)對DAE_C 與DAE_D 進行預(yù)訓(xùn)練。降噪自編碼器的損失函數(shù)使用均方根誤差(RMSE)。并在原始輸入中加入基于瑞利分布的乘性噪聲。
(3)將預(yù)訓(xùn)練好的DAE_C 與DAE_D 中的編碼部分嵌套至TA2NN 中,用以特征提取。TA2NN 的頂端接入一個全連接的分類器,最后一層采用sigmoid 函數(shù)進行激活,用以輸出一個0 至1 之間的浮點數(shù)。
(4)由于樣本數(shù)量較少,使用5 折交叉驗證進行訓(xùn)練及評估。B 超乳腺腫瘤識別本質(zhì)上是一個良惡性的二分類問題,因此采用二元交叉熵(binary cross entropy)作為損失函數(shù),其公式為:
本文提出了3 種常規(guī)的神經(jīng)網(wǎng)絡(luò)模型作為基準方法。
基準方法1:VGG16,VGG16 由Karen Simonyan和Andrew Zisserman 于2014 年開發(fā),對于ImageNet,它是一種簡單而又廣泛使用的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)。
基準方法2:Inception,Inception 是一種流行的多尺度特征提取的網(wǎng)絡(luò)架構(gòu),它由Google 的Christian Szegedy 等人于2013-2014 年開發(fā)。
基準方法3:baseCNN,考慮到基準方法1、2 均是復(fù)雜的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),因此baseCNN 采用簡單的卷積神經(jīng)網(wǎng)絡(luò)僅有4 個卷積層及最大池化層,在此基礎(chǔ)上加入了殘差連接(residual connection)。殘差連接也是一種解決特征缺失及表示瓶頸的常見方法之一。
實驗評估指標采用:準確度、敏感度、特異度。其公式為:
準確度=(TP+TN)/(TP+TN+FP+FN)
敏感度=TP/(TP+FN)
特異度=TN/(TN+FP)
其中,TP(True Positive):被正確識別的良性樣本個數(shù);TN(True Negative):被正確識別的惡性樣本個數(shù);FP(False Positive):被錯誤識別的良性樣本個數(shù);FN(False Negative):被錯誤識別的惡性樣本個數(shù)。3 個基準方法與TA2NN 基于一個樣本數(shù)量為611(良性311,惡性300)的測試集進行模型評估,其結(jié)果如表1 所示。
表1 準確度評估
從表1 中可以看出,TA2NN 的準確度及敏感度優(yōu)于基準方法,表明其整體識別率較高,并且對于假陰性的識別度高,能夠減少漏判幾率。Inception 的特異度最高,證明其很大程度上能夠降低假陽性的概率,減少錯判幾率。Inception 是基準方法中識別效果最好的方法,主要原因在于Inception 能夠提取多尺度多維度的空間特征,但是由于Inception 針對自然圖像進行開發(fā),是一種極深極廣的復(fù)雜卷積神經(jīng)網(wǎng)絡(luò),在小樣本的醫(yī)學(xué)圖像識別問題中很容易出現(xiàn)過擬合,導(dǎo)致泛化性較差。
對測試集中的樣本加上不同程度的瑞利噪聲,接著根據(jù)模型的準確度來評估其抗噪能力。實驗結(jié)果如表2 所示。
表2 魯棒性評估
表2 中出現(xiàn)0.1,0.3 等浮點數(shù)為施加噪聲的強度,很明顯看出TA2NN 的魯棒性顯著優(yōu)于基準方法,即使在加入很大噪聲的情況下依舊能夠保證一定的準確度,但基準方法的準確度已經(jīng)接近50%,在臨床上失去參考價值。之所以TA2NN 具有較強的魯棒性,是因為降噪自編碼器的遷移,以及采用一張下采樣的降質(zhì)圖像加入到輸入中,使得模型能夠在分布較大噪聲的低質(zhì)量圖像中提取出有用的特征。
本文研究分析了B 超乳腺腫瘤的內(nèi)部構(gòu)造及邊緣輪廓等先驗知識,提出了一種基于降噪自編碼的多流卷積神經(jīng)網(wǎng)絡(luò)模型:TA2NN。通過將原始輸入分解成一幅下采樣降質(zhì)圖與一幅中心裁剪圖,并遷移使用了預(yù)訓(xùn)練的降噪自編碼器,提取出了高維的輪廓特征以及低維的腫瘤內(nèi)部特征,使得腫瘤良惡性的識別準確度以及模型魯棒性均有較為明顯的提升。