白 茹,余 慧,安建成,曹 銳
太原理工大學(xué) 軟件學(xué)院,太原 030600
乳腺癌是全世界女性發(fā)病率和死亡率較高的癌癥,堪稱(chēng)“女性殺手”。根據(jù)2018年世界衛(wèi)生組織統(tǒng)計(jì),每四位女性癌癥新發(fā)病例中就有一位是乳腺腫瘤患者[1]。預(yù)計(jì)2020年底,美國(guó)有4.2萬(wàn)人死于乳腺癌,而中國(guó)高達(dá)6.6萬(wàn)人[2]。更緊迫的是,中國(guó)的乳腺腫瘤發(fā)病率和死亡率均呈現(xiàn)出逐年上升的趨勢(shì)[3]。目前在一期診斷出乳腺癌的概率不到20%,一旦查出,多數(shù)已經(jīng)轉(zhuǎn)移或擴(kuò)散[4]。由此可見(jiàn),早期準(zhǔn)確的診斷和治療是影響乳腺癌療效的關(guān)鍵性因素,可將乳腺癌患者的生存率從30%提高到50%[5]。乳腺X線(xiàn)攝影技術(shù)因簡(jiǎn)便易行、分辨率高、射線(xiàn)劑量低、不會(huì)危害女性健康等特點(diǎn),是目前普查早期發(fā)現(xiàn)和診斷乳腺腫瘤的首選方法[6]。乳腺影像上的異常主要有2種類(lèi)型:腫塊和鈣化,本文的研究?jī)?nèi)容為腫塊分類(lèi)。在臨床實(shí)踐中,放射科醫(yī)師可將腫塊組織分為良性或惡性。由于腫塊與周?chē)M織的對(duì)比度低且醫(yī)生的專(zhuān)業(yè)知識(shí)水平不一,導(dǎo)致相當(dāng)一部分病例可能被誤診。而計(jì)算機(jī)輔助診斷(computer aided diagnosis,CAD)系統(tǒng)可以避免人為主觀(guān)因素為醫(yī)生提供第二意見(jiàn),進(jìn)一步提高診斷水平和速度,降低錯(cuò)誤率[7]。與傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)具有優(yōu)秀的特征自動(dòng)提取能力,而且層數(shù)越多,所提取特征就越豐富,越具有語(yǔ)義信息。因此,本文主要對(duì)基于CNN的乳腺腫塊分類(lèi)展開(kāi)研究,提高分類(lèi)準(zhǔn)確度。
近年來(lái),深度學(xué)習(xí)技術(shù)在圖像處理領(lǐng)域[8-10]取得了顯著成果,而且在圖像領(lǐng)域應(yīng)用最為成功的是CNN,CNN在乳腺癌分類(lèi)方面的表現(xiàn)幾乎與人類(lèi)專(zhuān)家相當(dāng),甚至更好。Levy等[11]為網(wǎng)絡(luò)提供兩種乳腺腫塊上下文信息:一是包含腫塊周?chē)?0像素固定填充的區(qū)域,二是使用比例填充提取腫塊邊界框大小兩倍的區(qū)域。使用AlexNet網(wǎng)絡(luò)對(duì)兩種不同方法提取的乳腺腫塊在DDSM數(shù)據(jù)集上進(jìn)行訓(xùn)練和測(cè)試,分別達(dá)到了64%和71%的準(zhǔn)確率。孫利雷等[12]分別使用大尺度卷積核和小尺度卷積核提取乳腺影像特征圖,在DDSM數(shù)據(jù)集上進(jìn)行訓(xùn)練,準(zhǔn)確率達(dá)到71.29%,表明了多尺度卷積提取到的特征更豐富。侯霄雄等[13]使用通過(guò)遷移學(xué)習(xí)再訓(xùn)練后的AlexNet模型在MIAS數(shù)據(jù)集上對(duì)比不同分類(lèi)器對(duì)乳腺腫塊分類(lèi)效果的影響,結(jié)果表明深度學(xué)習(xí)模型的結(jié)構(gòu)越深,其特征提取效果越好,且深度相同時(shí)Softmax分類(lèi)效果更好,準(zhǔn)確率達(dá)到85%。沿著加深CNN網(wǎng)絡(luò)層數(shù)和使用多尺度卷積核來(lái)提高分類(lèi)精度的思想,Vang等[14]提出了基于InceptionV3模型的乳腺病理圖像分類(lèi)方法,通過(guò)包含多數(shù)投票、梯度提升機(jī)和邏輯回歸的集成融合框架來(lái)預(yù)測(cè),準(zhǔn)確率達(dá)到87.5%。Abdel等[15]提出了使用跳躍連接的CNN模型ResNet50來(lái)分類(lèi)預(yù)分割的乳腺腫塊,有效克服了梯度消失等問(wèn)題,在DDSM數(shù)據(jù)集上進(jìn)行測(cè)試,準(zhǔn)確率為85.7%。Ertosun等[16]在網(wǎng)絡(luò)輸入上進(jìn)行改進(jìn),將整個(gè)乳房X光檢查圖像作為輸入,不進(jìn)行圖像分割等預(yù)處理步驟,使用Alexnet、VGG16、GooleNet在DDSM數(shù)據(jù)集上獲得了84%、82%、85%的準(zhǔn)確率。Huang等[17]首次引入密集連接卷積網(wǎng)絡(luò)DenseNet,它的每一層都直接連接到它前面的每一層,該網(wǎng)絡(luò)加強(qiáng)了特征傳播,鼓勵(lì)特征重用,大大減少了參數(shù)的數(shù)量。Li等[18]對(duì)DenseNet神經(jīng)網(wǎng)絡(luò)模型改進(jìn),用Inception替代了DenseNet神經(jīng)網(wǎng)絡(luò)模型的第一卷積層,提高了模型計(jì)算速度和效率。Das等[19]引入了一個(gè)新的池化層,幫助圖像聚合更多的信息特征,而不需要patch之間的重疊或覆蓋,有助于學(xué)習(xí)局部特征的同時(shí),學(xué)習(xí)全局的分類(lèi)邊界。
從上述的研究發(fā)現(xiàn),基于深度學(xué)習(xí)的乳腺腫塊良惡性研究已能對(duì)空間上和特征維度上的信息進(jìn)行聚合,但是沒(méi)有考慮從特征通道層面著手。同時(shí)模型越深,CNN重用特征減少,參數(shù)數(shù)量越多,而且在有標(biāo)注的乳腺圖像有限的情況下,復(fù)雜的網(wǎng)絡(luò)模型在訓(xùn)練時(shí)難以?xún)?yōu)化。因此,基于CNN的乳腺圖像自動(dòng)分類(lèi)仍然是一個(gè)非常具有挑戰(zhàn)性的問(wèn)題。
為此,本文在深入研究不同CNN的基礎(chǔ)上,借鑒DenseNet和SENet的設(shè)計(jì)思想,提出了一種融合兩者優(yōu)勢(shì)的CNN模型DSAMNet。DSAMNet不僅可以增強(qiáng)特征重用,融合高中低層特征信息,而且能實(shí)現(xiàn)特征提取過(guò)程中的重標(biāo)定。此外,對(duì)于空間信息的聚合,本文改進(jìn)了SE模塊,設(shè)計(jì)了一種新的AM池化函數(shù)來(lái)整合特征圖的空間信息,增強(qiáng)特征表達(dá)能力。
DenseNet是一種密集連接的卷積神經(jīng)網(wǎng)絡(luò),如圖1所示。該網(wǎng)絡(luò)使用級(jí)聯(lián)方式,每一層特征接受來(lái)自前幾層的輸入,并將自己的特征映射傳遞到后續(xù)的所有層,來(lái)實(shí)現(xiàn)特征重用,這可以充分結(jié)合圖像上下文信息,易于復(fù)雜的圖像分類(lèi),提升模型效率。因此,將這種網(wǎng)絡(luò)模型應(yīng)用于乳腺圖像分類(lèi)具有良好的前景。DenseNet具有如下優(yōu)點(diǎn):緩解梯度消失問(wèn)題;加強(qiáng)特征傳播;旁路加強(qiáng)特征重用。但也存在缺點(diǎn):它的核心計(jì)算是卷積算子,是對(duì)一個(gè)局部區(qū)域進(jìn)行特征融合,沒(méi)有考慮特征通道之間的關(guān)系。
圖1 DenseNet結(jié)構(gòu)圖Fig.1 Structure of DenseNet
SENet[20]是由Momenta研發(fā)工程師Hu等提出的CNN結(jié)構(gòu)。它的核心思想在于通過(guò)學(xué)習(xí)的方式來(lái)自動(dòng)獲取每個(gè)特征通道的重要程度,然后依照這個(gè)重要程度去提升有用的特征并抑制對(duì)當(dāng)前任務(wù)用處不大的特征。SENet由一系列SE模塊組成,一個(gè)SE模塊的步驟包括壓縮(Squeeze)、激勵(lì)(Excitation)和重標(biāo)定(Reweight),如圖2所示。壓縮是順著空間維度將每個(gè)二維的特征通道變成一個(gè)實(shí)數(shù),這個(gè)實(shí)數(shù)某種程度上具有全局感受野。激勵(lì)是通過(guò)對(duì)每個(gè)通道進(jìn)行自選學(xué)習(xí)來(lái)控制其重要性。重標(biāo)定對(duì)通道的重要性大小進(jìn)行歸一化,并通過(guò)乘法逐通道加權(quán)到先前的特征上。研究發(fā)現(xiàn)SE模塊可以在不引入新的空間維度情況下顯式地建模特征通道之間的相互依賴(lài)關(guān)系,嵌入到其他深層模型中提升網(wǎng)絡(luò)性能。
圖2 SE模塊結(jié)構(gòu)圖Fig.2 Structure of SE block
本文提出的DSAMNet網(wǎng)絡(luò)結(jié)構(gòu)是在DenseNet的基礎(chǔ)上嵌入SE模塊,并對(duì)SE模塊進(jìn)行了改進(jìn),不僅加強(qiáng)了深層信息傳遞,而且實(shí)現(xiàn)特征通道的重標(biāo)定,旨在對(duì)乳腺腫塊的良惡性進(jìn)行分類(lèi)。融合后的模型如圖3所示,該模型主要由三個(gè)密集塊(SE-D block)、兩個(gè)過(guò)渡層(SE-T layer)組成。
圖3 DSAMNet模型結(jié)構(gòu)Fig.3 Architecture of DSAMNet
密集塊由SE模塊和n(n=1,6,12,18)個(gè)復(fù)合函數(shù)密集連接組成,其中每個(gè)復(fù)合函數(shù)是四個(gè)連續(xù)操作:批處理歸一化(BN)[21]、修正線(xiàn)性單元(ReLU)[22]、3×3卷積層(Conv)和dropout,如圖4所示。每個(gè)密集塊都包含相同數(shù)量的卷積層,每個(gè)密集塊的卷積個(gè)數(shù)為(n-4)/3。
圖4 SE-D模塊結(jié)構(gòu)圖Fig.4 Structure of SE-D block
過(guò)渡層設(shè)置在兩個(gè)密集塊之間,是由BN、ReLU、1×1 Conv、(Pool)、dropout和SE模塊組成,如圖5所示。
圖5 SE-T層結(jié)構(gòu)圖Fig.5 Structure of SE-T layer
密集塊和過(guò)渡層內(nèi)SE模塊由Pool、全連接層(FC)、ReLU、Sigmoid和Scale組成。SE模塊通過(guò)自動(dòng)學(xué)習(xí)的方式來(lái)為特征通道的重要程度進(jìn)行劃分,然后依照這個(gè)重要程度有選擇地增強(qiáng)乳腺腫塊部分的特征通道,并抑制對(duì)乳腺腫塊分類(lèi)無(wú)用的特征通道,從而讓提取的特征指向性更強(qiáng)。
DenseNet、SE-DenseNet和DSAMNet網(wǎng)絡(luò)結(jié)構(gòu)配置如表1所示。由表1可以看出融合后的SE-DenseNet模型是在DenseNet的基礎(chǔ)上嵌入SE模塊,并且刪除第一個(gè)卷積層后最大池化層,避免了低級(jí)特征丟失;去掉第一個(gè)過(guò)渡層中的平均池化操作,只保留1×1卷積,以保留全局信息。
表1 DenseNet、SE-DenseNet和DSAMNet模型結(jié)構(gòu)Table 1 Architecture of DenseNet,SE-DenseNet and DSAMNet model
本文提出的DSAMNet模型在SE-DenseNet模型基礎(chǔ)上用3個(gè)3×3的卷積替換第一個(gè)7×7的卷積層,增加了卷積過(guò)程中的非線(xiàn)性能力同時(shí)降低了參數(shù)量。對(duì)SE模塊進(jìn)行了改進(jìn),如圖6所示,用AM池化替代了原來(lái)的全局平均池化,以提取更復(fù)雜的腫塊特征。最后一層是二分類(lèi)器,將提取的特征映射到對(duì)應(yīng)乳腺腫塊類(lèi)別的概率值,其配置如表1所示。
圖6 改進(jìn)后的SE模塊結(jié)構(gòu)圖Fig.6 Structure of improved SE block
SE模塊包括三個(gè)步驟,即壓縮操作、激勵(lì)操作和重標(biāo)定操作,作用是可以自動(dòng)學(xué)習(xí)到不同通道特征的重要程度,更加關(guān)注乳腺腫塊的通道特征,而抑制那些不重要的通道特征。壓縮操作是為了利用全局信息建立通道之間的依賴(lài)關(guān)系,解決較低層次上卷積層感受野比較小,在局部空間內(nèi)進(jìn)行操作的問(wèn)題,但是還存在只能提取背景信息的問(wèn)題。而全局平均池化可以提取乳腺腫塊圖像的背景信息,全局最大池化可以提取乳腺腫塊圖像的紋理信息。因此,本文對(duì)原SE模塊的壓縮操作步驟進(jìn)行改進(jìn),如圖6所示,設(shè)計(jì)了AM池化函數(shù),采用全局平均池化和全局最大池化的加權(quán)操作對(duì)U(C個(gè)H×W特征圖)中每個(gè)特征圖進(jìn)行壓縮使C個(gè)特征圖最后變成1×1×C的實(shí)數(shù)數(shù)列Z,使其具有全局的感受野,而且網(wǎng)絡(luò)低層也能利用全局信息。因此改進(jìn)后的SE模塊不僅可以提取乳腺腫塊圖像的背景信息,而且還提取了乳腺腫塊圖像的紋理信息。這樣可以提取更復(fù)雜的乳腺特征,從而更準(zhǔn)確定位乳腺腫塊部分。
AM池化函數(shù)如公式(1)所示:
式中,Z c為Z的第c個(gè)特征通道,u c∈R(H×W)為第c個(gè)通道的特征圖,F(xiàn) sq(·)是對(duì)輸出卷積做壓縮操作。
激勵(lì)操作(FC-ReLU-FC-Sigmoid)通過(guò)參數(shù)來(lái)為每個(gè)特征通道生成權(quán)重,其中參數(shù)被學(xué)習(xí)用來(lái)顯式地建模特征通道之間的依賴(lài)性,即利用AM池化聚集的信息Z c學(xué)習(xí)C中每個(gè)通道的特征權(quán)值。第一個(gè)FC是把C個(gè)通道壓縮成C/r個(gè)通道來(lái)減少模型所需的參數(shù)和計(jì)算時(shí)間。第二個(gè)FC恢復(fù)回C個(gè)通道,使模型更加非線(xiàn)性,更好地適應(yīng)通道之間的復(fù)雜關(guān)系,r是指壓縮的比例,本文中r=16。ReLU降低了梯度消失的概率,Sigmoid使C中每個(gè)通道的特征權(quán)值在0~1之間。激勵(lì)操作如公式(2)所示:
其中,F(xiàn)ex(·)是激勵(lì)過(guò)程,σ(·)表示Sigmoid激活函數(shù),δ(·)表示ReLU激活函數(shù)。分別是兩個(gè)全連接層的權(quán)值矩陣。
重標(biāo)定操作是將上步sigmoid輸出值乘到U的C通道上,作為下一級(jí)的輸入數(shù)據(jù),完成在通道維度上的對(duì)原始特征的重標(biāo)定。具體如公式(3)所示:
其中,是?中第c個(gè)特征通道的特征圖,s c是第c個(gè)通道特征權(quán)值向量中的一個(gè)標(biāo)量值,F(xiàn)scale(·)是重標(biāo)定過(guò)程。
本文根據(jù)SE模塊嵌入DenseNet的不同位置建立了6種不同的網(wǎng)絡(luò)模型:SE-DenseNet-A、SE-DenseNet-B、SE-DenseNet-C、DSAMNet-A、DSAMNet-B、DSAMNet-C,如圖7所示。其中,SE-DenseNet-A和DSAMNet-A是SE模塊嵌入到密集塊內(nèi)、SE-DenseNet-B和DSAMNet-B是SE模塊嵌入到過(guò)渡層內(nèi)、SE-DenseNet-C和DSAMNet-C是SE模塊嵌入到密集塊和過(guò)渡層內(nèi)。DSAMNet-A、DSAMNet-B、DSAMNet-C嵌入的是改進(jìn)的SE模塊。
圖7 SE-DenseNet和DSAMNet模型結(jié)構(gòu)圖Fig.7 Architecture of SE-DenseNet and DSAMNet
3.1.1 數(shù)據(jù)集
DDSM[23](digital database for screening mammography)是乳腺疾病分類(lèi)公開(kāi)獲取且研究廣泛的乳腺數(shù)據(jù)集,本文使用該數(shù)據(jù)集的精簡(jiǎn)數(shù)據(jù)集CBIS-DDSM[24](curated breast imaging subset of DDSM)。DDSM是由美國(guó)南佛羅里達(dá)州大學(xué)與幾家合作單位聯(lián)合創(chuàng)建的,包含2 620個(gè)乳腺圖像病例,每個(gè)病例的左右乳腺各兩個(gè)不同角度拍攝,即頭足位和斜側(cè)位圖像,如圖8所示。
圖8 CBIS-DDSM數(shù)據(jù)集中乳腺圖像Fig.8 Mammography CBIS-DDSM dataset
其中選用乳腺腫塊病例1 696個(gè)用于本實(shí)驗(yàn),每幅乳腺圖像都標(biāo)記出了乳腺腫塊的位置以及腫塊的良性惡性類(lèi)型信息,該數(shù)據(jù)集已經(jīng)劃分好訓(xùn)練集和測(cè)試集,訓(xùn)練集1 318張,測(cè)試集378張,其中良性乳腺圖像分別為681張和231張。
3.1.2 預(yù)處理
本文在CBIS-DDSM數(shù)據(jù)庫(kù)基礎(chǔ)上進(jìn)行了數(shù)據(jù)預(yù)處理,包括歸一化和數(shù)據(jù)增強(qiáng),增加網(wǎng)絡(luò)學(xué)習(xí)的特征多樣性,提升模型分類(lèi)準(zhǔn)確度。數(shù)據(jù)預(yù)處理如下:
(1)首先在提供的掩碼圖像中找出乳腺腫塊的位置,然后在完整乳腺圖像的對(duì)應(yīng)位置找出原圖像的感興趣區(qū)域(region of interest,ROI),最后剪裁出大小為299×299的ROI區(qū)域,如圖9所示。
圖9 CBIS-DDSM數(shù)據(jù)集乳腺圖像Fig.9 Mammography CBIS-DDSM dataset
(2)對(duì)ROI圖像歸一化,主要目的是減少光不均勻?qū)θ橄賵D像的干擾,加快收斂速度,本文將乳腺圖像歸一化于0~1之間。
(3)對(duì)ROI圖像進(jìn)行一系列隨機(jī)變換,即旋轉(zhuǎn)(90°、180°、270°)、翻轉(zhuǎn)、平移、剪切、縮放。數(shù)據(jù)增強(qiáng)后既增加了樣本數(shù)量,也避免了過(guò)擬合問(wèn)題。增強(qiáng)后的訓(xùn)練集、驗(yàn)證集、測(cè)試集的圖像數(shù)量如表2所示。
表2 實(shí)驗(yàn)數(shù)據(jù)集分布情況Table 2 Distribution of experimental dataset
采用最常用的評(píng)價(jià)指標(biāo)對(duì)醫(yī)學(xué)圖像分類(lèi)模型性能評(píng)估,包括:準(zhǔn)確度(Acc)、F1-score、ROC(receiver operating characteristic,ROC)和AUC(area under the curve,AUC),定義如下:
其中,T P是真陽(yáng)性,TN是真陰性,F(xiàn)P是假陽(yáng)性,F(xiàn)N是假陰性。F1-score是分類(lèi)模型精確率和召回率的一種調(diào)和平均。ROC是以TPR(true positive rate,TPR)為縱坐標(biāo),F(xiàn)PR(false positive rate,F(xiàn)PR)為橫坐標(biāo)繪制二維平面上的圖形來(lái)評(píng)估分類(lèi)性能,AUC值是指ROC曲線(xiàn)在[0,1]區(qū)間和X軸上所圍合的面積。計(jì)算機(jī)輔助診斷系統(tǒng)的整體性能與AUC值成正比,即AUC值越大,其性能越好。
本研究使用基于CentOs 7.8系統(tǒng)的工作站,運(yùn)行在Intel?Xeon?Silver 4210 CPU 2.20 GHz上,擁有125 GB內(nèi)存和NVidia GeForce RTX 2080Ti 10GiB GPU,使用TensorFlow和Keras等框架構(gòu)建文中所用的網(wǎng)絡(luò)模型。在模型的訓(xùn)練過(guò)程中,采用交叉熵?fù)p失函數(shù)作為訓(xùn)練的損失函數(shù),批大小設(shè)置為8,模型初始學(xué)習(xí)率設(shè)為0.001,當(dāng)損失不再持續(xù)減少時(shí),將學(xué)習(xí)率乘以一個(gè)因子,將因子設(shè)為0.1,以避免錯(cuò)過(guò)最佳點(diǎn),盡可能得到更好的模型。除此之外,dropout設(shè)置為0.2來(lái)避免過(guò)擬合,優(yōu)化器采用SGD優(yōu)化器。
為了分析融合后模型的性能,本文將DSAMNet、SE-DenseNet與DenseNet模型在復(fù)合函數(shù)n=6時(shí)(深度為22)進(jìn)行比較評(píng)估,測(cè)試結(jié)果如表3所示??梢钥闯觯琒E-DenseNet變種的三個(gè)模型的分類(lèi)性能都優(yōu)于DenseNet模型,比DenseNet模型準(zhǔn)確率提升了0.037~0.101,其中SE-DenseNet-B模型準(zhǔn)確率最高,達(dá)到0.847,測(cè)試時(shí)間增加了4 s,參數(shù)量增加了0.40%。這證實(shí)了SE模塊嵌入DenseNet能夠提高參數(shù)效率,對(duì)分類(lèi)性能的提升是有優(yōu)勢(shì)的,但代價(jià)是訓(xùn)練時(shí)間和內(nèi)存的增加。這些代價(jià)相對(duì)較小,可以忽略不記。而且從表3可知,SE-DenseNet-A的準(zhǔn)確率0.783和SE-DenseNet-C的準(zhǔn)確率0.796都低于SE-DenseNet-B的準(zhǔn)確率0.847。究其原因,密集塊內(nèi)嵌入SE塊在提取新特征的過(guò)程中造成過(guò)擬合。而在過(guò)渡層內(nèi)嵌入SE塊在提取新特征后可以增強(qiáng)有用的特征,削弱非本質(zhì)特征,這使得SE-DenseNet-B的分類(lèi)性能比SE-DenseNet-A和SEDenseNet-C的優(yōu)越,而SE-DenseNet-C也在過(guò)渡層嵌入SE塊,一定程度上減少了過(guò)擬合,因此,SE-DenseNet-C準(zhǔn)確率比SE-DenseNet-A的略高。由以上分析可得,融合后的模型對(duì)乳腺腫塊的分類(lèi)效果更好。同樣,由表3可知,DSAMNet變種的三個(gè)模型的準(zhǔn)確率都高于對(duì)應(yīng)的SE-DenseNet變種的三個(gè)模型,準(zhǔn)確率增加了0.5%~0.8%,參數(shù)量增加了5.5%~5.66%,測(cè)試時(shí)間的增加可以忽略不記,驗(yàn)證了改進(jìn)SE塊中AM池化函數(shù)是有效的,它可以提取到更多的乳腺圖像特征,提高了參數(shù)利用率,從而提高分類(lèi)準(zhǔn)確率。其中,DSAMNet-B的Acc、F1-score、AUC三個(gè)分類(lèi)指標(biāo)最高,分別為0.854、0.872、0.899。
本文還將DSAMNet變種的三個(gè)模型與第一個(gè)卷積層替換為3個(gè)3×3卷積層的模型在深度為22時(shí)進(jìn)行比較,驗(yàn)證將第一個(gè)7×7卷積層替換為3個(gè)3×3卷積層后模型的性能,結(jié)果如圖10所示。
圖10 DSAMNet模型分類(lèi)性能對(duì)比Fig.10 Classification performance comparison of DSAMNet model
由圖10可知DSAMNet(3×3×3)變種的三個(gè)模型的分類(lèi)性能都高于對(duì)應(yīng)的DSAMNet(7×7)變種的三個(gè)模型,模型準(zhǔn)確率提高了0.4%~0.7%,證實(shí)具有小濾波器的模型優(yōu)于具有較大濾波器的模型。究其原因,用3個(gè)3×3的卷積替換7×7的卷積,增加了卷積過(guò)程中的非線(xiàn)性,減少了過(guò)擬合,因此DSAMNet(3×3×3)模型的分類(lèi)性能更優(yōu)。
本文還對(duì)比不同深度下DSAMNet模型的分類(lèi)效果,通過(guò)改變復(fù)合函數(shù)(n=1,6,12,18)的數(shù)量來(lái)改變網(wǎng)絡(luò)的深度(7,22,40,58),實(shí)驗(yàn)結(jié)果如圖11所示。
圖11 不同深度DSAMNet模型準(zhǔn)確率對(duì)比圖Fig.11 Comparison of accuracy of DSAMNet model with different depths
研究發(fā)現(xiàn),DSAMNet模型在深度為7和58時(shí)準(zhǔn)確率略差。當(dāng)模型深度為7時(shí),相當(dāng)于傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò),沒(méi)有進(jìn)行密集連接,特征重用率低,導(dǎo)致模型的分類(lèi)性能不高,說(shuō)明了密集連接起到了加強(qiáng)特征重用,提升梯度的反向傳播的作用。當(dāng)模型深度為58時(shí),由于模型的深度增大,訓(xùn)練參數(shù)增多,導(dǎo)致了過(guò)擬合,使得模型的分類(lèi)效果略差。而當(dāng)模型深度為22和40時(shí),總體分類(lèi)性能呈上升趨勢(shì)。說(shuō)明隨著深度的增加,網(wǎng)絡(luò)提取到深層的語(yǔ)義信息越豐富,分類(lèi)結(jié)果越好。其中,模型深度為40時(shí)取得的分類(lèi)效果最好,使用ROC和AUC度量在此深度下模型的性能,DSAMNet-A、DSAMNet-B、DSAMNet-C模型的ROC曲線(xiàn)如圖12所示。從曲線(xiàn)下的面積來(lái)看,模型DSAMNet-B的面積最大為0.929,取得了最先進(jìn)的結(jié)果,說(shuō)明模型DSAMNet-B的穩(wěn)定性和分類(lèi)性能最好。
圖12 DSAMNet模型ROC曲線(xiàn)對(duì)比圖Fig.12 Accuracy classification performance comparison of model with different layers
為了驗(yàn)證本文所提出算法得收斂性質(zhì),本文對(duì)比了DSAMNet-B、SE-DenseNet-B和DenseNet模型訓(xùn)練過(guò)程,如圖13所示??梢钥闯?,DSAMNet-B、SE-DenseNet-B和DenseNet模型在迭代過(guò)程中準(zhǔn)確率呈現(xiàn)上升趨勢(shì),在30代前DSAMNet-B和SE-DenseNet-B模型比DenseNet模型收斂的更快,在55代時(shí)學(xué)習(xí)率變小,準(zhǔn)確率變大,從60代開(kāi)始趨于穩(wěn)定值,說(shuō)明所有模型都能夠收斂。并且由圖13和相關(guān)數(shù)據(jù)可算出DenseNet、DSAMNet-B和SE-DenseNet-B模型的收斂精度為0.61%、0.52%和0.26%(85代之后),說(shuō)明所提出模型的收斂精度更高。
圖13 DSAMNet-B、SE-DenseNet-B、DenseNet的準(zhǔn)確率Fig.13 Accuracy of DSAMNet-B、SE-DenseNet-B and DenseNet model
將本文提出的模型與當(dāng)前乳腺腫塊影像分類(lèi)的模型進(jìn)行比較,在DDSM數(shù)據(jù)集上訓(xùn)練和測(cè)試,對(duì)準(zhǔn)確率進(jìn)行了比較,對(duì)比結(jié)果如表4所示。
表4 模型在DDSM數(shù)據(jù)集上結(jié)果對(duì)比Table 4 Comparison of model results on DDSM dataset
在本文中,為了解決乳腺圖像良惡性分類(lèi)問(wèn)題,本文提出了一種新的混合神經(jīng)網(wǎng)絡(luò)DSAMNet。首先,針對(duì)數(shù)據(jù)集樣本不足的問(wèn)題,通過(guò)數(shù)據(jù)增強(qiáng)方法,有效地避免了深度學(xué)習(xí)中由于樣本不足而導(dǎo)致的過(guò)擬合問(wèn)題。其次,將SENet模塊嵌入DenseNet,采用特征重校準(zhǔn)策略,通過(guò)學(xué)習(xí)自動(dòng)獲取每個(gè)特征通道的重要性,實(shí)現(xiàn)特征通道的動(dòng)態(tài)學(xué)習(xí),當(dāng)模型SE-DenseNet-B的深度為22時(shí)準(zhǔn)確率比模型DenseNet提高了10.8%,證明SE層有助于提高模型性能。最后,對(duì)混合神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了改進(jìn),用3個(gè)3×3的卷積替換了第一個(gè)卷積層7×7的卷積,AM池化函數(shù)替代了SE模塊中的全局平均池化函數(shù),模型DSAMNet-C的準(zhǔn)確率比模型SE-DenseNet-C提高了0.8%,證實(shí)了改進(jìn)后的模型效果更好。通過(guò)在CBIS-DDSM數(shù)據(jù)集上進(jìn)行訓(xùn)練與測(cè)試,實(shí)驗(yàn)結(jié)果表明,本文提出的DSAMNet在分類(lèi)性能上優(yōu)于DenseNet,不僅提高了乳房X線(xiàn)攝影圖像的良惡性分類(lèi)性能,也幫助放射科醫(yī)師提供客觀(guān)、準(zhǔn)確的診斷結(jié)果,減少錯(cuò)誤率,具有重要的臨床應(yīng)用價(jià)值和研究意義。