王文欣,賀煜航,陳 剛
(武漢大學(xué)國(guó)家網(wǎng)絡(luò)安全學(xué)院,武漢 430072)
圖像分割是指將圖像分成若干具有相似性質(zhì)區(qū)域的過(guò)程。傳統(tǒng)的分割方法包括閾值分割、邊緣檢測(cè)、聚類、遺傳算法、區(qū)域生長(zhǎng)分割法、深度學(xué)習(xí)等[1]。醫(yī)學(xué)影像分割[2-3]作為醫(yī)學(xué)影像分析的核心任務(wù),需要有經(jīng)驗(yàn)的醫(yī)生對(duì)臟器、病灶進(jìn)行精準(zhǔn)分割。當(dāng)圖像存在多個(gè)目標(biāo)物體時(shí),深度學(xué)習(xí)分割多個(gè)目標(biāo)就變成了語(yǔ)義解析的任務(wù)。在當(dāng)前醫(yī)學(xué)影像分割中,語(yǔ)義目標(biāo)識(shí)別的主要任務(wù)是對(duì)主要骨結(jié)構(gòu)(肋骨、椎骨、頭骨等)、主要器官(肺部、心臟、肝臟等)以及一些解剖標(biāo)記點(diǎn)(如肝臟頂部、主動(dòng)脈弓)進(jìn)行識(shí)別、配準(zhǔn)和分割,采用深度學(xué)習(xí)進(jìn)行醫(yī)學(xué)影像分割時(shí),需要區(qū)分病灶或器官。但是醫(yī)學(xué)影像分割所需較高的分割精度和穩(wěn)定性,不正確或不穩(wěn)定的分割將會(huì)直接影響后續(xù)計(jì)算,從而失去分割意義。
全卷積網(wǎng) 絡(luò)(Fully Convolutional Network,F(xiàn)CN)[4]通過(guò)將深層網(wǎng)絡(luò)的全連接層改為卷積層,從而保存分割的位置信息,分割結(jié)果取決于池化層輸出的上采樣倍數(shù),分割精度與分割后語(yǔ)義信息呈負(fù)相關(guān)。文獻(xiàn)[5]提出U-Net 網(wǎng)絡(luò)將跨越連接原理應(yīng)用于分割問(wèn)題,利用底層信息補(bǔ)充高層信息,有效提高分割精度。在心臟和大血管分割的問(wèn)題上[6],稠密連接的卷積網(wǎng)絡(luò)(DenseNet)[7]將任意兩層網(wǎng)絡(luò)連接起來(lái),以最大程度地保存網(wǎng)絡(luò)信息流和梯度流,降低參數(shù)量的同時(shí)也解決了梯度消失問(wèn)題。
FCN、U-Net 以及各種分割網(wǎng)絡(luò)都基于卷積神經(jīng)網(wǎng) 絡(luò)(Convolutional Neural Network,CNN)[8],而CNN 本身存在著一定的弊端。CNN 采用卷積-池化方式并不會(huì)保存特征相對(duì)于整體的空間依賴關(guān)系,即存在同變性和不變性問(wèn)題,CNN 對(duì)旋轉(zhuǎn)是沒(méi)有不變性的。不變性是指目標(biāo)外觀發(fā)生平移、旋轉(zhuǎn)、光照等變化但人們依舊能夠?qū)⑵渥R(shí)別出來(lái)。這種相對(duì)的空間依賴關(guān)系對(duì)醫(yī)療圖像識(shí)別、分割十分重要,例如,由左肺、右肺與心臟構(gòu)成的X 射線圖像,這些圖像在顯示上相互重疊,并具有較嚴(yán)謹(jǐn)?shù)目臻g位置關(guān)系。CNN 利用池化操作不僅導(dǎo)致空間上相對(duì)信息丟失,而且有可能直接丟棄相關(guān)的信息。
FCN、U-Net 等分割網(wǎng)絡(luò)利用底層信息補(bǔ)充高層信息的方法解決CNN 存在的問(wèn)題。另一種方法是研究人員對(duì)數(shù)據(jù)進(jìn)行處理,例如在訓(xùn)練數(shù)據(jù)集中加入旋轉(zhuǎn)的圖像,使網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),從而解決CNN 對(duì)旋轉(zhuǎn)、平移等不敏感的問(wèn)題。傳統(tǒng)CNN 對(duì)于單一目標(biāo)的旋轉(zhuǎn)、平移(例如一幅圖片中的眼睛與鼻子互換位置)仍會(huì)檢測(cè)為正常目標(biāo)。文獻(xiàn)[9]提出的膠囊網(wǎng)絡(luò)是一種在最低層的膠囊(即神經(jīng)元)上包含目標(biāo)位置、姿態(tài)等信息的神經(jīng)網(wǎng)絡(luò),其能從本質(zhì)上優(yōu)化傳統(tǒng)CNN。
本文結(jié)合U-Net 網(wǎng)絡(luò)與膠囊網(wǎng)絡(luò)提出一種多標(biāo)簽語(yǔ)義分割網(wǎng)絡(luò)UCaps,利用高斯混合模型與EM 路由算法聚合低層膠囊對(duì)高層膠囊的概率推導(dǎo)過(guò)程,從而保留低層膠囊的精細(xì)度和各特征間位置、姿態(tài)的統(tǒng)一性,解決傳統(tǒng)分割網(wǎng)絡(luò)中卷積與池化分割輪廓不清晰的問(wèn)題。
U-Net 網(wǎng)絡(luò)[5]特點(diǎn)是U 型的網(wǎng)絡(luò)結(jié)構(gòu)與跨越連接操作,通過(guò)下采樣pooling 與上采樣反卷積操作得到顯著特征,同時(shí)用跨越連接將前層圖與后層圖相疊加,盡可能少地丟失圖像信息,將信息丟失多而特征明顯的層與信息丟失少特征模糊的層疊加,平衡語(yǔ)義信息和圖像精度。由于醫(yī)學(xué)圖像數(shù)據(jù)量通常只有幾百幅,因此底層特征尤為重要。過(guò)多的訓(xùn)練會(huì)出現(xiàn)過(guò)擬合現(xiàn)象,需要盡量少的數(shù)據(jù)使其盡快收斂。U-Net 網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。
圖1 U-Net 網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure of U-Net network
U-Net 網(wǎng)絡(luò)作為醫(yī)學(xué)圖像分割領(lǐng)域效果較優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu),模型代表有結(jié)合DenseNet 原理的UNet++[10]、具有嵌套 和Dense 跨越連接結(jié)構(gòu) 的UNet3+[11]等。U-Net 網(wǎng)絡(luò)被證明在小數(shù)據(jù)集、高精度的醫(yī)學(xué)影像分割中具有相對(duì)最優(yōu)的結(jié)構(gòu),對(duì)構(gòu)建UCaps 網(wǎng)絡(luò)結(jié)構(gòu)具有啟發(fā)作用。
文獻(xiàn)[9]使用多維向量代替?zhèn)鹘y(tǒng)的標(biāo)量,提出膠囊網(wǎng)絡(luò)。與CNN 相比,膠囊網(wǎng)絡(luò)通過(guò)動(dòng)態(tài)計(jì)算權(quán)重在每個(gè)正向通道上的耦合系數(shù)來(lái)對(duì)每個(gè)目標(biāo)貢獻(xiàn)不同的權(quán)重值。這種優(yōu)化的機(jī)制即動(dòng)態(tài)路由。膠囊網(wǎng)絡(luò)與動(dòng)態(tài)路由的基本原理是某一層的膠囊網(wǎng)絡(luò)通過(guò)變換矩陣對(duì)更高級(jí)膠囊網(wǎng)絡(luò)的實(shí)例化參數(shù)進(jìn)行預(yù)測(cè),當(dāng)動(dòng)態(tài)路由使多個(gè)預(yù)測(cè)都一致時(shí),更高級(jí)膠囊網(wǎng)絡(luò)將會(huì)活躍。
動(dòng)態(tài)路由是一種聚類的迭代算法,膠囊網(wǎng)絡(luò)的輸出是對(duì)動(dòng)態(tài)路由輸入進(jìn)行聚類的結(jié)果。整個(gè)動(dòng)態(tài)路由的算法可以用其他聚類算法計(jì)算達(dá)到更優(yōu)的效果。
文獻(xiàn)[12]通過(guò)矩陣與激活值的方式代替向量并作為基礎(chǔ)膠囊網(wǎng)絡(luò),使用高斯混合模型[13]與EM 算法代替原本的動(dòng)態(tài)路由算法,稱為EM 路由算法。EM 路由算法利用聚類方法對(duì)膠囊網(wǎng)絡(luò)進(jìn)行分組,從而形成低層與高層之間的關(guān)系,通過(guò)聚類低層膠囊對(duì)高層膠囊進(jìn)行推測(cè),即使用EM 路由算法將相應(yīng)投票非常接近的膠囊網(wǎng)絡(luò)進(jìn)行聚類,得到更高一層的膠囊網(wǎng)絡(luò)。膠囊網(wǎng)絡(luò)是基于加權(quán)的歐氏距離構(gòu)建高斯混合模型,其中歐氏距離進(jìn)行聚類的特點(diǎn)在于聚類中心向量是類內(nèi)向量加權(quán)平均。研究人員最早提出,利用向量簇構(gòu)建膠囊網(wǎng)絡(luò),使用向量模長(zhǎng)表示特征的顯著程度,因此向量不適用于EM 路由算法。膠囊結(jié)構(gòu)在改為矩陣時(shí),需要一個(gè)標(biāo)量激活值作為衡量特征顯著程度的標(biāo)準(zhǔn)。具有EM 路由的膠囊網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。
圖2 具有EM 路由的膠囊網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of capsule network with EM-Routing
膠囊網(wǎng)絡(luò)多用于解決分類問(wèn)題。膠囊網(wǎng)絡(luò)之間路由的原理是低級(jí)膠囊對(duì)高級(jí)膠囊形態(tài)推測(cè)的過(guò)程,同樣可以應(yīng)用于解決圖像分割問(wèn)題。文獻(xiàn)[9]對(duì)兩個(gè)手寫體數(shù)字重疊的數(shù)據(jù)集進(jìn)行識(shí)別,基于動(dòng)態(tài)路由的膠囊網(wǎng)絡(luò)對(duì)重疊數(shù)字的識(shí)別和分割效果較優(yōu)。膠囊網(wǎng)絡(luò)與其路由方法同樣適用于圖像分割領(lǐng)域。研究人員結(jié)合醫(yī)學(xué)影像(例如肺癌篩查[14]、左心室分割[15])與膠囊網(wǎng)絡(luò)在圖像分割領(lǐng)域上取得較優(yōu)的成果。文獻(xiàn)[16]提出SegCaps 將膠囊網(wǎng)絡(luò)應(yīng)用在二類分割任務(wù)中,通過(guò)實(shí)驗(yàn)對(duì)其改進(jìn)后發(fā)現(xiàn),SegCaps 網(wǎng)絡(luò)架構(gòu)雖然大幅減少了訓(xùn)練參數(shù),但在多標(biāo)簽分割任務(wù)上的準(zhǔn)確率大幅下降。
因此,本文研究的重點(diǎn)是將膠囊原理和最適合分割的U 型網(wǎng)絡(luò)架構(gòu)相結(jié)合,并融合全新的膠囊路由,使得膠囊網(wǎng)絡(luò)在對(duì)多標(biāo)簽進(jìn)行分割時(shí)效果較優(yōu)。
UCaps 使用共計(jì)14 層的網(wǎng)絡(luò)結(jié)構(gòu),其中有1 個(gè)卷積膠囊層,9 個(gè)EM 路由膠囊層,3 個(gè)上采樣膠囊層,1 個(gè)分類膠囊層。整體網(wǎng)絡(luò)結(jié)構(gòu)取自U-Net 網(wǎng)絡(luò)[5]。
UCaps 網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示,由下采樣(左側(cè))和上采樣(右側(cè))組成。UCaps 網(wǎng)絡(luò)結(jié)構(gòu)的第1 層使用卷積膠囊層,輸入的圖像卷積為包含[4,4]的姿態(tài)矩陣和1 個(gè)標(biāo)量激活值的多個(gè)膠囊。
圖3 UCaps 網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Structure of UCaps network
UCaps 網(wǎng)絡(luò)將膠囊網(wǎng)絡(luò)輸入EM 膠囊層,膠囊網(wǎng)絡(luò)進(jìn)行深度可分離卷積,并將展開(kāi)的膠囊網(wǎng)絡(luò)乘視角不變的變換矩陣W得到投票矩陣V,最后通過(guò)EM算法[17]計(jì)算高層膠囊網(wǎng)絡(luò)的輸出姿態(tài)矩陣和激活值,并將結(jié)果保存在skip 中用于準(zhǔn)備后面跨越連接操作。在每個(gè)下采樣步驟,UCaps 網(wǎng)絡(luò)使用與傳統(tǒng)膠囊網(wǎng)絡(luò)[18]相同結(jié)構(gòu),逐步抽象其特征,使得膠囊網(wǎng)絡(luò)獲取更高級(jí)的語(yǔ)義信息。下采樣膠囊為3 層,過(guò)大的層數(shù)會(huì)導(dǎo)致計(jì)算參數(shù)量太大,過(guò)少的層數(shù)使得模型缺少足夠的表達(dá)能力。上采樣膠囊層類似UNet 網(wǎng)絡(luò)中上采樣的過(guò)程。跨越連接操作在第4 維度將skip 膠囊與輸出膠囊進(jìn)行拼接,即將Caps 層輸出添加進(jìn)DeCaps 層的channel 中。這種做法與UNet 網(wǎng)絡(luò)上的通道拼接類似,形成更多的膠囊層,缺點(diǎn)在于使用concat 操作比較占用顯存,優(yōu)點(diǎn)是融合多尺度維度信息。拼接后的膠囊層融合了同尺度的輸出和上一層膠囊表達(dá)的信息。這樣的連接貫穿整個(gè)網(wǎng)絡(luò),通過(guò)3 次拼接使得UCaps 網(wǎng)絡(luò)同時(shí)保留低層膠囊的特征信息與高層膠囊的信息。上采樣膠囊層與下采樣對(duì)應(yīng),同樣為3 層。UCaps 網(wǎng)絡(luò)經(jīng)過(guò)3 個(gè)上采樣層與膠囊層將結(jié)果輸入分類膠囊層,分類膠囊層主要按照分割的種類將對(duì)應(yīng)膠囊輸出進(jìn)行分類操作,輸出每個(gè)膠囊所代表的圖片像素對(duì)應(yīng)的分割標(biāo)簽類別并預(yù)測(cè)投票值,進(jìn)而得到整幅圖的分割預(yù)測(cè)結(jié)果。
EM 路由算法使用高斯分布進(jìn)行聚類,利用高斯模型對(duì)高層膠囊的姿態(tài)矩陣進(jìn)行建模。姿態(tài)矩陣為[4,4],即使用16μ和σ的高斯模型。μ用于估算激活膠囊成本,成本越低越有可能激活高級(jí)膠囊。
本文在膠囊層基礎(chǔ)上設(shè)計(jì)上采樣算法作為上采樣膠囊層。上采樣膠囊層示意圖如圖4 所示。
圖4 上采樣膠囊層示意圖Fig.4 Schematic diagram of up-sampling capsule layers
上采樣層過(guò)程如式(1)所示:
將Rij帶入到EM算法中,最大化M步驟如式(2)所示:
期望E 步驟的計(jì)算如式(3)所示:
上采樣膠囊層使用如下公式作為損失函數(shù):
margin 值隨著訓(xùn)練次數(shù)增加而增大(本文實(shí)驗(yàn)取0.2~0.9)。作為最終膠囊激活值,在訓(xùn)練早期值小,說(shuō)明通過(guò)高斯聚類后的模型預(yù)測(cè)處于均勻分布狀態(tài)。margin 值過(guò)大,使Lloss值被margin 值影響過(guò)多。隨著訓(xùn)練輪數(shù)的增加,值會(huì)越來(lái)越大,說(shuō)明膠囊激活值指向越來(lái)越清晰,margin 值隨之增大,以穩(wěn)定Lloss值。
高斯混合模型將數(shù)據(jù)點(diǎn)聚類為混合高斯分布,EM(期望最大化)路由的目的是使用聚類技術(shù)將膠囊分組形成一個(gè)部分-整體關(guān)系。文獻(xiàn)[12]指出,高層膠囊表示其上一層低層膠囊的高斯分布期望,通過(guò)高斯混合模型擬合其最小化的損失函數(shù)。同層間不同的高斯混合模型反映了相同低層膠囊對(duì)不同高層膠囊的傾向性,即高斯混合模型集中了高層膠囊中的低層信息。EM 路由通過(guò)訓(xùn)練視角不變的變換矩陣W,使得高層膠囊不僅包含低層膠囊的特征,同時(shí)保留低層膠囊間的位置信息,即使圖片發(fā)生旋轉(zhuǎn),仍然能將相同位置關(guān)系的低層膠囊進(jìn)行聚類。
數(shù)據(jù)集使用的是日本放射技術(shù)學(xué)會(huì)(Japanese Society of Radiological Technology,JSRT)數(shù)據(jù)庫(kù)[19]。該數(shù)據(jù)庫(kù)由JSRT 與日本放射學(xué)會(huì)(JRS)合作創(chuàng)建的有無(wú)胸肺結(jié)節(jié)的標(biāo)準(zhǔn)數(shù)字圖像構(gòu)成。數(shù)據(jù)庫(kù)共有154 張有結(jié)節(jié)與94 張沒(méi)有結(jié)節(jié)的圖像。圖像分辨率為2 048 像素×2 048 像素,像素尺寸為0.175 mm。標(biāo)簽圖像來(lái)自文獻(xiàn)[20]中對(duì)JSRT 數(shù)據(jù)集進(jìn)行手動(dòng)標(biāo)注的肺部、心臟和鎖骨的標(biāo)簽圖,將圖像壓縮為128 像素×128 像素,并進(jìn)行數(shù)據(jù)集拓展。數(shù)據(jù)集隨機(jī)進(jìn)行角度偏移、水平或豎直移動(dòng)、縮放,拓展至2 726 張。數(shù)據(jù)集圖像與標(biāo)簽如圖5 所示。
圖5 數(shù)據(jù)集圖像與標(biāo)簽Fig.5 Image and label of dataset
本文使用設(shè)備CPU 為4 核32 GB內(nèi)存,GPU 使用Tesla-V100-SXM-32GB。實(shí)驗(yàn)環(huán)境Tensorflow 1.13.1+cuda10.0+cudnn7.4.5。
本文網(wǎng)絡(luò)分別與以下基準(zhǔn)網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)對(duì)比:1)U-Net 網(wǎng)絡(luò)[5],使用CNN 卷積操作的U-Net 網(wǎng)絡(luò),線性上采樣過(guò)程取代反卷積層,并用交叉熵評(píng)估損失;2)SegCaps 網(wǎng)絡(luò)[16],將兩種類別分割的SegCaps分割網(wǎng)絡(luò)改進(jìn)為多標(biāo)簽分割,并使用weighted softmax 損失函數(shù)進(jìn)行評(píng)估;3)MatVec-Caps 網(wǎng)絡(luò)[21],使用MatVec-CapsNet 網(wǎng)絡(luò)進(jìn)行多標(biāo)簽分割,MatVec-CapsNet 采用雙路由方法;4)UCaps-Dynamic Routing網(wǎng)絡(luò),使用文獻(xiàn)[9]提出的Dynamic Routing 的路由方法設(shè)計(jì)UCaps 網(wǎng)絡(luò)。
本文將UCaps 網(wǎng)絡(luò)與以上4 種網(wǎng)絡(luò)進(jìn)行對(duì)比,從CNN 與膠囊、多標(biāo)簽分割與單標(biāo)簽分割、EM 路由與動(dòng)態(tài)路由3 個(gè)角度進(jìn)行實(shí)驗(yàn)對(duì)比,評(píng)估UCaps 網(wǎng)絡(luò)的性能。
UCaps 在數(shù)據(jù)訓(xùn)練后快速收斂,無(wú)論訓(xùn)練集還是測(cè)試集損失分布合理,并未出現(xiàn)欠擬合或過(guò)擬合現(xiàn)象。UCaps 對(duì)左右肺原始圖片中突出的部分進(jìn)行分割的精度高,左右鎖骨次之,而在心臟部分的分割準(zhǔn)確率約為87%。心臟在圖像中的位置相對(duì)不固定,其形狀結(jié)構(gòu)差異性較大,難以對(duì)其進(jìn)行精確分割。隨著訓(xùn)練迭代次數(shù)增多,UCaps 在測(cè)試集上心臟部分的分割準(zhǔn)確度有顯著提高。UCaps 網(wǎng)絡(luò)在測(cè)試集上分割結(jié)果如圖6 所示,圖6(a)和圖6(c)的底色為原始圖像,圖6(b)和圖6(d)的底色為標(biāo)簽圖。
圖6 UCaps 網(wǎng)絡(luò)的分割結(jié)果Fig.6 Segmentation results of UCaps network
U-Net、SegCaps、MaVec-Caps、UCaps 網(wǎng)絡(luò)的分割準(zhǔn)確率對(duì)比如表1 所示。從表1 可以看出,所有網(wǎng)絡(luò)在心臟分割部分上的識(shí)別率均低于90%。這可能與訓(xùn)練時(shí)間不足有關(guān)。本文實(shí)驗(yàn)的目的是在有限的數(shù)據(jù)集和迭代的情況下獲得更快的收斂速度和更高的準(zhǔn)確率。由于心臟在這5 個(gè)分類標(biāo)簽中變化最大、形狀最多,因此對(duì)本文的實(shí)驗(yàn)結(jié)果造成了一定的影響。SegCaps 網(wǎng)絡(luò)主要解決二分類分割問(wèn)題,本文將其簡(jiǎn)單修改為解決多標(biāo)簽分割問(wèn)題。修改后的SegCaps 網(wǎng)絡(luò)僅分割左右肺部和心臟,在相同迭代次數(shù)下對(duì)特征的識(shí)別性能較低。SegCaps 網(wǎng)絡(luò)簡(jiǎn)化了路由算法,減少了參數(shù)量,能分割更大圖片的同時(shí)降低了特征的識(shí)別精度。UCaps 網(wǎng)絡(luò)的平均分割準(zhǔn)確率為93.21%,優(yōu)于其他網(wǎng)絡(luò)。不同網(wǎng)絡(luò)的分割結(jié)果對(duì)比如圖7 所示。
表1 不同網(wǎng)絡(luò)的分割準(zhǔn)確率對(duì)比Table 1 Segmentation accuracy comparison among different networks
圖7 不同網(wǎng)絡(luò)的分割結(jié)果對(duì)比Fig.7 Segmentation results comparison among different networks
在4 000次訓(xùn)練下,不同網(wǎng)絡(luò)的測(cè)試結(jié)果對(duì)比如圖8所示。在訓(xùn)練初期,幾種網(wǎng)絡(luò)模型都快速收斂,但在將每個(gè)分割部位進(jìn)行準(zhǔn)確度測(cè)算時(shí),由于左右鎖骨部分與雙肺重疊,因此無(wú)法定位。雙肺分割精度收斂快,因心臟在圖像中的位置關(guān)系不準(zhǔn)確,導(dǎo)致分割精度較低。與其他網(wǎng)絡(luò)相比,使用EM 路由的UCaps 網(wǎng)絡(luò)能在較短時(shí)間內(nèi)通過(guò)位置關(guān)系定位鎖骨與心臟,在訓(xùn)練前期具有較優(yōu)的表現(xiàn)。當(dāng)使用像素為單位整體評(píng)價(jià)準(zhǔn)確率時(shí),幾種網(wǎng)絡(luò)測(cè)試準(zhǔn)確率差距不明顯,但對(duì)分割后的各部位單獨(dú)進(jìn)行對(duì)比時(shí),UCaps網(wǎng)絡(luò)表現(xiàn)十分優(yōu)異。UCaps的膠囊網(wǎng)絡(luò)[21]結(jié)構(gòu)保證各部分間的位置形態(tài)關(guān)系,此外,EM 路由與高斯聚類算法則保證UCaps 在很少的數(shù)據(jù)集中具有更優(yōu)的表現(xiàn)。
圖8 4 000 次訓(xùn)練后不同網(wǎng)絡(luò)的測(cè)試結(jié)果對(duì)比Fig.8 Test results comparison among different networks after 4 000 trainings
在不同訓(xùn)練次數(shù)下不同網(wǎng)絡(luò)的右肺和右鎖骨分割準(zhǔn)確率對(duì)比如表2 與表3 所示。從表2 和表3 可以看出,在訓(xùn)練初期各網(wǎng)絡(luò)的右肺分割準(zhǔn)確率較高,但在訓(xùn)練初期不同網(wǎng)絡(luò)對(duì)右鎖骨分割時(shí)的準(zhǔn)確率差距較大。結(jié)合EM 路由的UCaps 網(wǎng)絡(luò)收斂速度遠(yuǎn)快于其他網(wǎng)絡(luò)模型。
表2 不同網(wǎng)絡(luò)的右肺分割準(zhǔn)確率對(duì)比Table 2 Segmentation accuracy of right lung comparison among different networks %
表3 不同網(wǎng)絡(luò)的右鎖骨分割準(zhǔn)確率對(duì)比Table 3 Segmentation accuracy of right clavicle comparison among different networks %
本文提出多標(biāo)簽語(yǔ)義分割網(wǎng)絡(luò)UCaps,通過(guò)設(shè)計(jì)適用于膠囊網(wǎng)絡(luò)的上采樣膠囊算法,補(bǔ)充高層膠囊與低層膠囊的特征信息。在此基礎(chǔ)上,將高斯混合模型與EM 路由算法相結(jié)合,聚合底層特征對(duì)高層特征的推導(dǎo)過(guò)程。實(shí)驗(yàn)結(jié)果表明,相比U-Net、SegCaps、MaVec-Caps 網(wǎng)絡(luò),UCaps 網(wǎng)絡(luò)具有較快的收斂速度和較高的分割精度,在邊緣輪廓上的分割結(jié)果更清晰。后續(xù)將在圖像分割領(lǐng)域中通過(guò)使用金字塔結(jié)構(gòu)、引入注意力機(jī)制等方法,優(yōu)化膠囊網(wǎng)絡(luò)參數(shù),進(jìn)一步提高膠囊網(wǎng)絡(luò)解決不變性與同變性問(wèn)題的能力。