馮晨雅 秦耿耿 陳衛(wèi)國
乳腺癌是危害女性健康最常見的惡性腫瘤之一,近年來其發(fā)病率逐年增長,且發(fā)病年齡趨于年輕化[1]。“早發(fā)現(xiàn)、早診斷、早治療”是降低乳腺癌病人死亡率的關(guān)鍵,盡早對乳腺癌病人進行確診及治療,可使死亡率降低40%以上[1-2]。目前,乳腺X 線攝影是篩查乳腺癌首選的檢查方法[3],乳腺超聲、專用乳腺CT 及乳腺MRI 是重要的補充影像檢查手段。為了幫助影像診斷醫(yī)生更好地區(qū)別病灶與乳腺腺體實質(zhì),計算機輔助診斷(computer-aided detection/diagnosis,CAD)技術(shù)應(yīng)運而生,而且成為國內(nèi)外研究的熱點。CAD 中最重要的一環(huán)是對病灶進行分割。國際上很早已經(jīng)開始對乳腺病灶的分割技術(shù)進行研究,但國內(nèi)對此研究相對較少[2]。隨著人工智能研究的發(fā)展,乳腺病灶分割受到更多關(guān)注。腫塊是乳腺癌最常見、最基本的表現(xiàn),因此腫塊分割尤為重要。本文就不同影像檢查手段中乳腺腫塊的分割技術(shù)研究現(xiàn)狀及進展予以綜述。
病灶分割是根據(jù)影像上病灶與背景區(qū)域的差異將病灶分離出來,以便更好地觀察,從而提高診斷效能,避免不必要的活檢。CAD 很重要的一步是對乳腺影像進行病灶分割,后續(xù)的診斷都是建立在良好病灶分割效果的基礎(chǔ)上。乳腺腫塊的形態(tài)、密度、灰度等具有多樣性,這增加了腫塊分割的難度。因此,如何將腫塊從腺體組織里分離出來尤為重要。
乳腺腫塊傳統(tǒng)的分割方法多為基于圖像的處理方法,可分為基于邊緣、區(qū)域、閾值和特定理論的分割方法等[4]。
2.1 邊緣 由Kass 等[5]提出的基于參數(shù)的活動輪廓模型(Snake 模型)是較常使用的邊緣分割方法。這種模型使用局部輪廓曲率控制輪廓曲線的連續(xù)性和平滑性,并通過結(jié)合圖像特征來計算得到輪廓的邊緣,但此種方法容易產(chǎn)生假邊界。凸活動輪廓模型需要預定義閾值以固定進行腫塊分割時使用的最佳輪廓的全局最優(yōu)解,但固定閾值或手動調(diào)整閾值都不切實際。為了解決這個問題,Acho 等[6]提出了一種凸活動輪廓模型的閾值優(yōu)化方法,使用粒子群優(yōu)化得到的腫塊概率矩陣來確定閾值。但是,該方法收斂速度較慢,容易收斂到局部極小值,即使調(diào)整了T1值,仍不能成功分割灰度值與周圍背景組織相似的腫塊。
三維自動乳腺超聲系統(tǒng) (automated breast ultrasound systems,ABUS)和專用乳腺 CT 可以生成乳腺三維影像,并可避免乳腺X 線攝影中組織重疊導致的腫塊遮蓋,因而得到廣泛應(yīng)用[7-8]。Kuo 等[9]選取了一條徑向梯度指數(shù)(radial gradient index,RGI)最高的輪廓線用于產(chǎn)生最終的腫塊輪廓;Gu 等[10]根據(jù)此線提出了一種基于邊緣的變形模型。而Kozegar等[7]則在三維ABUS 中,根據(jù)前人經(jīng)驗提出了一種新的半自動分割腫塊的方法(即結(jié)合腫塊信息的兩階段分割算法),第一階段采用新的自適應(yīng)生長算法對腫塊邊界進行粗略估計,第二階段在此基礎(chǔ)上提出了一種新的基于邊緣的變形模型。此種新的分割算法根據(jù)腫塊分割相似度系數(shù)(Dice)測度獲得了精確的腫塊分割結(jié)果。Kuo 等[11]將水平集方法擴展到動態(tài)增強(dynamic contrast enhanced,DCE)乳腺CT 三維影像上,并使用RGI 分割生成初始輪廓,結(jié)合主動輪廓模型,增加3 個停止標準來終止腫塊邊緣處的迭代輪廓演化過程,通過計算與手工勾畫病灶輪廓的重疊率來評估自動腫塊分割算法,結(jié)果顯示該算法重疊率>0.65(Dice 系數(shù)為 0.7),可以很好地應(yīng)用于乳腺CT 影像中腫塊的分割。
2.2 區(qū)域 2001 年Chan 等[12]基于區(qū)域性水平集方法和Mumford-Shah 泛函理論提出基于區(qū)域的水平集活動輪廓(chan-vese,C-V)模型,并于次年結(jié)合一種特殊的多相水平集公式,將該模型擴展到多種圖像分割[13]。而Liu 等[14]則在C-V 模型的基礎(chǔ)上提出了一種基于指數(shù)加權(quán)平均比率 (ratio of exponential weighted averages,ROEWA) 算子改進的 C-V 模型,主要適用于含有斑點噪聲的超聲圖像,相較于輪廓初始化+C-V 模型,該算法在腫塊分割上具有更優(yōu)的準確度和更快的分割速度。Hmida 等[15]提出一種新的乳腺腫塊分割方法,首先初始化興趣區(qū)(ROI)的輪廓,然后將模糊輪廓與C-V 模型結(jié)合,得到描繪腫塊輪廓的最終模型。該模型平均真陽性率為91.12%,精確率為88.08%。
2.3 多種方法結(jié)合 隨著新方法的提出,與一些特定理論相結(jié)合的圖像分割方法備受關(guān)注。近年有研究提出結(jié)合2 種方法,將不同算法優(yōu)缺點互補從而取得較為理想的結(jié)果。Chu 等[16]使用形態(tài)學增強和簡單線性迭代聚類(simple linear iterative cluster,SLIC)方法檢測乳腺腫塊,并取得良好的效果。SLIC是一種基于K 均值(K-means)聚類算法常用的超像素分割方法。形態(tài)學增強可以提高腫塊區(qū)域與乳腺背景對比度,更好地顯示腫塊邊界,使得SLIC 方法能夠基于簡單的特征即可獲得令人滿意的分割性能,表明形態(tài)學增強和SLIC 結(jié)合對提高現(xiàn)有CAD系統(tǒng)的分割性能有很好的應(yīng)用前景。而Gu 等[17]提出了一種基于超像素生成和曲線演化的乳腺腫塊分割三步法,首先采用SLIC 方法和基于密度的含噪空間聚類(density-based spatial clustering of applications with noise,DBSCAN)方法生成乳腺 X 線影像的超像素,然后構(gòu)建乳腺腫塊的ROI,最后提出了一種基于局部高斯分布(local Gaussian distribution,LGD)擬合、圖形塊先驗和空間約束的隱式水平集方法來驅(qū)動曲線并捕捉乳腺腫塊的邊緣。該方法排除了ROI 假陽性區(qū)域,能更精確地捕捉乳腺腫塊的邊緣,具有較好的分割效果。
乳腺MRI 是檢查乳腺疾病的重要補充影像手段,在原位癌及無鈣化病灶的診斷中具有重要意義[18]。褚等[19]提出一種基于超像素和改進C-V 模型的三維全自動分割方法,利用MRI 序列幀間的相關(guān)性,采用超像素算法提取腫塊的大致輪廓,再用改進的C-V 水平集算法對可疑病灶邊緣進行優(yōu)化,可以得到更接近腫塊實際邊緣的邊界,較好地解決了乳腺MRI 序列中腫瘤的三維分割問題,其準確率高且具有較高的分割精度,以手動分割輪廓為基準,該分割方法平均重疊率為87.84%,對比C-V 模型為58.90%,超像素和水平集結(jié)合為76.36%,K-means+C-V 為 83.62%。
由于乳腺影像中噪聲和偽影較多,背景復雜多變,病灶與背景的對比度差,因此傳統(tǒng)的腫塊分割方法結(jié)果往往不佳。近年來,隨著計算機技術(shù)及人工智能研究的發(fā)展,許多新興的與人工智能相關(guān)的乳腺腫塊分割技術(shù)應(yīng)運而生。人工智能分割方法包括傳統(tǒng)機器學習和深度學習。
3.1 傳統(tǒng)機器學習 傳統(tǒng)機器學習是利用經(jīng)驗學習改善算法的一種人工智能學習方法。傳統(tǒng)的機器學習方法包括支持向量機、隨機森林、聚類算法等[20]。Panigrahi 等[21]提出了一種新的多尺度高斯核誘導模糊C 均值聚類方法(multi-scale Gaussian kernel induced fuzzy C-means clustering method,MsGKFCM)用于自動提取ROI 中的病灶,以劃定腫塊的邊緣,并在此基礎(chǔ)上提出一種基于MsGKFCM 和多尺度矢量場卷積的混合方法來獲得精確的腫塊邊緣。該方法首先利用散斑噪聲抑制各向異性擴散技術(shù)對圖像進行濾波,然后將MsGKFCM 應(yīng)用于濾波后的圖像分割出腫塊,利用多尺度向量卷積確定準確的腫塊邊緣,結(jié)果顯示該算法的準確度達到97.3%,F(xiàn) 分值為92.3%。
3.2 深度學習 深度學習是近年迅速發(fā)展的機器學習中的新方法,通過模擬人類大腦結(jié)構(gòu)建立提高神經(jīng)網(wǎng)絡(luò)學習能力的模型。深度學習具有強大的特征提取能力,可以自動學習輸入端到輸出端的映射關(guān)系,被廣泛應(yīng)用于乳腺腫塊分割。常用的深度學習包括卷積神經(jīng)網(wǎng)絡(luò)(convolution neural networks,CNN)、全卷積神經(jīng)網(wǎng)絡(luò)(full convolutional networks,F(xiàn)CN)以及在FCN 基礎(chǔ)上衍生的其他學習模型。
3.2.1 CNN 和FCN CNN 是一種前饋神經(jīng)網(wǎng)絡(luò),它的人工神經(jīng)元可以響應(yīng)一部分覆蓋范圍內(nèi)的周圍單元,在大規(guī)模圖像處理中具有優(yōu)勢。CNN 最初是為圖像的分類任務(wù)而設(shè)計的,2015 年Arevalo等[22]使用CNN 替代手動提取特征方法,使乳腺X 線影像上病灶的分類準確度顯著提高。FCN 將傳統(tǒng)CNN 的全連接層換成了卷積層,使卷積層成為網(wǎng)絡(luò)結(jié)構(gòu)的唯一組成成分,而且FCN 可以對全視野的乳腺數(shù)據(jù)直接進行特征提取,減少了采用數(shù)據(jù)采樣對小腫塊的影響,提高了對腫塊的檢測精度[23]。Chen等[24]根據(jù)深度實驗室版本 2(DeepLab-v2)提出了一個相似的模型結(jié)構(gòu),為了捕捉不同尺度的上下文特征,使用不同膨脹率的空洞卷積做池化層,得到一個多孔空間金字塔池化(atrous spatial pyramid pooling,ASPP)模塊,同時將主干網(wǎng)絡(luò) VGG16 替換成ResNet50,提高了模型的擬合能力。而徐等[25]設(shè)計的基于FCN 遷移學習的乳腺腫塊圖像分割方法進一步驗證了該算法分割效果明顯優(yōu)于傳統(tǒng)分割算法。但此類方法大多是在人工勾畫或提取病變區(qū)域ROI 后再進行分割的,前期準備工作繁瑣且具有較強的主觀性,增加了整個分割流程的復雜程度,使CAD 系統(tǒng)發(fā)展受到一定限制。
Al-Antari 等[26]提出并利用一種新的深度網(wǎng)絡(luò)模型——全分辨率卷積神經(jīng)網(wǎng)絡(luò)對大量乳腺X 線影像進行分割,首先用YOLO(You Look Only Once)檢測腫塊區(qū)域,然后全分辨率卷積神經(jīng)網(wǎng)絡(luò)學習原始輸入數(shù)據(jù)每個像素的全分辨率特征,從解碼器中移除了最大集合和子采樣層并使卷積層提取和學習輸入圖像的全分辨率特征以實現(xiàn)像素到像素的腫塊精確分割,最終通過四次交叉驗證、測試得到良好的分割結(jié)果 [總體準確度92.97%,Dice(F1 分數(shù))為92.69%],結(jié)果表明該新模型在腫塊分割方面優(yōu)于傳統(tǒng)的深度學習方法,可用來協(xié)助放射科醫(yī)師診斷乳腺腫塊。Badrinarayanan 等[27]使用FCN 實現(xiàn)乳腺腫塊分割,并在FCN 后加入條件隨機場來精細分割結(jié)果。趙[23]提出了一種基于醫(yī)學先驗知識的多目標、多腫瘤分割方法,首先使用背景顯著性將醫(yī)學先驗知識融入到模型輸出,對腫瘤檢測定位進行約束,然后利用不同膨脹率的空洞卷積金字塔層級結(jié)構(gòu)改進區(qū)域生成網(wǎng)絡(luò)(region proposal network,RPN),以提高模型用于不同大小腫瘤檢測、分割時的表現(xiàn),最后將全連接的條件隨機場連接在Mask分支后,使分割結(jié)果更加精細,有效提升多尺度乳腺腫塊分割表現(xiàn),其中對小腫塊檢測準確率的改善尤為顯著。該模型對腫瘤區(qū)域分割的交并比(intersection over union,IOU)達到 86.1%,真陽性率為92.69%。
3.2.2 U 型卷積神經(jīng)網(wǎng)絡(luò)(U-Net)及其衍生網(wǎng)絡(luò) UNet 由 Ronneberger 等[28]在 2015 年提出,是使用全卷積網(wǎng)絡(luò)進行語義分割的主流算法之一,使用具有壓縮和擴展路徑的對稱U 形結(jié)構(gòu)。2018 年Kumar 等[29]提出了一種多級U-Net 算法用于分割超聲影像上的可疑乳腺腫塊,該算法不需要初始種子,可以實時分割可疑乳腺腫塊,結(jié)果顯示該算法最終Dice 為0.82,真陽性率為0.84;其性能與基于距離正則化水平集(distance regularized level set segmentation,DRL)相當(Dice=0.84),并優(yōu)于單純U-Net(Dice=0.54)。
Caballo 等[30]訓練 U-Net 對平掃專用乳腺 CT 影像中基于2D 的乳腺腫塊進行分割,其與實際腫塊的符合率為0.85,并比較了與4 名放射科醫(yī)生勾畫腫塊的一致性及所勾畫的病灶之間在影像組學特征提取的一致性。雖然研究結(jié)果顯示U-Net 的腫塊分割與放射科醫(yī)生間的一致性為0.78,但仍有超過90%影像組學特征的提取是穩(wěn)定的。MR 擴散加權(quán)成像(DWI)不需要注射對比劑,作為MRI 檢查的一種輔助序列,可以提高乳腺MRI 的準確性,減少不必要的活檢,但DWI 分辨力較低,進行基于乳腺DWI 的MRI 自動全乳腺分割技術(shù)存在一定難度[31]。Zhang 等[32]使用深度學習模型(U-Net 和分割網(wǎng)絡(luò)SegNet)和遷移學習作為分割方法,在DCE-MRI 預先訓練模型上進行遷移學習,并運用于DWI,結(jié)果顯示 U-Net 模型在 DCE-MRI 及 DWI 上較 SegNet具有更好的性能;而且分割過程中發(fā)現(xiàn),U-Net 及SegNet 模型在DWI-MRI 數(shù)據(jù)上也得到了良好的分割效果,并提出DWI 在未來有可能代替DCE-MRI成為乳腺MRI 輔助診斷的新工具。
單純U-Net 在不同檢查方式乳腺影像中得到了很好的應(yīng)用,近些年在單純U-Net 的基礎(chǔ)上又有多方面的改進,例如基于注意力機制、數(shù)據(jù)處理、卷積模塊等方面的改進,以便更好地通過影像分割乳腺腫塊。
3.2.2.1 基于注意力機制的改進 有研究者[1,4]進行了基于FCN 的全視野數(shù)字乳腺X 線攝影(full field digital mammography,F(xiàn)FDM)腫塊分割研究,應(yīng)用更有效的非對稱編碼器-解碼器網(wǎng)絡(luò)架構(gòu),結(jié)合注意力引導密集上采樣(attention-guided denseupsampling,AU)模塊,通過 AU 網(wǎng)絡(luò)(AUNet)來提高分割性能,獲得最佳分割結(jié)果,結(jié)果顯示不僅能很好地分割不規(guī)則和小尺寸的乳腺腫塊,而且能通過注意力選擇機制有效地減少假陽性,同時不增加假陰性結(jié)果。
2020 年,一種新的選擇核心(selective kernel,SK)-U-Net 網(wǎng)絡(luò)被用于超聲進行乳腺腫塊分割[33]。SK 通過注意力機制調(diào)整網(wǎng)絡(luò)的ROI,并融合擴張卷積和傳統(tǒng)卷積網(wǎng)絡(luò)提取的特征映射,有效解決乳腺腫塊大小的問題,結(jié)果顯示SK-U-Net 的平均Dice為0.826,受試者操作特征曲線下面積(AUC)為0.958, 而 標準 U-Net 的 Dice 為 0.778,AUC 為0.909;研究還顯示該算法在良惡性腫塊分割中,惡性腫塊的 Dice(0.842)高于良性腫塊(0.820),可以更好地幫助診斷醫(yī)師識別乳腺惡性腫瘤,提高乳腺癌的檢出率。
3.2.2.2 基于卷積模塊的改進 梁[34]在U-Net 的基礎(chǔ)上增加其網(wǎng)絡(luò)深度,并加入殘差學習單元,提出了殘差學習U 型卷積神經(jīng)網(wǎng)絡(luò)(RcsU-Net),解決了網(wǎng)絡(luò)加深出現(xiàn)的梯度消失問題,使分割效果得到顯著提升,并借鑒了移動最小二乘形變的方法,在擴大數(shù)據(jù)集規(guī)模提高網(wǎng)絡(luò)泛化能力的同時,保證了重要診斷信息的完整性,能夠精準高效地分割腫塊區(qū)域(Dice 為 0.956 8,IOU 為 0.917 3)。
3.2.2.3 基于數(shù)據(jù)處理方法的改進 Zeiser 等[35]在U-Net 的基礎(chǔ)上結(jié)合數(shù)據(jù)增強提出了一種新的模型,該模型去除了乳腺攝影中不相關(guān)的信息,增強影像對比度獲得ROI,并對影像進行水平翻轉(zhuǎn)和縮放,最終敏感度為92.32%,特異度為80.47%,準確度為 85.95%,Dice 為 79.39%,AUC 為 86.40%。
為了提高數(shù)字乳腺體層攝影(digital breast tomography,DBT)影像中乳腺腫塊的自動分割精度,Lai 等[36]提出了一種基于U-Net 網(wǎng)絡(luò)的DBT 乳腺腫塊自動分割算法,增強了大量腫塊區(qū)域的對比度并對DBT 圖像進行頂帽(TOP-HAT)變換,構(gòu)建了高效的U-Net 神經(jīng)網(wǎng)絡(luò)對DBT 腫塊進行預分割,并使用中值濾波器獲取腫塊邊界以取得最終分割結(jié)果,結(jié)果顯示該網(wǎng)絡(luò)在DBT 腫塊的自動分割方面取得了良好的結(jié)果,并且其準確度、特異度、敏感度和AUC 優(yōu)于其他經(jīng)典CAD。
3.2.3 其他網(wǎng)絡(luò) 金字塔型結(jié)構(gòu)是一種由不同分辨率圖像組成的形同金字塔樣層次式的數(shù)據(jù)結(jié)構(gòu),在金字塔結(jié)構(gòu)的上層圖像中,濾去了絕大部分的高頻成分而保留低頻成分。運用到乳腺影像上,腫塊屬于低頻成分,背景屬于相對高頻成分,濾去高頻的背景組織后,就留下了低頻腫塊[37]。Wang 等[38]提出了一種新的多級嵌套金字塔網(wǎng)絡(luò)(multi-level nested pyramid network,MNPNet)來處理乳腺圖像腫塊分割中普遍存在的類內(nèi)不一致和類間不區(qū)分的局限性。MNPNet 包括編碼器和解碼器,前者在修改后的ResNet34 生成的特征金字塔上,通過多層嵌套ASPP 模塊,對上下文特征、低層細節(jié)信息和高層語義信息進行多級多尺度編碼;后者由一系列簡單而有效的雙線性上采樣和特征融合操作組成,用于細化腫塊邊界區(qū)域的分割結(jié)果。所提出的MNPNet 在INBREAM 和DDSM-BCRP 2 個公共乳腺攝影腫塊分割數(shù)據(jù)庫上得到了很好的驗證,在沒有任何前后處理的情況下,Dice 系數(shù)分別達到了91.10%和91.69%,表明MNPNet 可以指導今后臨床腫塊分割。
乳腺癌作為威脅女性健康的第一大腫瘤,其防治是全世界的公共健康問題,早預防早診治能提高病人預后[31]。CAD 技術(shù)系統(tǒng)基于乳腺影像,借助計算機圖像處理、數(shù)據(jù)統(tǒng)計以及人工智能等技術(shù),能探測乳腺病灶,尤其是與腺體組織重疊而容易被忽視的病變,并有助于鑒別病變良惡性,降低召回率和活檢率,對乳腺癌的診治提供了很大幫助。盡管現(xiàn)階段可用的分割算法較多,且不斷有新的改良算法出現(xiàn),但哪種方法能達到最好的分割效果尚無定論,且所訓練的模型在不同樣本中的分割效果也還有待觀察。因此,如何選擇合適的方法或算法以更好地分割腫塊與乳腺組織,幫助放射科醫(yī)生更準確地診斷乳腺癌,降低乳腺癌死亡率,提高病人生存率及生存質(zhì)量仍是今后的研究重點。