陳 珊, 卜 巍, 鄔向前
(1 哈爾濱工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 哈爾濱 150001; 2 哈爾濱工業(yè)大學(xué) 媒體技術(shù)與藝術(shù)學(xué)院, 哈爾濱 150001)
乳腺癌是女性最常見的癌癥類型。據(jù)世界衛(wèi)生組織統(tǒng)計(jì),全球每年有超過50萬婦女死于乳腺癌,超過120萬婦女被診斷患有乳腺癌,且發(fā)病率不斷上升[1]。在中國女性中,乳腺癌約占所有女性癌癥的15%。并有數(shù)據(jù)顯示,中國乳腺癌的發(fā)病率每年正以3%的速度上升。這一現(xiàn)實(shí)狀況即使其已然成為女性群體中性命攸關(guān)的危重病癥之一。但乳腺癌的致病誘因至今還未獲得徹底揭示,因此盡早發(fā)現(xiàn)乳腺癌并盡早治療則顯得尤為重要。
乳腺鉬靶X光檢查是目前早期乳腺癌檢查的主要方法,醫(yī)生通過閱讀乳腺鉬靶圖像,初步判斷有無乳腺癌變。但這種初期診斷主要基于醫(yī)生的主觀判斷,容易出現(xiàn)漏診和誤診的情況。研究表明,這種人為診斷的敏感度為84%,特異度為91%[2- 3]。分析可知,漏診和誤診的發(fā)生可概略歸結(jié)為醫(yī)生長時(shí)間閱片疲勞、醫(yī)生閱片經(jīng)驗(yàn)的差異和鉬靶圖像中病灶特征不明顯等原因。漏診易耽誤寶貴的治療時(shí)間,誤診則會(huì)給就診者帶來很大的精神壓力。因此,提升醫(yī)生的閱片效率和診斷準(zhǔn)確性至關(guān)重要。
乳腺腫塊病變檢測(cè),是乳腺鉬靶圖像診斷中的關(guān)鍵任務(wù)之一,即是要對(duì)乳腺鉬靶圖像中的腫塊病變進(jìn)行準(zhǔn)確定位和分類,但由于乳腺鉬靶圖像中的不同腫塊病變往往具有不同的形狀和尺度(如圖1所示,紅色矩形框區(qū)域?yàn)槟[塊),檢測(cè)上存在一定難度。有效的乳腺腫塊病變檢測(cè)方法應(yīng)當(dāng)能對(duì)乳腺鉬靶圖像中不同形狀和尺度的腫塊病變都能有較好的檢測(cè)性能。
以往的大多數(shù)乳腺病變檢測(cè)方法都基于兩階段框架:先在圖像中生成候選區(qū)域,接著就在這些區(qū)域上對(duì)腫塊目標(biāo)進(jìn)行后續(xù)的定位和分類,比如Fast R-CNN[4]、Faster R-CNN[5]等。應(yīng)對(duì)大小尺度不同的目標(biāo)主要是通過在候選區(qū)域生成時(shí),采用變化窗口大小的滑動(dòng)窗口,或是采用選擇性搜索法[6]和對(duì)目標(biāo)位置進(jìn)行回歸的RPN網(wǎng)絡(luò),再在第二階段開始時(shí)將這些區(qū)域放縮到同樣大小,旨在進(jìn)一步調(diào)整區(qū)域的位置和邊界。
SSD(Single Shot MultiBox Detector)網(wǎng)絡(luò)[7]是時(shí)下自然圖像領(lǐng)域中性能較優(yōu)的圖像檢測(cè)方法之一。相比于兩階段檢測(cè)網(wǎng)絡(luò)Fast R-CNN、Faster R-CNN,SSD網(wǎng)絡(luò)在簡化模型的同時(shí),保持了較高的檢測(cè)性能。其運(yùn)行機(jī)理就是將所有計(jì)算壓縮到一個(gè)單一網(wǎng)絡(luò)中,去除了區(qū)域候選生成和特征重采樣等操作,使得網(wǎng)絡(luò)更易于訓(xùn)練。同時(shí),SSD網(wǎng)絡(luò)在最終預(yù)測(cè)時(shí)將來自多個(gè)層不同尺度的特征圖的預(yù)測(cè)進(jìn)行集成,在每個(gè)不同尺度的特征圖中生成一系列大小和長寬比不同的默認(rèn)檢測(cè)框,用來解決圖像中檢測(cè)目標(biāo)尺度不一的問題。綜上分析可知,本文即將SSD網(wǎng)絡(luò)應(yīng)用到乳腺腫塊病變檢測(cè)任務(wù)中,基于不同層多尺度特征來對(duì)腫塊病變進(jìn)行定位和分類,并在DDSM數(shù)據(jù)庫[8]上獲得了優(yōu)秀的檢測(cè)性能。
(a) 腫塊圖像1 (b) 腫塊圖像2
本文提出的基于多尺度特征的乳腺腫塊病變檢測(cè)方法的總體過程如圖2所示。從圖2中可以看到,乳腺鉬靶圖像先被輸入到基網(wǎng)絡(luò)中進(jìn)行特征提取,本文采用的基網(wǎng)絡(luò)為ResNet-50網(wǎng)絡(luò)(只保留最后一個(gè)卷積層之前的部分,包括最后一個(gè)卷積層);再經(jīng)過附加的數(shù)個(gè)卷積模塊進(jìn)行分析處理;選擇其中一些特征層,利用這些層的不同尺度的特征圖進(jìn)行腫塊病變目標(biāo)位置和目標(biāo)類別的預(yù)測(cè);最后將這些特征層的預(yù)測(cè)結(jié)果結(jié)合起來,經(jīng)過非極大值抑制去除冗余檢測(cè)框,得到最終的乳腺鉬靶圖像腫塊病變檢測(cè)結(jié)果。 這里將針對(duì)方法過程中的關(guān)鍵部分:附加特征層和多特征層預(yù)測(cè),可做闡釋論述如下。
在基網(wǎng)絡(luò)后添加了一些特征層,這些特征層在尺度上逐層遞減。如此一來,這種設(shè)計(jì)就能進(jìn)一步加深網(wǎng)絡(luò),得到更抽象的特征,抽象的特征能使目標(biāo)的分類更為準(zhǔn)確;同時(shí)也有助于此后在不同尺度特征圖上的目標(biāo)預(yù)測(cè)研究。不同特征層的不同尺度特征圖上的一個(gè)特征單元在原圖中對(duì)應(yīng)的感知野大小也不同,因此在不同特征層的不同尺度特征圖上進(jìn)行目標(biāo)預(yù)測(cè),可以對(duì)圖像中大小尺度不同的目標(biāo)功能實(shí)現(xiàn)較好的檢測(cè)性能。本文在基網(wǎng)絡(luò)后添加3個(gè)卷積模塊,共6個(gè)卷積層,作為附加的多尺度特征層。該研究結(jié)構(gòu)描述詳見表1。
表1 檢測(cè)網(wǎng)絡(luò)結(jié)構(gòu)
多特征層預(yù)測(cè)是SSD方法的長足優(yōu)勢(shì)所在。這里將對(duì)此給出探討分述如下。
(1)在每個(gè)特征層上的預(yù)測(cè)設(shè)計(jì)??赏ㄟ^設(shè)定默認(rèn)檢測(cè)框來實(shí)現(xiàn)。在預(yù)測(cè)時(shí),SSD將對(duì)每個(gè)默認(rèn)檢測(cè)框在圖像中所對(duì)應(yīng)的區(qū)域進(jìn)行目標(biāo)類別預(yù)測(cè)和目標(biāo)所在位置的預(yù)測(cè)。SSD針對(duì)可用于預(yù)測(cè)的特征圖中的每個(gè)特征單元(即m×n×p大小的特征圖中的一個(gè)1×1×p的特征單位),設(shè)定了多個(gè)默認(rèn)檢測(cè)框,這些默認(rèn)檢測(cè)框有不同的大小和長寬比,如圖3所示。其中,圖3(b)即以網(wǎng)絡(luò)結(jié)構(gòu)中的卷積模塊2為例,展示了默認(rèn)檢測(cè)框的具體設(shè)定情況。卷積模塊2中的特征圖大小為9×7×512,圖3 (b)為9×7大小的方格,劃分的每個(gè)方格都對(duì)應(yīng)著特征圖中的一個(gè)特征單元。
(a) 腫塊標(biāo)注圖像 (b) 默認(rèn)檢測(cè)框
設(shè)定默認(rèn)檢測(cè)框時(shí),涉及的性能參數(shù)有默認(rèn)檢測(cè)框大小和默認(rèn)檢測(cè)框長寬比,而設(shè)定默認(rèn)檢測(cè)框大小和長寬比都是為了確定該默認(rèn)檢測(cè)框在原圖像中對(duì)應(yīng)的區(qū)域范圍。其中,默認(rèn)檢測(cè)框大小指的是某一預(yù)測(cè)特征層上的默認(rèn)檢測(cè)框在原圖像中對(duì)應(yīng)的感知區(qū)域的大小,長寬比指的是該感知區(qū)域的長度與寬度的比值。默認(rèn)檢測(cè)框?qū)?yīng)到原圖像的具體映射方式將在2.1節(jié)訓(xùn)練部分予以詳述。每個(gè)特征層在預(yù)測(cè)時(shí),即對(duì)每個(gè)默認(rèn)檢測(cè)框在原圖中對(duì)應(yīng)的區(qū)域進(jìn)行目標(biāo)類別的預(yù)測(cè),并在原圖對(duì)應(yīng)區(qū)域內(nèi)進(jìn)行坐標(biāo)偏移量的回歸。
對(duì)于某一特征層m×n×p大小的特征圖,為得到腫塊目標(biāo)定位和目標(biāo)類別的預(yù)測(cè)結(jié)果,網(wǎng)絡(luò)采用大小為3×3×p的卷積核進(jìn)行卷積。如果在每個(gè)特征單元上設(shè)定k個(gè)默認(rèn)檢測(cè)框,圖像中共有c個(gè)目標(biāo)種類(包括背景區(qū)域),那么用于腫塊目標(biāo)定位預(yù)測(cè)的卷積濾波器個(gè)數(shù)為k×4,這里的4代表每個(gè)默認(rèn)檢測(cè)框預(yù)測(cè)出來的目標(biāo)位置坐標(biāo)偏移,而用于目標(biāo)類別預(yù)測(cè)的卷積濾波器個(gè)數(shù)為k×c,此處的c代表對(duì)每個(gè)默認(rèn)檢測(cè)框的類別預(yù)測(cè),預(yù)測(cè)結(jié)果是一個(gè)長度為目標(biāo)類別數(shù)的向量,向量的每個(gè)維度表示該默認(rèn)檢測(cè)框?qū)儆谠擃悇e的置信度,即每個(gè)特征單元在預(yù)測(cè)時(shí)的輸出數(shù)量將為k×(c+4)。對(duì)于m×n×p大小的特征圖,利用k×(c+4)個(gè)卷積核大小為3×3×p的卷積濾波器進(jìn)行卷積,得到(c+4)×k×m×n個(gè)輸出,如此就完成了在該特征圖上的目標(biāo)預(yù)測(cè)。
(2)多特征層檢測(cè)結(jié)果的集成設(shè)計(jì)。用于預(yù)測(cè)的特征層,可以是基網(wǎng)絡(luò)中的某些層,也可以是附加的多尺度層。對(duì)多特征層的檢測(cè)結(jié)果進(jìn)行集成,就是在訓(xùn)練時(shí)將每一層的檢測(cè)結(jié)果與ground truth(真值,專業(yè)人員標(biāo)注的腫塊病變區(qū)域)來做出比較,再將所有層與ground truth比較后的評(píng)估結(jié)果計(jì)入到損失函數(shù)中,并對(duì)該損失函數(shù)進(jìn)行最小化訓(xùn)練;測(cè)試時(shí),只要將每一預(yù)測(cè)特征層的預(yù)測(cè)結(jié)果映射到原圖像中,同時(shí)通過非極大值抑制操作對(duì)冗余檢測(cè)框進(jìn)行消除即可。這一部分將在2.1節(jié)訓(xùn)練部分和2.2節(jié)測(cè)試部分中論證呈現(xiàn)。本文選擇了res3d、res5c、卷積模塊1、卷積模塊2、卷積模塊3、全局均值池化層作為預(yù)測(cè)特征層來對(duì)腫塊目標(biāo)進(jìn)行預(yù)測(cè)。為了使得檢測(cè)網(wǎng)絡(luò)能夠達(dá)到更好、更快的收斂,基網(wǎng)絡(luò)ResNet-50先在乳腺鉬靶圖像分類任務(wù)上預(yù)訓(xùn)練了18 000次迭代。
在前文分析基礎(chǔ)上,研發(fā)推得本文訓(xùn)練時(shí)的主題研究過程可詳見如下。
2.1.1 將默認(rèn)檢測(cè)框映射到原圖中對(duì)應(yīng)的感知區(qū)域
SSD通過設(shè)定默認(rèn)檢測(cè)框大小和長寬比,來將默認(rèn)檢測(cè)框映射到原圖中對(duì)應(yīng)的感知區(qū)域。整個(gè)映射過程分為3個(gè)步驟。對(duì)此可做解析描述如下。
(1)找到默認(rèn)檢測(cè)框中心在原圖中的對(duì)應(yīng)位置。計(jì)算原圖相對(duì)于默認(rèn)檢測(cè)框所在特征層的特征圖的縮放比例r,將默認(rèn)檢測(cè)框中心在該特征圖中的坐標(biāo)乘以r,就會(huì)得到該默認(rèn)檢測(cè)框中心在原圖像中的對(duì)應(yīng)位置。
(2)計(jì)算每個(gè)預(yù)測(cè)特征層的默認(rèn)檢測(cè)框在原圖中對(duì)應(yīng)感知區(qū)域的最小尺度和最大尺度(按邊長計(jì))。被選中用于預(yù)測(cè)的特征層中的每個(gè)特征單元在原圖中對(duì)應(yīng)的感知區(qū)域大小隨著層次增加而變大。SSD為層次最低和層次最高的特征層分別設(shè)定了最小和最大的感知區(qū)域,剩余的特征層在原圖中對(duì)應(yīng)的感知區(qū)域范圍則在這最小感知區(qū)域和最大感知區(qū)域之間較為平均地順次分布。具體來說,假設(shè)這些被選中的用于預(yù)測(cè)的特征層對(duì)應(yīng)原圖的最小感知區(qū)域和最大感知區(qū)域分別為Smin和Smax,S1,S2, ......,Sk是Smin和Smax之間從小到大排列的一些值(S均代表區(qū)域邊長),那么第一個(gè)預(yù)測(cè)特征層的最小感知區(qū)域?yàn)镾min,最大感知區(qū)域?yàn)镾1,第二個(gè)預(yù)測(cè)特征層的最小感知區(qū)域?yàn)镾1,最大感知區(qū)域?yàn)镾2,…,第k個(gè)預(yù)測(cè)特征層的最小感知區(qū)域?yàn)镾k-1,最大感知區(qū)域?yàn)镾k,最后一個(gè)預(yù)測(cè)特征層的最大感知區(qū)域?yàn)镾max。
(3)根據(jù)每個(gè)預(yù)測(cè)特征層的默認(rèn)檢測(cè)框在原圖中對(duì)應(yīng)感知區(qū)域的最小尺度(記為Minsize)和最大尺度(記為Maxsize),以及默認(rèn)檢測(cè)框的長寬比ar,劃定每個(gè)默認(rèn)檢測(cè)框在原圖中的具體映射區(qū)域。每個(gè)長寬比ar對(duì)應(yīng)2個(gè)長方形默認(rèn)檢測(cè)框(如圖3 (b)所示的2個(gè)藍(lán)色矩形框),其在原圖映射區(qū)域的長和寬分別為:
(1)
除了設(shè)定的長寬比ar對(duì)應(yīng)的默認(rèn)檢測(cè)框之外,每個(gè)預(yù)測(cè)特征層的每個(gè)特征單元都有2個(gè)預(yù)先設(shè)定的正方形默認(rèn)檢測(cè)框(如圖3(b)所示的2個(gè)紅色矩形框),其在原圖映射區(qū)域的邊長分別為:
(2)
2.1.2 匹配方式研究
對(duì)于匹配方式,在將預(yù)測(cè)的檢測(cè)框和ground truth框定的腫塊病變目標(biāo)區(qū)域進(jìn)行匹配時(shí),為了保證每個(gè)ground truth區(qū)域都能獲得一個(gè)與其匹配的檢測(cè)框,首先為每個(gè)ground truth區(qū)域找到與其IoU值最大的檢測(cè)框進(jìn)行匹配。除此之外,將任意一個(gè)與ground truth區(qū)域IoU值大于某一閾值(記為匹配閾值)的區(qū)域與其進(jìn)行匹配。以該匹配方式進(jìn)行訓(xùn)練,不僅能使得最佳匹配的區(qū)域在預(yù)測(cè)時(shí)獲得較高置信度,也可以使得那些和ground truth區(qū)域匹配得較好的區(qū)域也在預(yù)測(cè)時(shí)獲得較高分,這樣與實(shí)際情況更貼合,能使得訓(xùn)練結(jié)果更符合期待。本文在訓(xùn)練時(shí),將ground truth框定的區(qū)域和檢測(cè)框的匹配閾值設(shè)為0.2,而在自然圖像中,這個(gè)值一般為0.5、甚至是更高。這主要是以下2點(diǎn)原因造成的:一是由于乳腺鉬靶圖像上往往只有一個(gè)腫塊目標(biāo),有2個(gè)或是2個(gè)以上腫塊目標(biāo)的情況特別少,將匹配閾值調(diào)低可以使得訓(xùn)練時(shí)能匹配到更多的正樣本,否則正負(fù)樣本類別不平衡程度會(huì)過于嚴(yán)重,以至于難以訓(xùn)練得到好的檢測(cè)結(jié)果。二是因?yàn)橄啾扔谧匀粓D像中的例如貓或者狗這樣的目標(biāo),腫塊病變的邊緣非常不清晰、不明確[9],在檢測(cè)時(shí)對(duì)腫塊病變進(jìn)行準(zhǔn)確定位的難度更大,因此需要對(duì)其降低匹配標(biāo)準(zhǔn)。
2.1.3 損失計(jì)算
乳腺腫塊病變檢測(cè)任務(wù)包含了2個(gè)子任務(wù):腫塊檢測(cè)和腫塊分類。因此在衡量計(jì)算損失時(shí),也由2部分組成,分別是:定位損失和分類損失[7]。研究推得的計(jì)算損失的數(shù)學(xué)運(yùn)算公式可表示為:
(3)
在計(jì)算損失中,定位損失采用了平滑L1損失,并且(cx,cy,w,h)表示位置信息,(cx,cy)表示區(qū)域的中心坐標(biāo),w,h分別表示區(qū)域的寬和高[7]。定位損失的數(shù)學(xué)運(yùn)算公式可見如下:
(4)
(5)
(6)
(7)
(8)
分類損失采用了softmax損失[7],其運(yùn)算公式的數(shù)學(xué)表述如下:
(9)
(10)
2.1.4 訓(xùn)練過程中的優(yōu)化研究
針對(duì)訓(xùn)練過程中得到的樣本正負(fù)類別不平衡的問題,本文還采取了與文獻(xiàn)[7]中相同的措施。在訓(xùn)練匹配階段,往往匹配到的正樣本的數(shù)量非常少。為了防止正、負(fù)樣本發(fā)生傾斜,訓(xùn)練時(shí)并不將所有的負(fù)樣本都納入訓(xùn)練樣本,而是從中隨機(jī)挑選出一部分,使得正、負(fù)樣本的比例為1:3。這種將正、負(fù)樣本比維持在合理范圍內(nèi)進(jìn)行訓(xùn)練的做法,能夠使得網(wǎng)絡(luò)得到更好、更快的收斂。
為了訓(xùn)練得到更魯棒的模型,在訓(xùn)練過程中,本文采用與SSD[7]相同的重采樣數(shù)據(jù)增廣。對(duì)于輸入的乳腺鉬靶圖像,重新采樣與腫塊病變區(qū)域IoU值為0.1、0.3、0.5、0.7和0.9的區(qū)域,放縮到輸入圖像相同大小,作為新的輸入數(shù)據(jù)進(jìn)行訓(xùn)練。如果ground truth中心區(qū)域落在采樣區(qū)域內(nèi),那么就將采樣區(qū)域與ground truth交疊的部分作為該采樣區(qū)域的ground truth,否則就認(rèn)為該采樣區(qū)域內(nèi)不包含腫塊病變。
利用訓(xùn)練過的SSD網(wǎng)絡(luò)模型對(duì)新的乳腺鉬靶圖像樣本進(jìn)行測(cè)試,模型在每一個(gè)預(yù)測(cè)特征層進(jìn)行目標(biāo)預(yù)測(cè),即對(duì)每個(gè)默認(rèn)檢測(cè)框進(jìn)行目標(biāo)位置偏移和目標(biāo)類別置信度的預(yù)測(cè)。當(dāng)目標(biāo)類別置信度大于設(shè)定的置信度閾值時(shí),該默認(rèn)檢測(cè)框的預(yù)測(cè)結(jié)果將會(huì)保留下來。這些被保留下來的檢測(cè)框可能會(huì)有冗余,如圖4所示,因此需要引入非極大值抑制(Non-maximum Suppression, NMS)處理對(duì)冗余檢測(cè)框進(jìn)行抑制,使得對(duì)每個(gè)目標(biāo)的檢測(cè)盡量只保留一個(gè)最優(yōu)框。
圖4 冗余檢測(cè)框
非極大值抑制的做法大致如下:將所有被預(yù)測(cè)為同一類別的檢測(cè)框按置信度高低進(jìn)行排序,選出置信度最高的檢測(cè)框。再遍歷剩余該類別的檢測(cè)框,若和選中的置信度最高的檢測(cè)框的IoU值大于某一閾值(記為NMS閾值),則該檢測(cè)框就被舍去。從未處理的檢測(cè)框中再選出置信度最高的,重復(fù)上述過程。最后被保留下來的檢測(cè)框?qū)⒃谧罱K的檢測(cè)結(jié)果中呈現(xiàn)。本文將NMS閾值設(shè)定為0.1。因?yàn)橄啾扔谧匀粓D像,在乳腺鉬靶圖像中,發(fā)生冗余樣本框重疊的情況要少得多。
本文在DDSM數(shù)據(jù)庫上對(duì)提出的基于多尺度特征的乳腺腫塊病變檢測(cè)方法進(jìn)行性能評(píng)估,驗(yàn)證其有效性。實(shí)驗(yàn)環(huán)境為Intel? CoreTMi7-4790k CPU和NVIDIA Tesla K40c GPU。對(duì)DDSM數(shù)據(jù)庫中的乳腺鉬靶圖像進(jìn)行整理,挑選出包含腫塊的圖像用于乳腺腫塊病變檢測(cè)方法的性能評(píng)估,其中有良性腫塊圖像1 106張,惡性腫塊圖像1 160張。將乳腺鉬靶圖像放縮至1 152×896大小。若將圖像放縮得過大,在實(shí)驗(yàn)時(shí)將會(huì)超出內(nèi)存限制;若將圖像放縮得過小,那么腫塊區(qū)域?qū)?huì)變得過小,甚至是消失。本文實(shí)驗(yàn)中,對(duì)整理出的DDSM數(shù)據(jù)庫中的乳腺鉬靶圖像進(jìn)行90°、180°、270°旋轉(zhuǎn),作為數(shù)據(jù)增廣。
在本文中,采用FROC(the Free Response Operating Characteristic Curve)曲線作為乳腺腫塊病變檢測(cè)的評(píng)測(cè)指標(biāo)。FROC曲線是以平均每幅圖像的假陽性區(qū)域個(gè)數(shù)(False Positives per Image,FPI)為橫坐標(biāo),敏感度(Sensitivity)為縱坐標(biāo)的曲線。其中,假陽性區(qū)域?yàn)闄z測(cè)出是病變、但實(shí)際是正常的區(qū)域。FPI被定義為:
(11)
敏感度,即檢測(cè)出的病變區(qū)域個(gè)數(shù)占數(shù)據(jù)集中實(shí)際病變區(qū)域個(gè)數(shù)的比例,Sensitivity被定義為:
(12)
為驗(yàn)證本文提出的基于多尺度特征的乳腺腫塊病變檢測(cè)方法的有效性,本文在DDSM數(shù)據(jù)庫上構(gòu)建實(shí)驗(yàn),并與目前在DDSM數(shù)據(jù)庫上性能較優(yōu)的乳腺腫塊病變檢測(cè)方法的性能進(jìn)行比較。
本文方法在DDSM數(shù)據(jù)庫上進(jìn)行腫塊病變檢測(cè)的FROC曲線如圖5所示。從圖5中可以看到在平均每幅圖像的假陽性區(qū)域個(gè)數(shù)為一定時(shí),本文提出的乳腺腫塊區(qū)域檢測(cè)方法分別對(duì)良性腫塊和惡性腫塊處理后得到的檢測(cè)敏感度。部分檢測(cè)結(jié)果的展示如圖6所示。圖像中的藍(lán)色矩形框區(qū)域是ground truth區(qū)域,紅色矩形框是本文方法檢測(cè)出來的top3的腫塊病變區(qū)域??梢钥闯龃蟛糠诸A(yù)測(cè)矩形框的中心都能與ground truth中心較好地重合,但在大小上仍有出入。檢測(cè)錯(cuò)誤的矩形框大多處于乳腺區(qū)域邊緣(如圖6(b), 6 (c)所示),這是因?yàn)槿橄賲^(qū)域邊緣和腫塊邊緣有類似性質(zhì),邊緣兩側(cè)的區(qū)域有較大的對(duì)比度,這將需要在此后的研究中再繼續(xù)加以改進(jìn)。
圖5 本文方法的FROC曲線
考慮到一些方法只有針對(duì)惡性腫塊進(jìn)行檢測(cè)的檢測(cè)結(jié)果,因此僅在對(duì)惡性腫塊的檢測(cè)上與其它方法進(jìn)行比較。比較的結(jié)果可見表2。由表2可知,分別比較了在敏感度(Sensitivity)為0.70、 0.75、 0.80、 0.88、 0.92時(shí),平均每幅圖像假陽性區(qū)域個(gè)數(shù)(FPI)的大小。在Sensitivity相同的情況下,F(xiàn)PI越小意味著檢測(cè)器的性能越好。結(jié)果表明,本文提出的方法的檢測(cè)性能要遠(yuǎn)遠(yuǎn)勝過目前在DDSM數(shù)據(jù)庫上取得較好結(jié)果的數(shù)個(gè)方法,這就驗(yàn)證了SSD網(wǎng)絡(luò)這種基于多尺度特征的方法應(yīng)用于乳腺腫塊檢測(cè)任務(wù)上的有效性。
(a) 檢測(cè)結(jié)果1 (b) 檢測(cè)結(jié)果2
(c) 檢測(cè)結(jié)果3 (d) 檢測(cè)結(jié)果4
SensitivityFPIDhungel等人[10]Eltonsy等人[11]Sampat等人[12]本文方法0.704.00--0.680.754.80--0.860.80--1.000.920.85--1.501.050.88-2.402.701.440.92-5.40-1.92
本文將在自然圖像檢測(cè)領(lǐng)域性能較佳的SSD網(wǎng)絡(luò)應(yīng)用到乳腺腫塊病變檢測(cè)任務(wù)中,提出了基于多尺度特征的乳腺腫塊病變檢測(cè)方法,該方法在不同層次不同尺度的特征層上對(duì)腫塊目標(biāo)進(jìn)行檢測(cè)。不同層次不同尺度的特征層中的每個(gè)神經(jīng)單元在原圖像中所對(duì)應(yīng)的感知區(qū)域大小不同,因此每個(gè)特征層對(duì)某一尺度級(jí)別的目標(biāo)的檢測(cè)性能相對(duì)于其它尺度級(jí)別更好。對(duì)不同層次不同尺度特征層的預(yù)測(cè)結(jié)果進(jìn)行結(jié)合,可使得模型對(duì)尺度不一的目標(biāo)都有較好的檢測(cè)結(jié)果。本文在DDSM數(shù)據(jù)庫上展開實(shí)驗(yàn)驗(yàn)證,結(jié)果表明基于多尺度特征的乳腺腫塊病變檢測(cè)方法的性能要優(yōu)于目前在DDSM數(shù)據(jù)庫上性能較佳的一些腫塊檢測(cè)方法,證實(shí)了本文方法的有效性。