史水娥, 李 鑫, 胥帥帥, 伍 博
(1.河南師范大學(xué) 電子與電氣工程學(xué)院,河南 新鄉(xiāng) 453007;2.河南省電磁波工程院士工作站,河南 新鄉(xiāng) 453007)
白細(xì)胞通常被稱為免疫細(xì)胞,在人體免疫系統(tǒng)中起著重要作用,許多研究人員在血細(xì)胞檢測(cè)領(lǐng)域進(jìn)行了大量的工作。文獻(xiàn)[1]結(jié)合距離變換和邊緣梯度的信息,靈活提取代表目標(biāo)的前景標(biāo)記和代表背景及干擾的背景標(biāo)記,通過(guò)分水嶺變換實(shí)現(xiàn)細(xì)胞分割。文獻(xiàn)[2]針對(duì)顯微圖像中細(xì)胞的形狀特征,提出基于支持向量機(jī)和橢圓擬合的細(xì)胞圖像自動(dòng)分割。文獻(xiàn)[3]通過(guò)改進(jìn)的分?jǐn)?shù)階微分對(duì)細(xì)胞圖像進(jìn)行預(yù)處理,用分水嶺算法初分割,通過(guò)改進(jìn)的圖論對(duì)圖像再分割。文獻(xiàn)[4]采用多特征均值聚類算法和粘連分離模型分割圖像。盡管以上方法對(duì)紅細(xì)胞、淋巴細(xì)胞和單核細(xì)胞的分割效果較好,但當(dāng)細(xì)胞核不規(guī)則時(shí),效果并不理想。
為了有效檢測(cè)出不同形態(tài)白細(xì)胞的外輪廓信息,先使用K-means++聚類分割彩色血細(xì)胞圖像,可以有效去除背景中的血小板和紅細(xì)胞,得到的白細(xì)胞輪廓可以近似為橢圓,因此可以應(yīng)用橢圓檢測(cè)技術(shù)來(lái)識(shí)別這樣的元素。文獻(xiàn)[5]利用邊緣曲率和凸度來(lái)確定邊緣輪廓是否可以組合在一起,并進(jìn)行二維Hough變換來(lái)獲得橢圓參數(shù)。文獻(xiàn)[6]根據(jù)橢圓弦與其中心的關(guān)系選擇候選圓弧,并通過(guò)分解后的參數(shù)空間進(jìn)行參數(shù)估計(jì)。文獻(xiàn)[7]對(duì)Fornaciari方法進(jìn)行了改進(jìn),利用一個(gè)射影不變量來(lái)剪除不需要的候選對(duì)象。以上方法對(duì)規(guī)則的橢圓輪廓檢測(cè)效果較好,而對(duì)于近似橢圓的白細(xì)胞輪廓常有誤檢。
本文提出基于邊緣分類的橢圓檢測(cè)用于處理K-means++預(yù)處理過(guò)的血細(xì)胞圖像,以獲得不同形態(tài)的白細(xì)胞外輪廓信息。
K-means[8]聚類原理:以空間中k個(gè)點(diǎn)為中心聚類,對(duì)最靠近它們的對(duì)象歸類,類別數(shù)為k。不斷迭代,逐次更新各聚類中心值,直至得到最好的聚類結(jié)果。最終的k個(gè)聚類本身盡可能緊湊,各個(gè)聚類之間盡可能分開。該算法基于歐氏距離劃分,優(yōu)化目標(biāo)函數(shù)誤差平方和(sum of squares for error,SSE)為樣本點(diǎn)到所屬聚類中心的距離平方和,優(yōu)化目標(biāo)函數(shù)表達(dá)式為
(1)
式中xij為第i類第j個(gè)樣本點(diǎn);Ni為第i類的樣本個(gè)數(shù);ci為第i類的聚類中心;k為聚類數(shù)目。當(dāng)SSE最小時(shí),迭代結(jié)束。
K-means算法簡(jiǎn)潔快速,但隨機(jī)選取的初始聚類中心點(diǎn)位置距離越近,效果越差。K-means++[9]針對(duì)這一問(wèn)題做出改進(jìn),可以直觀地將這一改進(jìn)理解成K個(gè)初始聚類中心相互之間應(yīng)該分得越開越好。
白細(xì)胞圖片中每個(gè)像素點(diǎn)對(duì)應(yīng)的坐標(biāo)為(x,y,r,g,b),其中,(x,y)為位置信息,(r,g,b)為色彩信息。K-means++算法通過(guò)對(duì)每個(gè)像素點(diǎn)色彩信息RGB三個(gè)維度聚類,以實(shí)現(xiàn)相同顏色的像素在一簇,就可以將圖像分割,進(jìn)一步進(jìn)行橢圓檢測(cè)。
針對(duì)不規(guī)則的細(xì)胞邊緣的邊緣分類的橢圓檢測(cè)主要由4步組成:圓弧提取、弧線分組、橢圓聚類、參數(shù)估計(jì)。
首先,使用具有自動(dòng)閾值的Canny邊緣檢測(cè)器[10]檢測(cè)邊緣,根據(jù)梯度將邊緣分為四類。然后,利用尺寸約束去除無(wú)效邊緣。
1)邊緣分類:給定Canny邊緣檢測(cè)器獲得的邊緣點(diǎn)ei=(xi,yi,dxi,dyi),其中(xi,yi)是位置坐標(biāo),(dxi,dyi)分別是X和Y方向上的Sobel微分,該點(diǎn)的斜率tanφi由下式獲得
(2)
式中φi為該點(diǎn)的切線與水平軸正方向之間的角度。如果tanφi恰好等于零,則丟棄像素。將W+定義為具有正邊緣點(diǎn)的集合,將W-定義為其余邊緣點(diǎn)的集合。通過(guò)將每個(gè)邊緣點(diǎn)與同一集合中8個(gè)鄰域中的其他點(diǎn)鏈接在一起,形成一個(gè)弧。
根據(jù)弧中點(diǎn)M斜率tanφM的正負(fù)以及左端斜率值tanφl(shuí)和右端斜率值tanφr的大小關(guān)系將圓弧α分為4個(gè)類別,如表1所示。
表1 圓弧分類
2)大小限制:分類后,用αc表示需要去除的僅有少量像素的弧與具有大量共線點(diǎn)的弧,因?yàn)樗鼈儠?huì)導(dǎo)致錯(cuò)誤的檢測(cè)。圓弧中像素點(diǎn)數(shù)小于定義的閾值(Nk 在邊緣分類和無(wú)效邊緣刪除之后,將屬于同一個(gè)橢圓的弧進(jìn)行分組,為弧分組定義位置約束和切線約束。對(duì)每個(gè)弧組,使用最小二乘擬合用于估計(jì)橢圓參數(shù)。 1)位置約束:相對(duì)位置關(guān)系確?;〗M里形成橢圓的4個(gè)弧分別來(lái)自4個(gè)不同的類別(αⅠ,αⅡ,αⅢ,αⅣ)。定義有效標(biāo)記η,當(dāng)η=1時(shí),表明位置有效;當(dāng)η=0時(shí),表明位置無(wú)效,見表2。 表2 位置有效性分類 其中,LⅠ·x表示αⅠ的最左端像素的x坐標(biāo),RⅠ·y表示αⅠ的最右端像素的y坐標(biāo)。其余弧的標(biāo)記類似。根據(jù)實(shí)驗(yàn),Thp的值設(shè)置為2。 2)切線約束:在橢圓的外切四邊形中,兩條對(duì)角線和對(duì)邊的兩條切線弦相交一個(gè)點(diǎn)。本文將這一幾何關(guān)系稱為切線約束。如圖1(a)所示,理想情況4條虛線應(yīng)在同一點(diǎn)相交。然而圖像總有噪聲,所以,4條虛線不會(huì)正好相交于一點(diǎn),如圖1(b)所示。將C1表示為P1P3和P2P4的交點(diǎn),將C2表示為MiMk和MjMm的交點(diǎn)。由C1和C2的坐標(biāo)計(jì)算出C1和C2間的歐氏距離d(C1,C2)<閾值Thd時(shí),認(rèn)為4個(gè)圓弧滿足切線約束。 圖1 切線約束示意 滿足上述條件的圓弧,仍然可能存在錯(cuò)誤擬合的橢圓。由于外部特征影響,一個(gè)橢圓可能被分成兩個(gè)弧,導(dǎo)致提取出兩個(gè)橢圓。因此,需要對(duì)同一橢圓的多個(gè)檢測(cè)進(jìn)行聚類。 橢圓聚類:給定兩個(gè)橢圓,定義(Δdx,Δdy),Δda,Δdb和Δdθ分別為兩個(gè)橢圓中心、長(zhǎng)半軸、短半軸和旋轉(zhuǎn)角對(duì)應(yīng)的距離。然后,相似度指數(shù)D如下 D={(Δdx<0.1)&(Δdy<0.1)&(Δda<0.1)& (Δdb<0.1)&(Δdθ<0.1)} (3) 其中,D=1意味著有相似的橢圓需要聚類。得分最高的橢圓被認(rèn)為是給定聚類的中心。 對(duì)于滿足聚類后的圓弧組,使用改進(jìn)的最小二乘法擬合方法[11]估計(jì)橢圓參數(shù)。該方法能充分利用邊緣點(diǎn)對(duì)橢圓進(jìn)行擬合,與實(shí)際目標(biāo)吻合更優(yōu)。估計(jì)橢圓參數(shù)包括中心點(diǎn)C的坐標(biāo)(x,y),長(zhǎng)半軸a,短半軸b,旋轉(zhuǎn)角度θ和橢圓面積s。 進(jìn)行多個(gè)實(shí)驗(yàn)驗(yàn)證本文檢測(cè)算法的合理性,所有實(shí)驗(yàn)都是在具有Intel?CoreTMi5—8250U CPU @ 1.8 GHz,4 GB RAM的64位計(jì)算機(jī)上進(jìn)行的,操作系統(tǒng)Windows 10,編譯軟件為MATLAB 2018a。 實(shí)驗(yàn)使用經(jīng)典的BCCD數(shù)據(jù)集,其包括364張分辨率為640像素×480像素的8類不同形態(tài)的白細(xì)胞圖像。這里將K-means++算法與先進(jìn)的FRFCM(significantly fast and robust fuzzy C-means clustering)[12]和SFFCM(superpixel-based fast fuzzy C-means clustering)[13]進(jìn)行分割對(duì)比。 圖2(a)~(d)分別為淋巴細(xì)胞、單核細(xì)胞、中性桿狀核粒細(xì)胞和嗜堿性粒細(xì)胞。由于嗜酸性粒細(xì)胞與嗜堿性粒細(xì)胞分割效果相似,故不再列舉。與SFFCM和K-means++算法類似的是,F(xiàn)RFCM分割出了淋巴細(xì)胞與單核細(xì)胞的外輪廓,而對(duì)中性桿狀核粒細(xì)胞僅僅分割出了桿狀細(xì)胞核,對(duì)嗜堿性粒細(xì)胞外輪廓的分割效果也遠(yuǎn)不如SFFCM和K-means++算法,最重要的是,背景中大量的紅細(xì)胞與血小板分割了出來(lái),這些輪廓不利于下一步的橢圓檢測(cè)。SFFCM雖然對(duì)中性桿狀核粒細(xì)胞和嗜堿性粒細(xì)胞的外輪廓分割效果優(yōu)于FRFCM,但是背景中紅細(xì)胞與血小板的分割效果與FRFCM相似,同樣不利于橢圓檢測(cè)。K-means++方法對(duì)4種白細(xì)胞的胞外輪廓的分割效果明顯優(yōu)于FRFCM和SFFCM,使其最接近橢圓狀。另外,抹除了背景中大量的紅細(xì)胞與血小板,去除了其對(duì)橢圓檢測(cè)的干擾。 圖2 4種白細(xì)胞分割結(jié)果 圖3表示的是不同分葉數(shù)的中性分葉核粒細(xì)胞,其中,n=2,3,4,5表示分葉的數(shù)目,由于分葉的不規(guī)則,使其分割難度大大增加。可以看出的是,與圖2情況類似,F(xiàn)RFCM和SFFCM并不能有效去除背景中的紅細(xì)胞與血小板,對(duì)檢測(cè)目標(biāo)只分割出了顏色深的不規(guī)則的分葉細(xì)胞核部分,不利于下一步的橢圓檢測(cè)。K-means++方法不僅可以抹除背景,而且可以提取出橢圓狀的整體細(xì)胞,為橢圓檢測(cè)創(chuàng)造了條件。 圖3 中性分葉核粒細(xì)胞分割 為了評(píng)價(jià)基于邊緣分類的橢圓檢測(cè)方法的性能,實(shí)驗(yàn)中采用了經(jīng)典的評(píng)估指標(biāo),分別是準(zhǔn)確率P、召回率R和F值,其定義如下 (4) (5) (6) 式中Ψ為檢測(cè)出來(lái)正確的橢圓的個(gè)數(shù),Ω為檢測(cè)出來(lái)的橢圓的個(gè)數(shù),Γ為圖像中真實(shí)存在的橢圓的個(gè)數(shù)。 將邊緣分類橢圓檢測(cè)算法與Fornaciari的方法和Jia的方法進(jìn)行參數(shù)比較, 采用的是經(jīng)典的Prasad數(shù)據(jù)集,包含198張低分辨率的具有多個(gè)小橢圓的圖像,每幅圖像平均有5.91個(gè)橢圓,約52.02 %的圖像尺寸小于300×300。如圖4(a)所示,對(duì)于任意的檢測(cè)橢圓數(shù)目N本方法都有最高的F值。由圖4(a),(b)可知在檢測(cè)橢圓數(shù)目N=3時(shí)其綜合性能指標(biāo)F值與準(zhǔn)確率P均高達(dá)0.85。在圖4(c)中顯示召回率R基本上介于另外兩種方法之間,它們都隨著橢圓數(shù)目N的增加而緩慢降低。 圖4 3種方法的參數(shù)比較 接著展示了對(duì)上述8類不同形態(tài)白細(xì)胞分割圖片的檢測(cè)效果。圖5中為3種橢圓檢測(cè)算法的效果對(duì)比。第3行Fornaciari的方法僅檢測(cè)出了單核細(xì)胞,中性桿狀核粒細(xì)胞和嗜堿性粒細(xì)胞3種白細(xì)胞圖片,而對(duì)淋巴細(xì)胞和4種中性分葉核粒細(xì)胞都出現(xiàn)了錯(cuò)誤檢測(cè)或者重復(fù)檢測(cè)。第4行Jia的方法僅對(duì)分葉數(shù)n=2和n=5的中性分葉核粒細(xì)胞有效,而對(duì)于其他6種白細(xì)胞圖片同樣出現(xiàn)了不同程度的錯(cuò)誤檢測(cè)或者重復(fù)檢測(cè)。相較而言,本方法不僅成功檢測(cè)出8類血細(xì)胞圖片中的白細(xì)胞的輪廓信息,而且檢測(cè)效果也是最優(yōu)的,沒有誤檢或者復(fù)檢。得到的8類白細(xì)胞的參數(shù)信息如表3所示。 圖5 3種方法的檢測(cè)效果 表3 8種不同形態(tài)白細(xì)胞的參數(shù)信息 針對(duì)不同形態(tài)的白細(xì)胞大小和位置信息難以確定的問(wèn)題,本文使用K-means++算法分割預(yù)處理白細(xì)胞圖像,進(jìn)一步使用邊緣分類的橢圓檢測(cè)方法去獲得白細(xì)胞近似外輪廓信息。通過(guò)不同實(shí)驗(yàn)的分割效果對(duì)比,可以看出:K-means++有效地消除了背景中紅細(xì)胞與血小板的干擾,為橢圓檢測(cè)創(chuàng)造了先決條件。在檢測(cè)方面,邊緣分類的橢圓檢測(cè)算法的F值最優(yōu),在檢測(cè)橢圓數(shù)目N=3時(shí)其F值與準(zhǔn)確率P均高達(dá)0.85。在效果上成功檢測(cè)到準(zhǔn)確的全部8類不同形態(tài)的白細(xì)胞的大小和位置信息。目前該方法還沒有在醫(yī)學(xué)圖像處理中得到應(yīng)用,有一定的研究?jī)r(jià)值。2.2 弧線分組
2.3 橢圓聚類
2.4 參數(shù)估計(jì)
3 實(shí)驗(yàn)與結(jié)果
3.1 K-means++分割結(jié)果
3.2 橢圓檢測(cè)結(jié)果
4 結(jié) 論