肖月,李朋偉
(太原理工大學信息與計算機學院,晉中 030600)
細胞分割是細胞分析處理技術的重要環(huán)節(jié)之一,如何獲取更加準確和完整的分割結果顯得尤為重要。近年來,研究人員提出了許多有效的分割算法,關濤等[1]采用形態(tài)學濾波與自適應直方圖均衡增強圖像,然后在圖像內容與直方圖分布關系的基礎上,利用經(jīng)驗因子加權Otsu尋找自適應閾值的宮頸細胞分割方法;夏海英等[2]提出了一種改進的簡單線性迭代聚類(simple linear iterative clustering, SLIC)分割算法,利用SLIC算法得到超像素區(qū)域并與原圖像融合后進行標記,再由最大相似準則合并區(qū)域獲取宮頸細胞分割結果;林麗群等[3]利用形態(tài)學去噪與分數(shù)階微分對圖像進行預處理增強,采用分水嶺算法與最小生成樹算法結合的融合算法對粘連血細胞圖像進行分割。然而,閾值分割只考慮圖像的灰度信息,且對噪聲敏感,容易造成分割結果不均勻;區(qū)域分割算法適應性低,單獨使用效果差;圖論分割算法復雜、計算量大,不易操作。因此,目前尚無一種通用的細胞分割算法能使細胞圖像達到完美的分割效果。
Vincent和Soille在1991年首次提出了基于淹沒的分水嶺分割算法[4],該算法結構簡單、抗噪聲能力強,并且可以得到連續(xù)封閉且位置準確的目標輪廓,適用于細胞圖像的分割。但傳統(tǒng)分水嶺算法易受噪聲影響出現(xiàn)過分割現(xiàn)象,因此,研究人員提出了許多改進的分水嶺算法。朱逸婷[5]將標記的分水嶺法與局部信息模糊C均值聚類算法(fuzzy local information c-means, FLICM)結合在一起,通過聚類算法進行區(qū)域合并來改善過分割現(xiàn)象。孟少波等[6]利用小波分解變換對形態(tài)學梯度圖進行分解去噪,并通過閾值處理重構二維小波,經(jīng)小波二次分解去噪后的分水嶺變換極大地減少了過分割的現(xiàn)象。郭小梅等[7]利用分水嶺方法將圖像分割成許多區(qū)域一致的像素塊(超像素),基于超像素重新構建原圖像后再作標記,減少了算法過程中的待處理信息量,提高了運算速度及圖像分割效率。
針對以上問題,我們提出了一種基于Canny算子梯度修正的優(yōu)化分水嶺算法,并用于細胞圖像的分割。首先對圖像HSV顏色空間的各個通道分量利用Canny算子提取梯度,然后利用圖像信息熵確定各個分量在原始梯度中的權值,通過加權擬合形成最終的梯度圖像;對加權梯度圖進行基于開閉的濾波重建操作以平滑梯度圖像中的偽極小值,之后區(qū)域化梯度圖像,通過設定閾值對各個區(qū)域分別提取梯度極小值聯(lián)合構成前景標記圖,再由前景圖像獲取背景分割脊線并記為背景標記;最后利用強制極小值標記技術對重建梯度圖和前景、背景標記圖對梯度進行修正,將修正后的梯度圖用作分水嶺算法求出最終分割結果。
傳統(tǒng)分水嶺算法的操作對象并不是圖像本身,而是針對圖像梯度進行處理。算法基于拓撲學原理,將圖像梯度視作地貌高度,通過模擬降水(或淹沒)過程使每個局部的最低點處匯集成一個集水盆地,當兩個鄰近的集水區(qū)要匯合時,在匯合處筑造堤壩,全局建成的堤壩即為分水嶺。分水嶺算法依據(jù)圖像的梯度變化將圖像迅速地區(qū)域化,為分析提取圖像的局部特征提供更多可能。該算法對圖像的微弱邊緣響應靈敏,可以得到單一、封閉且強連續(xù)性的圖像邊緣,因此,適合細胞圖像的分割提取[8]。
由于分水嶺算法靈敏度高、響應性好,其對圖像噪聲以及圖像的不規(guī)則變換也異常敏感,具體表現(xiàn)為圖像灰度細節(jié)的微弱變化或是噪聲均能使圖像的局部極小值增加,造成分割后的區(qū)域過多而產生過分割現(xiàn)象;噪聲會直接影響圖像梯度,對含噪聲的梯度圖像直接分割會造成圖像輪廓偏移或混疊。這些均給圖像的分析帶來困擾,因此,如何獲取表達圖像信息完整且不含噪聲的梯度圖像,是優(yōu)化分水嶺算法的一個重要解決方案。
本研究算法流程見圖1。
圖1 改進分水嶺算法的流程圖
Canny算子是目前應用最多的邊緣檢測算子,具有良好的抗噪性能,同時又能保證邊緣檢測的完整性[9-10]。Canny算子是針對灰度圖像的邊緣檢測設計的,而彩色圖像直接轉為灰度圖像時,會導致部分顏色特征丟失,使檢測結果出現(xiàn)邊緣斷接或虛假連接。故本研究算法選擇在圖像的HSV顏色空間上進行梯度提取,該顏色模型由色調(H)、飽和度(S)、明度(V)三個通道組成,各個分量之間關聯(lián)性較弱,互不影響。所以HSV顏色模型的抗干擾能力強,在對圖像邊緣進行檢測時穩(wěn)定性較高。
算法中利用Canny算子對HSV空間的三個顏色分量分別提取梯度gH(x,y)、gS(x,y)、gV(x,y),之后由三個顏色分量所含信息熵的比值確定各分量梯度的權值,然后通過加權擬合形成最終的梯度圖,見圖2。具體操作過程如下:
(1)提取H、S、V各通道分量的梯度:由Canny算子對fH(x,y)、fS(x,y)、fV(x,y)三個通道分量的圖像提取梯度,主要分圖像平滑、梯度幅值計算、非極大值抑制和邊緣連接四個步驟進行,得到各顏色通道的梯度圖像gH(x,y)、gS(x,y)、gV(x,y);
(2)計算各分量梯度圖的權值:圖像信息熵是圖像特征的集中反映,表示圖中平均信息量的數(shù)量,根據(jù)不同顏色通道的圖像特征不同,利用信息熵作為量化三個分量圖像攜帶信息量的參數(shù),以確定各通道分量的權重。圖像二維熵不僅可以反應一維灰度信息分布的聚集特征,還可以聯(lián)合像素鄰域灰度均值構成二元序列組表達灰度特征的空間分布關系。假設圖像像素的灰度值表示為i,取其鄰域像素的灰度均值記為j(鄰域范圍由圖像大小決定),共同構成二維灰度特征的元組序列(i,j),其中,0≤i≤255,0≤j≤255,l(i,j)表示該灰度元組出現(xiàn)的頻次,其出現(xiàn)的概率為(圖像尺寸為m×n):
(1)
統(tǒng)計圖像所有灰度級出現(xiàn)的概率,則圖像的信息熵I(x,y)可以表示為:
(2)
由此可得H、S、V三個顏色分量的圖像熵值分別為IH(x,y)、IS(x,y)、IV(x,y)。
g(x,y)=εHgH(x,y)+εSgS(x,y)+εVgV(x,y)
(3)
通過加權合成的梯度圖像,既可以準確定位圖像輪廓,又可以最大限度地保留各分量的邊界信息。
圖2 梯度圖像
分水嶺算法直接處理梯度圖像時,會因噪聲或梯度邊緣過厚引起的輪廓定位誤差而導致過分割現(xiàn)象,因此,需要對梯度圖像進行形態(tài)學濾波重建[11-12]。
(4)
反復迭代該過程k次至穩(wěn)定狀態(tài),得到F關于G的測地膨脹的形態(tài)學重構表達式為:
(5)
測地腐蝕與測地膨脹互為對偶運算,在此不作介紹。本研究算法首先將梯度圖g作為掩膜,腐蝕梯度圖作為標記,然后基于開操作實現(xiàn)圖像重構:
ho={(gΘse)⊕se}∩g
(6)
之后再對開重建圖像進行膨脹,并將其補集作為閉重建過程中的標記圖像,同時取開重建圖像的補集作為模板圖像進行重構,得到基于閉操作的重構圖像:
hoc={~(ho⊕se)⊕se}∩(~ho)
(7)
由上述可知,形態(tài)學重建結果的好壞與結構元素的選取密切相關。結構元素[13]是提取分析圖像特征的“信息元探針”,其形狀、大小直接影響圖像特征量化的結果。一般選擇與目標特征輪廓相似、大小相近的結構元形狀,以最大程度地減少圖像信息的丟失,較好地恢復圖像目標的細節(jié)邊緣。因此,結構元素的選擇必須結合圖像自身以及實驗中的具體情況分析確定[14]。
形態(tài)學重建簡化了梯度圖像,減弱了梯度對于圖像邊緣方向性的依賴,保留了圖像的重要輪廓信息,同時梯度圖像中由噪聲和非規(guī)則細節(jié)引起的偽極小值也被剔除,從根源上消除了產生過分割現(xiàn)象的可能。
為了獲取感興趣的目標區(qū)域,需要用標記圖像對梯度圖像進行修正,使圖像只在特定的位置產生區(qū)域極小值[15]。因此,本研究提出了一種新的獲取標記圖像的方法,通過將梯度圖像區(qū)域化來尋找局部區(qū)域中的梯度極小值以構成前景標記圖像。根據(jù)經(jīng)驗,在圖像內部的相鄰像素間灰度值變化較小,梯度值小,而位于圖像邊緣的相鄰像素間的灰度值變化劇烈,對應的梯度值大。所以,通過像素灰度值的分布情況將圖像劃分成若干個獨立區(qū)域,然后對每個區(qū)域進行局部極小值梯度標記,即可實現(xiàn)對圖像內部像素的充分標記。具體方法為:
(1)先將灰度圖像f平分為m個區(qū)域(區(qū)域大小視圖像尺寸而定,應盡量小),計算每個區(qū)域像素灰度值的方差,然后與圖像整體的灰度方差值(定義為閾值)進行比較,當灰度方差大于該閾值,表示該區(qū)域包含的主要為邊緣像素點;灰度方差小于閾值,則表示包含的多為圖像內部像素點,然后將所有小于方差閾值的區(qū)域記為M1,M2,...,Mr(r (2)將灰度圖中r個區(qū)域的位置關系映射到梯度圖像(f→g),在梯度圖像g中統(tǒng)計r個區(qū)域內圖像梯度等級Xn的分布情況,并將區(qū)域內的梯度均值作為標記閾值Xs。 (3)比較M1區(qū)域中的各級梯度Xn與閾值Xs1,當Xn (4)重復步驟3,對M2~Mr區(qū)域內的梯度極小值進行標記,確定r-1個標號區(qū)域,最后由r個局部極小值的標號圖像構成前景標記圖: fgm={label1+label2+…+labelr} (8) 通過上述方法,可以將標記點限定在目標區(qū)域而避開圖像邊緣,再利用距離變換“細化”前景標記圖,對距離圖像做分水嶺變化求出背景分割脊線,分割脊線正好將連通的前景標記分隔開,將其作為背景標記圖像bgm。 利用前景、背景標記圖像對梯度進行修改,屏蔽原梯度圖像中的極小值而凸顯被重新標記的局部極小值,去除偽極小值對梯度圖像的影響,使檢測到的圖像邊緣更加準確清晰。本研究對Canny算子檢測到的HSV顏色空間加權梯度圖進行形態(tài)學濾波重建后,利用強制極小值技術結合形態(tài)學前景、背景標記對其進行梯度修正,使局部極小值只出現(xiàn)在前景圖像中標記的位置。修改后的待分割梯度圖像g為: g=imimposemin(hoc,fgm|bgm) (9) 將其應用于分水嶺變換求出分割結果圖f: f=watershed(g) (10) 為驗證Canny算子在本研究算法中的有效性,我們進行了兩組對比實驗以評價分割結果。實驗一為形態(tài)學改進的分水嶺算法與經(jīng)典分水嶺算法的對比,其分割結果及評價參數(shù)見圖3。圖3(a)、(b)分別為改組對比實驗的分割結果。由圖3(a)可知,經(jīng)典分水嶺算法只分割出了部分細胞(約為總細胞數(shù)的70%),且分割出的細胞輪廓定位不夠準確;利用形態(tài)學操作優(yōu)化后的結果見圖3(b),分割出的紅細胞數(shù)約占細胞總數(shù)的98%,同時,形態(tài)學處理可以提取到圖像更多的暗部細節(jié)特征,得到的分割線邊緣光滑,無凸起,定位也更精確。本研究在對細胞圖像的分割結果進行分析評價時,選取了交并比(intersection-over-union, IOU)和分割精確度(Precision)兩個特征參數(shù)進行判斷,兩個參數(shù)值越高,表示分割效果越好,結果見圖3(c)、(d)。經(jīng)計算得出,形態(tài)學改進的分水嶺算法其IOU值和Precision值比經(jīng)典分水嶺算法分別提高了14.96%和11.95%。 結構元素的選取是影響分水嶺算法分割結果好壞的重要因素,因此,本研究對結構元素的選取做如下分析:選擇三幅目標各不相同的圖像進行分析研究,并選取線形、圓盤形、菱形三種形狀的結構元素對每一幅圖像進行實驗,見圖5。其中,圖5(a)、(b)為結構元尺寸一定時,結構元形狀對圖像分割的影響。圖5(a)中的分割目標為大米顆粒,由圖可知,線形、圓盤形、菱形三種結構元的未分割目標數(shù)量依次減少,其占總目標數(shù)的比率分別為0.355、0.282、0.186,由于線形結構元與圖像目標的形態(tài)及大小相差較大,在參與運算時不能最大限度地對目標進行提取;而圓盤結構更容易將多余的背景區(qū)域覆蓋造成過分割現(xiàn)象,因此,選擇菱形作為提取大米圖像的結構元。圖5(b)中的分割目標為紅細胞。線形、菱形、圓盤形三條曲線未分割出的紅細胞數(shù)占總目標數(shù)的比率依次為0.389、0.279、0.257,即圓盤形結構元更適于對紅細胞圖像的分割。由此可知,當結構元大小一致時,越符合圖像特征的結構元形狀提取到圖像信息越完整,且能夠最大程度地保留原圖像的幾何形狀。 圖3 經(jīng)典分水嶺算法與形態(tài)學分水嶺算法分割結果對比圖 實驗二為本研究改進的分水嶺算法與經(jīng)典分水嶺算法的對比,二者的分割結果對比見圖4。其中,圖4(a)結果與圖3(a)一致。圖4(b)為本研究改進分水嶺算法的分割結果,該圖中分割出的細胞數(shù)約占細胞總數(shù)的98%,且分割邊緣更貼合細胞的真實狀態(tài),能夠較好地識別紅細胞的具體形態(tài),有助于進一步觀測紅細胞的大小變化,并為檢測紅細胞是否產生病變提供依據(jù)。利用IOU和Precision兩個參數(shù)對7分割結果進行分析對比,結果見圖5(c)、(d),顯示本研究提出的基于Canny算子提取加權梯度和形態(tài)學修正梯度圖的改進分水嶺算法較經(jīng)典分水嶺算法的IOU值和Precision值分別提高了31.86%和21.88%;與只有形態(tài)學優(yōu)化的分水嶺算法相比,其值分別提高了14.69%和8.87%。通過兩組對比實驗可以得出,本研究的改進分水嶺算法分割效果更佳,具有一定的可行性與有效性。 圖4 經(jīng)典分水嶺算法與本研究改進算法的分割結果對比圖 圖5(c)、(d)為結構元尺寸對圖像分割影響的結果。圖5(c)中結構元尺寸從S1變?yōu)镾2時,未分割出的大米顆粒數(shù)量逐漸減少,占總數(shù)量的比率分別為0.19、0.154;當結構元尺寸為S3時,未分割目標數(shù)量的比率達到最小值0.141,此時的分割準確度最高;當結構元尺寸繼續(xù)從S4變?yōu)镾6時,未分割出的大米顆粒數(shù)量重新增多,結構元各尺寸對應的未分割目標比率也分別增大至0.205、0.224、0.257。在圖5(d)中,結構元從S1增大到S5的過程中,未分割出的紅細胞數(shù)量均在逐漸減少,其占總目標數(shù)的比率分別為0.497、0.319、0.254、0.249,并在S5的時候達到了最小值0.194;當繼續(xù)增大結構元為S6時,未分割出的目標比率增大為0.393。因此,由圖5(c)、(d)可知,當結構元的尺寸與目標大小相近時,分割效果最好,因為結構元的增大意味著“探針”可攜帶的圖像信息變多,能夠更精準地描述圖像的結構特征并識別目標。但無限地增大結構元素,將導致圖像的一些局部細節(jié)被模糊掉,在形態(tài)學重建時,能更完整地恢復原圖像形貌,從而造成最終的分割結果準確性降低。 表1給出了本研究改進的分水嶺算法與文獻[16]、[17]的交并比和精確度性能參數(shù)的對比情況。文獻[16]的算法中圖像受光照情況影響較為明顯,對光照不均勻或曝光度高的細胞存在欠分割情況,故分割精確度較低;文獻[17]的算法中粘連細胞在邊界處的亮度變化較弱,易造成細胞邊界檢測不全,引起過分割現(xiàn)象。而本研究算法利用圖像HSV顏色空間的各分量梯度求加權擬合梯度,避免了原細胞圖像信息丟失,同時在形態(tài)學重建時修正對梯度圖的充分標記,剔除了細胞圖像中的偽極小值,使圖像信息被充分表達,其分割精確度較文獻[16]、[17]分別提高了9.97%、7.55%,獲得的細胞邊緣更加完整、連續(xù)且無過分割現(xiàn)象。 圖5 形態(tài)學結構元對分割結果的影響 表1 不同算法性能參數(shù)比較結果 本研究改進的分水嶺算法不同于經(jīng)典分水嶺算法中直接對灰度圖像的梯度圖進行提取和分割,而是由Canny算子獲取圖像HSV顏色空間的各個梯度分量后進行加權擬合,保留更多的圖像細節(jié),然后對平滑后的擬合梯度圖進行區(qū)域化,使得待標記的目標像素趨于集中,之后標記局部極小值時只在包含內部像素較多的區(qū)域進行,最后利用標記圖像對梯度圖進行形態(tài)學修正并求出分水嶺分割結果。實驗結果表明,本研究算法與經(jīng)典分水嶺算法相比,其交并比(IOU)參數(shù)值提高了31.86%,分割精確度提高了21.88%,對比文獻[18]、[19],本研究算法的分割精確度均有提高,因此,可用于后續(xù)細胞圖像的識別分類研究。后續(xù)研究工作將在已有基礎上對算法作進一步的豐富與擴展,以應用于更加復雜的圖像處理領域。3.4 梯度修正及分水嶺分割
4 實驗結果與分析
4.1 細胞圖分割結果
4.2 形態(tài)學結構元的影響
4.3 客觀評價參數(shù)對比
5 結束語