宋佳聲 王永堅(jiān) 戴樂(lè)陽(yáng)
(1.集美大學(xué)輪機(jī)工程學(xué)院 福建廈門(mén) 361021;2.福建省船舶與海洋工程重點(diǎn)實(shí)驗(yàn)室 福建廈門(mén) 361021)
散落于潤(rùn)滑系統(tǒng)中的大量磨損顆粒蘊(yùn)含著當(dāng)前機(jī)械設(shè)備的磨損狀態(tài)信息[1]。為了監(jiān)測(cè)設(shè)備的磨損狀態(tài),鐵譜分析技術(shù)首先通過(guò)在線(xiàn)或者離線(xiàn)光學(xué)成像系統(tǒng)獲取含有這些磨粒的鐵譜圖像,再通過(guò)圖像分割方法找出其中的磨粒區(qū)域,進(jìn)而分析設(shè)備磨損性質(zhì)和狀態(tài)。鐵譜圖像的分割是自動(dòng)化鐵譜分析技術(shù)的關(guān)鍵步驟,它對(duì)于自動(dòng)監(jiān)測(cè)設(shè)備磨損狀態(tài)有著重要的意義。所謂分割是指將鐵譜圖像劃分為2個(gè)或多個(gè)區(qū)域,直到所有感興趣的目標(biāo)(磨粒)被劃分出來(lái)為止。在分割的結(jié)果(圖像分割出來(lái)的區(qū)域)中,一般把感興趣的目標(biāo)所對(duì)應(yīng)的區(qū)域稱(chēng)為前景,比如鐵譜圖像的磨粒區(qū)域,其他的區(qū)域稱(chēng)為背景。雖然前景磨粒所呈現(xiàn)的形態(tài)復(fù)雜多變,但其背景區(qū)域的灰度卻相對(duì)一致?;阼F譜圖像這一特征,閾值法常常被用于鐵譜圖像的分割,因?yàn)殚撝捣ㄕ腔谝恢滦约僭O(shè)的圖像分割方法。傳統(tǒng)閾值法包括最大方差法[2]、最大熵法[3]和最小誤差法[4],它們?cè)阼F譜圖像分割中被廣泛使用。比如,樊紅衛(wèi)等[5]針對(duì)鐵譜圖像背景特征,提出了基于反相操作的鐵譜圖像的灰度圖,據(jù)此采用三段式閾值法分割該灰度圖。金路和王靜秋[6]將閾值法和形態(tài)學(xué)方法結(jié)合,提高了鐵譜圖像的分割精度。溫廣瑞等[7]首先基于差商構(gòu)造第一類(lèi)可接受函數(shù)和第二類(lèi)可接受函數(shù),然后結(jié)合實(shí)驗(yàn)數(shù)據(jù)確定兩類(lèi)誤差,選取同時(shí)滿(mǎn)足兩類(lèi)誤差的最小灰度值作為分割閾值。邱麗娟等[8]將Otsu法與聚類(lèi)算法結(jié)合實(shí)現(xiàn)了對(duì)彩色磨粒的分割。魯秋菊和拓守恒[9]針對(duì)多閾值選取的問(wèn)題提出了自適應(yīng)步長(zhǎng)方案實(shí)現(xiàn)對(duì)彩色圖像的全局分割。徐守坤等[10]在Otsu法的基礎(chǔ)上結(jié)合均勻性測(cè)度函數(shù)實(shí)現(xiàn)閾值的自適應(yīng)選擇以完成對(duì)水面圖像的閾值分割。
然而,目前探討這3種傳統(tǒng)閾值法在鐵譜圖像分割中應(yīng)用比較的文獻(xiàn)卻鮮有見(jiàn)到。為了探究它們?cè)阼F譜圖像分割中的不同之處,并進(jìn)一步討論閾值法對(duì)鐵譜圖像分割的適應(yīng)性,本文作者從算法原理和實(shí)驗(yàn)2個(gè)角度對(duì)3種傳統(tǒng)閾值法進(jìn)行了比較分析。
將鐵譜灰度圖像定義為二維空間函數(shù)I(x,y):R2→R,它定義了從二維像素空間到灰度值的映射函數(shù)。首先,應(yīng)用某種方法根據(jù)圖像某些屬性確定一個(gè)閾值t。然后,將圖像每一個(gè)像素的灰度值與之比較,得到一個(gè)邏輯矩陣(圖像)B(x,y),如式(1)所示,其中等于1的區(qū)域一般對(duì)應(yīng)于前景目標(biāo)。
(1)
對(duì)于一個(gè)給定的灰度圖像,假設(shè)任意灰度值(灰階)i的分布范圍為[1,2,......,L],并且設(shè)定灰度值等于灰階i的像素個(gè)數(shù)為ni,則圖像的總像素個(gè)數(shù)為N=n1+n2+......+nL。針對(duì)在該圖像灰階統(tǒng)計(jì)的直方圖中,灰階i的概率密度函數(shù)估計(jì)為
(2)
如前所述,在某個(gè)閾值t下圖像所有像素被劃分為2個(gè)集合C1和C2,從灰階的角度可以計(jì)算相應(yīng)的各階中心矩統(tǒng)計(jì)量。對(duì)于集合C1中的灰階統(tǒng)計(jì),則有:
(3)
(4)
(5)
對(duì)于C2中的各灰階統(tǒng)計(jì),則有
(6)
(7)
(8)
其中的ωi、μi和σi分別是集合Ci的權(quán)重、均值和標(biāo)準(zhǔn)方差?;谶@些統(tǒng)計(jì)量提出最優(yōu)化準(zhǔn)則以確定最優(yōu)的分割閾值,最為常用和基本的有以下幾種:
(9)
(2)最大熵值法(Maximum Entropy[2],后文簡(jiǎn)稱(chēng)為MaxEntropy法):基于任意閾值t分割出前景C1和背景C2區(qū)域,根據(jù)公式(3)、(4)、(5)和(6)計(jì)算相應(yīng)的權(quán)重和均值,并代入式(10)求解C1和C2區(qū)域的熵值H1(t)和H2(t),進(jìn)一步求解熵值H最大時(shí)所對(duì)應(yīng)的閾值t*,據(jù)此分割出前景目標(biāo)。
(10)
(11)
分割實(shí)驗(yàn)的原始數(shù)據(jù)是30幅標(biāo)準(zhǔn)灰度鐵譜圖像[11],分割目的是準(zhǔn)確分割出視場(chǎng)中出現(xiàn)的主要磨粒。分割結(jié)果將和手工標(biāo)定的Ground Truth數(shù)據(jù)比較,最后輸出都是一個(gè)邏輯圖像,邏輯“1”表示對(duì)應(yīng)于磨粒前景,邏輯“0”表示對(duì)應(yīng)于背景。采用了像素級(jí)的評(píng)價(jià)指標(biāo),為此對(duì)任意像素的分類(lèi)定義如圖1所示。矩形區(qū)域表示整體圖像,其中虛線(xiàn)橢圓所圍區(qū)域表示真實(shí)的磨粒區(qū)域,實(shí)線(xiàn)橢圓所圍區(qū)域表示算法分割出的磨粒區(qū)域,如此將整個(gè)矩形圖像空間分成了4個(gè)區(qū)域(TN、FN、FP和FP),分別采用不同的圖案填充。
圖1 TP、TN、FP、FN的定義
基于該定義,表1列出了6種經(jīng)常被采用的像素級(jí)評(píng)價(jià)指標(biāo)及其計(jì)算方法[12-13]??紤]到其中每2個(gè)指標(biāo)是互補(bǔ)關(guān)系,文中選用檢出率DR、誤檢率FAR和準(zhǔn)確度Accuracy這3個(gè)指標(biāo)。檢出率反映算法所分割出的磨粒完整度,誤檢率FAR反映出算法檢出的磨粒中有多少比例是不可信的,其值越大說(shuō)明分割中有效的磨粒占比越少。準(zhǔn)確度是一個(gè)綜合性指標(biāo),能夠評(píng)價(jià)算法的優(yōu)劣。
表1 鐵譜圖像分割評(píng)估指標(biāo)
3種自適應(yīng)閾值法對(duì)30幅鐵譜圖像進(jìn)行分割,并將分割結(jié)果與Ground Truth比照,計(jì)算3個(gè)評(píng)價(jià)指標(biāo)。3種方法的準(zhǔn)確率如圖2所示。可知,有5個(gè)圖像的分割結(jié)果存在差異,其余25組數(shù)據(jù)采用3種算法的準(zhǔn)確度是比較接近的。因此,下面將30幅鐵譜圖像分為兩組討論,一組是分割結(jié)果接近的25幅圖像,另外一組是分割結(jié)果差異顯著的3幅圖像(14號(hào)、20號(hào)和21號(hào))。
圖2 3種自適應(yīng)閾值算法對(duì)30幅鐵譜圖像分割的準(zhǔn)確度
(1) 第1組鐵譜圖像分割結(jié)果比較分析
由表2可知,Otsu方法的檢出率最低,但其誤檢率也最低;最大熵值法檢出率最高,誤檢率也比較低;最大誤差法檢出率與最大熵值法接近,但其誤檢率最大;3種方法在綜合評(píng)價(jià)指標(biāo)準(zhǔn)確度(Accuracy)上表現(xiàn)比較接近,偏差小于0.01。這些數(shù)據(jù)表明,對(duì)于一般的鐵譜圖像分割問(wèn)題,3種方法的分割結(jié)果基本一致。圖3更直接地說(shuō)明了表2所得到的統(tǒng)計(jì)結(jié)果,Otsu法分割的誤檢最少,MinErr法卻將很多背景噪聲誤檢為前景目標(biāo)。之所以會(huì)有這樣的差異,是因?yàn)樗鼈冞x用了不同的閾值。圖4顯示了對(duì)圖3中原圖分割時(shí)所采用的3種閾值,分別為82、34和23,這些閾值分別對(duì)應(yīng)著相應(yīng)目標(biāo)函數(shù)曲線(xiàn)的最大值或最小值點(diǎn)。圖4所示分別是類(lèi)間方差函數(shù)曲線(xiàn)、熵值曲線(xiàn)、最小誤差估計(jì)曲線(xiàn)和灰度分布的概率密度估計(jì)曲線(xiàn)(直方圖),相應(yīng)的極值點(diǎn)t*用“▼”標(biāo)示。
表2 3種自適應(yīng)閾值算法分割結(jié)果評(píng)價(jià)指標(biāo)均值
圖3 3種算法的分割結(jié)果Fig 3 Segmentation results of three thresholding methods (a)Otsu method;(b)MaxEntropy method;(c)MinErr method
(2)第2組鐵譜圖像分割結(jié)果比較分析
在圖2中,3種分割算法的準(zhǔn)確度出現(xiàn)較大差異的是14號(hào)、20號(hào)和21號(hào)鐵譜圖像,現(xiàn)將它們的分割圖像顯示如表3所示。Otsu法的誤檢率都超過(guò)90%,MaxEntropy法和MinErr法的平均誤檢率分別為29%和1.5%,平均準(zhǔn)確度依次為0.650 1、0.976 3和0.964 9。可見(jiàn),Otsu法對(duì)于這3幅圖像的分割結(jié)果基本是錯(cuò)誤的,而MaxEntropy法和MinErr法的分割結(jié)果接近。其中,MinErr法的誤檢率極小,但因其檢出率不高而在準(zhǔn)確度上稍小于MaxEntropy法。FAN和XIE[14]從熵值理論上重新推演了MinErr法的目標(biāo)函數(shù),也就是說(shuō),它只是采用了不同熵值表達(dá)下的最優(yōu)解,這也解釋了為什么其分割結(jié)果與MaxEntropy法趨同。
表3 3種閾值法分割結(jié)果的比較
另外,從圖像灰度分布來(lái)看,第一組25幅圖像的灰度分布呈現(xiàn)出雙峰模態(tài)特征,但第二組3幅圖像的直方圖則完全不同(見(jiàn)表3)。首先,它們有著極其相似的分布概率圖。然后,它們都呈現(xiàn)出單峰模態(tài),或者占比極其懸殊的雙峰模態(tài)。圖5顯示了第21號(hào)鐵譜圖像的灰度直方圖,并給出了3種方法在分割該樣本時(shí)所采用的閾值。如果對(duì)圖中分布曲線(xiàn)進(jìn)行平滑處理則會(huì)呈現(xiàn)單峰分布特征,Otsu法選擇的閾值試圖將主峰分開(kāi)為2個(gè)權(quán)重相似的分布,得到最小的類(lèi)間誤差。而MinErr法則依然用2個(gè)高斯分布模擬其概率分布,并在波谷位置找到閾值,使得這樣雙模態(tài)假設(shè)下的誤差最小。
圖5 鐵譜圖像21號(hào)的灰度直方圖及3種分割算法的閾值
(1)最大類(lèi)間方差法、最大熵值法和最小誤差法是3種基于直方圖的閾值分割法,它們采用了不同的目標(biāo)函數(shù),在極值化這些函數(shù)過(guò)程中產(chǎn)生了不同的閾值。
(2)30組鐵譜圖像的分割實(shí)驗(yàn)表明,在對(duì)有著不同的灰度分布特點(diǎn)的鐵譜圖像進(jìn)行分割時(shí),3種方法的表現(xiàn)差異明顯:當(dāng)鐵譜圖像灰度呈現(xiàn)明顯的雙峰分布,且磨粒目標(biāo)區(qū)域和背景區(qū)域在面積上差異并不懸殊時(shí),3種方法的分割結(jié)果有著相似的準(zhǔn)確度,最大類(lèi)間方差法的分割效果略好于其他兩者;當(dāng)鐵譜圖像灰度呈現(xiàn)單峰(磨粒區(qū)域的灰度值與背景接近),或者磨粒區(qū)域占比較小時(shí),最小誤差法有著最優(yōu)的分割效果,最大方差法則不能正確分割出磨粒目標(biāo)。因此,在鐵譜分析過(guò)程中,應(yīng)該根據(jù)鐵譜圖像的灰度分布特點(diǎn)選擇相應(yīng)的閾值分割算法。