孫國(guó)棟,林 凱,高 媛,徐 昀
(湖北工業(yè)大學(xué)機(jī)械工程學(xué)院,湖北武漢 430068)
圖像分割在工業(yè)選礦領(lǐng)域起著至關(guān)重要的作用,各種礦石顆粒圖像的分割效果直接影響著礦石的工程質(zhì)量、生成成本和設(shè)備需求。長(zhǎng)期以來(lái),傳統(tǒng)礦石顆粒的分類以手工測(cè)量和機(jī)械篩分為主,存在人為主觀性強(qiáng)、效率低等諸多弊端。隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展,基于機(jī)器視覺的圖像自動(dòng)分割算法逐漸取代了手工分割[1]。由于礦石顆粒工作環(huán)境多種多樣,已有一些學(xué)者進(jìn)行了相關(guān)的研究。
近些年來(lái),基于圖論的圖像分割算法已成為圖像分割領(lǐng)域的一個(gè)熱點(diǎn)方向[2]。Fowlkes等[3]提出了一種基于學(xué)習(xí)型親和度函數(shù)的分割算法,該算法融合了區(qū)域塊和輪廓信息來(lái)構(gòu)建親和度圖模型,可以達(dá)到較好的分割效果,但該算法的計(jì)算量較大。Kim等[4]提出了一種基于譜聚類的分割算法,該算法直接通過(guò)計(jì)算局部區(qū)域的全親和度圖,用以實(shí)現(xiàn)了較高的分割效率。Li等[5]提出了一種基于二部圖的超像素分割算法,該算法同時(shí)考慮了像素與超像素之間、超像素與超像素之間的相似性,實(shí)現(xiàn)了較好的分割效果。Wang等[6]提出了一種基于稀疏全局/局部親和度圖的分割算法,該算法可以獲得局部和全局的分割信息,有較好的分割性能,但該算法忽略相似度矩陣中元素非負(fù)的問題。由上可知,親和度圖的構(gòu)造模型直接影響圖像分割算法的性能。
但是,上述學(xué)者提出的親和度圖的構(gòu)造模型在礦石顆粒分割方面還難以達(dá)到滿意的效果,為了進(jìn)一步改善對(duì)礦石顆粒圖像的分割性能,本文結(jié)合目前已有的相關(guān)研究成果,提出了一種新穎的親和度圖構(gòu)造模型,該模型利用超像素與鄰域超像素之間的線性表達(dá)來(lái)刻畫超像素之間的親和度關(guān)系,能有效量化超像素間關(guān)聯(lián)程度,可以提高礦石顆粒圖像的分割性能。
超像素是圖像亮度、顏色和紋理特征較為一致的子區(qū)域,可以優(yōu)化親和度圖的結(jié)構(gòu)模型和減小圖像分割的計(jì)算量。本文采用和文獻(xiàn)[5]相同的方法,利用幾組不同的參數(shù)來(lái)獲取幾組不同尺度的超像素,以此對(duì)圖像進(jìn)行預(yù)處理來(lái)獲取各種尺度的特征信息。如圖1所示,首先,利用mean shift(MS)[7]和felzenszwalb-huttenlocher(FH)[2]2種算法對(duì)原始圖像進(jìn)行過(guò)分割,得到幾組不同尺度的超像素;接著提取每個(gè)超像素的特征。由于 mLab(mean value in Lab color space)特征具有區(qū)分不同顏色的良好特性,LBP(local binary pattern)特征具有表達(dá)圖像紋理特征的能力,因此,本文對(duì)超像素提取 mLab和LBP2種特征來(lái)構(gòu)造改進(jìn)親和度圖。
親和度圖(affinity graph)描述超像素和超像素間的關(guān)聯(lián)程度,對(duì)圖像分割起至關(guān)重要的作用。常規(guī)的親和度圖是利用超像素間的歐式距離來(lái)計(jì)算超像素間的相似度,用以構(gòu)建親和度圖,但是歐式距離不能準(zhǔn)確刻畫一個(gè)區(qū)域內(nèi)超像素間的相似度。為了充分考慮超像素的區(qū)域信息,本文利用鄰域超像素間的線性表達(dá)模型,用以求解每一個(gè)像素與其鄰域超像素間的線性關(guān)系,進(jìn)而得到所有超像素間的相似度矩陣。如圖2所示,假設(shè)超像素s1的鄰域超像素分別為s2,s3,s4,…,s7,則超像素s1可以由鄰域超像素的線性表示:s1=c2s2+c3s3+c4s4+c5s5+c6s6+c7s7,進(jìn)一步可以求解出超像素s1與鄰域超像素之間的相對(duì)誤差r和相似度w。
圖2 鄰域超像素間的線性表達(dá)
(1)
(c)計(jì)算超像素si和其鄰域超像素sj之間的重構(gòu)誤差rij,求解方法如下:
(2)
(d)計(jì)算超像素si和其鄰域超像素sj之間的相似度wij,求解方法如下:
(3)
(e)最終得到改進(jìn)親和度圖W=(wij)。
(4)
最后,為了融合所有不同尺度下超像素對(duì)應(yīng)的改進(jìn)親和度圖Wl,l=1,2,3…,本文將所有尺度下的親和度圖轉(zhuǎn)化為塊對(duì)角的等效親和度圖Ws,其表達(dá)式如下:
(5)
式中:Wl表示尺度l下的改進(jìn)親和度圖。
為了實(shí)現(xiàn)圖像的最終分割,本文將改進(jìn)親和度圖Ws進(jìn)一步轉(zhuǎn)化為二部圖并利用Tcuts算法[5]對(duì)其進(jìn)行分割。具體步驟如下:首先,對(duì)圖像I建立二部圖GB={U,V,B},用以表達(dá)像素和超像素間的關(guān)系,其中,節(jié)點(diǎn)U=I∪SI(I為所有像素,SI為所有超像素),節(jié)點(diǎn)V=SI;親和度矩陣B=[WIS;WS],其中,像素與超像素間的關(guān)系矩陣為WIS=(bij)|I|×|V|,
(6)
LV=λDVf
(7)
基于超像素間的改進(jìn)親和度圖,本文提出的圖像分割算法總體框架如圖3所示,具體計(jì)算流程如下:
(1)利用MS和FH算法對(duì)圖像I進(jìn)行過(guò)分割,得到幾組不同的超像素SIl,l=1,2,3,…;
(2)提取超像素的mLab和LBP 2種特征;
(3)利用鄰域超像素字典分別構(gòu)建mlab和LBP特征的改進(jìn)親和度圖WmLab和WLBP;
(4)將WmLab和WLBP利用式(4)進(jìn)行融合得到W;
(5)將幾組不同尺度的改進(jìn)親和度圖Wl進(jìn)行融合得到等效Ws;
(6)將改進(jìn)親和度圖Ws轉(zhuǎn)化為二部圖GB={U,V,B},并對(duì)二部圖GB利用Tcuts算法進(jìn)行劃分,進(jìn)而得到最終分割結(jié)果。
圖3 算法整體流程
為了驗(yàn)證改進(jìn)親和度圖算法的可行性和有效性,首先,介紹用于實(shí)驗(yàn)的數(shù)據(jù)庫(kù)和性能評(píng)價(jià)指標(biāo);然后,分析了特征融合參數(shù)a和b對(duì)礦石顆粒圖像分割性能的影響;最后,將本文提出的算法與目前現(xiàn)有算法進(jìn)行對(duì)比分析。實(shí)驗(yàn)條件如下:Windows 7操作系統(tǒng),CPU為Intel Xeon E5-2640 @2.40 GHz,內(nèi)存64 GB和MATLAB R2017a。
實(shí)驗(yàn)所用的數(shù)據(jù)庫(kù)來(lái)自不同光照強(qiáng)度下的礦石顆粒圖像,該數(shù)據(jù)庫(kù)中每種光照強(qiáng)度下分別對(duì)應(yīng)20幅不同排列的礦石顆粒圖像。為了進(jìn)一步定量分析本文算法在礦石圖像上的分割性能,考慮到礦石顆粒圖像的目標(biāo)單一,且可以計(jì)數(shù),故針對(duì)礦石顆粒分割建立3個(gè)特定的定量評(píng)價(jià)指標(biāo):正確分割率(correct segmentation rate,CSR),過(guò)分割率(oover-segmentation rate,OSR),欠分割率(under-segmen-tation rate,USR)。例如,一幅礦石圖像中顆??倲?shù)為M,通過(guò)算法分割得到:x個(gè)礦石顆粒分割準(zhǔn)確;y個(gè)礦石顆粒過(guò)分割;z個(gè)礦石顆粒欠分割,如圖4所示。因此,上述指標(biāo)可以定義為:CSR=x/M,OSR=y/M,USR=z/M,并對(duì)所有圖像的結(jié)果取平均值。
圖4 3種分割結(jié)果
在利用式(4)對(duì)不同特征改進(jìn)親和度圖進(jìn)行融合時(shí),參數(shù)a和b直接決定不同特征所占的權(quán)值比重,為了驗(yàn)證不同參數(shù)取值對(duì)算法分割性能的影響程度,設(shè)置一系列不同的a和b值進(jìn)行比較,從中找出最佳的權(quán)值配比。所有實(shí)驗(yàn)過(guò)程均保持其他參數(shù)相同,僅僅改變參數(shù)a和b。不同a和b值對(duì)應(yīng)的定量對(duì)比結(jié)果如表1。
表1 不同參數(shù)下的定量結(jié)果
從表1可知,礦石顆粒圖像分割結(jié)果受參數(shù)a和b取值的影響,隨著參數(shù)a取值的增大,其對(duì)應(yīng)圖像的分割效果變差,過(guò)分割的現(xiàn)象越明顯。原因在于礦石顆粒圖像的顏色信息并不豐富,隨著參數(shù)a的增大,提高了特征融合中mLab特征的比重和減小了LBP特征的比重,導(dǎo)致最后構(gòu)建的親和度圖包含的紋理特征信息減少,故不利于礦石顆粒圖像邊界的區(qū)分。綜上所述,紋理特征LBP更有利于礦石顆粒圖像的分割,為了優(yōu)化不同特征的貢獻(xiàn),故將參數(shù)設(shè)置為:a=0.1,b=0.9。
為了驗(yàn)證和分析算法的分割性能,將本文算法與目前現(xiàn)有基于圖論的圖像分割算法進(jìn)行比較,如,SAS(aggregating superpixels)算法[5],l0-graph算法[8],GL-graph算法[6]。上述所有方法的參數(shù)均調(diào)整至最優(yōu),不同算法的視覺對(duì)比實(shí)驗(yàn)結(jié)果如圖5(虛線框表示分割錯(cuò)誤,包括過(guò)分割和欠分割)和定量對(duì)比結(jié)果見表2。
從圖5的視覺分割結(jié)果可知,從總體上看,本文的算法可以適應(yīng)不同光照強(qiáng)度下不同形狀礦石顆粒的分割;從細(xì)節(jié)上看(虛線框),本文算法的過(guò)分割情況要好于其他算法。從表2定量結(jié)果可知,當(dāng)參數(shù)調(diào)整為最佳時(shí),各個(gè)算法的欠分割率相差不大且較低,但是本文算法的過(guò)分割率明顯低于其他算法,說(shuō)明本文算法的分割性能要優(yōu)于其他算法。
(a)原圖像 (b)SAS算法 (c)l0-Graph算法 (d)GL-Graph算法 (e)本文算法圖5 不同算法的分割結(jié)果
表2 不同算法的礦石分割結(jié)果 %
為了進(jìn)一步驗(yàn)證本文算法在實(shí)際環(huán)境中的有效性,故對(duì)每種光強(qiáng)度下的照片增加高斯和椒鹽混合噪聲(均值設(shè)為0.2),來(lái)反映實(shí)際工作環(huán)境。分割的視覺效果如圖6,定量結(jié)果如表3。由圖6和表3可知,可以看到在有噪聲和無(wú)噪聲的情況下分割結(jié)果相差不大,由此可以說(shuō)明本文算法可以滿足實(shí)際工作條件下的分割性能。綜上所述,本文算法在礦石顆粒圖像的分割中可以得到較好的效果,且具有一定的魯棒性。
(a)原圖 (b)無(wú)噪聲 (c)有噪聲圖6 有噪聲和無(wú)噪聲的分割結(jié)果
表3 有噪聲和無(wú)噪聲的分割結(jié)果 %
為了提升復(fù)雜礦石顆粒圖像的分割性能,提出了基于改進(jìn)親和度圖的分割算法。該算法主要是使用不同尺度的超像素作為分割節(jié)點(diǎn),同時(shí)利用鄰域間超像素的線性表達(dá)來(lái)構(gòu)建新穎的親和度圖模型,并利用Tcuts算法對(duì)構(gòu)建的模型進(jìn)行切分,進(jìn)而得到最終的分割結(jié)果。實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有的算法相比,本文的算法能夠準(zhǔn)確地分割不同光照強(qiáng)度下礦石顆粒的邊界,且對(duì)具有噪聲工況下的礦石顆粒圖像也具有較好的魯棒性。