盧印舉,段明義,蘇 玉
(1.鄭州工程技術(shù)學(xué)院信息工程學(xué)院,河南鄭州 450044;2.上海理工大學(xué)光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093)
玻璃生產(chǎn)工藝流程的復(fù)雜性及其環(huán)境差異性,導(dǎo)致在生產(chǎn)過程中玻璃產(chǎn)生夾雜、癤瘤、氣泡以及污點(diǎn)等各種缺陷[1]。傳統(tǒng)的人工及半自動檢測存在以下缺點(diǎn):人工抽檢存在遺漏的可能,人眼長時(shí)間工作會出現(xiàn)視力模糊等現(xiàn)象,導(dǎo)致玻璃缺陷檢測的準(zhǔn)確率降低;人工檢測主要是依靠工人主觀感覺判斷,對于玻璃缺陷的評判標(biāo)準(zhǔn)帶有主觀性。因此,玻璃缺陷分類識別是玻璃檢測技術(shù)中的一個(gè)難題。
針對人工和半自動玻璃缺陷檢測的弊端,目前,玻璃缺陷圖像分割方法很多,主要有基于玻璃缺陷特征值、閾值分割、神經(jīng)網(wǎng)絡(luò)、小波分析以及支持向量機(jī)等多種檢測方法。
Wang等[2]通過灰度共生矩陣及不變矩來描述并提取圖像的紋理和形狀,以提取到的特征向量為訓(xùn)練樣本,選擇3層前饋神經(jīng)網(wǎng)絡(luò)作為模式識別的判別函數(shù),在模式空間中對玻璃缺陷分類進(jìn)行有效識別。Mello等[3]通過玻璃的表面反射和透明特性的分析,將校正模塊融合到傳統(tǒng)CNN算法之中而達(dá)到玻璃缺陷識別的目的。Tseng等[4]從4幅圖像中提取人工特征向量來描述缺陷,選擇神經(jīng)網(wǎng)絡(luò)決策樹作為缺陷分類器來完成缺陷自動識別與檢測。文獻(xiàn)[5]在瓷磚表面缺陷的檢測和分類中采用統(tǒng)計(jì)方法中的局部方差旋轉(zhuǎn)不變度量算子進(jìn)行缺陷邊緣檢測,使用形態(tài)學(xué)算子來填充和平滑檢測到的分類區(qū)域。最新的深度學(xué)習(xí)理論[6]在缺陷檢測中得到廣泛的應(yīng)用,這些深度學(xué)習(xí)的方法由于需要海量標(biāo)記樣本而限制了其應(yīng)用、影響其識別精度。
上述玻璃缺陷分割方法依據(jù)簡單的幾何特征和灰度閾值,對圖像識別能力弱,使得分割效果不佳。為此,提出一種基于雙特征隨機(jī)場的玻璃缺陷分割算法,該算法以圖像灰度和紋理觀測數(shù)據(jù),將馬爾科夫隨機(jī)場模型的空間信息以先驗(yàn)概率的方式引入到高斯混合模型,通過交替進(jìn)行評估像素點(diǎn)與標(biāo)號場之間的對應(yīng)關(guān)系和更新空間約束來完成玻璃缺陷分割。
分?jǐn)?shù)階微分運(yùn)算能夠增強(qiáng)圖像邊緣輪廓信息和紋理細(xì)節(jié),選用文獻(xiàn)[7]中的分?jǐn)?shù)階導(dǎo)數(shù)定義,并取微分運(yùn)算的前3項(xiàng),在中心像素點(diǎn)8個(gè)方向上的分?jǐn)?shù)階微分運(yùn)算實(shí)現(xiàn)各向同性濾波器的構(gòu)造,階數(shù)擬定為0.5,用t0描述玻璃缺陷的灰度特征。
灰度共生矩陣為描述圖像紋理特征信息定義了14種統(tǒng)計(jì)量[8],選用熵、能量、相關(guān)性、對比度以及逆差距描述玻璃缺陷紋理細(xì)節(jié)。取0°、45°、90°和135°共4個(gè)方向,選取數(shù)據(jù)的平均值作為像素最終特征值。用t1~t5描述玻璃缺陷的紋理特征。
P(xi|zi=j)=N(μj,∑j)·
(1)
式中:D為玻璃缺陷觀測數(shù)據(jù)的維數(shù),D=6;μj為6維列向量;∑j為6×6對稱矩陣。
針對事件Z的所構(gòu)成的事件空間,圖像像素xi的邊緣分布為
(2)
結(jié)合式(2)和式(3),觀測數(shù)據(jù)的聯(lián)合分布:
(3)
利用貝葉斯定理,得到完整觀測數(shù)據(jù)目標(biāo)對數(shù)似然函數(shù):
L(∏,Θ|X)=ln[P(∏,Θ|X)P(∏)]
(4)
觀測數(shù)據(jù)xi在像素標(biāo)簽上獨(dú)立同分布,沒有考慮相鄰像素間的空間關(guān)聯(lián)性和約束性,因此,將馬爾科夫隨機(jī)場模型的空間信息以先驗(yàn)概率的方式引入到高斯混合模型,勢能函數(shù)U(∏)選擇文獻(xiàn)[9]中的定義:
(5)
結(jié)合式(5),忽略常數(shù)項(xiàng),將所有的因子代入式(4),得到觀測數(shù)據(jù)的似然函數(shù):
(6)
對式(6)的最大化通過EM算法來實(shí)現(xiàn),在圖像分割的實(shí)際過程中,即圖像分割問題轉(zhuǎn)換為像素標(biāo)簽區(qū)域后驗(yàn)最大化優(yōu)化求解問題。
將式(1)和式(2)代入式(6),根據(jù)貝葉斯定理,給定圖像像素xi條件下zi=j的后驗(yàn)概率:
(7)
在E步中利用式(7)得到目標(biāo)似然函數(shù)的下界,M步對下界進(jìn)一步最大化。對式(7)目標(biāo)函數(shù)求偏導(dǎo),?φ/?uj=0,?j∈[1,K],得到:
(8)
令?φ/?∑j=0,?j∈[1,K]可以實(shí)現(xiàn)對∑j的估計(jì),得到:
(9)
根據(jù)πij的約束性,忽略式(6)中不依靠先驗(yàn)的常數(shù)項(xiàng)并利用拉格朗日乘數(shù)法,目標(biāo)函數(shù)變?yōu)?/p>
(10)
令偏導(dǎo)函數(shù)等于0,得到:
(11)
(12)
完成了模型參數(shù)的空間更新,利用期望最大化為像素xi分配到第j個(gè)分類區(qū)域。
根據(jù)標(biāo)簽類別數(shù)量,基于K均值算法計(jì)算出了圖像分割模型初始參數(shù)。圖像分割的算法描述如下:
(1)利用K均值算法進(jìn)行參數(shù)初始化πij、μj和∑j。
(2)E-Step:用當(dāng)前的πij、μj和∑j從式(7)估計(jì)αij的后驗(yàn)概率。
(3)M-step:
(a)利用當(dāng)前新αij,從式(8)估計(jì)新的均值向量μj;
(b)利用當(dāng)前新αij,從式(9)估計(jì)新的方差∑j;
(c)利用當(dāng)前αij,從式(11)估計(jì)新的先驗(yàn)概率πij;
(4)收斂:算法達(dá)到最大迭代次數(shù)或者小于給定閾值。
(5)利用Termini和De Luca[10]模糊熵對分割結(jié)果進(jìn)一步優(yōu)化處理。
實(shí)驗(yàn)環(huán)境的硬件平臺為Intel(R)Core(TM) i5 7200 CPU@2.50 GHz處理器、操作系統(tǒng)平臺為Windows 10 64位系統(tǒng)、編程軟件為MATLAB R2010b。算法滿足以下的條件之一停止:
(1)連續(xù)2次分割結(jié)果的改變比率不超過0.001;
(2)迭代次數(shù)超過50。
實(shí)驗(yàn)樣包含夾雜、癤瘤、氣泡以及污點(diǎn)4類玻璃缺陷圖片[11],目的將樣本分割為缺陷區(qū)域和非缺陷區(qū)域。通過算法參數(shù)對分割影響以及不同算法分割對比實(shí)驗(yàn)對本文算法性能進(jìn)行分析。
3.1.1 溫度系數(shù)對分割結(jié)果影響實(shí)驗(yàn)
測試圖像為癤瘤樣本,分?jǐn)?shù)階微分算子模板設(shè)定5×5,驗(yàn)證不同溫度系數(shù)因子對樣本圖像分割效果的影響,分割結(jié)果如圖1所示,圖1為溫度系數(shù)分別為β=1、2、4、8時(shí)的分割結(jié)果。實(shí)驗(yàn)結(jié)果顯示:如果選擇β值足夠小,能夠?qū)崿F(xiàn)高精度的分割,同時(shí)缺陷輪廓與真實(shí)輪廓之間也更加接近,然而圖像中會存在較多的噪聲點(diǎn),玻璃缺陷的邊緣產(chǎn)生毛刺和階梯噪聲。如果選擇的β值足夠大,圖像中的噪聲點(diǎn)大量減少,較小的區(qū)域也實(shí)現(xiàn)了較好的分割,雖然也有斷開的部分,但還是較完整地被分割,但是分割的準(zhǔn)確度仍然較低,識別目標(biāo)可能會存在邊緣細(xì)節(jié)丟失的情況。
(a)β=1
(b)β=2
(c)β=4
(d)β=8
3.1.2 收斂性分析
在癤瘤樣本圖像分割過程中,溫度系數(shù)β=1和模板參數(shù)5×5條件下,圖像序列能量函數(shù)U(x)隨迭代次數(shù)的收斂變化曲線如圖2所示。
(a)能量曲線
(b)對數(shù)似然函數(shù)曲線圖2 收斂過程
通過分析圖2(a)中能量函數(shù)U(x)由于迭代次數(shù)改變而發(fā)生變化的圖像曲線,容易發(fā)現(xiàn),由于迭代次數(shù)不斷增大,能量函數(shù)持續(xù)減小,最終區(qū)域在某一定值附近,這一數(shù)值便是標(biāo)號場的最大后驗(yàn)概率估計(jì)值。比較分析圖像分割的能量函數(shù)曲線,本文算法在第5次迭代時(shí)接近最小,算法基本達(dá)到收斂。目標(biāo)對數(shù)似然函數(shù)收斂曲線如圖2(b)所示。
3.2.1 分割質(zhì)量評價(jià)標(biāo)準(zhǔn)
本文所提的算法用D_MRF標(biāo)記,與當(dāng)前流行的GMM、MRF分割算法進(jìn)行了對照實(shí)驗(yàn),并以MCR[12]和Dice[13]為衡量指標(biāo),對各種分割方法進(jìn)行定量分析。衡量指標(biāo)的計(jì)算公式如下:
(13)
MCR的范圍為[0,1]區(qū)間,MCR值越高表示分割的結(jié)果較差,等于0時(shí)說明不存在錯(cuò)誤分類的像素,分割最準(zhǔn)確。
(14)
Dice值為0時(shí)說明基準(zhǔn)模型和自動模型分割的結(jié)果不存在完全的重疊,該值為1時(shí)說明不存在錯(cuò)誤分類的像素?cái)?shù)量,這時(shí)的分割效果最好。
3.2.2 不同算法的分割結(jié)果
本實(shí)驗(yàn)對不同分割算法的分割結(jié)果進(jìn)行比較分析,分割算法對比結(jié)果如圖3所示。圖3從左至右依次為樣本圖像、GMM和MRF算法分割結(jié)果,最右側(cè)為本文算法分割結(jié)果。
GMM算法僅利用像素的灰度信息,沒有描述像素之間的空間信息,無法精細(xì)分割圖像中局部灰度差異明顯的紋理細(xì)節(jié),圖像中的孤立像素不僅數(shù)量較多,不滿足原始影像的要求。圖3(b)癤瘤分割出現(xiàn)大量的噪聲,氣泡和夾雜樣本出現(xiàn)大量的錯(cuò)誤的連通區(qū)域,污點(diǎn)樣本的紋理邊界檢測錯(cuò)誤。
MRF分割的結(jié)果說明,馬爾科夫隨機(jī)場以圖像的灰度值為隨機(jī)場,在建模的時(shí)候應(yīng)用了條件隨機(jī)場來將上下文信息融合在觀測域和標(biāo)簽域的描述,因此,與GMM相比,MRF算法雖然增強(qiáng)了對圖像的理解能力,但對圖像的灰度值依賴性比較大。例如,圖3(c)夾雜樣本錯(cuò)分缺陷連接區(qū)域,癤瘤樣本產(chǎn)生大量的錯(cuò)分噪聲。
D_MRF算法包含了像素灰度值的特征隨機(jī)場,并引入分?jǐn)?shù)階微分算子來增強(qiáng)邊緣輪廓和紋理細(xì)節(jié),并利用灰度共生矩陣描述圖像的紋理特征信息,因而獲取觀測數(shù)據(jù)比其余算法更完整。結(jié)果顯示該算法的分割效果較好,能夠基本實(shí)現(xiàn)精準(zhǔn)的區(qū)域分割。
3.2.3 分割算法的定量分析
表1記錄的是圖像樣本上不同分割方法的質(zhì)量數(shù)據(jù),指標(biāo)參數(shù)越接近1說明分割的質(zhì)量越優(yōu)秀。分析表1的統(tǒng)計(jì)數(shù)據(jù)結(jié)果,容易發(fā)現(xiàn):
(1)GMM、MRF進(jìn)行分割所得的圖像中均存在十分明顯的錯(cuò)誤分類情況以及大量的噪聲點(diǎn),所以它們的指標(biāo)參數(shù)水平較低,而本文采用的分割方法能夠?qū)崿F(xiàn)更準(zhǔn)確的分類;
(2)本文采用的方法可以通過EM算法的方式來達(dá)到優(yōu)化對數(shù)概率的目的,算法分割質(zhì)量較好。
本文詳細(xì)地介紹了一種改進(jìn)的高斯混合模型的玻璃缺陷圖像分割方法:基于分?jǐn)?shù)階微分運(yùn)算獲取灰度特征,并利用灰度共生矩陣提取紋理特征,構(gòu)建灰度和紋理的雙特征;基于所構(gòu)建的雙特征改進(jìn)了高斯混合模型,通過交替進(jìn)行基于雙特征隨機(jī)場評估像素點(diǎn)與標(biāo)號場之間的對應(yīng)關(guān)系和更新空間約束來完成玻璃缺陷分割。實(shí)驗(yàn)表明,本文算法能夠提高圖像分割的魯棒性和精確性。
圖3 不同算法的分割效果
表1 算法比較分析結(jié)果統(tǒng)計(jì)