郭恒光,李 偉,張 偉,魯華杰
1(海軍航空大學(xué) 岸防兵學(xué)院,煙臺 264001)
2(海軍航空大學(xué) 職業(yè)教育中心,煙臺 264001)
不同類型的磨粒,由于磨損類型和形成機理不同,會表現(xiàn)出不同的形態(tài)特征,這些形態(tài)特征是判斷磨粒所屬類型的重要依據(jù).正常磨粒、球狀磨粒和切削磨粒等類型的磨粒一般在尺寸上和輪廓形態(tài)特征上具有鮮明的特點,與其他類型的磨粒區(qū)別比較明顯,根據(jù)磨粒圖像的形狀特征對這些類型的磨粒進行分類時,識別準確率一般都比較高;而嚴重滑動磨粒、疲勞剝塊和層狀磨粒等類型磨粒的輪廓非常不規(guī)則,并且表現(xiàn)出一定的相似性,采用圖像處理技術(shù)對這些類型的磨粒進行分類時,對磨粒圖像形狀特征的要求就比較高.因此研究磨粒圖像形狀特征提取方法,對于提高磨粒類型識別的準確率具有重要的意義.
高階統(tǒng)計量是描述隨機過程高階統(tǒng)計特性的一種數(shù)學(xué)工具,包括高階矩、高階累計量以及它們的傅里葉變換——高階矩譜和高階累計譜,高階累計譜簡稱高階譜.最常用的高階譜是三階譜和四階譜,通常稱為雙譜和三譜.Chandran 等[1]在1993年根據(jù)高階譜,定義了一系列具有旋轉(zhuǎn)和尺度不變性質(zhì)的特征參數(shù),用于一維信號模式識別.自1997年,Chandran[2]首次將高階譜分析推廣到二維圖像和物體識別領(lǐng)域,近年來在這些領(lǐng)域得到了成功應(yīng)用,例如聲納圖像中海礦識別[3],電子顯微鏡圖像中病毒識別[4]和熱成像中乳腺癌檢測[5].文獻[1-5]中都是采用Radon 變換將圖像映射到一組一維投影,對一維信號進行雙譜分析.
圖像識別中的形狀信息一般更多的包含在圖像的相位而不是幅度之中.普通的傅里葉變換,其幅度特征丟失了圖像的全部相位,與之相比,雙譜保留了除線性相位之外的全部信號信息.雙譜分析通過對含高斯噪聲序列的雙譜估計,重構(gòu)頻域的幅度與相位,理論上可以完全去除獨立的高斯噪聲.在此基礎(chǔ)上本文提出了基于形狀標記和雙譜分析的形狀特征提取方法,采用形狀標記得到圖像的一維信號表示,然后對形狀標記進行雙譜分析,在雙譜域提取雙譜不變量特征作為圖像的形狀特征.
高于二階的累積量,通常稱為高階統(tǒng)計量,它們的多維傅里葉變換稱為多譜.假設(shè)累積量ckx(τ1,τ2,···,τk?1)是絕對可求和的[6],即:
則k階譜定義為k階累積量的(k?1)維離散時間傅里葉變換,即:
式中,ω=[ω1,ω2,···,ωk?1]T,τ=[τ1,τ2,···,τk?1]T.
雙譜即三階譜,定義為:
對于一個離散時間能量有限的隨機信號x(t),將雙譜定義為:
式中,X(ω)為 信號x(t)的傅里葉變換.
文獻[5]指出提取雙譜不變量時,歸一化的雙譜要比原始的雙譜效果好,本文在提取雙譜不變量特征時,以歸一化雙譜為基礎(chǔ),歸一化的雙譜如下式所示:
式中,P(ω)為功率譜.
圖1(a)、圖1(b)和圖1(c)分別為文獻[7]中經(jīng)過圖像分割之后的3 種典型的嚴重滑動磨粒、疲勞剝塊和層狀磨粒,圖1(d)、圖1(e)和圖1(f)分別為3 種類型磨粒的歸一化雙譜的對數(shù)幅值圖.此處計算磨粒圖像的雙譜時,采用Radon 變換的方法將圖像變?yōu)橐痪S信號,Radon 變換投影角度為30°.
對比圖1(d)、圖1(e)和圖1(f)可以發(fā)現(xiàn),3 種磨粒圖像的歸一化雙譜幅值峰在雙譜空間中出現(xiàn)的數(shù)量、位置以及峰值大小差異明顯,這也說明了根據(jù)磨粒圖像的雙譜,提取磨粒的形狀特征,對磨粒進行識別是可行的.
形狀標記是將二維圖像形狀邊界或區(qū)域用一維函數(shù)來表示的一種方法,常用的形狀標記方法有:中心距離函數(shù)、面積函數(shù)、弦長函數(shù)、累積角函數(shù)、復(fù)坐標函數(shù)等.近年來學(xué)者提出的形狀標記方法有:最遠點距離函數(shù)[8]、拱高半徑復(fù)函數(shù)[9]、周橫截三角形面積函數(shù)[10]等.本文提出的基于形狀標記的雙譜分析方法,首先計算磨粒形狀的形狀標記函數(shù),將二維圖像轉(zhuǎn)換為一維信號表示,然后對得到的一維信號進行雙譜分析,最后得到磨粒形狀的歸一化雙譜.采用的形狀標記方法有中心距離函數(shù)、累積角函數(shù)、最遠點距離函數(shù)和三角形區(qū)域表示,并且計算各形狀標記時進行了歸一化處理.
圖1 磨粒圖像及其歸一化雙譜幅值圖
中心距離函數(shù)(centroid distance)定義為形狀輪廓點(x(u),y(u))和 形狀質(zhì)心(xc,yc)之 間的距離CD(u):
由中心距離函數(shù)的定義可以看出,中心距離函數(shù)反映了形狀的整體特征,但是對形狀的局部特征描述不足.圖2(a)、圖2(b)、圖2(c)分別為圖1所示3 種磨粒的中心距離函數(shù)曲線,圖2(d)、圖2(e)、圖2(f)分別為3 種磨粒中心距離函數(shù)曲線的歸一化雙譜幅值圖.
形狀輪廓曲線的描述可以通過角函數(shù) φ (s)參數(shù)化來實現(xiàn),定義的是正切線的角度方向.但是角函數(shù)不具有連續(xù)性,這是因為角度方向被限定在[0,2π]之間,當角度方向大于或小于0 時,角函數(shù)具有不連續(xù)性.這一問題通過Zahn 和Roskie[11]提出的累積角函數(shù)(cumulative angular function)的正規(guī)化形式得到了解決.
曲線上一點的累積角定義為從起始點開始的角度的變化量,表示每個點角度變化的總和,因此稱為累積.角度的變化由角函數(shù) φ(s)的導(dǎo)數(shù)給出,該導(dǎo)數(shù)與曲率k(s)對應(yīng).點的累積角函數(shù)定義為:
式中,參數(shù)s的取值范圍為[0,L],L為曲線的長度.
因此,累積角函數(shù)的初始值和終點值分別為CA(0)=0和CA(L)=?2π.累積角函數(shù)雖然解決了角函數(shù)不連續(xù)的問題,但是仍然存在兩個問題,它在終點不連續(xù)并且它的值取決于所分析曲線的長度.這些問題通過定義正規(guī)函數(shù)CA?(t) 來 解決,CA?(t)的定義為:
式中,t的取值范圍為[0,2π],系數(shù)L/2π使得角函數(shù)正規(guī)化.
圖3(a)、圖3(b)、圖3(c)分別為圖1所示3 種磨粒的累積角函數(shù)曲線,圖3(d)、圖3(e)、圖3(f)分別為3 種磨粒的累積角函數(shù)曲線的歸一化雙譜幅值圖.
EL-ghazal 等[8]提出的最遠距離函數(shù)方法(farthest point distance),是指對于形狀輪廓上的一點a,在輪廓上找到與其距離最大的點b,則a處的最遠點距離函數(shù)值為點a與形狀質(zhì)心c的距離,加上點a對應(yīng)的最遠點b與形狀質(zhì)心c的距離.因此對于形狀輪廓(x(u,y(u)),u=0,1,···,N?1,最遠點距離函數(shù)FPD定義為式(10).
圖2 磨粒中心距離函數(shù)曲線及其歸一化雙譜幅值圖
圖3 磨粒累積角函數(shù)曲線形狀標記及其歸一化雙譜幅值圖
式中,(xfp(u),yfp(u)) 為輪廓點(x(u,y(u))對應(yīng)的最遠點,(xc,yc)為形狀質(zhì)心.
最遠點距離函數(shù)旨在將輪廓的角點信息和輪廓細節(jié)信息加入到中心距離函數(shù)中,用于克服中心距離函數(shù)對輪廓細節(jié)描述不足的缺點.
圖4(a)、圖4(b)、圖4(c)分別為圖1所示3 種磨粒的最遠點距離函數(shù)曲線,圖4(d)、圖4(e)、圖4(f)分別為3 種磨粒最遠點距離函數(shù)曲線的歸一化雙譜幅值圖.
圖4 磨粒最遠點距離函數(shù)曲線及其歸一化雙譜幅值圖
三角形區(qū)域表示(triangle area representation)[12]根據(jù)形狀輪廓上的點形成的三角形區(qū)域來進行計算,可以用來度量輪廓點處的曲率.對于輪廓上3 個點(x(u?1),y(u?1)),(x(u),y(u)) 和(x(u+1),y(u+1))所構(gòu)成的三角形區(qū)域,其面積TAR(u,k)由下式計算得到:
TAR取正值、負值和零值分別對應(yīng)凸點、凹點和直線點,表示每一個輪廓點的凹凸性,圖5(a)、圖5(b)、圖5(c)分別為圖1所示3 種磨粒的三角形區(qū)域表示曲線,圖5(d)、圖5(e)、圖5(f)分別為3 種磨粒的三角形區(qū)域表示曲線的歸一化雙譜幅值圖.
與根據(jù)Radon 變換得到的歸一化幅值圖對比可以發(fā)現(xiàn),根據(jù)3 種類型的磨粒形狀標記得到的雙譜幅值圖,雙譜空間中峰出現(xiàn)的數(shù)量、位置以及峰值大小表現(xiàn)出的差異更加明顯,因此結(jié)合形狀標記和雙譜分析得到的形狀特征區(qū)分能力更加有效.
雙譜一般為復(fù)數(shù),具有幅值和相位,即:
式中,|Bx(ω1,ω2)|和 φB(ω1,ω2)分別為雙譜的幅值和相位.
雙譜具有如下對稱性:
雙譜Bx(ω1,ω2) 的對稱線如圖6所示,有ω1=ω2,2ω1=?ω2,2 ω2=?ω1,ω1=?ω2,ω1=0 和ω2=0.雙譜的定義域根據(jù)上述的對稱線被劃分成12 個扇形區(qū)域.圖6中的陰影部分表示的三角形區(qū)域ω2≥0,ω1≥ω2,ω1+ω2≤π 為雙譜Bx(ω1,ω2) 在 (ω1,ω2)平面內(nèi)的主域,由式(13)所示的雙譜的對稱性可知,所有扇形區(qū)域的雙譜能夠根據(jù)主域內(nèi)的雙譜進行完全的描述.
圖5 磨粒三角形區(qū)域表示曲線及其歸一化雙譜幅值圖
圖6 雙譜的對稱區(qū)域
根據(jù)雙譜的上述性質(zhì),如圖7所示在雙譜主域內(nèi),計算雙譜不變量,并以雙譜不變量作為磨粒的形狀特征.本文在計算雙譜不變量時,采用兩種方法:一是根據(jù)雙譜積分;二是根據(jù)雙譜矩.
圖7 雙譜不變量計算區(qū)域
根據(jù)雙譜積分計算雙譜不變量時,在雙譜主域內(nèi),沿特定斜率a的直線,對雙譜值進行積分得到I(a),以雙譜值積分I(a) 的相位φ (a)作為雙譜不變量:
根據(jù)雙譜矩計算雙譜不變量時,在雙譜主域內(nèi)計算歸一化雙譜的(p,q)階矩M(pq),以雙譜矩M(pq)的相位φ (pq)作為雙譜不變量:
本文采用雙譜積分提取磨粒形狀特征時,斜率a的取值為1 /10,2/10,···,1,則根據(jù)中心距離函數(shù)、累積角函數(shù)、最遠點距離函數(shù)和三角形區(qū)域表示可分別得到10 維形狀特征,分別為:
采用雙譜矩提取磨粒形狀特征時,(p,q)的階數(shù)取值為(0,0),(0,1),(1,0),(1,1),(0,2),(2,0),(1,2),(2,1)和(2,2).則根據(jù)中心距離函數(shù)、累積角函數(shù)、最遠點距離函數(shù)和三角形區(qū)域表示可分別得到9 維形狀特征,分別為:
根據(jù)以上分析,結(jié)合中心距離函數(shù)、累積角函數(shù)、最遠點距離函數(shù)、三角形區(qū)域表示和雙譜分析,通過雙譜積分和雙譜矩計算雙譜不變量,以雙譜不變量作為磨粒的形狀特征,共可以得到76 維形狀特征F:
圖8為以直方圖表示的,采用本文方法得到的圖1所示的3 種類型磨粒的形狀特征,直方圖的前40 個分量為結(jié)合中心距離函數(shù)、累積角函數(shù)、最遠點距離函數(shù)、三角形區(qū)域表示和雙譜分析,通過雙譜積分得到的形狀特征,后36 個分量為通過雙譜矩得到的形狀特征.觀察圖8可以發(fā)現(xiàn),3 種類型的磨粒采用本文方法得到的形狀特征區(qū)別明顯,在采用每種形狀標記和雙譜分析得到的形狀特征分量上都表現(xiàn)出了差別.
為了有效評價所提出的形狀特征提取算法的有效性,本文將所提出的算法在形狀識別領(lǐng)域應(yīng)用廣泛的MPEG-7 CE Shape-1 Part B[13]數(shù)據(jù)集和Swedish leaf[14]數(shù)據(jù)集上進行實驗與分析,并與其它方法進行對比.
本文實驗中主要與幾種形狀標記的方法進行比較,參與比較的形狀特征提取方法包括:文獻[5]的方法、文獻[15]的方法和文獻[16]的方法.其中文獻[5]的方法是通過Radon 變換將圖像映射到一組一維投影,然后對一維信號進行雙譜分析得到形狀特征;文獻[15]的方法是根據(jù)輪廓的多尺度拱高作為形狀特征;文獻[16]的方法是根據(jù)輪廓的多尺度彈性度作為形狀特征.以上3 種方法中,第一種為采用Radon 變換和雙譜分析相結(jié)合的方法,后兩種都是多尺度形狀標記的方法.
圖8 基于形狀標記和雙譜分析的磨粒形狀特征
為了綜合評價各形狀特征提取算法的性能,本文中進行兩組實驗,實驗1 是在原始數(shù)據(jù)集上進行的,實驗2 是在添加高斯噪聲的數(shù)據(jù)集上進行的.在實驗2中,為了評價各形狀特征提取算法的抗噪聲干擾能力,在MPEG-7 數(shù)據(jù)集和Swedish leaf 數(shù)據(jù)集的每幅圖片上添加均值為0,標準差為σ的高斯噪聲,其中σ的取值由0.1 變化到1.由于文獻[15]的方法、文獻[16]的方法和本文方法都是根據(jù)形狀輪廓提取形狀特征,因此對圖像添加噪聲時,是在形狀輪廓的像素上添加高斯噪聲,而文獻[5]的方法是根據(jù)形狀區(qū)域提取形狀特征,因此對圖像添加高斯噪聲時,是在整幅圖像上添加的.為了便于對各種方法進行比較,根據(jù)本文方法和文獻中的方法進行形狀識別時,分類器采用k 近鄰法,用留一法交叉驗證各形狀特征提取方法的性能,以識別準確率作為評價指標.
實驗1 的結(jié)果如表1所示,由表1所示的實驗結(jié)果可以看出,在MPEG-7 數(shù)據(jù)集和Swedish leaf 數(shù)據(jù)集上,本文方法和兩種多尺度形狀標記的方法識別準確率都比較高,其中文獻[16]方法的識別準確率最高,文獻[5]方法得到識別率最低.
表1 實驗1 的實驗結(jié)果
實驗2 所得實驗結(jié)果如圖9所示.由圖9(a)和圖9(b)的對比可以看出,隨噪聲水平的增加,各算法識別準確率在MPEG-7 數(shù)據(jù)集和Swedish leaf 數(shù)據(jù)集上的變化趨勢大致相同,與文獻[15]的方法和文獻[16]的方法相比,本文方法和文獻[5]的方法隨噪聲水平的增加,識別準確率的變化相對較小.
圖9 實驗2 的實驗結(jié)果
由以上兩個實驗看出,在文獻[5]方法的基礎(chǔ)上,本文利用形狀標記方法將二維圖像轉(zhuǎn)換成一維信號,然后對其進行雙譜分析,以雙譜不變量作為形狀特征,可以提高雙譜分析用于形狀識別時的識別準確率,同時與基于形狀標記的形狀特征提取算法相比,可以顯著提高對噪聲的抗干擾能力.
本文結(jié)合形狀標記和雙譜分析用于提取圖像的形狀特征.首先采用4 種形狀標記方法:中心距離函數(shù)、累積角函數(shù)、最遠點距離函數(shù)和三角形區(qū)域表示,將二維圖像轉(zhuǎn)換為一維信號表示;然后對得到的一維信號進行雙譜分析,得到形狀的歸一化雙譜;最后在歸一化雙譜域內(nèi),根據(jù)雙譜積分和雙譜矩計算雙譜不變量,作為圖像的形狀特征,共計76 維.為了有效評價所提方法的有效性,在MPEG-7 CE Shape-1 Part B 數(shù)據(jù)集和Swedish leaf 數(shù)據(jù)集上進行形狀識別能力實驗與抗噪聲能力實驗.實驗結(jié)果表明:本文所提方法能夠有效提高雙譜分析用于形狀識別時的識別準確率,同時與基于形狀標記的形狀提取方法相比,能夠顯著提高抗噪聲干擾能力.