馬迎春,劉慧鋒,張 航
(1. 山西迪邁沃科光電工業(yè)有限公司,山西 太原 030006; 2. 山西大學(xué) 物理電子工程學(xué)院,山西 太原 030006)
在機(jī)器視覺領(lǐng)域,金屬表面缺陷檢測[1]、立體視覺技術(shù)[2]、目標(biāo)識別[3]等對目標(biāo)物特征的提取及匹配[4]等很大程度上取決于圖像興趣點(關(guān)鍵點或特征點),即只需提取圖像的某些特征點進(jìn)行局部分析,而非整幅圖像. 角點是圖像中很有價值的一種二維特征點,它在保留圖像重要信息的同時,有效減少了處理圖像的信息量[5]. 國內(nèi)外學(xué)者基于對角點的檢測過程做了大量研究,取得了相應(yīng)的成果,按照檢測判斷依據(jù)的不同大致分為基于灰度和基于邊緣輪廓的角點檢測. Harris和Stephens提出的Harris角點檢測是檢測角點的經(jīng)典方法,Harris角點針對Moravec角點中的連續(xù)平方求和而引入局部變換因子,并利用高斯權(quán)重函數(shù)特性檢測角點而進(jìn)行改進(jìn)[6]. J.Shi和C.Tomasi對Harris檢測提出了改進(jìn)算法,采用與harris 不同的角點響應(yīng)函數(shù),Shi-Tomasi角點檢測劃分相關(guān)一對一匹配對,依據(jù)圖像的角點特征、灰度和位置信息采用最大互相關(guān)函數(shù)進(jìn)行相似度計算[7]. Smith和Brady提出了SUSAN檢測算法,SUSAN算子采用圓形模板來得到各向同性的響應(yīng),不需要計算微分以及非線性響應(yīng)的特點使得SUSAN算子抑制噪聲的性能較好[8],但定位精度較差. 此后,人們針對不同檢測算子的缺陷提出過大量的改進(jìn)方法,都取得了較好的檢測效果.
上述提到的幾種代表性算法,屬于灰度角點檢測算法,依賴于像素點鄰域的灰度值判斷特征變化,操作計算復(fù)雜、難度大. 相比于此類檢測器,基于邊緣輪廓的檢測器首先提取邊緣輪廓,然后在輪廓上而不是整幅圖像上檢測角點,這樣就大大降低了圖像處理運算的信息量,極大地降低了錯誤檢概率,因此受到廣泛應(yīng)用. 近年來,學(xué)者大量的研究與實驗也驗證了基于圖像邊緣輪廓的檢測算法性能優(yōu)于基于灰度信息的檢測算法. Mokhtarian等人提出了曲率尺度空間CSS檢測方法[9],但該方法顯著的問題在于如何選擇合適的高斯尺度以及角點的閾值. Mohammad和Lu提出了利用弦到點的距離累加CPDA[10],He和Yung利用自適應(yīng)曲率閾值對CSS算法進(jìn)行了相應(yīng)的改進(jìn)[11].
Gabor濾波器擁有和人類視覺皮層感受野響應(yīng)相似的性質(zhì),SHEN L等人證明了Gabor濾波器在提取局部特征上的優(yōu)勢[12]. 李云紅等人提出將Gabor濾波器平滑后的輪廓像素的主方向角度差作為角點測度,降低了計算的復(fù)雜度,取得了較好的檢測效果[13]. 本文基于同樣的數(shù)學(xué)思想,提出利用多方向Gabor濾波器虛部(imaginary part of Gabor filters, IPGFs)對圖像輪廓平滑,有效地抑制了噪聲并且提高了檢測準(zhǔn)確率.
Gabor濾波器即Gabor小波變換,實質(zhì)上是一個以Gabor函數(shù)作為基函數(shù)的小波變換,它結(jié)合了Gabor變換和小波變換的優(yōu)點,具有多尺度、多分辨率的特性,被廣泛應(yīng)用到圖像的特征提取中. Pellegrino F A 等人分析認(rèn)為IPGFs可以提供一個像素周圍精確的方向強(qiáng)度變化信息,適用于圖像角點檢測[14].
在空域,一個二維Gabor濾波器是一個正弦平面波和高斯核函數(shù)的乘積[15],表現(xiàn)形式為
x′=xcosθ+ysinθ,y′=-xsinθ+ycosθ,
(1)
式中:γ,η分別為沿x軸和y軸方向的銳度(垂直于平面波);f是濾波器的中心頻率;θ是調(diào)制平面波和高斯主軸沿逆時針旋轉(zhuǎn)的角度,濾波器的參數(shù)在極坐標(biāo)中定義.
對于一個輸入圖像I(x,y), 在IPGFs平滑后的響應(yīng)函數(shù)可以表示為
φ(x,y;f,θ)=Im(ψ(x,y;f,θ)),
(2)
在實際應(yīng)用中,輸入圖像是二維離散的I(m,n),IPGFs響應(yīng)函數(shù)也是離散的,離散的IPGFs幅值響應(yīng)定義為
m′=mcosθk+nsinθk,n′=-msinθk+ncosθk,
(3)
式中:fs為第s個尺度的中心頻率;K為方向采樣個數(shù);θk為第k個方向角度. 圖 1 顯示8個方向的IPGFs頻域圖.
圖 1 8個方向的IPGFs頻域圖Fig.1 Eight directions of IPGFs frequency domain
圖 2 算法流程圖Fig.2 Algorithm flow chart
以CSS算法、CPDA算法和H&Yung算法為代表的基于圖像輪廓的角點檢測算法大多分三步進(jìn)行: 邊緣提取、填充輪廓、角點判決.
C={P1,P2,…,PN}.
(4)
式(4)表示圖像輪廓,其中PN=[xN,yN]T表示第N個輪廓上的像素. 對于輸入的離散圖像I(m,n), 8個方向的IPGFs的梯度幅值響應(yīng)可表示為
G(m,n;fs,k)=I(m,n)φ(m,n;fs,θk)=
(5)
每個像素點對應(yīng)的最大梯度方向及主方向定義為
(6)
輪廓線上邊緣點的角點測度定義為沿輪廓線位于該邊緣像素點兩側(cè)最近的兩個邊緣像素點的主方向角度差.
δ=min{|βN-1-βN+1|, π-|βN-1-βN+1|}.
(7)
算法流程如圖 2 所示.
角點檢測長期以來缺乏嚴(yán)格統(tǒng)一的算法測評技術(shù). 近二十年來,獲得廣泛認(rèn)可的算法測評技術(shù)是Awrangjeb和Lu提出的基于輪廓的角點檢測算法測評技術(shù),使用平均重復(fù)率(average repeatability,Ravg)和定位誤差(localization error,Le)來衡量角點檢測算法的優(yōu)劣[16]. 與CSS,CPDA和H&Yung對比,對本文算法進(jìn)行比較評估.
Ravg計算原始圖像和變換圖像之間重復(fù)角點的平均數(shù)量,可以檢測算法在圖像幾何變換下的穩(wěn)定性,其定義為
(8)
式中:No,Nt分別表示原始圖像中檢測到的角點數(shù)量、變換后圖像中檢測到的角點數(shù)量;Nr表示原始圖像與變換圖像兩者的重復(fù)角點數(shù)(重復(fù)角點之間的距離為3個像素以內(nèi)).
Le計算重復(fù)角點的像素偏差值,用于檢測算法的精確度,它使用被檢測角點的均方根誤差(root-mean-square-error,RMSE)來衡量,定義為
(9)
式中: (xoi,yoi)和(xti,yti)分別為第i個重復(fù)角點在原始圖像和變換圖像中的位置坐標(biāo).
我們選用CSS, CPDA和H&Yung算法所用的檢測圖像作為原始測試圖像,如圖 3 所示,對圖像進(jìn)行如下兩種幾何變換:
1) 旋轉(zhuǎn): 以10°為步長在[-90°,90°]旋轉(zhuǎn),不包括0°,得到18個旋轉(zhuǎn)角度下的幾何變換圖像;
2) 高斯噪聲: 在測試圖像中加入以方差1為步長,區(qū)間[1,15],0均值高斯白噪聲.
圖 3 測試圖像(所標(biāo)記為事實角點)Fig.3 Test image(marked as the fact corner)
表 1~4 分別列出了本文算法與其他算法在不同的旋轉(zhuǎn)角度和高斯噪聲方差下計算所得的平均重復(fù)率Ravg和定位誤差Le的比較結(jié)果.
表 1 不同旋轉(zhuǎn)角度下各算法的Le(Pixels)
統(tǒng)計分析表 1 中數(shù)據(jù)可知,在圖像進(jìn)行旋轉(zhuǎn)幾何變換下,CSS, CPDA和本文算法的Le差別均在1%以內(nèi),本文算法比H&Yung降低了8.6%.
表 2 不同旋轉(zhuǎn)角度下各算法的Ravg(×100%)
表 2 數(shù)據(jù)表明,在圖像進(jìn)行旋轉(zhuǎn)幾何變換下,本文算法的Ravg較CSS高31.7%,較CPDA高 16.4%,較H&Yung 高7.9%.
表 3 不同高斯噪聲方差下各算法的Le(Pixels)
分析表 3 的數(shù)據(jù)可知,隨著高斯噪聲方差的增加,各算子的定位誤差均隨之增大. 在圖像加入高斯噪聲后,本文算法的Le比CSS高出了23.5%,比CPDA高出3.2%,比H&Yung降低了11.1%.
表 4 不同高斯噪聲方差下各算法的Ravg(×100%)
分析統(tǒng)計表 4 數(shù)據(jù)可知,在圖像加入高斯噪聲后,本文算法的Ravg比CSS高4.9%,比CPDA高18.1%,比H&Yung高10.9%. 隨著高斯噪聲方差的增大,本文算法Ravg下降最緩慢,CSS算法和Yung算法次之,CPDA算法的平均重復(fù)率下降最快.
綜合上述表 1~4 的實驗測試數(shù)據(jù)分析可知: 圖像旋轉(zhuǎn)幾何變換下,CSS算法的穩(wěn)定性能最差,相應(yīng)的改進(jìn)算法CPDA和H&Yung提高了其穩(wěn)定性,卻增大了其定位誤差,使角點檢測準(zhǔn)確性略有下降. 本文算法提高了其平均重復(fù)率的同時,降低了改進(jìn)算法的定位誤差Le; 在抗噪聲性能方面,改進(jìn)算法CPDA和H&Yung在算法穩(wěn)定性和角點檢測的準(zhǔn)確性方面都較CSS算法有所降低,這是其輪廓平滑處理的不足和欠缺. 綜合評價,本文算法表現(xiàn)出較強(qiáng)的噪聲魯棒性和圖像幾何變換下的穩(wěn)定性,在算法測評中的綜合性能最佳.
基于圖像輪廓的角點檢測及對圖像輪廓提取的基礎(chǔ)上,沿著輪廓查找角點,所需處理的信息量大大降低,降低了錯誤檢概率,提高了算法的實時性能. 本文算法結(jié)合圖像的邊緣映射與主方向角度差,提高了算法的噪聲魯棒性. 首先基于Canny算子在圖像邊緣提取中的優(yōu)良性能,充分利用二維Gabor濾波器模擬人類視覺系統(tǒng)視網(wǎng)膜上圖像分解的機(jī)制,結(jié)合Gabor 變換和小波變換多尺度、多分辨率特性及其在圖像特征提取中的優(yōu)勢,利用Gabor濾波器虛部平滑圖像輪廓,針對傳統(tǒng)基于圖像輪廓角點檢測中利用高斯核函數(shù)平滑造成的角點定位準(zhǔn)確率低、對局部信息變換敏感及噪聲魯棒性差等問題,本文算法提高了角點的定位準(zhǔn)確性,同時表現(xiàn)出較強(qiáng)的噪聲魯棒性. 實驗測試表明,本文算法在角點檢測算法測評技術(shù)中,較傳統(tǒng)的算法綜合性能高.