摘 要:針對(duì)尺度不變的二值化角點(diǎn)(BRISK)算法抗噪性能較低,未充分利用圖像的邊緣的問(wèn)題,提出了一種基于非線性尺度空間的圖像配準(zhǔn)技術(shù)。該算法在構(gòu)造尺度空間的時(shí)候采用非線性濾波器構(gòu)造圖像非線性尺度空間,同時(shí)利用AGAST算法在構(gòu)建的非線性空間里提取具有顯著特征的角點(diǎn),結(jié)合旋轉(zhuǎn)不變性的BRIEF算法構(gòu)造128位的二值化描述子,采用漢明距離匹配描述子。實(shí)驗(yàn)結(jié)果表明,該算法能大幅度提高關(guān)鍵點(diǎn)的提取質(zhì)量,獲得了較好特征點(diǎn)重復(fù)檢測(cè)率,增強(qiáng)了特征點(diǎn)魯棒性以及提高了描述子的匹配率。
關(guān)鍵詞:角點(diǎn);非線性濾波器;非線性尺度空間;二值化描述子;漢明距
中圖分類(lèi)號(hào):V243.6
圖像配準(zhǔn)是計(jì)算機(jī)視覺(jué)的基礎(chǔ)應(yīng)用之一,有大量的視覺(jué)應(yīng)用都依賴(lài)于圖像特征點(diǎn)的匹配。例如:圖像拼接,目標(biāo)識(shí)別以及3D圖像合成等應(yīng)用的基礎(chǔ)技術(shù)之一就是圖像配準(zhǔn)技術(shù)。圖像配準(zhǔn)技術(shù)簡(jiǎn)而言之就是把不同來(lái)源,不同場(chǎng)景,不同時(shí)段以及不同視角的,通過(guò)圖像配準(zhǔn)發(fā)現(xiàn)其對(duì)應(yīng)關(guān)系,就能夠使其在不同空間上達(dá)成空間一致的關(guān)系,在此基礎(chǔ)之上根據(jù)不同的要求采取不同的應(yīng)用策略[1]。
2011年,Leutenegger等針對(duì)SIFT[2]以及SURF[3]的缺陷提出BRISK[4](Binary Robust Invariant Scalable Keypoints)算法。BRISK算法的特性使其初步可以應(yīng)用在手機(jī)等低性能的移動(dòng)終端中,但是由于其采用的AGAST[5]角點(diǎn)算子在簡(jiǎn)化的高斯尺度空間中進(jìn)行檢測(cè)關(guān)鍵點(diǎn),高斯尺度空間采用的高斯核濾波器,會(huì)對(duì)角點(diǎn)的邊緣模糊,進(jìn)而導(dǎo)致提取的AGAST算子質(zhì)量不高,降低了匹配精度。針對(duì)這一缺陷,本文利用非線性尺度空間具有較好的濾波效果和圖像結(jié)構(gòu)邊緣保持性能的特點(diǎn),降低了無(wú)效特征點(diǎn)的數(shù)量,提高了特征點(diǎn)的鑒別性。再利用旋轉(zhuǎn)不變的BRIEF算法對(duì)提純后的魯棒性較好的關(guān)鍵點(diǎn)構(gòu)造二值化的描述子,最后對(duì)描述子利用漢明距離進(jìn)行匹配。
1 算法設(shè)計(jì)
基于特征的圖像配準(zhǔn)算法的流程一般分為三個(gè)部分:特征點(diǎn)提??;描述子構(gòu)造;描述子匹配。特征點(diǎn)提取與描述子構(gòu)造是圖像配準(zhǔn)技術(shù)的重點(diǎn)。
1.1 非線性尺度空間構(gòu)造
非線型濾波器將圖像在不同尺上的局部結(jié)構(gòu)變化視為流動(dòng)函數(shù)的散度,非線性濾波器的濾波參數(shù)設(shè)置不再是預(yù)先設(shè)置,而是根據(jù)圖像的結(jié)構(gòu)變化以及處理圖像的目的而自適應(yīng)的選取不同的參數(shù)。這種方程一般被視為非線性局部差分方程,如公式(1)。
(1)
其中div和▽分別表示求導(dǎo)與梯度操作符。傳導(dǎo)函數(shù)c(x,y,t)能夠根據(jù)圖像結(jié)構(gòu)來(lái)自適應(yīng)調(diào)節(jié)擴(kuò)散參數(shù)。時(shí)間t就是尺度參數(shù),其值越大就會(huì)導(dǎo)致圖像結(jié)構(gòu)越平滑。
1.1.1 擴(kuò)散方程
為了加快擴(kuò)散方程的衰減Weickert提出了一個(gè)新的擴(kuò)散方程,擴(kuò)撒方程定義為公式(2),g3代價(jià)函數(shù)對(duì)邊緣兩邊的區(qū)域的平滑要強(qiáng)于對(duì)線本身的平滑。參數(shù)k的選取可以通過(guò)手動(dòng)修正,或者通過(guò)估計(jì)圖像的梯度來(lái)自適應(yīng)調(diào)整,這就可以確定那條邊緣應(yīng)該被加強(qiáng),那條邊緣穩(wěn)定性較差需要被平滑掉。根據(jù)實(shí)驗(yàn)經(jīng)驗(yàn),參數(shù)k一般選取圖像經(jīng)過(guò)高斯函數(shù)平滑后的圖梯度直方圖的70%的梯度值。
(2)
1.1.2 非線性尺度空間的構(gòu)造
代價(jià)函數(shù)g3能夠較好的平滑圖像輪廓兩邊的平坦區(qū)域而較好的保留輪廓本身,因此選用g3來(lái)進(jìn)行構(gòu)造非線性尺度空間。為了構(gòu)造非線性尺度空間,需要把線性尺度空間中的尺度參數(shù)σi轉(zhuǎn)化為非線性尺度空間的時(shí)間尺度t,在高斯尺度空間中使用標(biāo)準(zhǔn)差為σ的高斯核對(duì)圖像進(jìn)行卷積與非線性尺度參數(shù)的進(jìn)化時(shí)間參數(shù) 時(shí)的濾波效果相同,因此可以構(gòu)造出高斯尺度空間與非線性的映射關(guān)系:
(3)
從圖1高斯尺度空間與非線性尺度空間的對(duì)比中可以看出,高斯尺度空間中圖像中所有的結(jié)構(gòu)都被平滑了,然而在非線性尺度空間中圖像的邊緣被完整的保持而未被平滑。
圖1 高斯空間(上),非線性尺度空間(下)
1.2 關(guān)鍵點(diǎn)提取
利用AGAST檢測(cè)算子的FAST9-16檢測(cè)子對(duì)每一圖像組及內(nèi)插組分別使用同一閾值T進(jìn)行關(guān)鍵點(diǎn)提取,即關(guān)鍵點(diǎn)要求在16個(gè)圓環(huán)點(diǎn)中,至少有9個(gè)連續(xù)比中心點(diǎn)亮或者暗的點(diǎn)。初步提取關(guān)鍵點(diǎn)之后需要對(duì)關(guān)鍵點(diǎn)進(jìn)行極大值抑制濾除不穩(wěn)定的點(diǎn)。
1.3 特征點(diǎn)描述子構(gòu)造
為了構(gòu)造具有旋轉(zhuǎn)不變性的描述子,對(duì)提取的關(guān)鍵點(diǎn)鄰域的像素對(duì)進(jìn)行主方向歸一化從而保證描述子的旋轉(zhuǎn)不變性。
1.3.1 采樣與主方向估計(jì)
在關(guān)鍵點(diǎn)中心采樣N個(gè)鄰域點(diǎn),為了提高描述子的鑒別性和抗噪性,方差為σi的高斯濾波器對(duì)以采樣點(diǎn)為中心半徑為σ的進(jìn)行平滑。對(duì)于 個(gè)采樣點(diǎn)對(duì) ,其局部梯度值 可以通過(guò)平滑后的像素值 與 來(lái)估計(jì):
(4)
對(duì)于所有的采樣點(diǎn)集合:
(5)
可以分為長(zhǎng)距離對(duì)L與段距離對(duì)S:
(6)
其中距離閾值可以設(shè)置為 , 。通過(guò)對(duì)長(zhǎng)距離的像素對(duì)L進(jìn)行迭代就可以估計(jì)關(guān)鍵點(diǎn)k的主方向。選取長(zhǎng)距離的像素對(duì)是基短距離的像素對(duì)梯度互相抵消進(jìn)而不關(guān)鍵點(diǎn)整體的梯度沒(méi)有影響同時(shí)也可降低算法的運(yùn)算復(fù)雜度。
(7)
1.3.2 構(gòu)建描述子
為了保持描述子的旋轉(zhuǎn)不變性,需要對(duì)描述子進(jìn)行旋轉(zhuǎn)與尺度的歸一化,在算法中描述子的主方向角為 ,而描述子向量則采用經(jīng)過(guò)方向歸一化后的短距離書(shū)像素對(duì) 像素值之比。
描述子的構(gòu)造采用了BRIEF的基本思想,但是與BRIEF相比,在尺度與旋轉(zhuǎn)的方向的處理上又有些本質(zhì)的不同。首先,采樣點(diǎn)的選取是在歸一化的半徑范圍內(nèi)選取,也即根據(jù)尺度的不同自適應(yīng)的調(diào)整采樣區(qū)域的半徑;其次,相鄰采樣點(diǎn)之間的高斯濾波互相不會(huì)造成影響,從而提高了描述子的魯棒性;最后,采樣的數(shù)量較少,同時(shí)對(duì)采樣點(diǎn)像素對(duì)分為長(zhǎng)短距離兩組,分別計(jì)算描述子主方向與描述向量。
(8)
1.4 描述子匹配
由于描述子為二值化的128bit向量,因此采用Hamming距離來(lái)作為匹配度量,結(jié)合現(xiàn)代計(jì)算機(jī)的特點(diǎn),Hamming距離可以通過(guò)XOR運(yùn)算來(lái)加速運(yùn)算。
2 實(shí)驗(yàn)結(jié)果
為了使實(shí)驗(yàn)結(jié)果更具有說(shuō)服力,實(shí)驗(yàn)對(duì)象采用Mikolajczyk和Schmid提供的圖片庫(kù)[6],每一組實(shí)驗(yàn)數(shù)據(jù)都有六張圖片,其中每一組的基準(zhǔn)圖像為第一張。實(shí)驗(yàn)程序采用C++語(yǔ)言和Opencv2.3開(kāi)源庫(kù)實(shí)現(xiàn)。實(shí)驗(yàn)分別從關(guān)鍵點(diǎn)可重復(fù)檢測(cè)率以及描述子匹配率兩個(gè)方面分析算法的性能,對(duì)比算法分別為SIFT,SURF以及BRISK。
圖2 關(guān)鍵點(diǎn)平均重復(fù)率
2.1 關(guān)鍵點(diǎn)檢測(cè)算子可重復(fù)檢測(cè)率實(shí)驗(yàn)
關(guān)鍵點(diǎn)可重復(fù)檢測(cè)率定義:在相應(yīng)區(qū)域內(nèi)在兩幅圖像中同時(shí)出現(xiàn)的關(guān)鍵數(shù)目與所有關(guān)鍵點(diǎn)數(shù)目之比。因?yàn)閷?shí)驗(yàn)所用圖片已知其變換關(guān)系,測(cè)試圖片與基準(zhǔn)圖片相應(yīng)區(qū)域同時(shí)出現(xiàn)的關(guān)鍵點(diǎn)即 。若認(rèn)為檢測(cè)算子可重復(fù)檢測(cè)則 ,因此可重復(fù)檢測(cè)率是判斷一個(gè)檢測(cè)算子是不是有較強(qiáng)的魯棒性以及鑒別性的重要指標(biāo)。
從圖2中可以看出,在圖像形變比較小以及圖像質(zhì)量較高的情況下,BRISK與NBRISK的特征點(diǎn)重復(fù)檢測(cè)率相差不大,但是相比于SIFT性能提升比較明顯,而在圖像模糊以及形變較大的情況下,NBRISK表現(xiàn)出較好的性能,這樣充分證明了非線性濾波器較強(qiáng)的邊緣保持能力。
2.2 圖像特征描述子匹配
從圖3中可以看出,SIFT的浮點(diǎn)型描述子的性能較為優(yōu)異,在圖像形變比較小的情況下,NBRISK與BRISK都要比SIFT的匹配精度高,但BRISK與NBRISK速度更快效率更高,且存儲(chǔ)資源消耗少,更適用于地低性能的可移動(dòng)設(shè)備上,因?yàn)闃?gòu)造非線性尺度空間的原因,NBRISK耗時(shí)較長(zhǎng)因?yàn)闃?gòu)造非線性尺度空間的原因,NBRISK耗時(shí)較長(zhǎng),但是其準(zhǔn)確度卻大幅度提升。
3 結(jié)束語(yǔ)
NBRISK算法在BRISK以及AGAST算法的思想基礎(chǔ)之上,結(jié)合SIFT的尺度空間的特點(diǎn),提出了非線性尺度空間圖像配準(zhǔn)技術(shù),在非線性尺度空間中提取圖像的關(guān)鍵點(diǎn)與描述子,利用了非線性濾波器在濾除噪聲的同時(shí)較好的保留圖像的邊緣結(jié)構(gòu)信息的特點(diǎn),獲得了重復(fù)檢測(cè)率較高的關(guān)鍵點(diǎn)。為了進(jìn)一步的提高效率,采用了二值化的關(guān)鍵點(diǎn)描述方式,犧牲有限的配準(zhǔn)精度,降低了計(jì)算代價(jià)。
參考文獻(xiàn):
[1]趙芹,周濤,舒勤.基于特征點(diǎn)的圖像配準(zhǔn)技術(shù)探討[J].紅外技術(shù),2006(06):327-330.
[2]Lowe D G.Distinctive image features from scale-invariant keypoints[J].International journal of computer vision,2004(02):91-110.
[3]Leutenegger S,Chli M,Siegwart R Y.BRISK:Binary robust invariant scalable keypoints[C]//Computer Vision (ICCV),2011 IEEE International Conference on.IEEE,2011:2548-2555.
[4]Bay H,Ess A,Tuytelaars T,et al.Speeded-up robust features (SURF)[J].Computer vision and image understanding,2008(03):346-359.
[5]孫浩,王程,王潤(rùn)生.局部不變特征綜述[J].中國(guó)圖象圖形學(xué)報(bào),2011(02):141-151.
[6]Mikolajczyk K,Schmid C.A performance evaluation of local descriptors[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2005(10):1615-1630.
作者簡(jiǎn)介:余道明(1988-),男,河南信陽(yáng)人,碩士研究生,主要研究方向:計(jì)算機(jī)視覺(jué)、圖像處理;張家樹(shù)(1966-),男,四川成都人,教授,博士生導(dǎo)師,主要研究方向:自適應(yīng)信號(hào)處理、圖像處理、模式識(shí)別等;汪輝(1988-),男,湖北武漢人,碩士研究生,主要研究方向:計(jì)算視覺(jué)、圖像去噪。
作者單位:西南交通大學(xué)信息 科學(xué)與技術(shù)學(xué)院,成都 610031
基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目-高效穩(wěn)健的自適應(yīng)絕對(duì)偏度濾波算法研究(項(xiàng)目編號(hào):F010305)。