楊殿斌 ,李 瀟 ,張紅順
(長(zhǎng)安大學(xué)工程機(jī)械學(xué)院,陜西 西安 710064)
多聚焦圖像是一系列聚焦于物體不同深度的圖像。多聚焦圖像有許多機(jī)器視覺方面的應(yīng)用,如圖像融合、聚焦形貌恢復(fù)、場(chǎng)景三維重建[1-2]等,以擴(kuò)展聚焦深度或恢復(fù)物體的3D形狀。這些機(jī)器的視覺應(yīng)用可以實(shí)際服務(wù)于農(nóng)用機(jī)械的自動(dòng)駕駛、農(nóng)作物狀態(tài)監(jiān)測(cè)、工裝磨損檢測(cè)等方面[3-5]。但多聚焦圖像在預(yù)處理前還不能夠直接使用,進(jìn)行圖像配準(zhǔn)是必不可少的重要前提。
圖像配準(zhǔn)的目的是根據(jù)坐標(biāo)變換模型將目標(biāo)圖像與參考圖像對(duì)齊,使它們?cè)谀繕?biāo)幾何形狀上匹配一致。但由于多聚焦圖像本身的特性,離焦模糊區(qū)域特征檢測(cè)困難,常規(guī)配準(zhǔn)方法的精度很難保證。因此,對(duì)多聚焦圖像配準(zhǔn)方法的研究十分必要。在已有研究中,Holia等[6]提出了一種基于加窗與主成分分析法的圖像配準(zhǔn)算法,Liu等[7]提出了一種基于多尺度小波的多聚焦圖像區(qū)域融合與配準(zhǔn)算法。它們的優(yōu)點(diǎn)是圖像配準(zhǔn)與融合同步進(jìn)行,有效提高了圖像融合的精度。缺點(diǎn)是它們無法在非融合條件下實(shí)現(xiàn)配準(zhǔn),獲得常規(guī)的配準(zhǔn)圖像,應(yīng)用面不廣。
在此研究背景下,本研究提出了一種基于改良SURF的多聚焦圖像配準(zhǔn)方法與模型,模型中只存在唯一需要求優(yōu)的參數(shù)(Hessian矩陣值)。以特征點(diǎn)對(duì)間的歐式距離作為判斷指標(biāo),通過黃金分割搜索對(duì)參數(shù)進(jìn)行最優(yōu)估計(jì),可有效提高多聚焦圖像的配準(zhǔn)精度,獲得更優(yōu)的配準(zhǔn)結(jié)果。
本研究提出的圖像配準(zhǔn)流程圖如圖1所示。輸入圖像后,對(duì)圖像進(jìn)行SURF特征檢測(cè)后進(jìn)行特征匹配,計(jì)算匹配后的特征點(diǎn)對(duì)間的平均歐氏距離。平均歐式距離越小,匹配結(jié)果越精確。通過一定次數(shù)的黃金分割搜索可以大致估算出最優(yōu)的Hessian矩陣值,即最優(yōu)參數(shù)估計(jì)。之后建立仿射變換模型進(jìn)行坐標(biāo)變換,重采樣后完成配準(zhǔn)。
圖1 配準(zhǔn)流程圖
SURF是最常用的檢測(cè)算子之一[8]。相較其他檢測(cè)算子,SURF有很多優(yōu)點(diǎn),如具有尺寸不變性和可重復(fù)性,計(jì)算迅速,旋轉(zhuǎn)、面對(duì)平移、縮放時(shí)具有很好的魯棒性。
對(duì)圖像I(x,y)上的目標(biāo)像素點(diǎn)X(x,y),在尺度σ上可將Hessian矩陣H(X,σ)定義為:
式中,Lxx(X,σ)為圖像I(x,y)與高斯二階微分在X(x,y)的卷積,g(σ)是高斯函數(shù)。Lxy(X,σ)、Lyy(X,σ)同理。
為了將圖像卷積運(yùn)算的速度提高,Bay更換高斯模板為盒子濾波器。Dxx、Dxy、Dyy表示盒子濾波器與圖像的卷積。此時(shí)Hessian矩陣的行列式det(H)可近似估計(jì)為:
之后可根據(jù)行列式det(H)值對(duì)局部極值點(diǎn)進(jìn)行判斷。僅當(dāng)行列式值為正數(shù)時(shí),該點(diǎn)為局部極值點(diǎn)。再對(duì)該點(diǎn)的3×3×3鄰域點(diǎn)進(jìn)行非極大值抑制,之后通過線性插值運(yùn)算,實(shí)現(xiàn)SURF特征的精確定位。
本研究提出的多聚焦圖像配準(zhǔn)模型中,影響配準(zhǔn)精度的參數(shù)是SURF檢測(cè)算子中的Hessian矩陣值。不同參數(shù)值決定了不同的特征檢測(cè)與匹配結(jié)果。匹配精度越高,誤差越小,用于實(shí)現(xiàn)坐標(biāo)變換的仿射變換模型越優(yōu)異。利用黃金分割搜索可有效實(shí)現(xiàn)對(duì)Hessian矩陣值的最優(yōu)估計(jì)。黃金分割搜索用于對(duì)參數(shù)H的最優(yōu)估計(jì)算法流程如下:
1)設(shè)置參數(shù)H的搜索域。設(shè)置H搜索域?yàn)閇H1,H2]。當(dāng)H1=100,H2=3 000時(shí),可滿足大多數(shù)情況下的多聚焦圖像配準(zhǔn)要求。
2)檢驗(yàn)搜索域的右極限。若H2=3 000時(shí),特征匹配點(diǎn)對(duì)數(shù)t<10,則令H2逐次減少100,減少x次直到滿足t≥10。令H2=H2-100x,此時(shí)搜索域?yàn)閇H1,H2]。
3)給定分割比r=0.618,進(jìn)行黃金分割搜索。令:
4)進(jìn)行最優(yōu)估計(jì)。D(k)代表Hessian矩陣值為k時(shí)的平均歐氏距離。若D(h1)≥D(h2),令H1=h1,否則令H2=h2。重復(fù)5次后,令H*=(H1+H2)/2,此時(shí)H*即為Hessian矩陣值的最優(yōu)估計(jì)。
為了驗(yàn)證所提出算法的有效性與優(yōu)越性,使用六組多聚焦圖像進(jìn)行配準(zhǔn)實(shí)驗(yàn)。實(shí)驗(yàn)硬件環(huán)境為Intel(R) Core(TM) i7-10875H,CPU @2.6GHz,內(nèi)存32 G的PC機(jī)。軟件工具為Win10操作系統(tǒng),Visual Studio 2019,VC++,OpenCV3.4.6。
實(shí)驗(yàn)所用的六組多聚焦圖像如圖2所示,聚焦區(qū)域用紅色橢圓標(biāo)記。MSE(Mean Square Error)是一種常用的客觀評(píng)價(jià)方法,用于估計(jì)圖像配準(zhǔn)的準(zhǔn)確性[9],較小的MSE值意味著更準(zhǔn)確的圖像配準(zhǔn)。NCC(Normalized Correlation Coefficient)可以描述圖像之間的相似性[10]。NCC值越接近1,代表配準(zhǔn)越精確。圖像的評(píng)價(jià)結(jié)果如表1和表2所示。
圖2 六組多聚焦圖像
由表1和表2可知,與常規(guī)的傳統(tǒng)方法相比,本研究提出的方法的MSE值均更低,且NCC更接近于1。這表明本研究提出的基于改良SURF的多聚集配準(zhǔn)方法優(yōu)于常規(guī)配準(zhǔn)方法,能夠得到更高的配準(zhǔn)精度,是更好的配準(zhǔn)方法。
表1 六組多聚焦圖像的MSE值
表2 六組多聚焦圖像的NCC值
本研究提出了一種基于改良SURF的多聚焦圖像配準(zhǔn)方法與模型。它在多聚焦圖像融合和聚焦成形方面具有良好的應(yīng)用前景。配準(zhǔn)時(shí)利用黃金分割搜索對(duì)SURF算法的Hessian矩陣值進(jìn)行最優(yōu)估計(jì),以獲得最優(yōu)配準(zhǔn)精度。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的、廣泛使用的常規(guī)配準(zhǔn)方法相比,該方法可以有效地提高多聚焦圖像的配準(zhǔn)精度,可以更好地應(yīng)用于農(nóng)業(yè)機(jī)械的智能自動(dòng)駕駛、作業(yè)道路導(dǎo)航、工裝作業(yè)狀態(tài)監(jiān)測(cè)等實(shí)際方面。