何復亮,伍 夢,龍睿捷,陳志高
(1.江西省中核測繪院,江西 南昌 330096;2.東華理工大學 測繪工程學院,江西 南昌 330006)
側掃聲吶使用聲波作為目標探測的信息載體,通過近距離的精細探測,能夠獲取目標區(qū)域高分辨率的海底地貌圖,已成為水下探測最主要的應用系統(tǒng)之一。但在實際探測過程中,容易出現(xiàn)因近距離探測而丟失視野以及探測較大目標時無法獲取完整的場景信息的現(xiàn)象。針對這些問題,圖像拼接技術脫穎而出。
1988年,Harris C等[1]提出了Harris角點檢測算法。通過二階矩陣的特征值檢測圖像上的特征點;1998年Lindeberg引入了自動尺度選擇的概念,可以檢測圖像中具有自身尺度特征的特征點,從而使其提取的特征具有尺度不變性[2];2003年,Matthew B等[3]在SIFT特征提取算法的研究基礎上提出了基于尺度不變特征點的自動全景拼接技術。2008年,Herbert B等[4]提出了一種新的尺度旋轉不變特征檢測算法—SURF算法。但由于側掃聲吶圖像的諸多特性以及拼接算法的復雜性,聲吶圖像拼接技術仍處于起步階段,針對聲吶圖像還沒有提出一種準確、高效的拼接方法。如何精準、實時地完成水下圖像拼接,成為目前水下圖像拼接算法研究的主要難點[5]。基于此問題,本文采用SURF算法進行程序設計,通過對多種方法的實驗分析比較,實現(xiàn)了側掃聲吶圖像的精確鑲嵌。
SURF算法在SIFT算法的基礎上改進了特征的提取和描述方式,執(zhí)行速度快、信息量小、匹配精度高、提取的特征不受光照變化、透視、仿射、旋轉等影響,對于相同場景、不同尺度、不同拍攝角度的聲吶圖像鑲嵌非常適用[6]。其最大優(yōu)點在于引入了Haar特征以及積分圖像的概念,解決了SIFT算法效率低的問題,在圖像的識別、配準與拼接等方面得到廣泛的運用。SURF算法是在積分圖像的基礎上進行計算,通過Hessian矩陣檢測子來檢測特征點;構建相同層數(shù)的尺度空間若干組,初步確定關鍵點;通過計算每個特征點的Haar小波變換來確定特征點描述符需先確定特征點的主方向。SURF算法簡化近似思想與SIFT算法類似[7],通過對DOH中的高斯二階微分模板近似簡化,促使濾波僅需進行加減法即可實現(xiàn),這種運算與濾波模板尺寸有關。SURF算法大致步驟分為積分圖像計算、特征點檢測與描述、特征點匹配[8]。本文在此基礎上引入了USM圖像銳化、誤匹配點剔除以及小波融合法,實現(xiàn)了聲吶圖像精確鑲嵌。示意圖如圖1所示:
圖1 基于SURF的側掃聲吶圖像精確鑲嵌示意圖
利用 SURF算法獲取側掃聲吶相鄰條帶特征點后,需要進行特征點匹配。本文采用基于歐式距離的最近鄰次近鄰法進行特征點匹配。由于在高維向量空間中進行特征匹配數(shù)量巨大,過程復雜繁瑣且存在成像角度及集合變形等因素影響,誤匹配點是不可避免的,因此要想獲取高精度的匹配結果,有必要對錯誤匹配點進行剔除。本文針對如下兩類誤匹配點檢測方法進行研究,并選取了精度、運算時間等指標進行分析比較。
基于函數(shù)擬合的方法是根據(jù)圖像的大小、幾何變形情況選擇合適的函數(shù)模型,然后使用偏最小二乘法求解函數(shù)的系數(shù)。偏最小二乘方法(PLS)是一種由Wold H[9]于20世紀60年代提出的多元統(tǒng)計數(shù)據(jù)分析方法,它是一種多因變量對多自變量的回歸建模方法,能夠較好地解決許多以往用普通多元回歸無法解決的問題。隨著涉及領域的擴展,在圖像降維、特征提取等方面,PLS衍生出了較多有效的算法[10-11]。
(1)F1和G1盡可能多地包含有各自變量的變異信息,即:
(2)F1和G1之間的相關程度達到最大,即:
式中:r(·,·)表示相關關系。
因此,將兩個條件綜合起來即是在PLS要求F1和G1之間的協(xié)方差達到最大,即:
式中:Cov(·,·)表示兩個變量之間的協(xié)方差。若滿足上述兩個條件,F(xiàn)1和G1不但最大可能包含變量信息,而且兩者之間的相關程度達到最大。
設F1和G1是原始數(shù)據(jù)的線性變換,即:
其中,w1和c1為待定的規(guī)范化投影向量。因此目標函數(shù)可以轉化為:
此優(yōu)化問題可以通過Lagrange乘數(shù)法求解,容易得到如下特征分解問題:
求得投影向量w1和c1后,可以得到成分G1=Yc1和,其中分別表示第i對特征點在投影向量上的坐標分量。根據(jù)偏最小二乘的思想,X與Y的相關性可以近似通過F1和G1的相關性來描述。當特征點之間具有線性變換(如剛體變換和仿射變換)關系時,它們之間是嚴格線性相關的;當誤匹配存在時,他們是近似線性相關的。通過繪制一階成分圖(F1,G1),每對特征點i以(F1(i),G1(i))為坐標點,可以大致觀察F1和G1之間是否存在顯著的線性關系,當具有線性關系時,可以通過坐標點(F1(i),G1(i))擬合直線。另一方面通過觀測每對特征點在成分圖中的坐標位置,可以判定誤匹配點對。當坐標點距離擬合直線距離遠的情況下,可以認定是誤匹配,由此可以定義誤匹配判定準則如下:
(1)利用坐標點(F1(i)G1(i)) 擬合直線ax+by+c=0,坐標點到直線的距離為:
(2)定義影響函數(shù)為:
(3)T為預先設定的閾值,當IF(i)>T時,將xi與yi視為誤匹配,將其剔除;否則認為是正確匹配。
偏最小二乘方法具有計算簡單、速度快的優(yōu)點,但也存在一些不足:
(1)異常數(shù)據(jù)誤差較大,會使函數(shù)模型偏離實際數(shù)據(jù),影響檢測精度[12];
(2)誤匹配點檢測精度完全依賴于選擇的函數(shù)模型,模型選擇不準確影響檢測結果。
基于統(tǒng)計模型的方法是統(tǒng)計滿足給定條件的最多數(shù)量的匹配點。最常用的就是抽樣隨機一致性算法(RANSAC)。由Fischler M A等[13]于1981年最先提出,它是根據(jù)一組包含異常數(shù)據(jù)的樣本數(shù)據(jù)集,計算出數(shù)據(jù)的數(shù)學模型參數(shù)得到有效樣本數(shù)據(jù)的算法。RANSAC算法假定樣本由正確數(shù)據(jù)與異常數(shù)據(jù)構成,可被模型描述的點稱為“內點”,偏離模型的點稱為“外點”。通過給定一組正確的數(shù)據(jù),存在可以計算出符合這些數(shù)據(jù)的模型參數(shù)的方法。這里設定一個閾值t∈R,使得全部被判定為內點的點都不超過該閾值,RANSAC算法步驟如下:
(1)考慮一個最小抽樣集的勢為n的模型(n為初始化模型參數(shù)所需要的最小樣本數(shù))和一個樣本集P,集合P的樣本數(shù)Num(P)>n,從P中隨機抽取包含n個樣本的P的子集S初始化模型M;
(2)余集CPS=PS中與模型M的誤差小于設定的閾值t的樣本集以及S本身構成S*。S*認為是模型M的內點集,它們構成S的一致集(Consensus Set);
(3)若Num(S*)≥N(N表示正確模型所含一致集的最小個數(shù))認為模型M是正確的,并利用S*(已經確定為內點集)重新計算得到新的模型M*,重新隨機抽取新的S,重復以上過程。
(4)在完成一定的抽樣次數(shù)后,若未找到一致集則算法失敗,否則選取抽樣后得到的最大一致集判斷內外點,算法結束。
(5)上述過程經過一定次數(shù)的重復迭代執(zhí)行,每一次生成的模型或者由于存在過少的一致集內的點而被拒絕,或者得出一個新模型對應著一個一致集。由于匹配過程中所需要的局內點的數(shù)目和迭代次數(shù)均未知,迭代次數(shù)k可以用如下公式估算:
式中:n為估算模型參數(shù)所需要的最少數(shù)據(jù)點;p表示算法給出的結果是最優(yōu)的概率,一般取值為0.99;w表示所有數(shù)據(jù)點中“內點”比例。在實際中,w是無法提前知道的,通常是在算法迭代中不斷更新。也可以采用自適應的方法來初始化k和w。另外,距離閾值t也是一個重要的參數(shù)需要被初始化,在外點距離不知道的情況下,定義閾值參數(shù)只能依靠多次試驗。
RANSAC算法具有算法簡單,魯棒性強等優(yōu)點,在圖像誤匹配點檢測中得到了廣泛的應用[14-15]。但也存在一些不足:(1)迭代次數(shù)不確定,次數(shù)較少可能導致無法找到最佳模型參數(shù),次數(shù)太多會導致計算速度降低;(2)針對多個模型,算法不適應。
本文采用小波融合法實現(xiàn)相鄰條帶的側掃圖像融合。該方法能夠在提高圖像質量的同時,最大限度地保存各條帶的原始信息,消除鑲嵌過程中產生的拼接痕跡。小波融合法的基本原理是對原圖像進行分解,生成所有高頻和低頻圖像的組合圖像,再對各個子圖像多層分解得到次級子圖像。再在變換域上進行特征選擇創(chuàng)建融合圖像,最后進行圖像重構得到融合圖像。通常分為以下4個步驟:
(1)對相鄰條帶聲吶圖像進行配準;
(2)對高、低分辨率的聲吶圖像進行n次小波變換,獲得相應分辨率的低頻輪廓圖像和高頻細節(jié)圖像;
(3)用全色圖像的高頻部分來替代光譜圖像的高頻部分;
(4)對替換后圖像進行小波逆變換,得到融合后的聲吶圖像。
聲吶圖像融合效果可借助灰度均值、標準方差、熵、聯(lián)合熵來進行評價。均值和標準方差反映圖像的平均亮度和相對整幅圖像的離散度;圖像熵值反映了圖像灰度值較整幅圖像的平均灰度的離散情況;聯(lián)合熵可以用來評價三幅圖像之間的相關性,反映了兩幅鑲嵌圖像和融合后圖像之間的聯(lián)合信息,聯(lián)合熵值越大,表示融合后圖像質量越好。
本文選取的實驗數(shù)據(jù)為側掃聲吶采集的相鄰條帶影像,采用VS2010進行程序設計。通過兩種算法對經過斜率和閾值約束后的特征點對中的一幅聲吶圖像特征點進行實驗,特征點數(shù)量為149個,得到結果如圖2所示。
圖2 誤匹配點剔除效果圖
表1 兩種算法的局內點數(shù)
根據(jù)表1可以發(fā)現(xiàn),在相同約束條件下,RANSAC算法得到47個局內點,算法耗時0.005 s;偏最小二乘法得到41個局內點,算法耗時0.148 3 s。RANSAC算法對坐標點數(shù)據(jù)進行了多次迭代計算得到了最佳的模型,數(shù)據(jù)量較小,迭代次數(shù)并沒有對RANSAC算法的計算速度造成實質性影響,計算耗時遠小于偏最小二乘算法且得到的局內點大于偏最小二乘法,運算效率高;偏最小二乘法的擬合結果考慮了所有特征點的位置得出一條最佳直線,雖然這些特征點是已經經過剔除了大量誤匹配點的特征點,但仍存在一些較大的異常數(shù)據(jù)點會使擬合的函數(shù)模型偏離實際數(shù)據(jù),從而導致擬合的模型誤差較大;對于已經利用斜率距離約束后得到的條帶圖像的匹配點對,正確的特征點對數(shù)量較多,但仍存在一些異常數(shù)據(jù)點容易使得偏最小二乘算法得到偏離實際的函數(shù)模型。綜上,RANSAC算法提純聲吶圖像的特征點對效果更佳。
在利用RANSAC算法對條帶圖像匹配點對進行精確提取后,采用SURF算法鑲嵌原始聲吶條帶圖像以及USM算法銳化處理后的聲吶條帶圖像,最后采取小波融合對重疊區(qū)域進行融合。利用傳統(tǒng)鑲嵌辦法(地理編碼鑲嵌)進行對比,得到如下實驗結果,如圖3至圖5所示。
圖3 地理編碼鑲嵌圖
圖4 SURF算法鑲嵌圖
圖5 USM處理后的SURF算法鑲嵌圖
根據(jù)圖3至圖5的側掃聲吶鑲嵌圖像可以發(fā)現(xiàn),3種方法均在一定程度上實現(xiàn)了條帶與條帶的拼接。但采取地理編碼方法鑲嵌的聲吶圖像處于不同條帶的同一目標物未能較好的融合,出現(xiàn)較大錯位現(xiàn)象,圖像重疊區(qū)域灰度較深且整體灰度不均衡。采用SURF算法鑲嵌的聲吶目標物融合較好,無明顯錯位現(xiàn)象,圖像重疊區(qū)域灰度也更加均衡。USM算法是一種圖像銳化算法,能夠起到補償輪廓、突出邊緣信息的作用。采用USM算法處理后的SURF算法鑲嵌圖的目標物特征更為明顯,最大程度地保留了重疊區(qū)域的目標物特征。表2為融合圖像質量評價結果。
表2 融合圖像質量評價表
從表2可以發(fā)現(xiàn),3種方法進行鑲嵌后的聲吶圖像相較于單條帶圖像熵值均較大,說明鑲嵌之后的聲吶圖像所包含的信息量有所增加;采用USM銳化處理后的SURF算法鑲嵌圖的標準方差、信息熵、聯(lián)合熵均大于原始條帶SURF算法鑲嵌圖;原始條帶SURF算法鑲嵌圖的標準方差、信息熵、聯(lián)合熵均大于地理編碼鑲嵌圖。說明采用SURF算法進行聲吶圖像鑲嵌相較于地理編碼鑲嵌能顯著提高圖像的信息量,采用USM算法對聲吶圖像進行銳化處理,能有效加強圖像特征,提高圖像信息量,且融合后質量更好。
本文研究了一種基于SURF算法的側掃聲吶圖像精確鑲嵌方法。通過兩種誤匹配點剔除算法的實驗分析比較,選取RANSAC算法進行側掃聲吶圖像誤匹配點剔除。同時,采用 USM算法對原始條帶圖像進行圖像增強,能夠進一步提升相鄰條帶特征點的匹配精度。再結合小波融合法進行圖像鑲嵌。實驗結果表明,SURF算法解決了地理坐標鑲嵌造成的目標錯位問題,且對條帶圖像進行USM圖像銳化能夠有效增強圖像特征進而提高圖像匹配精度,實現(xiàn)了側掃聲吶圖像的精確鑲嵌。