李邱達,邊春華,張 維,文 杰
(中核核電運行管理有限公司,浙江 嘉興 314300)
隨著機器人和傳感技術的最新進展,微小型自主水下機器人已應用于人類無法進入或不安全地區(qū)的各種水下任務。尤其是,由于安全原因,人類潛水員的現有檢查方法存在明顯的局限性。因此,水上結構物的目視檢查是無人潛水器的一種典型應用[1]。使用水下機器人系統進行自主視覺檢查可以提高操作安全性和任務的實際性能。對于自主視覺檢查,非常希望能夠創(chuàng)建視覺地圖并同時相對于地圖定位車輛,稱為視覺同步定位和映射(SLAM),基于特征的成對圖像配準是視覺SLAM前端級的常用方案[2]。通常,視覺特征稀疏地位于水下結構物的表面。這種環(huán)境特征可能導致在成對圖像配準時產生無意義計算,主要有兩個原因:①視覺上無信息的圖像的特征提??;②條件較差的圖像的特征匹配[3]。該研究提出了一種選擇性圖像配準方案,該方案包括兩個附加步驟:關鍵幀選擇和關鍵對選擇。所提出的方法既可以有效地拒絕非信息圖像,又可以減少成對圖像匹配的無意義嘗試,因此預計它將提高視覺SLAM的總體計算效率。
使用增強狀態(tài)卡爾曼濾波器來解決基于視覺的姿態(tài)估計問題。在預定義的圖像采集模式下(即,使用所有輸入圖像或僅使用關鍵幀圖像),擴增狀態(tài)向量定義如下:
這里,x是表示車輛當前姿勢的狀態(tài)向量。車輛狀態(tài)定義為三維位置坐標和航向角(即x=[x y z]),考慮到機器人的運動通常在橫搖和俯仰中充分穩(wěn)定[4]。增強狀態(tài)的其他元素{x,i=0,…,k-1}表示以前狀態(tài)的歷史,收集的姿勢對應于姿勢圖結構中的節(jié)點[5]。隨著歷史姿態(tài)節(jié)點的增加,相應的誤差協方差矩陣也隨之增加[6]。本研究中制定的SLAM濾波器使用兩種不同類型的觀測值:一個是局部參考坐標系中z方向上的絕對深度測量,另一個是通過成對圖像配準獲得的相對姿態(tài)測量(即相機測量)。假設各測量噪聲項遵循零均值高斯分布。
可見光在水中的顯著衰減和散射,導致低對比度和不均勻照明獲取的水下圖像中的效果。為了增強原始灰度圖像的可見性,采用對比度受限自適應直方圖均衡化(CLAHE)作為預處理步驟,然后使用尺度不變特征變換(SIFT)提取顯著特征并計算描述符向量。
隨后,使用SIFT描述符執(zhí)行成對匹配步驟來估計圖像配準模型,并從中獲得相對姿態(tài)測量。這里,使用二維單應模型進行圖像配準,假設從水下結構表面獲得的局部場景近似平面。初始匹配結果可能有不正確的對應關系,稱為異常值[7]。為了去除異常值并確定圖像對之間的主導單應模型,使用隨機樣本一致性(RANSAC)方法作為一種穩(wěn)健的模型擬合算法。剔除異常值后,通過正交回歸從內部對應計算出相對單應。
通過一系列的坐標變換,將UUV的相對姿態(tài)信息從產生的單應圖中提取出來,并利用相機內部參數和高度測量來解決相對平移信息中固有的尺度模糊性。
式中,
典型的運動結構(SFM)方法從一系列視頻幀中估計攝像機運動和3-D場景結構。然而,在使用的應用程序中,低程度的時間圖像重疊(通常是35%或更少的數字靜止圖像)促使專業(yè)人員專注于從空間相鄰的圖像幀中恢復成對測量。在這種方法中,攝像機提供了模尺度姿態(tài)之間的6-DoF相對坐標轉換的觀測(通過計算基本矩陣)。這些測量值在遞歸估計中用作約束框架,確定與相機測量和導航一致的全局姿態(tài),全局姿態(tài)對應于與圖像采集相關的時間點機器人軌跡的樣本。因此,與典型的基于特征的SLAM估計問題不同,它跟蹤當前機器人姿態(tài)和相關的地標地圖,視覺增強導航(VAN)狀態(tài)向量完全由圖像采集時采樣的歷史軌跡樣本組成。在命名法中,這些樣本被稱為延遲態(tài)。
延遲狀態(tài)方法對應于基于視圖的環(huán)境表示,其中估計傳感器導航提供了時間(Markov)觀測,而重疊圖像提供了時間和非時間(即空間圖像重疊)姿態(tài)約束。這種基于視圖的方法可以通過文獻追溯到Lu和Milios使用激光距離數據的批量掃描匹配方法。Leonard和Rikoski的延遲決策框架,用于聲納數據的特征初始化,以及Fleischer和McLauchlan使用相機圖像的混合批處理/遞歸公式。在這種情況下,成對注冊的圖像可以觀察到機器人相對于之前訪問過的地方進行運動。
所提出的關鍵幀選擇方法基于CLAHE的直方圖均衡圖像。首先,采用高斯差分(DoG)濾波器來識別預處理圖像中每個點的清晰度。由DoG濾波器創(chuàng)建的獨特性圖像ID表示為
其中,I表示直方圖均衡圖像;G(kσ)和G(σ)分別是具有不同尺度kσ和σ的高斯核函數。
使用DoG的兩個主要原因如下:①高斯尺度歸一化拉普拉斯(LoG)被認為是圖像最穩(wěn)定的顯著性檢測器,并且DoG是歸一化LoG的合理且計算效率高的近似值;②本工作中使用的SIFT算法還利用DoG函數來尋找候選特征。因此,得到的圖像中的顯著性值可以反映與SIFT特征的接近趨勢。
SIFT特征點是通過尺度層及其相鄰層應用非最大抑制來確定的。盡管所提出的方法由于其計算負擔而沒有顯示生成尺度空間,但如果原始尺度層中的顯著性值遠遠大于相鄰值的顯著性值,則該點很可能是SIFT特征??紤]到這一點,采用相對于顯著性值的梯度,并將梯度的大小規(guī)格化如下
其中,歸一化項可以直觀地近似為ID∈(-Imax,Imax),Imax表示最大強度值,對應于白色像素。
基于DoG的歸一化梯度,引入了一種定量度量來表示每個圖像的信息性。為此,定義了以下關鍵幀度量,其表示歸一化梯度的比率大于閾值Gt。
這里,F(·)表示與標準化梯度之比相關的累積分布函數形象。
圖2描述了使用水下圖像數據集的初步測試結果。這里,針對每個圖像計算并呈現了所提出的關鍵幀度量(Sf)。此外,SIFT提取的特征數量(Nf)被表示為確認計算值的有效性。從結果評估和比較中可以看出,計算的關鍵幀度量與SIFT特征的數量成正比例。使用水下圖像數據集對所提出的關鍵措施進行初步測試的結果,用于測試的水下圖像在圖1(a)~圖1(b)中以紋理豐富度的遞減順序顯示,圖1(c)、圖1(d)分別表示與每個測試圖像相對應的DoG歸一化梯度的統計直方圖和累積分布。在每個分布圖中指定關鍵幀度量(Sf)和SIFT特征的數量(Nf)。
圖1 使用水下圖像進行初步測試的結果Fig.1 Results of preliminary test using underwater images
圖2 測試結果圖Fig.2 Test results
通過評估相機測量的預期不確定性,計算關鍵對度量以確定是否執(zhí)行特征匹配步驟。作為高斯隨機向量的攝像機測量值zc表示為
式(7)中:Δxi,j,Δyi、j和Δψi,j表示相對x,y平移以及第i和第j之間航向角的變化第j個圖像;∑c是相對姿勢觀察。
假設相機測量主要受比較圖像之間的相對單應性影響。因此,為了公式化相機測量的預期不確定性,單應性參數也被視為高斯隨機向量,如式(8)所示。
其中,平均向量h由H ij的元素組成,∑h表示相應的協方差矩陣。
一對圖像之間的重疊區(qū)域通過以下方式估計:與比較圖像相關的導航姿態(tài)信息(即,增強狀態(tài)向量的當前估計)。在預期的重疊區(qū)域中,認為相機測量的不確定性受到每個特征位置的不確定性和用于擬合相對單應性模型的對應觀察數的影響。通過文獻中提出的方法獲得特征位置的不確定性[8],對應觀測值的數量近似為重疊區(qū)域中的特征數量?;谠撔畔?,通過協方差更新方程以貝葉斯遞歸估計的方式計算期望單應性不確定性。
鍵對測量的測試結果如圖2,示例圖像是從將過去圖像映射到各個目標圖像。所得到的密鑰對度量值越高,意味著對應的圖像越有可能基于重疊區(qū)域(藍色矩形)中的特征觀察(黃色圓圈點)實現成功的圖像配準。圖2為擬定關鍵空氣措施的初步測試結果。圖2(a)以及圖2(b)描繪高度可能的圖像以實現成功的圖像配準。盡管圖2(a)的預期重疊區(qū)域小于圖2(b)的重疊區(qū)域,但由于特征觀察的數量較多,圖2(a)中的關鍵對得分高于圖2(b)中的。
如圖3所示,在位于KAIST的室內水箱中使用可懸停的自主水下機器人獲得了一個實驗數據集。室內水箱長15m,寬10m,深1.6m。由于污漬和變色斑點導致的非結構化特征很少出現在地板表面,自主水下機器人被控制為遵循給定路徑并保持距水面都有恒定的深度。
圖3 實驗系統及場地Fig.3 Experimental system and site
在實驗裝置中,沒有能夠提供地面真實軌跡數據的絕對定位系統。因此,采用全局束調整(GBA)技術繪制全局優(yōu)化軌跡,作為參考數據。相對于GBA軌跡比較航位推算軌跡,不應用選擇性圖像配準的窮舉基線視覺SLAM的結果以及通過具有選擇性圖像配準的視覺SLAM估計的軌跡。圖4為航位推算(DR)和估計軌跡之間的定性比較。黑線表示GBA結果中的參考軌跡,洋紅線是基于IMU和DVL測量的航位推算結果,藍線表示在無選擇性圖像配準的情況下通過窮舉視覺的基線軌跡,紅線表示通過所提出的具有選擇性圖像配準的視覺SLAM估計得到的軌跡。如圖4所示,無論是否采用選擇性圖像配準方法,視覺SLAM結果顯示出比DR結果更精確的軌跡。此外,所提出的具有選擇性圖像配準的視覺SLAM具有與基線結果相當的精度。
圖4 估計軌跡的比較Fig.4 Comparison of estimated trajectories
本文針對水下結構物表面視覺特征分布不均勻的特點,提出了一種基于圖像配準的微小型自主水下機器人視覺全局定位SLAM算法。所提出的選擇性圖像配準方法可以在特征提取和特征匹配之前評估每個圖像的潛在效用和比較圖像的成對有效性,這是一種計算代價高昂的過程。通過使用自主水下機器人平臺獲得的一系列實驗數據,證明了所提出的視覺全局定位法SLAM的有效實用性。