胡文超,孫新柱,陳孟元
(安徽工程大學(xué) 安徽省電氣傳動(dòng)與控制重點(diǎn)實(shí)驗(yàn)室,安徽 蕪湖 241000)
同步定位與地圖構(gòu)建(simultaneous location and mapping,SLAM)就是運(yùn)動(dòng)載體利用自身攜帶的傳感器獲得周圍環(huán)境的地圖,同時(shí)確定自己在地圖中的位置[1]。機(jī)器人SLAM可以實(shí)現(xiàn)二維空間的經(jīng)歷圖構(gòu)建,但是對(duì)于空中某一高度的經(jīng)歷圖構(gòu)建,例如利用SLAM技術(shù)用經(jīng)歷圖來(lái)描述建筑物特定高度的外圍輪廓,機(jī)器人SLAM已經(jīng)不再適用。無(wú)人機(jī)可以在特定高度下飛行,利用無(wú)人機(jī)SLAM技術(shù)可以實(shí)現(xiàn)特定高度下二維經(jīng)歷圖的構(gòu)建。無(wú)人機(jī)SLAM問題應(yīng)用最成功的是概率的方法,如卡爾曼濾波算法[2]、擴(kuò)展卡爾曼濾波算法[3]、粒子濾波算法[4]等,文獻(xiàn)[5]將小型無(wú)人機(jī)的SLAM問題分解成路徑估計(jì)與環(huán)境地標(biāo)估計(jì)兩部分,分別采用粒子濾波器和擴(kuò)展卡爾曼濾波器進(jìn)行估計(jì),提出了一種小型無(wú)人機(jī)的FAST SLAM算法,運(yùn)算的復(fù)雜度大幅度降低,且能更好地表示非線性、非高斯運(yùn)動(dòng)模型,這些概率算法的優(yōu)勢(shì)是能夠處理傳感器與環(huán)境的模糊性,有很好的SLAM性能,但由于概率方法存在計(jì)算量大、搜索時(shí)間長(zhǎng)、易陷于局部最優(yōu)解等問題,故不能夠完全解決全局地圖構(gòu)建和導(dǎo)航問題。慣性導(dǎo)航設(shè)備是無(wú)人機(jī)最常用的導(dǎo)航與地圖構(gòu)建方案,其主要使用慣性/衛(wèi)星/磁傳感器/氣壓高度計(jì)組合導(dǎo)航,但是無(wú)人機(jī)在樓群之間、大型建筑物內(nèi)部或者山區(qū)等GPS信號(hào)較弱的地區(qū)飛行時(shí),由于缺乏衛(wèi)星導(dǎo)航系統(tǒng),慣性導(dǎo)航系統(tǒng)的誤差會(huì)不斷發(fā)散,很難實(shí)現(xiàn)準(zhǔn)確的導(dǎo)航與地圖構(gòu)建[6]。而視覺SLAM方法僅使用機(jī)載攝像頭作為外部傳感器,目前常用的是單目視覺SLAM[7]、雙目視覺SLAM[8]、RGB_D SLAM[9]、文獻(xiàn)[10]使用四旋翼飛行器搭載RGB_D傳感器并進(jìn)行SLAM系統(tǒng)研究,使用稀疏的RGB_D SLAM方法,提高無(wú)人機(jī)SLAM系統(tǒng)的實(shí)時(shí)性的同時(shí)也達(dá)到了高精度的效果。然而視覺SLAM算法對(duì)于光照依賴性較強(qiáng),必須在適宜的光照強(qiáng)度下,在黑暗或較暗的光強(qiáng)下,很難實(shí)現(xiàn)準(zhǔn)確的同步定位與地圖構(gòu)建;為了解決此類問題,出現(xiàn)了聲吶SLAM算法,聲吶SLAM與視覺SLAM相比,聲吶具有處理速度快、不受光線條件限制等優(yōu)點(diǎn),文獻(xiàn)[11]利用AUV上的聲吶傳感器持續(xù)探測(cè)非合作目標(biāo)并估計(jì)目標(biāo)航跡的同時(shí),利用探測(cè)到的AUV與目標(biāo)間的相對(duì)信息修正其自身航位推算帶來(lái)的累積估計(jì)誤差,從而提高AUV的自定位精度。但是聲吶SLAM的缺點(diǎn)在于獲取的信息量較少,空間分布分散,其感知信息存在較大的不確定性,因此生物聲吶逐漸作為研究的熱點(diǎn)。生物聲吶,能夠?qū)崿F(xiàn)在復(fù)雜的環(huán)境下進(jìn)行導(dǎo)航,因?yàn)樗鼜幕芈曋刑崛「嗟男畔?。文獻(xiàn)[12]提出可以模仿蝙蝠聲吶的發(fā)射與接收過程,利用仿生聲吶系統(tǒng)實(shí)現(xiàn)復(fù)雜環(huán)境下的定位與導(dǎo)航。
概率方法廣泛應(yīng)用于SLAM的同時(shí),澳大利亞昆士蘭大學(xué)Michael等[13]提出了一種基于復(fù)合位姿表征的嚙齒動(dòng)物海馬區(qū)擴(kuò)展模型(RatSLAM)。RatSLAM模型提出了一種位姿細(xì)胞網(wǎng)絡(luò),即連續(xù)吸引子網(wǎng)絡(luò),作為一種手段來(lái)進(jìn)行路徑積分。RatSLAM的路徑積分是通過里程計(jì)獲取速度與角度信息,同時(shí)使用視覺傳感器對(duì)里程計(jì)得到的信息進(jìn)行修正與更新,繪制精確的經(jīng)歷圖。文獻(xiàn)[14]已經(jīng)證明在RatSLAM基礎(chǔ)上,可以使用仿生聲吶模板來(lái)代替RatSLAM系統(tǒng)中的視覺模板,用雙耳平滑耳蝸圖來(lái)代替視覺圖像,可以實(shí)現(xiàn)在暗光或黑暗的條件下,使用BatSLAM模型來(lái)構(gòu)建二維經(jīng)歷圖。
BatSLAM模型通過雙耳平滑耳蝸圖作為仿生聲吶模板構(gòu)建二維經(jīng)歷圖,使用絕對(duì)差值和(SAD)模塊進(jìn)行處理產(chǎn)生局部場(chǎng)景,即通過計(jì)算所有模板中的耳蝸圖的像素亮度與當(dāng)前耳蝸圖的像素亮度之差并求和后與閾值相比較來(lái)進(jìn)行仿生聲吶模板的更新,但是此方法是基于外觀的低分辨率、并且只需判斷圖像外觀前后是否一致,不存在幾何處理和特征提取。耳蝸圖在獲取和傳輸過程中會(huì)產(chǎn)生各類噪音,相同位置獲得的回波信號(hào)構(gòu)建的耳蝸圖具有一定的差異,單獨(dú)使用SAD模塊處理會(huì)由于識(shí)別出錯(cuò)而導(dǎo)致二維經(jīng)歷圖的失真。
文獻(xiàn)[15]提出對(duì)視覺圖像進(jìn)行閉環(huán)檢測(cè),通常利用當(dāng)前幀和歷史幀的特征點(diǎn)匹配對(duì)數(shù),通過設(shè)定的閾值來(lái)判斷是否達(dá)到閉環(huán)狀態(tài)。對(duì)于音頻圖像,出現(xiàn)了可以進(jìn)行聲音識(shí)別的音頻感知哈希技術(shù)。音頻感知哈希是指可以代表一段音頻重要聲學(xué)特征的基于內(nèi)容的緊致數(shù)字簽名,其主要目的是建立一種有效機(jī)制來(lái)比較兩個(gè)音頻文件的感知聽覺質(zhì)量[16]。本文以音頻感知哈希檢索時(shí)的誤碼率作為標(biāo)準(zhǔn),將當(dāng)前耳蝸圖構(gòu)建的音頻感知哈希與模板庫(kù)中耳蝸圖構(gòu)建的音頻感知哈希相比較,當(dāng)最小誤碼率小于某一閾值時(shí),識(shí)別成功,完成閉環(huán)檢測(cè),從而實(shí)現(xiàn)經(jīng)歷圖的優(yōu)化。
采用一種可以在特定高度下進(jìn)行繪制二維經(jīng)歷圖的BatSLAM模型,使用仿生聲吶模板來(lái)代替RatSLAM系統(tǒng)中的視覺模板,用雙耳平滑耳蝸圖代替視覺圖像來(lái)構(gòu)建二維經(jīng)歷圖。使用仿生聲吶系統(tǒng)采集回波信號(hào),經(jīng)過一系列處理后將二次采樣的雙耳平滑耳蝸圖作為仿生聲吶模板,同時(shí)生成局部場(chǎng)景細(xì)胞。用位姿感知細(xì)胞來(lái)表示無(wú)人機(jī)在特定高度下的位置與方向。使用陀螺儀與加速度計(jì)信息來(lái)更新位姿感知細(xì)胞,使用仿生聲吶模板對(duì)應(yīng)的局部場(chǎng)景細(xì)胞來(lái)實(shí)現(xiàn)位姿感知細(xì)胞的修正,當(dāng)使用仿生聲吶模板識(shí)別失敗時(shí),則使用音頻感知哈希模板進(jìn)行位姿細(xì)胞的修正??紤]到單獨(dú)使用音頻感知哈希進(jìn)行修正會(huì)降低算法的實(shí)時(shí)性,所以選擇優(yōu)先使用仿生聲吶模板修正,輔助使用音頻感知哈希修正,在提高閉環(huán)檢測(cè)準(zhǔn)確率的同時(shí),實(shí)時(shí)性也不會(huì)有很大的影響。最后由位姿感知細(xì)胞、局部場(chǎng)景細(xì)胞與音頻感知哈希的相互聯(lián)系來(lái)實(shí)現(xiàn)二維經(jīng)歷圖的構(gòu)建與校正。改進(jìn)后的BatSLAM算法的結(jié)構(gòu)框圖如圖1。
圖1 改進(jìn)后的BatSLAM算法的結(jié)構(gòu)框圖Fig.1 Structure block diagram of the improved BatSLAM algorithm
蝙蝠發(fā)出高頻信號(hào),并對(duì)反射的回波信號(hào)進(jìn)行分析并進(jìn)行導(dǎo)航。在頭部相關(guān)傳遞函數(shù)(head function related transfer,HRTF)的基礎(chǔ)上,加入發(fā)射器與接收器的位置信息,采用echolation related transfer function(ERTF)進(jìn)行聲源定位。左耳與右耳ERTF濾波器如式(1)、式(2)所示。
式中: He(f,θ)表 示發(fā)射器方位,(f,θ)、(f,θ)分別表示左右接收器方位。頻率為 f, 角度 θ表示仿生聲吶系統(tǒng)中處于特定高度的反射器的方位角。
文獻(xiàn)[11]指出雙耳ERTF差是綜合了回聲譜、雙耳強(qiáng)度差(IID)和雙耳時(shí)間差(ITD)的聲源定位模型,包含了從目標(biāo)物到反射器位置的詳細(xì)方位信息,可以實(shí)現(xiàn)蝙蝠的回聲定位。
在多個(gè)反射器的作用下,左右耳蝸接收到的信號(hào)如式(3)、式(4)所示。
為了分析這些雙耳回波信號(hào)的生理學(xué)時(shí)頻特性,使用Gammatone聽覺濾波器組來(lái)模擬蝙蝠耳廓聽覺頻率響應(yīng),其時(shí)域表達(dá)式為式中: fc(n)為中心頻率;b為帶寬。對(duì)于接收到的回波信號(hào)經(jīng)過Gammatone濾波器組處理后,使用得到的Gammatone耳蝸能量譜來(lái)表示回波信號(hào)的時(shí)頻特性,接下來(lái)進(jìn)行一階低通濾波,分別得到左耳與右耳耳蝸圖,計(jì)算公式如式(6)、式(7)所示。式 中 : XL(t) 、 XR(t)分 別 為 左 耳 與 右 耳 耳 蝸 圖 ,ulp(t)為 一階低通濾波, xL(t)、 xR(t)為左耳與右耳接收的信號(hào)。
在BatSLAM模型中,將構(gòu)建的耳蝸圖模型作為仿生聲吶模板,在使用耳蝸圖作為仿生聲吶模板時(shí),必須注意對(duì)無(wú)人機(jī)位置細(xì)微的變化進(jìn)行處理,及時(shí)進(jìn)行二次采樣的單聲道耳蝸圖使系統(tǒng)更加具有魯棒性。這里使用高斯濾波器進(jìn)行平滑處理,進(jìn)一步排除細(xì)小位置改變帶來(lái)的影響。二個(gè)平滑和二次采樣的單聲道耳蝸圖連接起來(lái),形成一個(gè)雙耳平滑耳蝸圖如式(8)所示。
使用標(biāo)準(zhǔn)化雙耳平滑耳蝸圖,計(jì)算公式為
將標(biāo)準(zhǔn)化雙耳平滑耳蝸圖作為當(dāng)前仿生聲吶模板,計(jì)算公式為
定高飛行的無(wú)人機(jī)在特定的位姿狀態(tài)時(shí),處于空間位姿感知細(xì)胞網(wǎng)絡(luò)(X,Y,θ)中,通過連續(xù)吸引子網(wǎng)絡(luò)(CAN)控制無(wú)人機(jī)位姿感知網(wǎng)絡(luò)內(nèi)部的活動(dòng)。路徑積分是通過轉(zhuǎn)換每個(gè)位姿感知細(xì)胞基于無(wú)人機(jī)加速度計(jì)速度、陀螺儀角速度和(X,Y,θ)坐標(biāo)的活動(dòng)來(lái)更新姿態(tài)細(xì)胞的活動(dòng),同時(shí)使用仿生聲吶模板的比較來(lái)保持和修正位姿信息,從而實(shí)現(xiàn)位姿感知細(xì)胞的重定位。
1) CAN模型
位姿細(xì)胞內(nèi)部動(dòng)態(tài)過程主要包括興奮度更新,對(duì)所有細(xì)胞的全局抑制。使用一個(gè)三維離散高斯分布來(lái)創(chuàng)建興奮度權(quán)重矩陣 ε,如式(11)所示:
式中: km、 kn分別表示位置與方向的常數(shù);a、b、c為x′、 y′、 θ′的分布系數(shù)。
由于興奮性造成的位姿感知細(xì)胞的活動(dòng)變化如式(12)所示:
式中: Nx′,Ny′,Nθ′為 (x′,y′,θ′)空間中的位姿感知細(xì)胞三維矩陣元素。 Pabc為位姿感知細(xì)胞的活動(dòng)系數(shù),對(duì)于位姿感知細(xì)胞的活動(dòng)變化的全局抑制如式(13)所示:
式中:抑制常數(shù) φ控制全局抑制水平且興奮度水平被限制在非負(fù)數(shù)范圍。
2)直觀的路徑積分
該模型的路徑積分方法是轉(zhuǎn)換現(xiàn)有位姿感知細(xì)胞的活性而不是立即將當(dāng)前活性復(fù)制傳遞。該過程使其性能獨(dú)立于感知變化更新速率和加速度計(jì)速度與陀螺儀角速度,不僅能生成更加準(zhǔn)確的無(wú)人機(jī)飛行軌跡,并且不需要參數(shù)調(diào)整。經(jīng)過路徑積分后,被更新的位姿感知細(xì)胞活性為如式(14)所示:
式中: kx′、 ky′、 kθ′是路徑積分常數(shù);v表示加速度計(jì)速度;w表示陀螺儀得到的角速度。
3)仿生聲吶模板修正位姿感知細(xì)胞
采用雙耳平滑耳蝸圖作為仿生聲吶模板,局部場(chǎng)景細(xì)胞由一個(gè)一維細(xì)胞陣列組成,每個(gè)細(xì)胞單元對(duì)應(yīng)一個(gè)特定的仿生聲吶模板。在路徑積分時(shí),由于位置和方向上的累計(jì)誤差,使用仿生聲吶模板來(lái)進(jìn)行修正。對(duì)于每個(gè)新的場(chǎng)景,算法會(huì)建立新的仿生聲吶模板,同時(shí)建立局部場(chǎng)景細(xì)胞與位姿感知細(xì)胞間的聯(lián)系。進(jìn)行更新的連接強(qiáng)度如式(16)所示:
式中: Gi為局部場(chǎng)景細(xì)胞的活動(dòng)水平; Px′y′θ′為位姿感知細(xì)胞的活動(dòng)水平;λ表示加權(quán)值。
對(duì)于每一個(gè)雙耳平滑耳蝸圖使用絕對(duì)差值和SAD模塊進(jìn)行處理產(chǎn)生局部場(chǎng)景。SAD模塊將當(dāng)前耳蝸圖與模板庫(kù)中的耳蝸圖進(jìn)行比較,通過計(jì)算所有模板中耳蝸圖的像素亮度與當(dāng)前耳蝸圖的像素亮度之差,如式(17)所示:
式中: Ucur表示當(dāng)前耳蝸圖的像素亮度; Ui表示數(shù)據(jù)庫(kù)中的第i個(gè)仿生聲吶模板的像素亮度。如果像素亮度之差低于某一閾值 τ,當(dāng)前耳蝸圖被識(shí)別出來(lái),對(duì)位姿感知細(xì)胞進(jìn)行校正:
如果像素亮度之差高于某一閾值 τ,當(dāng)前耳蝸圖成為新的仿生聲吶模板并加入到模板庫(kù)中。閾值τ為
式中: nG為數(shù)據(jù)庫(kù)中的仿生聲吶模板的數(shù)量; αt為調(diào)整系統(tǒng)的比例因子, αt設(shè)置為0.5。
1)音頻感知哈希
音頻感知哈希是音頻數(shù)據(jù)集到音頻感知摘要集的單向映射,將具有相同感知內(nèi)容的音頻數(shù)字表示唯一地映射為一段數(shù)字摘要。映射關(guān)系為PH,如式(20)所示, ph感知哈希(perceptual hash):
生成的數(shù)字摘要稱為感知哈希(perceptual hash)。在感知哈希映射作用下,音頻信息間主觀測(cè)度下的感知距離轉(zhuǎn)化為感知哈希間的客觀可計(jì)算的數(shù)學(xué)距離 n ∈N。
2)音頻感知哈希的生成
仿生聲吶系統(tǒng)將收集到的音頻信號(hào)B作為感知哈希函數(shù)的輸入,使用一組具有8通道的Gammatone濾波器進(jìn)行濾波,將濾波后的的數(shù)據(jù)根據(jù)頻帶高低進(jìn)行排序,由低到高分別為 S1,S2,···,S8。使用Gammatone耳蝸能量譜來(lái)對(duì)回波信號(hào)的時(shí)頻特性進(jìn)行表示。將每一個(gè)頻帶的數(shù)據(jù){,,···,}實(shí)行90%重疊后進(jìn)行分幀,每幀20 ms(即
80個(gè)采樣點(diǎn)),矩陣W作為能量譜矩陣,對(duì)于能量譜矩陣?yán)锩恳粋€(gè)元素 W(n,L),如式(21)所示:
式中: Δ2Qk是 對(duì) Qk做 二階差分, Rk長(zhǎng)度為6。最后對(duì)得到的結(jié)果實(shí)行二值化處理,音頻感知哈希Y如式(23)所示。
式中:音頻感知哈希生成過程如圖2所示。
圖2 音頻感知哈希生成Fig.2 Audio perception Hashi generation
3)音頻感知哈希模板修正
對(duì)于每個(gè)新的場(chǎng)景,算法會(huì)建立新的音頻感知哈希模板。同時(shí)建立音頻感知哈希與位姿感知細(xì)胞間的聯(lián)系。進(jìn)行更新的連接強(qiáng)度如式(24)所示:
式中: Yi指的是第i個(gè)音頻感知哈希模板。這里采用誤碼率P=Vi/V來(lái)衡量任意二個(gè)音頻感知哈希之間的相似水平,V表示待識(shí)別音頻感知哈希碼元個(gè)數(shù),Vi表示模板庫(kù)中的音頻感知哈希進(jìn)行對(duì)比時(shí)出現(xiàn)錯(cuò)誤的個(gè)數(shù)。將當(dāng)前音頻感知哈希和數(shù)據(jù)庫(kù)中音頻感知哈希進(jìn)行對(duì)比,若低于閾值 γ則
對(duì)位姿感知細(xì)胞進(jìn)行修正:
如果高于閾值 γ,當(dāng)前音頻感知哈希成為新的音頻感知哈希模板并加入到音頻感知哈希模板庫(kù)中。
每個(gè)經(jīng)驗(yàn) exi,yi,θi= 〈Ei,Pxi,yi,θi,Yi,Gi〉關(guān)聯(lián)經(jīng)驗(yàn)?zāi)芗?jí)Ei, 位姿細(xì)胞 Pxi,yi,θi和局部場(chǎng)景細(xì)胞 Gi,與音頻感知哈希模板 Yi,第i個(gè)經(jīng)驗(yàn)如式(26)所示:
當(dāng)前位姿感知細(xì)胞的活性或當(dāng)前的音頻感知哈希決定經(jīng)驗(yàn)?zāi)芗?jí) Ei的各組成要素,如式(27)所示。
使用當(dāng)前位姿信息、音頻感知哈希和仿生聲吶模板與經(jīng)歷圖進(jìn)行匹配時(shí),當(dāng)?shù)竭_(dá)經(jīng)驗(yàn)過的地方時(shí),進(jìn)行一次閉環(huán)檢測(cè),并對(duì)經(jīng)歷圖進(jìn)行校正,經(jīng)驗(yàn)位姿改變?nèi)缡?28)所示:
式中:α為校正常數(shù), Nf為經(jīng)驗(yàn)i到其他經(jīng)驗(yàn)的連接數(shù), Nt為從其他經(jīng)驗(yàn)到經(jīng)驗(yàn)i的連接數(shù)。
本文是通過I2C協(xié)議來(lái)讀取MPU6050數(shù)據(jù),獲取的傳感器數(shù)據(jù)經(jīng)過預(yù)處理后,經(jīng)過互補(bǔ)濾波算法進(jìn)行數(shù)據(jù)融合,通過姿態(tài)解算獲取四旋翼飛行器的姿態(tài)角與位置,由SPI總線將數(shù)據(jù)發(fā)送到定高飛行的無(wú)人機(jī)控制器。使用氣壓計(jì)MES5611來(lái)獲取氣壓數(shù)據(jù)。因?yàn)闅鈮褐蹬c海拔高度成固定的比例,通過氣壓計(jì)數(shù)據(jù)轉(zhuǎn)換為海拔高度:
式中:Alt是海拔高度,m; P0為1 013.25 hPa.
通過3個(gè)超聲波換能器作為蝙蝠的耳朵和嘴,3個(gè)超聲波換能器按照“一字型”進(jìn)行排列。“二耳”分別將采集的信息通過信號(hào)接收電路,經(jīng)過AD芯片轉(zhuǎn)換為數(shù)字信號(hào)傳遞給四旋翼飛行器的STM32主控芯片;STM32主控芯片發(fā)出信號(hào),經(jīng)過信號(hào)處理電路后使用“嘴”發(fā)出聲波,仿生聲吶系統(tǒng)采集音頻信號(hào)并傳輸給上位機(jī)獲得左右耳蝸圖。
圖3表示為2組不同回波信號(hào)的Gammatone耳蝸能量譜。分別含有了3段回波信號(hào)的最初版本、帶噪聲版本、高斯平滑處理版本。耳蝸能量譜的縱軸表示不同的頻帶,橫軸表示不同時(shí)間,能量值越高對(duì)應(yīng)的顏色也相應(yīng)較深。由圖3可以發(fā)現(xiàn),兩組音頻信號(hào)獲得的能量譜具有很大的不同,而相同音頻雖然經(jīng)過不同的處理,但是相鄰頻帶間能量差異依然沒有較大改變。所以可以通過耳蝸能量譜進(jìn)行特征提取構(gòu)建音頻感知哈希。
圖3 最初音頻和處理后的音頻耳蝸能量譜比較Fig.3 Comparison of the energy spectrum between the initial and the processed audio cochlea.
為了分析不同噪音條件下改進(jìn)算法與原算法的閉環(huán)檢測(cè)的準(zhǔn)確率,這里選取典型的兩種噪音,即高斯噪音與椒鹽噪音。設(shè)計(jì)了外加高斯噪音、椒鹽噪音和未添加噪音下的準(zhǔn)確率-召回率對(duì)比試驗(yàn)。選取其中一個(gè)耳蝸圖模板,得到不同噪音版本與原始版本的耳蝸圖對(duì)比如圖4所示。
圖4 不同噪音版本與原始版本耳蝸圖對(duì)比Fig.4 Comparison of different noise versions and original versions of cochlea
為了分析不同噪音對(duì)于閉環(huán)檢測(cè)準(zhǔn)確性的影響,本文使用準(zhǔn)確率P、召回率R來(lái)分析不同條件下2種算法的性能。其表達(dá)式如式(30)、式(31)所示。
式中:TP表示正確識(shí)別的閉環(huán)經(jīng)驗(yàn)單元,F(xiàn)P表示錯(cuò)誤識(shí)別的閉環(huán)經(jīng)驗(yàn)單元,F(xiàn)N表示未識(shí)別的實(shí)際閉環(huán)經(jīng)驗(yàn)單元。BatSLAM算法和基于音頻感知哈希閉環(huán)檢測(cè)的BatSLAM算法在不同條件下的準(zhǔn)確率、召回率如表1、2所示。
表1 BatSLAM在不同條件下的準(zhǔn)確率、召回率Table1 The accuracy and recall rate of BatSLAM under different conditions
表2 基于音頻感知哈希的BatSLAM在不同條件下的準(zhǔn)確率、召回率Table2 The accuracy and recall rate of BatSLAM based on audio perception Hashi under different conditions
通過表1、2可得,在無(wú)噪音條件下,兩種算法的準(zhǔn)確率大體相同分別為99.06%和100%,但是對(duì)于召回率,改進(jìn)后的算法具有明顯提高,未識(shí)別的實(shí)際閉環(huán)經(jīng)驗(yàn)單元數(shù)量明顯減少。當(dāng)噪聲干擾較小時(shí),即高斯噪音,準(zhǔn)確率提高程度不太明顯,當(dāng)噪音干擾較大時(shí),即椒鹽噪音,其準(zhǔn)確率具有顯著提高,因?yàn)楦倪M(jìn)后的算法不僅考慮到外觀,而且考慮到相鄰頻帶間的能量差異,從而提高了正確識(shí)別的閉環(huán)經(jīng)驗(yàn)單元數(shù)量。當(dāng)存在多種噪音時(shí),基于音頻感知哈希的BatSLAM算法具有明顯優(yōu)勢(shì),提高了閉環(huán)檢測(cè)的準(zhǔn)確率。
本文首先設(shè)計(jì)了硬件平臺(tái)數(shù)據(jù)處理方案,實(shí)現(xiàn)了對(duì)MPU6050姿態(tài)數(shù)據(jù)、氣壓計(jì)MES5611的數(shù)據(jù)以及音頻數(shù)據(jù)的采集與處理;然后將無(wú)人機(jī)定高飛行過程中獲取的姿態(tài)數(shù)據(jù)與仿生聲吶系統(tǒng)獲取的音頻數(shù)據(jù)上傳到上位機(jī)進(jìn)行了MATLAB仿真實(shí)驗(yàn)分析,來(lái)驗(yàn)證改進(jìn)算法的可行性。
選取室外高度為1 m的橢圓形方桌構(gòu)建的環(huán)形空間作為實(shí)驗(yàn)場(chǎng)地,使用GPS獲取位置信息作為基準(zhǔn)。無(wú)人機(jī)分別使用BatSLAM算法和基于音頻感知哈希的BatSLAM算法在暗光條件下以1 m的特定高度進(jìn)行繞圈實(shí)驗(yàn),起始點(diǎn)為A,終點(diǎn)為B,圖5和圖6中A與B點(diǎn)代表相同的實(shí)際位置。如圖5所示,BatSLAM算法構(gòu)建的經(jīng)歷圖在第一圈時(shí),由于聲吶模板修正,當(dāng)?shù)竭_(dá)終點(diǎn)B時(shí),自動(dòng)定位到起點(diǎn)A,繼續(xù)導(dǎo)航,當(dāng)?shù)竭_(dá)C點(diǎn)時(shí),由于耳蝸圖在獲取和傳輸過程中會(huì)產(chǎn)生各類噪音,僅僅使用SAD處理方法會(huì)導(dǎo)致識(shí)別出錯(cuò),同時(shí)因?yàn)榧铀俣扔?jì)與陀螺儀漂移出現(xiàn)了C-D間的誤差偏移,當(dāng)?shù)竭_(dá)D點(diǎn)時(shí),再次識(shí)別成功,自動(dòng)定位到E點(diǎn),繼續(xù)導(dǎo)航。如圖6所示,將音頻感知哈希算法融合進(jìn)入的BatSLAM算法,經(jīng)歷圖在第一圈時(shí),由于聲吶模板-音頻感知哈希修正,當(dāng)?shù)竭_(dá)終點(diǎn)B時(shí),自動(dòng)定位到起點(diǎn)A,繼續(xù)導(dǎo)航,雖然在導(dǎo)航過程會(huì)存在各種噪音干擾,但是當(dāng)使用仿生聲吶模板識(shí)別失敗時(shí),自動(dòng)調(diào)用音頻感知哈希進(jìn)行修正,因此第二圈軌跡與第一圈基本重合。因?yàn)槁晠饶0?音頻感知哈希修正不僅考慮到外觀,而且考慮到相鄰頻帶間的能量差異,提高了閉環(huán)檢測(cè)的準(zhǔn)確性?;谝纛l感知哈希閉環(huán)檢測(cè)的BatSLAM算法不僅完成了無(wú)人機(jī)特定高度和暗光條件下的二維經(jīng)歷圖繪制,而且提高了閉環(huán)檢測(cè)準(zhǔn)確率,減小了軌跡偏差,改善了經(jīng)歷圖的失真,實(shí)現(xiàn)了經(jīng)歷圖優(yōu)化。
圖5 BatSLAM經(jīng)歷圖Fig.5 BatSLAM experience diagram
圖6 基于音頻感知哈希閉環(huán)檢測(cè)的BatSLAM經(jīng)歷圖Fig.6 BatSLAM experience graph based on audio perception Hashi closed loop detection
本文提出的基于音頻感知哈希閉環(huán)檢測(cè)的BatSLAM模型不僅實(shí)現(xiàn)了無(wú)人機(jī)特定高度和暗光條件下的二維經(jīng)歷圖繪制,同時(shí)改善單獨(dú)使用SAD模塊處理所導(dǎo)致二維經(jīng)歷圖失真問題,而且提高了閉環(huán)檢測(cè)的準(zhǔn)確率,減小了軌跡偏差,從而實(shí)現(xiàn)經(jīng)歷圖的優(yōu)化?;诒舅惴ǖ臒o(wú)人機(jī)SLAM技術(shù)具有適應(yīng)性強(qiáng)的優(yōu)勢(shì),可以擺脫對(duì)于GPS的依賴,不受光照強(qiáng)度的限制等,可以適用于各種復(fù)雜的外界環(huán)境下,如礦洞、樓群間、山區(qū)等。同時(shí)具有廣泛的實(shí)際應(yīng)用前景,可以實(shí)現(xiàn)無(wú)人機(jī)自主導(dǎo)航的同時(shí)并在固定高度下對(duì)農(nóng)作物進(jìn)行灌溉;模仿蝙蝠在洞穴中躲避空中鐘乳石的原理,實(shí)現(xiàn)在室內(nèi)或室外復(fù)雜環(huán)境下躲避空中障礙物;實(shí)現(xiàn)建筑物特定高度外圍輪廓的的二維經(jīng)歷圖構(gòu)建等。本文僅僅進(jìn)行了簡(jiǎn)單地形環(huán)境下的SLAM二維經(jīng)歷圖的構(gòu)建并證明了算法的合理性與可行性,復(fù)雜環(huán)境下的SLAM二維經(jīng)歷圖的構(gòu)建將是接下來(lái)的工作重點(diǎn),正在深入研究中。