李 娟, 張秉健, 楊莉娟, 王蒙迪
(1. 哈爾濱工程大學(xué)水下機器人技術(shù)重點實驗室, 黑龍江 哈爾濱 150001; 2. 哈爾濱工程大學(xué)自動化學(xué)院, 黑龍江 哈爾濱 150001; 3. 江南造船(集團)有限責(zé)任公司, 上海 201913)
隨著現(xiàn)代科學(xué)技術(shù)的不斷發(fā)展,越來越多的國家利用自主水下航行器(autonomous underwater vehicles, AUV)系統(tǒng)來進行海洋開發(fā)和水下目標(biāo)搜索[1-2],AUV已經(jīng)成為許多國家海洋戰(zhàn)略研究中的重要技術(shù)領(lǐng)域。當(dāng)AUV處于完全未知的區(qū)域中時,由于水下環(huán)境變化復(fù)雜,水下通信的信號微弱、環(huán)境噪聲對AUV的任務(wù)干擾性大等特點[3],要求AUV能夠利用對外界環(huán)境的感知[4],自主高效地實時規(guī)劃任務(wù)航線來對該區(qū)域?qū)崿F(xiàn)目標(biāo)搜索。在完全未知的水下環(huán)境中執(zhí)行目標(biāo)搜索任務(wù)時,還要求其能夠識別目標(biāo),并通過觀測獲取目標(biāo)特征信息。近年來,傳統(tǒng)方法以搜索論為基礎(chǔ),實現(xiàn)水下梳子型掃描,或者預(yù)先離線設(shè)計覆蓋任務(wù)區(qū)域的多AUV搜索航跡[5-7]。在未知環(huán)境中,目標(biāo)的環(huán)境信息未知,無法進行預(yù)先規(guī)劃,只能根據(jù)任務(wù)執(zhí)行過程中實時感知的環(huán)境信息進行在線航跡決策。
未知環(huán)境下目標(biāo)搜索和定位問題[8-11]備受國內(nèi)外學(xué)者的關(guān)注。文獻[12]提出了基于預(yù)測控制思想的協(xié)同區(qū)域搜索算法,研究了各種通信限制對區(qū)域搜索功能的影響,提高了區(qū)域搜索效能;文獻[13]提出了分散控制算法,用于細(xì)菌啟發(fā)性搜索目標(biāo),提高計算效率;文獻[14]提出了強魯棒性蟻群優(yōu)化和杜鵑搜索優(yōu)化方法,該方法建立在三維路徑規(guī)劃時,其路徑長度優(yōu)于其他算法;文獻[15]針對洋流對AUV目標(biāo)搜索的影響,提出了基于粒子群優(yōu)化和速度合成算法,進一步提高AUV工作效率,降低能量消耗;文獻[16]提出分步方案來解決多體協(xié)同搜素和區(qū)域覆蓋,搜索機器人提供先驗的環(huán)境概況,而服務(wù)機器人則根據(jù)先驗信息來完成后驗更新,提高了搜索效率,但增加了能源消耗;文獻[17-18]通過未知環(huán)境中移動機器人用于監(jiān)視任務(wù)最大化,提出了自適應(yīng)算法,該方法通過不斷地適應(yīng)性調(diào)整來完成監(jiān)視任務(wù),但該算法在航跡規(guī)劃中,對視域范圍內(nèi)獲取信息的情況有很強的依賴性。近年來,智能仿生算法在AUV路徑規(guī)劃中的應(yīng)用十分廣泛,常見的的算法包括蟻群算法[19-20]、粒子群優(yōu)化算法[21]、神經(jīng)網(wǎng)絡(luò)算法[22]與遺傳算法[23-24]等。相比于傳統(tǒng)搜索論,這些方法雖然在已知環(huán)境下的全局優(yōu)化搜索方面較為明顯,但在未知環(huán)境下缺乏靈活規(guī)劃航跡能力,不能較全面地觀測目標(biāo)特征,搜索效率較低,適應(yīng)性差。
本文首先分配分布式結(jié)構(gòu)體系的多AUV協(xié)同搜索目標(biāo),考慮到傳感器與運動過程中非線性噪聲影響,分析未知環(huán)境下的目標(biāo)特性,采用基于感知自適應(yīng)算法為AUV提供最優(yōu)一步的航跡規(guī)劃,在此基礎(chǔ)上將自適應(yīng)算法與貝葉斯估計融合,在無目標(biāo)狀態(tài)下利用分區(qū)域柵格值優(yōu)化搜索策略,提出了基于分區(qū)域自主搜索目標(biāo)的感知自適應(yīng)算法,其能夠?qū)崿F(xiàn)多AUV自適應(yīng)搜索并定位目標(biāo)。最后通過仿真實驗驗證了該算法相對于傳統(tǒng)梳子型搜索以及離線全局優(yōu)化算法,保障了有效的定位精度的同時搜索效率提高。
假設(shè)每艘AUV均裝配聲吶、像機和通信設(shè)備,并且由這些AUV對某未知水下任務(wù)區(qū)域進行目標(biāo)搜索與定位,由于水下所有的環(huán)境特征信息預(yù)先未知,前視聲吶與AUV自身運動控制中出現(xiàn)的非線性噪聲影響,會降低AUV搜索效率,嚴(yán)重干擾任務(wù)的順利進行。
傳統(tǒng)的梳子形區(qū)域目標(biāo)搜索中,在有限的能源下AUV搜索效率很低,而在全局優(yōu)化算法的離線設(shè)計任務(wù)航跡中,并沒有考慮到前視聲吶的非線性影響,如圖1所示。
圖1 離線軌跡的目標(biāo)搜索Fig.1 Offline trajectory target search
圖1中共設(shè)有9個未知目標(biāo)點,由A出發(fā)到達B點,AUV在離線的優(yōu)化路徑作用下,前視聲吶的視域范圍內(nèi),搜索到任務(wù)目標(biāo)的數(shù)量為6個,有3個目標(biāo)被遺漏。比較目標(biāo)6與目標(biāo)1,搜索過程距離目標(biāo)6較近,視覺受限小,定位效果相比目標(biāo)1要好。說明在完全未知環(huán)境下,離線設(shè)計AUV全局優(yōu)化路徑并不能遍歷所有目標(biāo)點,且不能有效觀測到目標(biāo)特征,容易遺漏重要數(shù)據(jù),降低AUV搜索效率。
因此,考慮到上述問題,AUV執(zhí)行未知區(qū)域的搜索任務(wù)時,還應(yīng)滿足以下任務(wù)要求:
(1) 在有限條件下AUV搜索到更多的任務(wù)目標(biāo)信息。
(2) 不僅要求AUV探測到任務(wù)目標(biāo),還需較為精確地獲取位置信息等。
(3) AUV面對未知復(fù)雜的環(huán)境能夠?qū)崟r自主地規(guī)劃航跡。
(4) AUV要根據(jù)不同的目標(biāo)特性做出不同的任務(wù)決策。
本文研究目的是尋求一種搜索策略,在滿足定位精度要求的條件下,自適應(yīng)面對外界環(huán)境變化,盡可能獲取更多的未知目標(biāo)信息,擴大區(qū)域覆蓋范圍,提高多AUV搜索效率。
本文擬采用SeaBat6012前視聲納,其工作視域R為150 m,水平開角α為120°,垂直開角β為15°,水平波束數(shù)目為80條,垂直波束數(shù)目為3層,共240條探測波束。前視聲納能夠探測到在其視域內(nèi)所有的目標(biāo),并求得目標(biāo)與240條波束的交點坐標(biāo)和交點到聲納的距離[25]。
前視聲吶獲取信息的方法是利用柵格的方法,將前視聲吶的視域劃分為一個二維的柵格數(shù)組,通過填充每個柵格來表示該柵格內(nèi)有無探測到目標(biāo),如圖2所示。
圖2 前視聲納模型Fig.2 Front view sonar model
建立前視聲吶視域的數(shù)學(xué)模型,假設(shè)(xc,yc,zc)為質(zhì)心,(xs,ys,zs)是前視聲吶安裝點的坐標(biāo),Lcs為前視聲吶安裝點到AUV質(zhì)心的距離,其中(xc,yc,zc)=(0,0,0),(xs,ys,zs)=(Lcs,0,0),則AUV前視聲吶的視域范圍為
(1)
式中,(xbs,ybs,zbs)可表示為
(2)
式中,(xabs,yabs,zabs)為目標(biāo)在船體坐標(biāo)系Oxsyszs下的坐標(biāo)。
需要特別注意的是,由于AUV所配置前視聲吶在數(shù)據(jù)采集過程中容易受到水介質(zhì)等影響,產(chǎn)生非線性干擾造成測量誤差。因此,前視聲納的非線性可表示為
(3)
式中,yx-q表示聲吶探測目標(biāo)的特征信息;L表示前視聲吶的視域閾值;x與q分別表示AUV與目標(biāo)的位置關(guān)系;h表示無噪聲的傳感器函數(shù);d表示x與q的距離;ζ表示非線性高斯噪聲。當(dāng)目標(biāo)出現(xiàn)在前視聲納的視域范圍內(nèi),AUV對目標(biāo)位置估計的不確定度與其距離成正比。
若把AUV視為一個質(zhì)點,(x,y,z)是AUV在k時刻的坐標(biāo)。暫時不考慮深度參數(shù),則其運動模型可以描述為
(4)
式中,x表示經(jīng)度;y表示緯度;T為過程時間;Vk是由DVL測得的速度;φk是由羅盤測量的艏向角。
在上述運動模型中,真實輸入為
(5)
模型可以描述為
Xk+1=f(Xk,uk,ωk)=Xk+Γ(uk+ωk)
(6)
式中,Xk=(xkykφ)T代表AUV在k時刻的位置,Γ(uk+ωk)是非線性項。
在運動方程中,非線性項噪聲對AUV航位推算的準(zhǔn)確性有較大影響,長期干擾會出現(xiàn)累計誤差,造成航位推算失效。
AUV搜索的目標(biāo)分為靜態(tài)目標(biāo)和動態(tài)目標(biāo),當(dāng)未知目標(biāo)出現(xiàn)在視域范圍時,要求AUV能夠識別其目標(biāo)特性,并針對不同的目標(biāo)特性,做出不同的任務(wù)決策。
當(dāng)靜態(tài)目標(biāo)出現(xiàn)在AUV的視域范圍內(nèi)時,AUV首先判斷該目標(biāo)信息是否已經(jīng)存在數(shù)據(jù)庫中,若不存在,將該目標(biāo)信息添加至數(shù)據(jù)庫中。反之,利用目標(biāo)信息與數(shù)據(jù)庫中相應(yīng)信息作對比分析,記入較為準(zhǔn)確的數(shù)據(jù)。靜態(tài)目標(biāo)的特征模型可以表示為
(7)
當(dāng)動態(tài)目標(biāo)出現(xiàn)在AUV的視域范圍內(nèi)時,AUV首先分析該目標(biāo)的運動特性,根據(jù)其運動特性預(yù)測航跡信息,隨后可實現(xiàn)跟蹤或摧毀任務(wù)。假設(shè)動態(tài)目標(biāo)為CT模型[26],即角速度為常值的轉(zhuǎn)彎模型,其狀態(tài)向量可表示為
(8)
在直角坐標(biāo)系下,運動目標(biāo)數(shù)學(xué)模型的離散時間方程為
(9)
式中,ω是轉(zhuǎn)彎角速度;T為采樣時間。
在未知環(huán)境下,目前優(yōu)化方法中多數(shù)是基于離線設(shè)計的全局路徑優(yōu)化,由于AUV只能沿著預(yù)設(shè)航跡執(zhí)行搜索,不能實時面對復(fù)雜的隨機環(huán)境,因此提出基于分區(qū)域的感知自適應(yīng)搜索算法。
基于感知的自適應(yīng)算法(cognitive-based adaptive optimization, CAO)搜索是一個動態(tài)局部優(yōu)化過程[27],與傳統(tǒng)優(yōu)化方案相比,其能夠?qū)崟r獲得優(yōu)化標(biāo)準(zhǔn)函數(shù)的最佳一步法解決方案,因此自適應(yīng)算法總是能夠有效地將AUV快速移動到最優(yōu)標(biāo)準(zhǔn)函數(shù)的位置。
首先定義一個優(yōu)化標(biāo)準(zhǔn)函數(shù),即
(10)
式中,x與q分別表示AUV與目標(biāo)的位置信息;v表示AUV的視域范圍;D表示任務(wù)區(qū)域;K為人為定義常數(shù),優(yōu)化標(biāo)準(zhǔn)函數(shù)是使AUV能夠靠近并看清目標(biāo)的代價約束條件。函數(shù)第1項表示AUV視域內(nèi)出現(xiàn)目標(biāo)后,利用優(yōu)化函數(shù)規(guī)劃航跡,使其不斷靠近目標(biāo)位置,函數(shù)第2項則是利用攝像機等設(shè)備近距離觀測目標(biāo)特征信息。
將上述定義函數(shù)用于多AUV的優(yōu)化標(biāo)準(zhǔn),滿足一些合理的局部路徑約束條件[28](如避障)及存在非線性WGN(nonlinear WGN,NWGN)的影響下,多AUV的優(yōu)化標(biāo)準(zhǔn)函數(shù)為
(11)
式中,N表示任務(wù)中AUV的數(shù)量;ζk為零均值NWGN。雖然假設(shè)噪聲序列ζk是隨機的零均值信號,但他不滿足加性WGN(additive WGN,AWGN)的屬性。
該算法能夠有效地處理優(yōu)化問題,其中目標(biāo)函數(shù)和約束的顯式形式是未知的,但是在每個時間節(jié)點處可獲得這些函數(shù)的噪聲測量估計,使用函數(shù)近似估計每個時刻k處的未知目標(biāo)函數(shù)J,根據(jù):
(12)
(13)
AUV的下一步位置集合被選為如下R個候選位置,即
(14)
舍去違背AUV正常運行軌跡的預(yù)測數(shù)據(jù)后,計算新的AUV位置如下,即
(15)
AUV不斷感知環(huán)境,自適應(yīng)搜索到的目標(biāo),還需將目標(biāo)信息標(biāo)記存儲,可利用貝葉斯估計來定位目標(biāo)的位置信息。如下為AUV的運動方程與觀測方程,即
(16)
觀測方程具體表示為
(17)
AUV的目標(biāo)定位可以表示為對每一時刻聯(lián)合后驗概率密度的估計,即
p(xv,k,θ|z0∶k,u0∶k,xv,0)
(18)
上述各個變量及其內(nèi)容如表1所示。
表1 貝葉斯估計變量及其內(nèi)容
假設(shè)AUV的狀態(tài)轉(zhuǎn)移過程是馬爾可夫(Markov)過程[29],根據(jù)貝葉斯估計理論[30],已知AUV的運動模型和觀測模型,可以通過二階遞歸的時間更新和量測更新來完成。
(1) 時間更新
p(xv,k,θ|z0∶k-1,u0∶k,xv,0)=
p(xv,k-1,θ|z0∶k-1,u0∶k,xv,0)dxv,k-1=
(19)
(2) 量測更新
p(xv,k,θ|z0∶k,u0∶k,xv,0)=
(20)
根據(jù)0到k時刻的控制輸入u0∶k及0到k時刻的觀測值z0∶k遞歸計算k時刻AUV的狀態(tài)xv,k,同時計算當(dāng)前觀測過程中,所有已觀測的目標(biāo)特征狀態(tài)θ的聯(lián)合后驗概率密度p(xk,θ|z1∶k,u0∶k,x0)得
p(xk,θ|z0∶k,u0∶k,x0)=
p(xv,k-1,θ|z0∶k-1,u0∶k-1,xv,0)dxv,k-1
(21)
式中,η表示歸一化常數(shù),概率p(xv,k-1,θ|z0∶k-1,u0∶k-1,xv,0)為k-1時刻的條件概率密度,p(xv,k,θ|z0∶k,u0∶k,xv,0)為k時刻的條件概率密度。
當(dāng)AUV視域范圍內(nèi)無任何目標(biāo)或其他特征信息時,為了讓AUV能夠合理地執(zhí)行區(qū)域覆蓋與目標(biāo)搜索任務(wù),可以根據(jù)AUV自身的設(shè)備條件將區(qū)域分割,本文假設(shè)未知環(huán)境為大范圍的矩形區(qū)域,將該矩形區(qū)域劃分為若干個子區(qū)域,每個子區(qū)域的邊界值約為AUV視域的2倍。
子區(qū)域利用柵格法設(shè)有獨立的代價值,AUV根據(jù)每個子區(qū)域的代價值和到達距離,決定選擇搜索區(qū)域的優(yōu)先級,任務(wù)區(qū)域以任務(wù)鎖定的方式執(zhí)行,當(dāng)AUV在進入該區(qū)域前,會首先判斷該區(qū)域是否被設(shè)置為任務(wù)鎖定,即
(22)
若區(qū)域未鎖定,將此區(qū)域定位為下一步的任務(wù)區(qū)域;反之,判斷此區(qū)域被鎖定的執(zhí)行者是否屬于該AUV,即
Task={1,2…..,n}
(23)
式中,n為任務(wù)AUV的數(shù)量。
若鎖定區(qū)域為該AUV任務(wù)區(qū)域,則其將針對駛向本區(qū)域執(zhí)行航跡規(guī)劃,反之,計算其他未被鎖定的任務(wù)區(qū)域,計算區(qū)域優(yōu)先級,選擇最優(yōu)區(qū)域執(zhí)行航跡規(guī)劃。
在AUV執(zhí)行區(qū)域選擇的過程時,將每個區(qū)域的區(qū)域點設(shè)在形心處,AUV優(yōu)先選擇代價值最小且滿足路徑代價最短的區(qū)域作為任務(wù)區(qū),運用分區(qū)域策略可以提高AUV感知自適應(yīng)算法的搜索效率及其覆蓋面積。
實驗仿真環(huán)境為900×900 m的未知水下區(qū)域環(huán)境,AUV的任務(wù)航跡均由感知自適應(yīng)算法實時規(guī)劃,目標(biāo)個數(shù)與目標(biāo)點的位置為隨機設(shè)計,實驗預(yù)設(shè)3個AUV,并以分布式結(jié)構(gòu)體系執(zhí)行未知環(huán)境下的目標(biāo)搜索與定位任務(wù),仿真實驗實際參數(shù)如下。
AUV:AUV分別從x方向(150,0),(450,0),(750,0)作為初始任務(wù)位置,速度為2節(jié)。
航位推算系統(tǒng):采樣時間為1 s,速度誤差為0.025 m/s,位置誤差0.25 m,艏向最大偏轉(zhuǎn)角不超過60°,觀測噪聲設(shè)為WGN。
隨機設(shè)計目標(biāo)的位置信息后,將柵格法應(yīng)用在未知環(huán)境中,根據(jù)AUV所配置的傳感器視域范圍,將該區(qū)域分為9個子區(qū)域,初始化所有子區(qū)域,每個子區(qū)域有獨立的代價值和區(qū)域鎖定值,多AUV協(xié)同搜索任務(wù)開始時,未知環(huán)境下會在隨機位置中出現(xiàn)動態(tài)目標(biāo),按照恒定角速度做勻速曲線運動,如圖3所示。
圖3 AUV任務(wù)開始Fig.3 AUV task start
本實驗仿真中,AUV以分布式結(jié)構(gòu)體系搜索靜態(tài)目標(biāo),未知動態(tài)目標(biāo)出現(xiàn)在3號AUV視域范圍內(nèi)時,3號AUV結(jié)束當(dāng)前的搜索狀態(tài),調(diào)整搜索模式后,預(yù)測動態(tài)目標(biāo)軌跡并保持動態(tài)目標(biāo)在視域范圍內(nèi),如圖4所示。
圖4 發(fā)現(xiàn)動態(tài)目標(biāo)Fig.4 Discover dynamic targets
假設(shè)動態(tài)目標(biāo)為敵方AUV,我方AUV與動態(tài)目標(biāo)達到某一程度后銷毀動態(tài)目標(biāo),進而繼續(xù)按照感知自適應(yīng)算法搜索靜態(tài)目標(biāo)。為了驗證算法的效率和可靠性,將實驗結(jié)束的條件設(shè)定為區(qū)域內(nèi)所有靜態(tài)目標(biāo)被搜索,且全部達到預(yù)設(shè)的定位精度,則任務(wù)結(jié)束時的搜索狀態(tài)如圖5和圖6所示。
圖5 任務(wù)結(jié)束Fig.5 End task
圖6 觀測矩陣協(xié)方差Fig.6 Observation matrix covariance
如圖6所示,AUV進行自適應(yīng)目標(biāo)搜索與定位的過程中,AUV的聯(lián)合概率密度協(xié)方差是逐漸減小且趨于穩(wěn)定的,避免了累計誤差的出現(xiàn),且達到了設(shè)定目標(biāo)定位允許的誤差范圍。應(yīng)用此算法時,考慮到前視聲吶傳感器非線性的影響,即通過算法優(yōu)化使得AUV能夠在一定范圍內(nèi)靠近目標(biāo),保障前視聲吶較為準(zhǔn)確地看清區(qū)域目標(biāo)位置,使得所探測到目標(biāo)都能夠滿足定位精度要求,與全局靜態(tài)路徑規(guī)劃相比,減少關(guān)鍵目標(biāo)位置的遺失。此次仿真任務(wù)所用時間為2 940步,若選用梳子形掃描并達到定位精度,則每個AUV至少需要4 450步才能完成搜索任務(wù),在進行100次實驗過程中,所用時間都低于梳子形掃描的時間,相對于傳統(tǒng)的搜索模式,在搜索效率上明顯提高,如圖7所示。
圖7 實驗數(shù)據(jù)比較Fig.7 Comparison of experimental data
在未知復(fù)雜的水下環(huán)境中,利用多AUV對外界隨機環(huán)境的感知,實時規(guī)劃任務(wù)航線,對該區(qū)域執(zhí)行目標(biāo)搜索與定位任務(wù)?;诜謪^(qū)域的感知自適應(yīng)算法對區(qū)域目標(biāo)進行搜索,在搜索過程中盡可能接近并看清目標(biāo)的位置信息,保障每個探測過的目標(biāo)位置均達到預(yù)設(shè)精度,且相比較傳統(tǒng)搜索算法和離線設(shè)計全局優(yōu)化路線,能夠更好地提高搜索效率,減少關(guān)鍵信息的遺漏。通過實驗仿真驗證了該方法在未知領(lǐng)域內(nèi)搜索的可行性和有效性。