姚 鵬,邱立艷
(中國(guó)海洋大學(xué)工程學(xué)院,青島 266100)
隨著人類對(duì)海洋的開發(fā)利用不斷深入,各類水下事故也頻繁發(fā)生,自主式水下機(jī)器人(Autonomous Underwater Vehicle,AUV)是一種無需操作者操控就能自行完成各類海洋任務(wù)的智能機(jī)器人[1-2],利用AUV 搜索海域內(nèi)的事故目標(biāo)具有重要意義。海洋環(huán)境中的事故目標(biāo)通常分為靜態(tài)目標(biāo)(如海底沉船等)和動(dòng)態(tài)目標(biāo)(如體積較小的可隨浪流移動(dòng)的目標(biāo)),本文針對(duì) AUV動(dòng)態(tài)目標(biāo)搜索問題展開研究。海洋動(dòng)態(tài)目標(biāo)會(huì)受浪流影響而移動(dòng),因此其所在海域的目標(biāo)概率圖是實(shí)時(shí)更新的,且考慮各種復(fù)雜的環(huán)境因素,一般需要基于目標(biāo)概率圖和 AUV 本身所搭載的側(cè)掃聲吶[3]探測(cè)模型對(duì)任務(wù)海域進(jìn)行啟發(fā)式搜索。
目前,研究中大多將側(cè)掃聲吶的探測(cè)范圍看成標(biāo)準(zhǔn)的圓形區(qū)域或者單個(gè)柵格區(qū)域。李娟等[3]直接用非線性高斯噪聲模擬海洋復(fù)雜因素對(duì)側(cè)掃聲吶探測(cè)概率的影響,未進(jìn)一步處理且會(huì)影響AUV 航位演算的精確性,甚至使AUV 航位推算失效。文獻(xiàn)[4]根據(jù)聲吶方程建立了基于多聲吶探測(cè)性能評(píng)估的傳感器概率感知模型,進(jìn)而結(jié)合水聲環(huán)境以及探測(cè)系統(tǒng)參數(shù)定量確定水下機(jī)器人系統(tǒng)對(duì)區(qū)域內(nèi)各處目標(biāo)的探測(cè)能力。另外,Paull等[5]針對(duì)特殊的海底環(huán)境,將部分復(fù)雜因素的影響考慮在 AUV 的搜索過程中,但海洋環(huán)境下的一些特殊情況,如目標(biāo)特性、聲透射角度、地形起伏等仍被忽略。
在針對(duì)海洋動(dòng)態(tài)目標(biāo)的航跡規(guī)劃方面,Paull等[5]構(gòu)建了受部分復(fù)雜環(huán)境因素影響的側(cè)掃聲吶探測(cè)概率模型,基于信息增益實(shí)現(xiàn) AUV 對(duì)高價(jià)值區(qū)域的搜索,然后通過定義分支熵指標(biāo)使得未知區(qū)域能夠被 AUV 成功探測(cè),最后通過多目標(biāo)優(yōu)化方法得到最佳搜索航跡。Hu 等[6]對(duì)目標(biāo)概率的運(yùn)動(dòng)信息和運(yùn)動(dòng)距離信息進(jìn)行了綜合考慮,構(gòu)建目標(biāo)搜索的代價(jià)函數(shù),結(jié)合Voronoi 圖的特性,通過使機(jī)器人的運(yùn)動(dòng)朝著代價(jià)函數(shù)的梯度減小方向,完成對(duì)目標(biāo)的搜索任務(wù)。Cao 等[7]采用基于最小二乘法的多項(xiàng)式擬合實(shí)時(shí)預(yù)測(cè)動(dòng)態(tài)目標(biāo)在短期內(nèi)可能到達(dá)的位置,并通過協(xié)商分配方法為每艘 AUV 分配預(yù)期待搜索目標(biāo)點(diǎn),而后使用深度強(qiáng)化學(xué)習(xí)算法快速規(guī)劃 AUV 到每個(gè)目標(biāo)點(diǎn)的近似最優(yōu)航跡。Wang 等[8]提出一種基于物體幾何特征的漂移動(dòng)力學(xué)模型,同時(shí)考慮了物體形狀和隨機(jī)運(yùn)動(dòng)特征的影響,提出一種漂移預(yù)測(cè)模型,提高了海面目標(biāo)漂移軌跡計(jì)算的精度,可用于各種形狀目標(biāo)的漂移軌跡預(yù)測(cè)和海上搜救決策系統(tǒng)。Xiao 等[9]基于貝葉斯迭代準(zhǔn)則將目標(biāo)概率圖實(shí)時(shí)更新,進(jìn)而定義了能夠同時(shí)兼顧所有機(jī)器人代價(jià)平衡度和總的任務(wù)代價(jià)的優(yōu)化指標(biāo)。Bourgault 等[10]通過海上風(fēng)浪信息的統(tǒng)計(jì)數(shù)據(jù)構(gòu)建任務(wù)海域的目標(biāo)概率函數(shù),基于Markov 運(yùn)動(dòng)轉(zhuǎn)移概率實(shí)時(shí)預(yù)測(cè)目標(biāo)概率圖并據(jù)此進(jìn)行搜索航跡規(guī)劃。另外,Yue等[11]提出將強(qiáng)化學(xué)習(xí)應(yīng)用在未知環(huán)境下的目標(biāo)搜索中,并以此技術(shù)用于在海上搜尋移動(dòng)的船只。而針對(duì)復(fù)雜幾何、非均勻分布以及搜索過程中的目標(biāo)瞬時(shí)漂移等復(fù)雜情況,Stefan 等[12]結(jié)合最優(yōu)搜索理論和遍歷理論概念,提出一種改進(jìn)的動(dòng)態(tài)光譜多尺度覆蓋方法,提高了搜索的成功率。
此外,基于啟發(fā)式算法[13-18]對(duì)動(dòng)態(tài)目標(biāo)的搜索是當(dāng)前的研究熱點(diǎn),Zhu 等[13]針對(duì)動(dòng)態(tài)海洋目標(biāo),將動(dòng)態(tài)目標(biāo)視為一系列的離散點(diǎn),結(jié)合改進(jìn)的自組織映射神經(jīng)網(wǎng)絡(luò)和一種新的速度合成方法,提出一種集成式多 AUV 動(dòng)態(tài)任務(wù)分配和航跡規(guī)劃算法,在洋流變化、目標(biāo)移動(dòng)的動(dòng)態(tài)環(huán)境中可規(guī)劃出每個(gè)AUV 訪問對(duì)應(yīng)目標(biāo)的最短航跡。Sara 等[14]采用了蟻群算法進(jìn)行智能體的軌跡規(guī)劃以保證在最短的時(shí)間找到運(yùn)動(dòng)目標(biāo)。Wei 等[15]提出了一種專門的海區(qū)搜索地圖,其中設(shè)計(jì)目標(biāo)概率地圖來處理動(dòng)態(tài)目標(biāo)引起的不確定性并將其作為信息素映射用于改進(jìn)的多蟻群算法,但由于該方法的離散性,產(chǎn)生的軌跡是直接分割的,所以在實(shí)際應(yīng)用中會(huì)存在局限性。Joses 等[16]將線性搜索和離散近視搜索理論用于定位海洋環(huán)境下的動(dòng)態(tài)目標(biāo)。Cao 等[17]通過生物啟發(fā)神經(jīng)動(dòng)力學(xué)對(duì)任務(wù)海域進(jìn)行建模,通過神經(jīng)元的活性輸出值使得 AUV 完成對(duì)相關(guān)目標(biāo)的搜索。類似地,Ni等[18]提出一種基于生物神經(jīng)網(wǎng)絡(luò)的多智能體搜索捕獲算法,適用于對(duì)未知環(huán)境中的動(dòng)態(tài)目標(biāo)的有效搜索。另外,Yao 等[19]結(jié)合高斯混合模型提出一種并行式模型預(yù)測(cè)控制的目標(biāo)搜索方法,可滿足航跡規(guī)劃過程中的多種約束。
綜上所述,針對(duì)動(dòng)態(tài)目標(biāo)的搜索,目前的研究方法豐富多樣,但往往未將更真實(shí)的聲吶探測(cè)模型考慮在內(nèi)。模型預(yù)測(cè)控制是一種經(jīng)典有效的AUV 航跡規(guī)劃方法,但任務(wù)海域的復(fù)雜特性可能會(huì)使 AUV 在搜索過程中長(zhǎng)時(shí)間陷入局部區(qū)域,搜索效率較低。因此,針對(duì)海洋動(dòng)態(tài)目標(biāo)的搜索問題,應(yīng)進(jìn)一步考慮任務(wù)海域中各類實(shí)際環(huán)境因素對(duì)側(cè)掃聲吶探測(cè)概率的影響以提高規(guī)劃航跡的可行性,另外需對(duì)當(dāng)前的航跡規(guī)劃算法做出進(jìn)一步改進(jìn),以提升AUV 的搜索任務(wù)收益。
本文結(jié)合海洋復(fù)雜環(huán)境因素以及目標(biāo)特征構(gòu)建了符合實(shí)際情況的側(cè)掃聲吶探測(cè)概率模型以及簡(jiǎn)單的AUV 模型;基于側(cè)掃聲吶探測(cè)概率模型,利用Chapman-Kolmogorov 方程和貝葉斯公式實(shí)時(shí)預(yù)測(cè)并更新探測(cè)事件發(fā)生后的動(dòng)態(tài)目標(biāo)概率圖;為改善傳統(tǒng)模型預(yù)測(cè)控制(Model Predictive Control, MPC)方法的搜索效率較低的問題,引入長(zhǎng)時(shí)域思想,提出長(zhǎng)時(shí)域模型預(yù)測(cè)控制(Futuredependent Model Predictive Control, FMPC)策略,應(yīng)用于AUV 的搜索航跡規(guī)劃;進(jìn)行了實(shí)驗(yàn)仿真。
本文的主要研究?jī)?nèi)容是AUV 的搜索航跡規(guī)劃策略而非底層控制問題,且假設(shè)AUV 定深航行,因此可將AUV 簡(jiǎn)化成受一定運(yùn)動(dòng)約束的二自由度質(zhì)點(diǎn)模型
式中,(x,y) 表示 AUV 的位置,v表示AUV 的航行速度,ψ表示偏航角,a為加速度,ω為轉(zhuǎn)彎角速度。
為確保AUV 能夠正常航行,航行過程中AUV應(yīng)滿足下面的性能約束
式中,vmin,vmax分別是AUV 的最小航行速度和最大航行速度約束,amin,amax分別是AUV 在航行過程中的最小加速度和最大加速度約束,ωmin,ωmax表示 AUV 的最小轉(zhuǎn)彎角速度與最大轉(zhuǎn)彎角速度約束。
AUV 通過其本身搭載的側(cè)掃聲吶向當(dāng)前位置的左右兩側(cè)下方發(fā)射扇形波束聲脈沖信號(hào)來探測(cè)確定是否有目標(biāo)存在,如圖1 所示,其中藍(lán)色區(qū)域即為扇形波束聲脈沖。
北約海底研究中心(Nato Undersea Research Center)所提供的聲吶相關(guān)性能以及評(píng)估模型[20]表明,側(cè)掃聲吶的探測(cè)概率模型受到目標(biāo)特征、海洋環(huán)境因素等影響,因此本文結(jié)合目標(biāo)特征和海洋環(huán)境因素等,采用Sigmoid 函數(shù)來定義側(cè)掃聲吶的探測(cè)概率模型
式中,xtm表示目標(biāo),z t=D為針對(duì)目標(biāo)所發(fā)生的探測(cè)事件,d是目標(biāo)與聲吶之間的側(cè)向水平距離,參數(shù)α,β1,β2,dmin,dmax的 取值同時(shí)與聲吶自身的特性和所處海洋環(huán)境(如海水溫度、鹽度、海洋中的砂土成分等因素)有關(guān)。例如,某側(cè)掃聲吶在某海洋環(huán)境中的相關(guān)參數(shù)取為:α=0.95,β1=5.0,β2=1.0,dmin=2 m ,dmax= 28 m ,其 對(duì)應(yīng)的探測(cè)概率曲線如圖2 所示。
圖2 探測(cè)概率曲線Fig. 2 Detection probability curve
如圖2 所示,當(dāng)側(cè)向距離d位于0 到dmin之間時(shí),側(cè)掃聲吶的探測(cè)概率為 0,這是由于當(dāng)側(cè)向距離過小時(shí),AUV 機(jī)體本身會(huì)對(duì)探測(cè)區(qū)域造成遮擋,因而不會(huì)有探測(cè)概率;當(dāng)側(cè)向距離大于dmin時(shí),探測(cè)概率會(huì)迅速上升并在一定距離內(nèi)保持該概率;當(dāng)側(cè)向距離大于dmax時(shí),探測(cè)概率會(huì)隨距離的增大而迅速減小為0。
此外,側(cè)掃聲吶的測(cè)量特性也會(huì)隨探測(cè)角度的不同而不同。對(duì)于非對(duì)稱目標(biāo)(每個(gè)柵格內(nèi)存在的目標(biāo)形態(tài)一般為非對(duì)稱的),側(cè)掃聲吶從不同的角度發(fā)射探測(cè)信號(hào)時(shí)所探測(cè)到的目標(biāo)形態(tài)是不一樣的(如圖3 所示)。
圖3 不同探測(cè)角度的探測(cè)模型Fig. 3 Detection model from different angles
結(jié)合圖3 以及式(3),定義側(cè)掃聲吶對(duì)目標(biāo)的二次探測(cè)概率qtol為
式中,1q和q2分別表示AUV 以角度1θ和角度2θ第一次探測(cè)該目標(biāo)時(shí),通過式(3)所計(jì)算出來的探測(cè)概率。通過對(duì)qtol的不斷更新并結(jié)合規(guī)劃算法得到AUV 的航跡。需注意,考慮到水下弱通信特性,本文假設(shè)其他 AUV 對(duì)目標(biāo)的探測(cè)事件不會(huì)實(shí)時(shí)影響當(dāng)前AUV 的二次探測(cè)概率計(jì)算公式。
另外,本文考慮了海底地形對(duì) AUV 搜索航跡的影響。海底起伏地形會(huì)對(duì)側(cè)掃聲吶信號(hào)造成遮擋,可通過判斷目標(biāo)所在位置與 AUV 當(dāng)前位置的連線是否相交于該條連線上的地形來確定聲吶信號(hào)是否被遮擋。如圖4 所示,計(jì)算某柵格(黑色柵格)的實(shí)際地形高程數(shù)據(jù)是否大于此柵格在連線上的高度映射值,若前者大于后者,則信號(hào)被遮擋,探測(cè)概率即為0,否則探測(cè)概率仍可通過式(4)計(jì)算得到。
圖4 聲吶信號(hào)遮擋示意圖Fig. 4 Diagram of the occlusion of sonar signals
舉例來講,如圖5 所示,假設(shè)AUV 某時(shí)所在位置為x0,航行深度(恒定)為H0。某柵格位置為xa,AUV 到該柵格之間還存在x(i)個(gè)柵格。分別計(jì)算這些柵格在連線l上的高度映射值H(i),并與其實(shí)際高程數(shù)據(jù)h(i)相比較,從而確定探測(cè)xa處柵格側(cè)掃聲吶的概率模型
圖5 側(cè)掃聲吶探測(cè)某柵格的模型Fig. 5 Model of a grid detected by side-scan sonar
采用目標(biāo)概率圖來表示任務(wù)海域的先驗(yàn)信息。將整個(gè)任務(wù)海域柵格化處理得M個(gè)柵格,同時(shí)已知在第m(m= 1,…,M)個(gè)柵格內(nèi)的目標(biāo)先驗(yàn)概率為p(x0m|z0),其中,x0m是初始時(shí)刻的柵格位置,z0是初始時(shí)刻所發(fā)生的探測(cè)事件。根據(jù)式(5)可得在t時(shí)第i艘AUV 對(duì)該海域內(nèi)任一柵格m的探測(cè)概率q a(z t|xtm)。對(duì)于任務(wù)海域中的動(dòng)態(tài)目標(biāo),其目標(biāo)概率圖也是隨浪流潮汐等動(dòng)態(tài)變化的。雖然在短時(shí)間內(nèi)的變化幅度相比于任務(wù)海域的范圍較小,但仍需時(shí)刻更新目標(biāo)概率信息。目標(biāo)隨浪流移動(dòng)時(shí)的運(yùn)動(dòng)速率vt和運(yùn)動(dòng)方向θt是相互獨(dú)立的,用Beta 分布和高斯分布分別描述它們的概率分布,則目標(biāo)的運(yùn)動(dòng)概率可表示為兩者的聯(lián)合概率分布[10]式中,vt∈ [0,vtmax]是目標(biāo)隨浪流移動(dòng)速度且服從Beta 分布,目標(biāo)的移動(dòng)方向θt服從均值為μθ,方差為σθ2的高斯分布,μv=at vtmax/(at+bt)是待搜索目標(biāo)移動(dòng)的平均速度,其中a t,bt和c都是Beta分布中所涉及到的參數(shù)。
然后基于Chapman-Kolmogorov 方程即可預(yù)測(cè)得到t時(shí)刻的目標(biāo)概率圖
式中,vt,θt的值將由柵格n到柵格m的向量決定。
此外,在任一采樣時(shí)刻,通過貝葉斯公式迭代更新側(cè)掃聲吶探測(cè)后的目標(biāo)概率圖信息
式中,通過λ對(duì)概率進(jìn)行歸一化處理。
本節(jié)基于目前比較成熟的MPC 框架來規(guī)劃AUV 的搜索航跡。傳統(tǒng)的MPC 通過優(yōu)化搜索收益指標(biāo)可獲得AUV 的最優(yōu)控制輸入,因此優(yōu)化當(dāng)前第t步之后的未來N步控制輸入可獲得AUV 未來N步的狀態(tài)量。然后,AUV 基于上述控制量只移動(dòng)一步,如此迭代更新直至整個(gè)搜索任務(wù)完成。
但傳統(tǒng)的MPC 策略的時(shí)域長(zhǎng)度N往往是有限的,這種“短視性”的搜索策略也更加容易使AUV 在搜索過程中陷入局部區(qū)域,從而導(dǎo)致較低的搜索效率。為改善上述問題,本文在計(jì)算未來N步收益的基礎(chǔ)上又引入N步之后的大范圍預(yù)期收益。如圖6 所示,以t+N時(shí)刻AUV 所在位置為起點(diǎn),N代表擴(kuò)充的時(shí)域長(zhǎng)度,基于AUV的最小轉(zhuǎn)彎半徑rmin或最大轉(zhuǎn)彎角速率ωmax、最大運(yùn)行速度vmax等性能約束定義預(yù)期可搜索的區(qū)域,未來預(yù)期收益即為AUV 對(duì)該區(qū)域完成覆蓋搜索所獲得的單次搜索收益。
圖6 長(zhǎng)時(shí)域模型預(yù)測(cè)控制示意圖Fig. 6 Schematic diagram of future-dependent model predictive control
然后,將更新后的目標(biāo)概率圖p(xtm|z1:t)作為新的目標(biāo)概率圖,可根據(jù)側(cè)掃聲吶的探測(cè)概率模型以及上述未來大范圍預(yù)期收益GN計(jì)算總搜索收益指標(biāo)
通過AUV 在搜索過程中所獲最大收益Gmax與最小收益Gmin對(duì)上述指標(biāo)進(jìn)行歸一化處理,即
當(dāng)多艘AUV 執(zhí)行搜索任務(wù)時(shí),本文采用集中式策略。最終,動(dòng)態(tài)目標(biāo)搜索問題就等同于在一定約束條件下求解以下目標(biāo)函數(shù)
式中,Dmin代表AUV 間的安全距離,Ut:t+N表示N步最優(yōu)控制輸入,Nu表示AUV 數(shù)量。
本節(jié)在2000 m × 2000 m的任務(wù)海域內(nèi)進(jìn)行搜索實(shí)驗(yàn)分析與驗(yàn)證,將整片海域處理成50 × 50的離散化柵格。任務(wù)海域的初始目標(biāo)概率圖如圖7所示,t= 200 min時(shí),目標(biāo)概率圖變?yōu)槿鐖D8 所示狀態(tài)??梢钥闯?,相比于初始目標(biāo)概率圖,t= 200min 時(shí)的目標(biāo)概率圖整體向右移動(dòng)了120 m。另外,實(shí)驗(yàn)所涉及的參數(shù)如表1 所示,側(cè)掃聲吶的相關(guān)參數(shù)采取圖2 中的參數(shù)示例。
圖7 初始目標(biāo)概率圖Fig. 7 Initial target probability map
圖8 t=200 min 時(shí)的目標(biāo)概率圖Fig. 8 Target probability map at t=200 min
表1 實(shí)驗(yàn)參數(shù)Table 1 Experiment parameters
傳統(tǒng)的 MPC 因時(shí)域長(zhǎng)度有限,容易使得AUV 在搜索過程中陷入局部區(qū)域,影響最終的搜索效率。本節(jié)分別采用MPC 和FMPC 策略引導(dǎo)AUV 進(jìn)行目標(biāo)搜索,將所得實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比,證明了FMPC 相較于傳統(tǒng)的MPC 在任務(wù)時(shí)間受限情況下具有更好的探測(cè)效率。圖9 和圖10分別展示了在圖7 場(chǎng)景下(場(chǎng)景1),采用MPC和FMPC 方法引導(dǎo)3 艘AUV 執(zhí)行搜索任務(wù)時(shí)產(chǎn)生的航跡以及任務(wù)結(jié)束后的剩余目標(biāo)概率圖。
如圖10 所示,F(xiàn)MPC 會(huì)引導(dǎo)AUV 對(duì)任務(wù)海域中的每一片高價(jià)值區(qū)域進(jìn)行覆蓋搜索,相比于圖7 的初始目標(biāo)概率圖,采用FMPC 策略時(shí),當(dāng)指定任務(wù)時(shí)間結(jié)束后,其剩余目標(biāo)概率圖中已經(jīng)不存在顏色較深的區(qū)域(目標(biāo)存在概率較高的區(qū)域),而采用傳統(tǒng)的MPC 策略時(shí),任務(wù)海域中右下角仍然有深色區(qū)域未被成功覆蓋搜索到,如圖9(b)所示。
圖9 場(chǎng)景1 下的MPC 航跡規(guī)劃效果Fig. 9 Trajectory planning result by MPC in scenario 1
圖10 場(chǎng)景1 下的FMPC 航跡規(guī)劃效果Fig. 10 Trajectory planning result by FMPC in scenario 1
圖11 展示了兩種方法下3 艘AUV 的累計(jì)探測(cè)收益,從第20 min 開始,F(xiàn)MPC 下的AUV 收益就開始明顯高于MPC 下的搜索收益,且最終FMPC 可引導(dǎo)AUV 搜索達(dá)到理想收益的60%以上,而采用MPC 方法時(shí),AUV 僅能獲得45%左右的累計(jì)探測(cè)收益。
圖11 場(chǎng)景1 下的累計(jì)探測(cè)收益對(duì)比Fig. 11 Comparison of cumulative detection reward in scenario 1
為進(jìn)一步驗(yàn)證MPC 和FMPC 的效果,在另一個(gè)場(chǎng)景(如圖12 所示)下,改變AUV 起點(diǎn)再次進(jìn)行實(shí)驗(yàn)。
圖12 場(chǎng)景2 的初始目標(biāo)概率圖Fig. 12 Initial target probability map in scenario 2
圖13 和14 分別展示了兩種方法下的 AUV搜索航跡以及任務(wù)結(jié)束后的剩余目標(biāo)概率圖??梢钥闯?,在任務(wù)時(shí)間受限情況下,采用MPC 方法易使 AUV 陷入局部區(qū)域。圖13 中,AUV 的搜索路線基本集中在任務(wù)海域左側(cè)目標(biāo)存在概率較大的區(qū)域,但右上角目標(biāo)存在概率較大的部分區(qū)域并沒有被成功地搜索到(剩余目標(biāo)概率圖中仍存在深色區(qū)域),因此會(huì)降低最終的累計(jì)探測(cè)收益。通過圖14 可以看出,F(xiàn)MPC 方法則可以引導(dǎo)AUV 有效地搜索到任務(wù)場(chǎng)景中的所有具有較高目標(biāo)存在概率的海域,從而使得任務(wù)結(jié)束后的剩余目標(biāo)概率圖基本呈現(xiàn)淺色,這是因?yàn)樵摲椒〝U(kuò)充了時(shí)域長(zhǎng)度,更加具有全局視野。
圖13 場(chǎng)景2 下的MPC 航跡規(guī)劃效果Fig. 13 Trajectory planning result by MPC in scenario 2
圖14 場(chǎng)景2 下的FMPC 航跡規(guī)劃效果Fig. 14 Trajectory planning result by FMPC in scenario 2
圖15 為該場(chǎng)景下,利用兩種方法在指定時(shí)間內(nèi)引導(dǎo)AUV 執(zhí)行搜索任務(wù)最終所獲得的累計(jì)探測(cè)收益,很明顯,F(xiàn)MPC 方法獲得的最終收益約為理想收益的65%,而MPC 僅能獲得理想收益的42%左右。
圖15 場(chǎng)景2 下兩種方法的累計(jì)探測(cè)收益對(duì)比Fig. 15 Comparison of cumulative detection reward in scenario 2
另外,為驗(yàn)證FMPC 方法的魯棒性,本文在具有不同目標(biāo)概率分布信息的任務(wù)海域下進(jìn)行了50 組實(shí)驗(yàn),并隨機(jī)設(shè)置AUV 的起點(diǎn)。圖16 為每種場(chǎng)景下分別采用兩種方法所得的累計(jì)探測(cè)收益??梢钥闯?,無論場(chǎng)景和AUV 起點(diǎn)如何變化,F(xiàn)MPC 方法相比于MPC 方法都能夠引導(dǎo)AUV 更具有全局視野地展開搜索工作,從而獲得較高的搜索收益(效率)。
圖16 50 組實(shí)驗(yàn)中的累計(jì)探測(cè)收益Fig. 16 Cumulative detection reward in 50 experiments
假設(shè)AUV 在距離海底10 m 的恒定高度航行,本節(jié)采用指數(shù)函數(shù)生成海底橫向和縱向起伏地形并賦予一定的高程數(shù)據(jù)(均低于 AUV 的航行高度),如圖17 和圖18 所示。
圖17 縱向起伏地形Fig. 17 Longitudinal terrain
圖18 橫向起伏地形Fig. 18 Lateral terrain
圖19 和圖20 分別展示了在縱向和橫向起伏地形環(huán)境下3 艘AUV 的航跡。圖19 中,AUV 會(huì)從起點(diǎn)出發(fā)首先搜索縱向起伏地形左側(cè)的區(qū)域,這是因?yàn)槠鸱貏?shì)的遮擋會(huì)使側(cè)掃聲吶對(duì)其右側(cè)區(qū)域的探測(cè)收益為 0,故當(dāng)采用基于最大收益指標(biāo)的優(yōu)化方法規(guī)劃航跡時(shí),AUV 會(huì)優(yōu)先搜索左側(cè)收益較高的區(qū)域。圖20 中,由于橫向起伏地勢(shì)的遮擋,AUV 的搜索航跡也被局限。
圖19 縱向起伏地勢(shì)下的AUV 的航跡規(guī)劃效果Fig. 19 Trajectory planning result of AUVs in longitudinal undulating terrain
圖20 橫向起伏地勢(shì)下的AUV 的航跡規(guī)劃效果Fig. 20 Trajectory planning result of AUVs in lateral undulating terrain
本文針對(duì)海洋動(dòng)態(tài)目標(biāo)的搜索問題展開了相關(guān)研究。
(1)對(duì)AUV 所搭載的側(cè)掃聲吶進(jìn)行建模,建模過程中考慮到真實(shí)的海洋環(huán)境以及目標(biāo)與AUV 的側(cè)向距離等因素,引入了Sigmoid 函數(shù)來定義側(cè)掃聲吶的探測(cè)概率;結(jié)合側(cè)掃聲吶模型以及目標(biāo)特征,進(jìn)一步定義AUV 的二次探測(cè)概率;考慮了海底起伏地形對(duì)側(cè)掃聲吶探測(cè)信號(hào)的遮擋,更加符合探測(cè)的真實(shí)情況。
(2)以Beta 分布和高斯分布描述目標(biāo)的運(yùn)動(dòng)概率,并通過Chapman-Kolmogorov 方程以及貝葉斯準(zhǔn)則實(shí)時(shí)預(yù)測(cè)并更新目標(biāo)概率圖。
(3)引入長(zhǎng)時(shí)域預(yù)期收益對(duì)傳統(tǒng)的模型預(yù)測(cè)控制方法進(jìn)行改進(jìn),結(jié)合側(cè)掃聲吶探測(cè)概率模型,引導(dǎo)AUV 能夠在指定的任務(wù)時(shí)間內(nèi)擴(kuò)大搜索范圍,提高最終的搜索收益。
(4)實(shí)驗(yàn)仿真驗(yàn)證了結(jié)合復(fù)雜聲吶模型的FMPC 方法相比于傳統(tǒng)MPC 方法的高效性,以及海底地形對(duì)航跡規(guī)劃的影響。