王可錚,周興蓮,林夢(mèng)婷,李 彬
(1.聯(lián)想集團(tuán) 方案服務(wù)業(yè)務(wù)集團(tuán),四川 成都 610041;2.四川大學(xué) 空天科學(xué)與工程學(xué)院,四川 成都 610000)
多無人機(jī)(unmanned aerial vehicles,UAV)協(xié)同執(zhí)行任務(wù)能夠提升戰(zhàn)斗力,在多領(lǐng)域都得到了廣泛應(yīng)用,如協(xié)同搜索、探測(cè)等[1,2]。協(xié)同搜索的關(guān)鍵問題1是如何對(duì)不確定的環(huán)境進(jìn)行建模,最常用的方法是基于搜索圖的方法,例如基于環(huán)境不確定性的認(rèn)知圖[3,4]、信息素圖[5]、概率圖等[6];關(guān)鍵問題2是如何依據(jù)當(dāng)前對(duì)環(huán)境和目標(biāo)的認(rèn)知做出協(xié)同搜索決策,最典型的區(qū)域搜索方法有滾動(dòng)優(yōu)化算法[7]。
文獻(xiàn)[8]采用分散式結(jié)構(gòu),根據(jù)實(shí)時(shí)通信狀態(tài)構(gòu)建不同的小組和環(huán)境認(rèn)知地圖,小組內(nèi)采用集中式算法進(jìn)行決策。文獻(xiàn)[9]考慮通信距離限制情況,建立了UAV通信拓?fù)浣Y(jié)構(gòu),超過通信范圍且無法間接通信段UAV之間不能協(xié)同。文獻(xiàn)[10]針對(duì)UAV群部分鏈路不可達(dá)問題,根據(jù)實(shí)時(shí)通信狀態(tài),建立了局部互通網(wǎng)絡(luò),當(dāng)某一UAV無法與其他UAV進(jìn)行通信時(shí),將采用單機(jī)飛行控制,不再參與協(xié)同。
本文以特殊環(huán)境下通信受限時(shí)海上目標(biāo)搜索為研究背景,開展基于分布式模型預(yù)測(cè)控制(distributed model predictive control,DMPC)協(xié)同搜索問題研究,旨在生成一條最優(yōu)的搜索路徑。
將海面任務(wù)搜索區(qū)域Ξ視為平面,并進(jìn)行如圖1(a)所示的柵格化。采用概率圖表征目標(biāo)存在的概率情況。定義在網(wǎng)格c內(nèi),目標(biāo)存在的概率為pc(k)∈[0,1],pc(0)為先驗(yàn)信息。如圖1(b)所示,如果先驗(yàn)已知某個(gè)方格里面存在目標(biāo)的概率比較大時(shí),會(huì)將該方格及周圍方格的初始存在概率pc(0)設(shè)置為逐漸遞減形式,隨著UAV搜索任務(wù)的進(jìn)行,pc(k)實(shí)時(shí)變化,為UAV的決策提供實(shí)時(shí)的環(huán)境信息。引入γc,k∈[0,1]變量描述UAVi對(duì)網(wǎng)格c的不確定度
圖1 搜索區(qū)域環(huán)境建模
(1)
其中,Kγ>0,|?|為取絕對(duì)值。
假定任務(wù)派出n架UAV從指定機(jī)場(chǎng)出發(fā)對(duì)目標(biāo)區(qū)域Ξ展開搜索,在柵格圖模型中假設(shè)UAV是以一定速度飛行的質(zhì)點(diǎn)。規(guī)定每個(gè)單元格最多存在一個(gè)目標(biāo)。在柵格環(huán)境中規(guī)定UAVi只有8種航向狀態(tài),即,D={0,1,2,3,4,5,6,7},具體如圖2所示。由于UAV存在最小轉(zhuǎn)彎半徑的物理約束,因此,UAVi在t時(shí)刻的某種飛行方向下,下一步的飛行方向只有3種可選,直飛或者左右45°轉(zhuǎn)彎。
圖2 航向示意
定義狀態(tài)變量xi(k)=[δi(k),θi(k)],其中δi(k)=(xi(k),yi(k))=(n,m)為k時(shí)刻UAVi在柵格地圖上的位置索引,θi(k)為k時(shí)刻UAVi的航向角。UAVi的運(yùn)動(dòng)模型如下
(2)
其中,ln[*]為取整函數(shù),搜索過程中UAV以v0保持勻速飛行。
定義表征集群內(nèi)部通信狀態(tài)的鄰接矩陣F(k)
(3)
式中N為UAV的數(shù)量,fij=1為UAVi與UAVj之間能夠通信,fij=0為UAVi與UAVj之間超出通信范圍無法實(shí)現(xiàn)通信。令
本文考慮真實(shí)的雷達(dá)模型如圖3所示。O點(diǎn)為UAV所在位置,飛行高度為h,W為UAV在海面上的投影,在方位面的的覆蓋角度為2φ,垂直俯仰覆蓋角度為α1~α2,盲區(qū)半徑為r=h×tanα1。UAV搭載的雷達(dá)的搜索范圍在地面的投影則為ABCD圍成的扇形。這樣就將三維視場(chǎng)搜索問題轉(zhuǎn)換為二維平面內(nèi)的覆蓋問題,只要海上目標(biāo)出現(xiàn)在圖中的陰影部分,則視為可以搜索到目標(biāo)。
圖3 雷達(dá)搜索模型
定義τ=1為事件“網(wǎng)格c中存在目標(biāo)”,τ=0為事件“網(wǎng)格c中不存在目標(biāo)”,Ωi,c,k=1為在k時(shí)刻UAVi搜索到網(wǎng)格c中存在目標(biāo),將目標(biāo)存在概率地圖的更新寫為線性更新公式,定義一個(gè)新的變量
(4)
因此,概率地圖線性更新公式為
Πc,k=Πc,k-1+λc,k
(5)
其中
(6)
式中pd,pf分別為傳感器的虛警概率和檢測(cè)概率,這2個(gè)指標(biāo)描述了傳感器的性能。
分布式模型預(yù)測(cè)控制方法需要考慮相鄰智能體之間的信息交互,以實(shí)現(xiàn)UAV之間的協(xié)同。因此,UAVi決策搜索軌跡時(shí),需要考慮相鄰UAVj的狀態(tài)信息序列以及控制量序列。
3.1.1 搜索性能指標(biāo)
1)環(huán)境搜索收益
(7)
其中,Φl(c)為UAVi在網(wǎng)格c處,傳感器的探測(cè)靶面。
2)任務(wù)執(zhí)行代價(jià)
(8)
V(i,l,k)=Vs(i,l,k)-VD(i,l,k)
(9)
3.1.2 約 束
1)機(jī)間協(xié)同約束:為避免UAV集群發(fā)生碰撞,需要考慮UAV之間的安全約束
dij≥dmin
(10)
2)轉(zhuǎn)彎半徑約束:由于UAV存在轉(zhuǎn)彎半徑物理約束,每個(gè)時(shí)刻UAV的航向只能選擇直飛或者左右45°轉(zhuǎn)彎
θi(k)∈{-45°,0,45°}
(11)
考慮UAV間的相互通信,將集中式優(yōu)化決策問題分解為各個(gè)子系統(tǒng)的局部?jī)?yōu)化問題,進(jìn)行分布式求解,分布式模型預(yù)測(cè)控制包括預(yù)測(cè)、滾動(dòng)優(yōu)化和執(zhí)行3個(gè)關(guān)鍵步驟[11]。
3.2.1 預(yù) 測(cè)
3.2.2 滾動(dòng)優(yōu)化
分布式?jīng)Q策過程中每架UAV的優(yōu)化目標(biāo)只需要關(guān)注自身的搜索收益和航路代價(jià),因此在分布式框架下,優(yōu)化問題可構(gòu)造為
s.t.xi(k+q+1|k)=fi(xi(k+q|k),ui(k+q|k)),
xi(k+q|k)∈Ξ,θi(k+q|k)∈Θ,
dij≥dmin,q=1,2,…,T;i=1,2,…,N
(12)
由于耦合約束和耦合目標(biāo)函數(shù)的存在,導(dǎo)致上述優(yōu)化問題難以求解。因此,本文采用凍結(jié)策略[12]將上述問題進(jìn)行解耦。即每個(gè)采樣時(shí)刻都只有一架UAV會(huì)求解優(yōu)化問題(式(12)),更新控制序列,其他UAV將利用最新求解的控制序列進(jìn)行控制。具體而言,在UAVi進(jìn)行優(yōu)化更新時(shí),其他UAV的狀態(tài)及控制量采用上一更新時(shí)刻的預(yù)測(cè)序列,因此當(dāng)前優(yōu)化問題只包含與子系統(tǒng)i有關(guān)的優(yōu)化變量?!皟鼋Y(jié)”策略原理示意如圖4所示。
圖4 凍結(jié)策略下系統(tǒng)更新示意
其中,r=[x(k),x(k+1|k),…,x(k+T|k),…,u(k+T|k)],UAV將自身預(yù)測(cè)的狀態(tài)量以及控制量序列傳輸給鄰域內(nèi)的UAV。當(dāng)fij(k)=0時(shí),UAVi采取上一時(shí)刻獲取到的最新鄰居信息對(duì)下一時(shí)刻UAVj的狀態(tài)進(jìn)行預(yù)測(cè)。
3.2.3 執(zhí) 行
在以凍結(jié)策略進(jìn)行的滾動(dòng)優(yōu)化機(jī)制基礎(chǔ)之上,每架UAV會(huì)執(zhí)行上一個(gè)最新的控制序列中對(duì)應(yīng)時(shí)刻的控制量。
矩形格子大小設(shè)置為200 m×200 m,搜索任務(wù)區(qū)域?yàn)?00×100個(gè)網(wǎng)格,面向速度為30節(jié)的海上動(dòng)態(tài)目標(biāo),使用5架UAV執(zhí)行搜索任務(wù)。傳感器的虛警概率pf為0.3,檢測(cè)概率pd為0.9,探測(cè)范圍為1.2 km,盲區(qū)半徑為400 m。敵方目標(biāo)t1和t2的初始位置分別為[10,50]和[55,70],考慮低動(dòng)態(tài)目標(biāo),目標(biāo)做勻速運(yùn)動(dòng)。設(shè)置UAV搜索到2個(gè)目標(biāo)后就停止搜索。在目標(biāo)周圍存在區(qū)域,半徑為:考慮2個(gè)半徑為1 km的區(qū)域,及參數(shù)Kγ設(shè)置為1。UAV初始時(shí)刻在地圖邊緣呈一字隊(duì)形。圖5(a)為初始化地圖,其中,★代表目標(biāo)初始位置,底部扇形為雷達(dá)探測(cè)器的探測(cè)靶面,灰色陰影部分為威脅區(qū)域。
圖5 搜索地圖及搜索軌跡
如圖5(b)所示,使用DMPC算法在72 s時(shí),搜索到目標(biāo)t1,108 s時(shí)搜索到目標(biāo)t2。圖5(c)為平行搜索法下的搜索軌跡,47 s時(shí)探測(cè)到目標(biāo)t1,132 s時(shí)搜索到目標(biāo)t2。雖然平行搜索算法先行搜索到目標(biāo)t1,但所有目標(biāo)搜索到的總時(shí)間更長(zhǎng),且每個(gè)階段的搜索區(qū)域覆蓋率都比DMPC算法下的搜索結(jié)果低。
表1所示,DMPC在108 s時(shí)間內(nèi)的覆蓋率為42.10 %,而平行搜索算法在132 s的搜索任務(wù)執(zhí)行下只實(shí)現(xiàn)了39.92 %的覆蓋率。隨著搜索任務(wù)的進(jìn)行,由表2可以看出:在統(tǒng)計(jì)的多個(gè)時(shí)間段里DMPC算法的覆蓋率都是高于平行搜索算法。
表1 搜索到目標(biāo)的時(shí)間及覆蓋率對(duì)比
表2 覆蓋率隨時(shí)間的變化 %
本文研究了通信受限條件下UAV群協(xié)同搜索問題,利用模型預(yù)測(cè)控制的滾動(dòng)時(shí)域優(yōu)化特點(diǎn),針對(duì)海上艦船目標(biāo)搜索任務(wù)提出了一種多UAV分布式協(xié)同搜索算法。與傳統(tǒng)平行搜索算法相比,該算法能夠?qū)崿F(xiàn)避障,并以更高的效率實(shí)現(xiàn)目標(biāo)搜索任務(wù)。除了通信范圍受限問題,在實(shí)際的環(huán)境中,通信延時(shí)、數(shù)據(jù)包丟失等更復(fù)雜的情況將在未來的工作中進(jìn)一步的研究。