于 飛, 李 擎, 張 昊
(北京信息科技大學(xué)高動態(tài)導(dǎo)航技術(shù)北京市重點實驗室,北京 100101)
無人機與無人車是信息化裝備體系的重要組成部分,在軍事中投入使用可顯著提高軍事作戰(zhàn)能力,此外,可以在核、生物和化學(xué)戰(zhàn)爭環(huán)境中執(zhí)行物資運輸、目標識別以及環(huán)境勘測等任務(wù)。微分對策理論為軍事對抗問題提供了較為完善的模型[1-4],定性微分對策中界柵的確定是研究熱點之一[5-8]。應(yīng)用追逃微分對策分析時,對局環(huán)境中的障礙物的影響會被考慮[9-10]。文獻[11]為了解決固定翼無人機追蹤地面移動車輛的問題,運用微分對策理論進行定量分析,得到防止目標丟失的最優(yōu)策略。本文在無人機、無人車的追捕對抗過程中,考慮對局環(huán)境中障礙物的影響,定性分析追逃微分對策,確定其分界界柵。無人機配有固定攝像頭裝置,可以提供足夠的視覺分辨率,在野外作戰(zhàn)現(xiàn)場自動跟蹤地面的無人車,使其始終處于觀測范圍之內(nèi);無人車則根據(jù)自身運動特性以及周圍環(huán)境來躲避無人機的追蹤。對局雙方為單一的追捕者和躲避者,無人機希望最大化延長無人車在其有效可視范圍之內(nèi)的時間,無人車希望盡快逃避追捕。
設(shè)定P代表追捕方無人機,E代表躲避方無人車。假設(shè)P和E分別以速度vp,ve在平面上勻速運動。P的目的是迫使局中人E進入目標集D,并捕捉E,從而結(jié)束對策,而E的目標正好相反,試圖阻止或者拖延對策結(jié)束,如圖1所示。
P可以以速度vp在平面內(nèi)任意活動,滾轉(zhuǎn)角、俯仰角保持不變,偏航角控制為v;躲避E以速度ve運動,轉(zhuǎn)向控制記為u;P和E均可以完成瞬時的轉(zhuǎn)向。博弈具有一個完美的狀態(tài)反饋信息結(jié)構(gòu),因此,當參與者在進行博弈時,能夠不受干擾地知曉整個過程中的狀態(tài)變化,從而確定下一個動作。
圖1 對局示意圖Fig.1 Game diagram
對局環(huán)境中存在樹木形成的障礙,這會對雙方產(chǎn)生影響。追捕者希望在盡可能長的時間內(nèi)將躲避者保持在可視區(qū)域,躲避者希望在最短的時間內(nèi)打破視線。某一時刻,如果躲避者不在捕獲者的視線之內(nèi),此時對局終止。
(1)
由于無人車可以瞬時轉(zhuǎn)向,因此其方向控制:當u=+1時,向右運動;當u=-1時,則向左運動。
在設(shè)定的場景中,對局雙方視為點運動物體,除了有界速度之外,它們的運動沒有任何限制。與經(jīng)典情況一致,這里無人機與無人車的速度之比k=vp/ve>1。對局環(huán)境中僅包含限制追捕者和躲避者運動的障礙,對局雙方都有獨立決策權(quán),他們根據(jù)實際情況采取決策,控制局勢朝著有利于自己的方向發(fā)展。
P和E都可以控制各自的方向,且各自轉(zhuǎn)向控制分別為v,u。當P與E之間的距離小于L時,則認為被捕獲,此時對局結(jié)束。作簡單的分析不難得到表1中的4種結(jié)局。
情況2中P在機動性能上占絕對優(yōu)勢,所以總能捕獲到E;情況3中E在機動性能上占絕對優(yōu)勢,所以總能逃脫P的追捕。這兩種情況對局結(jié)果是確定的,沒有深入研究的意義,下面將對情況1和情況4這種雙方互有優(yōu)、劣勢的對局結(jié)果進行探討。情況4中vp>ve,v
表1 運動性能與結(jié)局的關(guān)系
定義d=(xe-xp,ye-yp,ze-zp)為追捕者的瞬時位置到躲避者的瞬時位置的指向向量,ve(t)和vp(t)分別為t時刻躲避者與追捕者的速度向量,于是有‖ve(t)‖=ve<‖vp(t)‖=vp。
定理1在任一時刻t0,如果追捕者的速度向量vp(t0)與相對位置向量d(t0)的內(nèi)積非正,即如果
d(t0),vp(t0)≤0
(2)
則t≥t0時P不能捕獲到E,E成功逃脫。
證明 不失一般性,設(shè)t0=0。為了證明這個定理,只需找到一個E成功逃脫的例子。假設(shè)在t≥0的任意時刻,P都不改變其速度方向,相對位置向量d滿足
(3)
(4)
鑒于P的約束性,定理1的證明說明,只有P的速度向量的分量指向E時捕獲才會發(fā)生,這種情況下P的最優(yōu)策略是盡快增大指向E的速度分量,如果這個分量增加得較慢,捕獲將可能無法完成。另一方面,如果P一直沒有指向E的速度分量,則E可憑借其機動性優(yōu)勢成功逃避追捕。
如表1所示,在情況1和情況4下,P和E各有優(yōu)勢,對策空間可以劃分為 2 部分。一部分為捕獲區(qū),另一部分為躲避區(qū),其分界面為界柵,記作D。
H(x,y,u,v,λ)=λ1vpcosv+λ2vpsinv+λ3veu
(5)
Hp(v)=vp(λ1cosv+λ2sinv)
(6)
He(v)=λ3veu
(7)
在λ1,λ2均為0的情況下,v可以取任何值,P可以遵循任何控制策略。 類似地,如果λ3=0,那么u可以取任何值,并且E可以遵循任何控制策略。這些條件代表了哈密爾頓算子的奇異點。
H(x,y,u,v,λ)表示狀態(tài)的變化率。如果軌跡X在?D上或者充分接近?D,并且H(x,y,u,v,λ)>0,那么軌跡X不能穿過?D;反之,即H(x,y,u,v,λ)<0則軌跡X穿過?D,此時對局結(jié)束。因此,從P與E各自的目的出發(fā),P欲使H<0,而E欲使H>0。哈密爾頓函數(shù)H(x,y,u,v,λ)中含有控制變量u,v,因此P應(yīng)該選擇最優(yōu)策略v,使H(x,y,u,v,λ)?D在目標邊界集合?D上取得盡可能小的負值以保證對局結(jié)束,而E應(yīng)選擇最優(yōu)策略u使H(x,y,u,v,λ)?D取得盡可能大正值以實現(xiàn)逃脫,即
(8)
(9)
(10)
式中:u=+1,說明沿x軸的正方向運動;u=-1,意味著朝相反方向運動。所以可得
(11)
樹木覆蓋會對無人機和無人車的視線造成影響,進而影響對局結(jié)果。本文把樹木作為對局環(huán)境中的障礙,對樹木的影響進行建模分析。追捕者成功追捕到目標,或者目標丟失都會導(dǎo)致對局結(jié)束。
按照設(shè)定場景,給出了樹木障礙物存在的情況下對局終止的兩個充分條件:1) 當無人車處于無人機的有效觀測距離之外時,認為目標丟失;2) 雖然無人車在無人機的有效觀測距離之內(nèi),但是兩者視線被障礙物阻擋,相互不可見。以上兩種情況分別對應(yīng)圖2a和圖2b。
圖2 對局情況分析Fig.2 Game situation analysis
(xe-xp)2+(ye-yp)2-L2≤0
(12)
同樣,選取三角形底邊頂點為(xT,yT),將條件2)向xoz面投影,條件2)可以表示為
(13)
上述兩個條件得到滿足時,對局終止,可得終端集
F=(xe-xp)2+(ye-yp)2-L2+(xp-xT)·
(ye-yT)-(yp-yT)(xe-xT)=0
(14)
由終端集可得參數(shù)方程
(15)
式中,s=(s1s2s3)T。
在界柵D上的法線向量λ滿足
(16)
因為法線向量的長度是任意的,故可取λ為單位法線向量,在?D上同樣有λT·λ?D=1,聯(lián)立式(10)可以求出確定目標邊界集?D上的單位法線向量λ。
(17)
代入式(9),可以得到最優(yōu)策略u*,v*。
(18)
積分可得
(19)
設(shè)置P的初始化坐標為(0 m,0 m,29 m),E的初始坐標為(3 m,5 m,0 m),速度比為k=1.14,捕獲半徑L=200 m。當障礙點在(5 m,5 m,5 m)時,得到圖3a所示三維空間界柵。
圖3 界柵Fig.3 The barrier
界柵D對應(yīng)的是穿過BUP的半透曲面,為方便觀察將圖3a朝xoy平面投影得到圖3b。圖3b中圓和雙曲圓弧代表目標集在xoy平面的投影,藍色陰影部分是由界柵D和目標集圍成的捕獲區(qū),在捕獲區(qū)內(nèi)運動,軌跡將到達目標集的邊界并穿過。在此區(qū)域內(nèi),只要P使得E進入該區(qū),則無論E采取何種策略,在P選擇適當?shù)牟呗韵?,E再也不能逃出該區(qū),即捕獲E。捕獲區(qū)之外為躲避區(qū),在此區(qū)域上,只要E初始位置在該區(qū)中,不管P采用何種策略,E總能采取適當?shù)牟呗远惚躊的捕獲。
分析對局環(huán)境中存在障礙物約束的追逃定性微分對策,建立了無人機、無人車的運動模型,通過分析確定了躲避區(qū)與捕獲區(qū)的分界界柵。不同的障礙物對界柵的形狀會有不同的影響,分析界柵的形狀、對策空間的劃分對于作戰(zhàn)能力評價、指導(dǎo)指揮訓(xùn)練、作戰(zhàn)等都有一定的意義。未來,對局雙方更復(fù)雜的運動模型,以及其他形狀的障礙物將會進一步討論。
參 考 文 獻
[1] 原鑫,李擎,蘇中.基于微分對策理論的兩車碰撞問題[J].北京信息科技大學(xué)學(xué)報:自然科學(xué)版,2016,31(5):68-72.
[2] 龔華軍,楊長鋒,王彪,等.無人機的追逃對抗仿真研究[J].控制理論與應(yīng)用,2009,26(9):1019-1022.
[3] 車競,鄭鳳麒.基于微分對策的追逃對抗仿真[J].飛行力學(xué),2014,32(4):372-375.
[4] 車競,錢煒祺,和爭春.基于矩陣博弈的兩機攻防對抗空戰(zhàn)仿真[J].飛行力學(xué),2015,33(2):173-177.
[5] 佟明安,王立新.三維空間雙機格斗的捕捉區(qū)和危險區(qū)[J].航空學(xué)報,1989,10(11):536-544.
[6] 張秋華,孫毅,黃明明,等.近地共面軌道上兩飛行器在徑向連續(xù)小推力下的追逃界柵[J].控制與決策,2007,22(5):530-534.
[7] 黃銀春.導(dǎo)彈攔截飛機末端制導(dǎo)制導(dǎo)律和界柵的研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2014.
[8] 王發(fā)坤,秦艷琳.三維空間中追逃對抗定性微分對策模型研究[J].艦船電子工程,2008,28(7):14-16,181.
[9] BHATTACHARYA S,HUTCHINSON S,BASAR T.Game-theoretic analysis of a visibility based pursuit-evasion game in the presence of obstacles[C]//American Control Conference,2009:373-378.
[10] OYLER D W,KABAMBA P T,GIRARD A R.Pursuit-evasion games in the presence of obstacles[J].Automatica,2016,65(C):1-11.
[11] QUINTERO S A P,HESPANHA J P.Vision-based target tracking with a small UAV:optimization-based control strategies[J].Control Engineering Practice,2014(32):28-42.