杜津銘,吳云華,陳志明,華 冰,許心怡,朱 翼,岳程斐
(1.南京航空航天大學空間光電探測與感知工業(yè)和信息化部重點實驗室,江蘇 南京 210016;2.南京航空航天大學航天學院,江蘇 南京 210016;3.哈爾濱工業(yè)大學(深圳)空間科學與應用技術研究院,廣東 深圳 518055)
船舶一直以來在國民經濟和國防事業(yè)中發(fā)揮著重要作用。根據國家統計局數據,2018年水運貨物周轉量占全部貨物周轉量的48.39%;亞丁灣索馬里一帶海域頻繁發(fā)生海盜劫持活動,中國海軍從2008年底開始在海盜頻發(fā)區(qū)域執(zhí)行護航、救援等活動。因此,研究海上目標搜索可以獲取對方海上力量分布,提前進行戰(zhàn)略決策,保障己方海洋權益、遠洋貿易、領土安全。
海上移動目標搜索通常利用衛(wèi)星對目標先進行分析并獲得其可能出現區(qū)域(潛在區(qū)域),再部署相關衛(wèi)星對這些區(qū)域進行搜索。常見的搜索算法有隨機搜索、最大概率網格搜索、最大發(fā)現概率搜索、最大覆蓋搜索、最大信息熵增量搜索等[1]。Ru等[2]根據傳感器的檢測結果,使用貝葉斯理論更新目標分布概率,采用分布式模型預測控制方法設計搜索策略,提高了搜索效率。Zhen等[3]提出了一種智能自組織算法來解決多無人機的協同搜索任務規(guī)劃問題。Sara等[4]采用蟻群算法對無人機的搜索路徑進行設計,以確保找到移動目標的時間最短。Rihel等[5]使用類似于模型預測控制的方法更新目標分布概率密度,在有界區(qū)域中,完成多無人機的目標搜索任務并保證搜索時間最短。Yue等[6]基于改進的多蟻群理論,通過設計目標概率圖減小了由動態(tài)目標引起的不確定性的影響,完成了未知環(huán)境下的目標搜索問題。饒世鈞等[7]基于目標先驗信息(包括任務特性、海區(qū)航行條件、大致航線等)確定多個離散目標分布區(qū),在假設目標服從均勻分布的情況下設計最優(yōu)搜索策略模型,提高了衛(wèi)星離散搜索效率。王慧林等[8]利用目標航速和航向先驗信息,建立目標運動預測模型并構建其潛在區(qū)域,通過遺傳算法規(guī)劃多星組網偵察同一潛在區(qū)域,完成對目標的偵測任務。陳杰等[9]采用偵察衛(wèi)星和地面系統結合的方式獲取目標運動信息,通過預測模型進行目標運動預測,最后調用遙感衛(wèi)星進行目標搜索。高越等[10]結合海上移動目標和光學遙感衛(wèi)星的特點,建立了目標揭示能力評價模型,完成了多星協同工作規(guī)劃任務。王瑞安等[11]基于stackelberg均衡策略,結合多步預測思想,實現了無人機和目標都具有遠距離探測能力的博弈搜索。
上述算法核心在于目標潛在區(qū)域預測與衛(wèi)星搜索規(guī)劃。其中預測算法直接決定了需要搜索區(qū)域面積和成功率,而規(guī)劃算法只是在預測的基礎上盡可能優(yōu)化效率。這些算法大多采用均勻分布假設或基于海上動態(tài)目標航向和速度等目標先驗信息,而海上動態(tài)目標航向容易受到局部環(huán)境影響,因此預測算法在時間跨度較小時效果較好,在時間跨度較大時存在較大誤差。針對上述研究的不足之處,本文提出海上動態(tài)目標潛在區(qū)域博弈預測及搜索方法?;谝阎畔?、目標與遙感衛(wèi)星星座之間的關系建立博弈論模型,以收益為指標設計博弈策略,將目標最優(yōu)決策作為目標潛在區(qū)域預測算法的結果,遙感衛(wèi)星星座的最優(yōu)決策作為衛(wèi)星搜索規(guī)劃算法的結果。目標最優(yōu)決策從目標航線的決定因素等方面進行求解,因此相比于基于航速信息的傳統算法擴展了預測的時間跨度并提升了整體預測精度。衛(wèi)星搜索規(guī)劃作為遙感衛(wèi)星星座在博弈論模型下的最優(yōu)決策,能夠保證在當前已知信息下的收益最優(yōu)。本論文的方法可以應用于衛(wèi)星、飛機等對大型船舶等海上動態(tài)目標的預測搜索,對國民經濟和國防事業(yè)具有重大潛在應用價值。
博弈論[12-13]研究理性決策主體間發(fā)生沖突時的決策及其均衡問題,共有3個要素:局中人(所有理性決策主體),策略集合以及收益函數。在海上動態(tài)目標搜索過程中,局中人集為
N={遙感衛(wèi)星星座,目標}
(1)
在t時刻,遙感衛(wèi)星狀態(tài)向量為
Xt=[xS(t),yS(t),θS(t)]T∈A1
(2)
式中:xS(t)和yS(t)為遙感衛(wèi)星在t時刻的星下點位置;θS(t)為遙感衛(wèi)星星下點軌跡斜率;A1為遙感衛(wèi)星的狀態(tài)空間。
在t時刻,海上動態(tài)目標的狀態(tài)向量為
Yt=[xT(t),yT(t)]T∈A2
(3)
式中:xT(t)和yT(t)為目標在t時刻的位置;A2為目標的狀態(tài)空間。
遙感衛(wèi)星星座通過目標區(qū)域的掃描方向θm(t)和區(qū)域位置[xm(t),ym(t)]確定下一時刻遙感衛(wèi)星,即遙感衛(wèi)星星座的決策變量為
Ss(t)[θm(t),xm(t),ym(t)]∈B1
(4)
式中:B1為遙感衛(wèi)星星座的決策空間。
目標通過改變其速度大小vT(t)和運動方向θT(t)決定下一時刻的位置,即目標的決策變量為
ST(t)[vT(t),θT(t)]∈B2
(5)
式中:B2為目標的決策空間。
遙感衛(wèi)星星座通過(Ss,ST)決策使得捕獲目標機率J1最大:
J1(Ss,ST)=max
(6)
目標則通過(Ss,ST)決策使得前往目的地的收益J2最大:
J2(Ss,ST)=max
(7)
對于上述博弈模型,若存在:
(8)
滿足
(9)
(10)
如圖1為海上動態(tài)目標潛在區(qū)域博弈預測及搜索方法示意圖。在0時刻,目標根據當前任務要求和自身運動參數進行決策,然后按照最優(yōu)航線航行。對遙感衛(wèi)星星座,其在t時刻收到對目標進行搜索任務,根據目標過去某時刻(0時刻與t時刻之間)的位置和對目標當前任務與運動參數的估計值,對目標潛在區(qū)域預測進行最優(yōu)決策估計并形成當前時刻下遙感衛(wèi)星星座的最優(yōu)決策。
圖1 海上動態(tài)目標潛在區(qū)域博弈預測及搜索方法示意圖Fig.1 Schematic diagram of latent area prediction and search method for marine moving targets based on game theory
目標和遙感衛(wèi)星星座作為博弈模型中的局中人,其信息是不對稱的,即兩局中人的最優(yōu)決策建立在非對稱信息假設下:
(11)
(12)
雖然目標在0時刻進行決策,遙感衛(wèi)星星座在t時刻進行決策,但雙方的決策都是基于已知信息進行的,在非對稱信息假設下,已知信息非時變。即在該假設下,目標和遙感衛(wèi)星星座從動態(tài)博弈變?yōu)殪o態(tài)博弈。目標和遙感衛(wèi)星星座在各自信息下的最優(yōu)決策構成納什均衡。
對目標來說,其收益J2可以表示為
J2=Ge-Gc(Lall)-Gh(tall,Lall)
(13)
式中:Ge為目標抵達目的地可獲得的收益,可看作一個常量;Gc(Lall)為目標在行動過程中的成本,為關于總航程Lall的函數,總航程越大成本越高;Gh(tall,Lall)為目標被衛(wèi)星發(fā)現造成的收益損失,為關于航行總時間tall和總航程Lall的函數,目標抵達目的地所消耗的時間越長,總航程越短(即以接近直線的方式前往目的地),被發(fā)現的幾率越大。
圖2為目標可能航線圖。A為目標起始點到目的地的最短航線,該決策只考慮Gc的航程成本和Gh中的時間因素,忽略Gh中的航程因素;B為目標到目的地的一條較長的弧線,該決策增大總航程Lall以降低目標被發(fā)現幾率,但沒有考慮Gc的航程成本和Gh中的時間因素。
圖2 目標可能航線Fig.2 Possible routes of target
通常情況下,A、B都不是最優(yōu)決策,但A、B構成了決策空間的邊界,最優(yōu)航線C處于A、B包圍的決策空間內,其綜合考慮了總航程、時間成本和被發(fā)現的損失。
圖3為t時刻的目標位置。Ltotal為目標起始點與目的地之間的距離;L(t)為目標與目標起始點之間的曲線長度,即目標從目標起始點到當前位置的航行路程;Ltd為目標與目的地之間的曲線長度,即目標從當前位置到目的地的航行路程;Lbias為目標偏離目的地與目標起始點連線的距離,即目標與最短航線的最小距離。分析式(13),目標的收益J2和目標的總航程Lall以及航行總時間tall有關。其中總航程Lall為
Lall=L(t)+Ltd
(14)
圖3 t時刻的目標位置Fig.3 Position of target at time t
假設Ssat為遙感衛(wèi)星成像區(qū)域面積,在t時刻,目標的概率分布為p(x,y,t),則遙感衛(wèi)星發(fā)現目標的期望為
(15)
在真實環(huán)境下,遙感衛(wèi)星星座的已知信息包括目標的航速范圍、目標在過去某時刻t0的位置,而目標決策函數中的參數無法完全掌握。因此,假設總航程Lall為
Lall=Ltotal+Ladd
(16)
式中:Ltotal為t0時刻目標位置與目的地之間的距離;Ladd為相對于最短航程所增加的航程,可表示為
Ladd=kadd·Ltotal
(17)
目標從t0時刻到t時刻的航行路程L(t)為
(18)
Lall≥Dist(p0,pt)+Dist(p0,pd)
(19)
式中:函數Dist(pi,pj)表示點pi和pj的距離。
根據式(16)和式(17),kadd滿足:
(20)
(21)
(22)
繪制目標概率分布圖[14-16]以避免式中的積分運算。假設Lallmax=1.8Ltotal,即3σdis=0.8,μv=40 km/h,3σv=15 km/h,目標在t0=0 h時的經緯度坐標為[9.5°,165°],目的地經緯度坐標為[27.5°,125.4°]。圖4為t=24 h時,整個區(qū)域的概率密度分布圖,圖5為t=48 h時,整個區(qū)域的概率密度分布圖。圖4和圖5中的三角形為起點,六角形為目的地。分析兩張圖可以發(fā)現,隨著時間的推移,目標出現在起點和目的地之間的概率增大,目標潛在區(qū)域的面積也不斷增大。
圖4 概率密度分布圖(t=24 h)Fig.4 Probability density distribution map (t=24 h)
圖5 概率密度分布圖(t=48 h)Fig.5 Probability density distribution map (t=48 h)
在實際應用中,海上目標航行的影響因素還包括天氣、洋流等。洋流主要隨季節(jié)變化,而天氣相對來說更具突變性,對海上航行的影響更大,因此下面對天氣干擾進行討論。天氣對海上動態(tài)目標的影響主要可分為兩種情況:① 不威脅航行安全的普通天氣,主要干擾海上目標的航速;② 熱帶氣旋等威脅海上航行安全的惡劣天氣,將對海上目標的航線規(guī)劃產生直接影響。對第一種情況,根據氣象局發(fā)布的預報信息,調整式中μv和σv(海上目標航速相關參數)以降低天氣對船速的干擾。對第二種情況,影響的具體表現為海上目標的航線在進行規(guī)劃時將避免經過惡劣天氣影響區(qū)域,即將直接影響海上目標概率分布區(qū)域。根據天氣對航線的影響程度,劃分惡劣天氣影響區(qū)域(簡稱天氣區(qū)域),該區(qū)域是海上目標航行禁區(qū)。根據第2.2節(jié)的分析,海上目標最優(yōu)航線為折線,因此通過從目的地和目標起始點對天氣區(qū)域作切線,劃分出3塊受天氣影響的區(qū)域,結果如圖6所示。
圖6 惡劣天氣影響區(qū)域劃分Fig.6 Regional division affected by severe weather
對于圖6中區(qū)域1,天氣主要影響海上目標的未來航線,而對當前時刻的概率分布影響較小,可以忽略其影響。對于區(qū)域3,海上目標進入該區(qū)域的航線必將經過天氣區(qū)域,因此在區(qū)域3中,海上目標分布概率為0。對于區(qū)域2,天氣區(qū)域將影響經過該區(qū)域的航線,即降低該區(qū)域分布概率。該區(qū)域內點(x,y)的概率密度p(x,y,t)變?yōu)?/p>
(23)
假設天氣區(qū)域為圓形,圓心為[28°,160°],半徑為500 km。圖7為t=48 h時刻,天氣影響下的海上目標概率分布圖。
圖7 天氣影響下的概率密度分布圖(t=48 h)Fig.7 Probability density distribution map under the influence of weather (t=48 h)
2016年投入使用的GF-4衛(wèi)星可見光紅外波段的分辨率優(yōu)于50 m,單景成像幅寬優(yōu)于500 km×500 km。歐洲空客公司提出的GO3S衛(wèi)星星下點空間分辨率為3 m,成像幅寬為100 km。GEO SAR衛(wèi)星通常能夠達到幅寬400 km之上[17],如Madsen等[18]研發(fā)的系統能夠提供10 m空間分辨率、600 km幅寬的條形觀測帶,Braun等[19]提出的系統空間分辨率為20 m、總幅寬為1 800 km[20]。因單顆衛(wèi)星的覆蓋范圍、載荷觀測能力等有限,難以滿足對全空域、全時域的信息獲取需求,需要將多星構成一個遙感星座。同時由于衛(wèi)星軌道限制,對海上動態(tài)目標的觀測屬于間歇式事件[10],通常情況下無法在單次成像就完成對所有目標潛在區(qū)域的探測,因此考慮通過多次成像完成對可能區(qū)域的探測。
假設Δtsat為遙感衛(wèi)星星座訪問指定地區(qū)的時間間隔,Wsat和Lsat為遙感圖像的寬和長,nsat為成像次數。圖8為第1次和第2次成像的成像區(qū)域示意圖。對于第i次成像,其成像區(qū)域的目標概率分布p(x,y,t)將會變?yōu)?或1,0為未發(fā)現目標,1為發(fā)現目標,提前結束后續(xù)成像過程。對于第i+1次成像來說,成像區(qū)域可以和第i次成像的成像區(qū)域合并,將合并后的大區(qū)域作為第i+1次的成像區(qū)域。
需要注意的是,由于兩次成像之間有時間間隔Δtsat,如果目標在第i次成像時位于成像區(qū)域邊緣,則在下一次成像前,目標將會進入第i次成像區(qū)域。因此,對于第i+1次成像,在合并上一次成像區(qū)域前,需要將上一次的成像區(qū)域向內收縮VmaxΔtsat,Vmax為目標的最大速度。
圖8 成像區(qū)域Fig.8 Imaging area
對于第i次成像,Ssat(i)為成像區(qū)域面積,t為成像時刻,p(x,y,t)為目標在t時刻的概率分布。遙感衛(wèi)星星座的收益J1可以表示為
G2(Ssat(i))-G3(i,Δtsat)
(24)
式中:第1項為衛(wèi)星發(fā)現目標的期望,其中kcost-pro為調節(jié)系數,其值越大代表發(fā)現目標的重要性更高,值越小代表更看重為發(fā)現目標所付出的成本;第2項G2(Ssat(i))為到第i次成像為止遙感衛(wèi)星拍攝并處理圖像的成本;第3項G3(i,Δtsat)為到第i次成像為止拍攝圖像所花費的時間成本。
為了驗證海上動態(tài)目標潛在區(qū)域博弈預測及搜索方法的有效性,對基于航速信息的傳統算法、僅基于海上動態(tài)目標分布概率的搜索算法和本文提出的潛在區(qū)域博弈預測及搜索算法進行仿真研究。
設置海上動態(tài)目標目的地經緯度坐標為[27.5°,125.4°],起始點(目標在t0=0 h時的坐標)為[9.5°,165°]。假設Lallmax=1.8Ltotal,即3σdis=0.8,μv=40 km/h,3σv=15 km/h,遙感衛(wèi)星星座的成像幅寬Wsat=600 km,遙感衛(wèi)星星座訪問指定地區(qū)所需時間(相鄰兩次成像時間間隔)Δtsat=30 min。
圖9為針對圖5的概率密度分布設計的最優(yōu)決策成像區(qū)域。圖9中的三角形為起始點,六角形為目的地。虛線圈出了概率密度大于一定閾值(最大值的2%)的區(qū)域,為最優(yōu)決策所要求的有效成像區(qū)域,該區(qū)域下發(fā)現目標的數學期望超過97.62%。實線矩形框對應第i次成像區(qū)域,即第i次進行目標搜索的區(qū)域。通過調整成像區(qū)域的位置和成像順序,可以使得發(fā)現目標的期望概率和預計搜索次數最優(yōu)。
圖9 最優(yōu)決策成像區(qū)域Fig.9 Imaging area of optimal
選用基于航速信息的傳統算法和僅基于海上動態(tài)目標分布概率的搜索算法作為對照組。圖10和圖11分別為兩種算法的成像區(qū)域,圖中實線矩形框對應第i次成像區(qū)域,三角形為起始點,六角形為目的地。圖10為傳統算法的成像區(qū)域,該算法基于航速信息,單次搜索區(qū)域為沿目標在t0=0 h時的坐標與目的地連線的垂線方向的條形掃描帶,從海上動態(tài)目標可能到達的離目的地最近的位置開始,向目標t0=0 h時的坐標進行多次搜索。圖11為僅基于海上動態(tài)目標分布概率的搜索算法的成像區(qū)域,該算法單次搜索區(qū)域與傳統算法類似,但是根據海上動態(tài)目標分布概率密度對每次搜索的掃描帶長度進行調整,從目標t0=0 h時的坐標開始向目的地進行多次掃描。
圖10 基于航速信息的傳統算法的成像區(qū)域Fig.10 Imaging area of traditional algorithm based on navigational speed information
圖11 僅基于海上動態(tài)目標分布概率的搜索算法的成像區(qū)域Fig.11 Imaging area of search algorithm based only on distribution probability of the marine moving target
分析表1實驗結果可知,傳統算法僅基于海上動態(tài)目標的最大航速估計值,從目標可能達到的離目的地最近的位置開始搜索,因此在目標的航線近似于起始點到目的地的直線(對應第2組仿真參數,即表1第3行)和目標在過去一段時間的平均航速較大(對應第4組仿真參數,即表1第5行)這兩種情形下,算法對目標的捕獲率較高,而在其他情形下算法的捕獲率較低。
分析表2實驗結果,搜索算法僅基于海上動態(tài)目標分布概率,未考慮搜索順序的影響。算法在面對推理參數與實際參數不一致的情形時,對目標的捕獲率整體較好,僅在目標在過去一段時間的平均航速較大(對應第4組仿真參數,即表2第5行)這一情形下捕獲率較低,這是由于航速較大時目標的實際可能分布區(qū)域大于理論區(qū)域,因此搜索區(qū)域的期望預期低于理論計算值。
分析表3實驗結果,潛在區(qū)域博弈預測及搜索算法綜合考慮海上動態(tài)目標分布概率與衛(wèi)星星座搜索路徑,算法在面對推理參數與實際參數不一致的情形時,對目標的捕獲率整體依舊較好,仿真結果基本符合理論計算結果。
表1 基于航速信息的傳統算法Table 1 Traditional algorithm based on navigational speed information
表2 僅基于海上動態(tài)目標分布概率的搜索算法Table 2 Search algorithm based only on distribution probability of the marine moving target
表3 潛在區(qū)域博弈預測及搜索算法Table 3 Latent area prediction and search algorithm based on game theory
對比分析表1,表2和表3的實驗結果,傳統算法所需信息較少(僅需要海上動態(tài)目標的最大航速估計值),但是對目標的捕獲率隨著真實情況的不同,波動較大,整體捕獲率較低;相對于傳統算法,僅基于海上動態(tài)目標分布概率的搜索算法引入了更多目標的信息,搜索區(qū)域更具針對性,因此算法的整體捕獲率更高;潛在區(qū)域博弈預測及搜索算法綜合考慮了海上動態(tài)目標分布概率與搜索成本,對搜索路徑進行了優(yōu)化,在保證了較高目標捕獲率的同時,平均成像次數和平均搜索面積較前兩種算法大幅下降。
針對海上動態(tài)目標搜索定位問題,根據目標已知的歷史位置及可能的目的地,本文給出了一種目標潛在區(qū)域博弈預測及搜索方法。通過對海上動態(tài)目標和遙感衛(wèi)星星座之間的態(tài)勢進行分析,在非對稱信息假設下,將兩者的博弈關系從動態(tài)博弈轉化為靜態(tài)博弈。以收益設計博弈策略,將目標潛在區(qū)域預測和衛(wèi)星搜索規(guī)劃轉化為納什均衡下最優(yōu)策略求解。對3種搜索算法進行仿真校驗。
結果表明,該算法在保證了較高目標捕獲率的同時,資源消耗量(成像次數與成像面積)較小。相比基于航速信息的傳統算法,該算法引入了目的地信息,能夠良好應用于時間跨度(海上目標的已知軌跡點對應時刻和開始搜索時刻之差)較大的情形,預測算法的結果作為搜索算法的輸入,預測時間跨度和預測準確性影響搜索算法的效率。預測時間跨度越大,目標潛在區(qū)域也越大,即需要進行搜索的區(qū)域也越大。從算法的應用角度定義預測時間跨度的閾值:完成目標搜索的時刻必須早于目標抵達目的地的時刻,即預測時間跨度與目標潛在區(qū)域搜索的時長之和必須小于目標到達目的地的預計時長。相比僅基于目標分布概率的搜索算法,該算法通過設計遙感衛(wèi)星星座的收益函數,能夠在低搜索成本(低目標捕獲率)和高目標捕獲率(高搜索成本)等不同任務場景之間靈活切換。需要指出的是,該方法不僅能夠應用于遙感衛(wèi)星星座對海上動態(tài)目標的搜索,同樣也適用于無人機或機器人對移動目標的搜索應用需求。