陳子豪, 李 娟,*, 劉 暢, 李 杰, 劉笑宇
(1. 北京理工大學(xué)機(jī)電學(xué)院, 北京 100081; 2. 中國(guó)兵器工業(yè)導(dǎo)航與控制技術(shù)研究所, 北京 100089)
現(xiàn)代戰(zhàn)場(chǎng)環(huán)境存在大量?jī)r(jià)值較高、機(jī)動(dòng)能力較差但防御能力較強(qiáng)的敵方地面目標(biāo),如指揮所、彈藥庫(kù)、雷達(dá)車等[1]。集群彈藥具有個(gè)體數(shù)量多、成本相對(duì)較低以及雷達(dá)紅外特征弱等特點(diǎn),可以從多個(gè)方向?qū)Φ孛婺繕?biāo)進(jìn)行協(xié)同打擊[2]。
集群彈藥協(xié)同任務(wù)規(guī)劃是集群協(xié)同作戰(zhàn)的一個(gè)關(guān)鍵性難題[3],集群彈藥協(xié)同打擊地面目標(biāo),若不考慮時(shí)間約束等問(wèn)題,可能會(huì)因?yàn)榇驌魰r(shí)間不一致“打草驚蛇”,使得目標(biāo)進(jìn)入防御模式,最終導(dǎo)致任務(wù)失敗。集群彈藥協(xié)同打擊問(wèn)題通常被解耦為兩個(gè)子問(wèn)題[4],即時(shí)間約束條件下的多目標(biāo)任務(wù)分配和航跡規(guī)劃問(wèn)題,這兩個(gè)子問(wèn)題相互耦合[5]。任務(wù)分配根據(jù)作戰(zhàn)任務(wù)和戰(zhàn)場(chǎng)態(tài)勢(shì),為每一枚彈藥匹配最優(yōu)的目標(biāo),使得集群以最小的損耗完成協(xié)同打擊任務(wù),最大化作戰(zhàn)效能;航跡規(guī)劃則是根據(jù)戰(zhàn)場(chǎng)地勢(shì)和敵方威脅等環(huán)境因素以及彈藥動(dòng)力學(xué)模型等約束,對(duì)彈藥從自身位置到分配目標(biāo)位置的最優(yōu)飛行路線規(guī)劃。
考慮到任務(wù)分配和航跡規(guī)劃之間的耦合關(guān)系,Gottlieb等人在任務(wù)分配中考慮目標(biāo)價(jià)值和無(wú)人機(jī)到達(dá)目標(biāo)時(shí)間,航跡則由Dubins路徑長(zhǎng)度表示[6]。Kim等人考慮了目標(biāo)的資源需求和無(wú)人機(jī)資源約束,采用無(wú)人機(jī)聯(lián)盟的方式同時(shí)攻擊目標(biāo)[7]。Yao等人使用A*算法估計(jì)無(wú)人機(jī)到達(dá)目標(biāo)的折線距離,并將其作為目標(biāo)函數(shù)的代價(jià)考慮[8]。Mana-thara等人在各無(wú)人機(jī)規(guī)劃航跡之后,當(dāng)無(wú)人機(jī)之間由于避碰機(jī)制發(fā)生航跡偏移后,通過(guò)僅調(diào)整速度實(shí)現(xiàn)同時(shí)到達(dá)[9-10]。部分研究者為集群個(gè)體規(guī)劃等長(zhǎng)航跡,各無(wú)人機(jī)以相同速度等速航行[11-12]。嚴(yán)飛等人考慮目標(biāo)函數(shù)中的收益和航跡代價(jià)影響,提出了一種基于合同網(wǎng)的任務(wù)分配方法[13]。Mclain等人基于Voronoi圖生成多條備選路徑后,采用協(xié)調(diào)變量和協(xié)調(diào)函數(shù)[14]的方法為備選路徑賦予合適的速度值,實(shí)現(xiàn)同時(shí)到達(dá)[15]。Shima等人通過(guò)使用旅行推銷員問(wèn)題求解器,基于歐幾里得距離對(duì)一組任務(wù)進(jìn)行排序來(lái)解決同時(shí)到達(dá)問(wèn)題[16]。袁利平等人考慮到戰(zhàn)場(chǎng)環(huán)境的動(dòng)態(tài)性和不確定性以及無(wú)人機(jī)自身的特點(diǎn),提出一種適用于多無(wú)人機(jī)同時(shí)到達(dá)的分散化控制方法,其內(nèi)容包括僅依靠局部信息交互的分散化控制結(jié)構(gòu)和基于一致性算法的分散化控制策略,但由于僅采用速度調(diào)整的方式,無(wú)人機(jī)的航行速度極易達(dá)到飽和[17]。集群彈藥大多以固定翼無(wú)人機(jī)為平臺(tái),故上述多數(shù)研究者在解決同時(shí)到達(dá)問(wèn)題中都使用了Dubins航跡規(guī)劃[18]。由于其路徑由直線段和曲線段構(gòu)成,更為貼合固定翼無(wú)人機(jī)的控制機(jī)理。然而,大多研究者們僅僅采用簡(jiǎn)單的距離代價(jià)融入任務(wù)分配的目標(biāo)函數(shù)中,導(dǎo)致只能采用等長(zhǎng)航跡的方法完成同時(shí)到達(dá)任務(wù),造成打擊時(shí)間過(guò)長(zhǎng)的情況。減少集群的打擊時(shí)間可以采用變速的方法,如何將速度和路徑信息融入到任務(wù)分配中為該問(wèn)題的關(guān)鍵。
本文針對(duì)固定翼集群彈藥協(xié)同打擊地面目標(biāo)展開研究,采用雙層優(yōu)化的方法將任務(wù)分配和航跡規(guī)劃看作一個(gè)整體,并提出了一種基于Dubins航跡規(guī)劃的多模式規(guī)劃方法,在保證同時(shí)到達(dá)的前提下,達(dá)到集群打擊效能的最優(yōu)。本研究主要有以下創(chuàng)新點(diǎn):① 采用雙層優(yōu)化處理上述問(wèn)題,相較于解耦的處理方式更易得到全局最優(yōu)解;② 將速度變量引入航跡規(guī)劃中,與傳統(tǒng)增加航行路徑的規(guī)劃相比,其路徑長(zhǎng)度與航行時(shí)間更優(yōu);③ 由于彈藥具有航行速度約束,設(shè)計(jì)了一種多模式的路徑規(guī)劃方法,保證極端環(huán)境下任務(wù)的完成。
本文安排如下:第1節(jié)對(duì)戰(zhàn)場(chǎng)環(huán)境的任務(wù)需求進(jìn)行描述和對(duì)集群彈藥任務(wù)規(guī)劃進(jìn)行建模;第2節(jié)介紹時(shí)間協(xié)同攻擊規(guī)劃算法各單元以及內(nèi)部的數(shù)據(jù)流向;第3節(jié)在多種不同的戰(zhàn)場(chǎng)環(huán)境中對(duì)時(shí)間協(xié)同攻擊規(guī)劃算法進(jìn)行實(shí)驗(yàn)驗(yàn)證;第4節(jié)對(duì)本文進(jìn)行總結(jié)并得出結(jié)論。
本文考慮固定翼集群彈藥協(xié)同打擊環(huán)境中的地面目標(biāo),如圖1所示。集群彈藥在發(fā)現(xiàn)地面群體目標(biāo)后,進(jìn)行協(xié)同攻擊任務(wù)規(guī)劃,完成同時(shí)打擊目標(biāo)任務(wù)。其中,集群彈藥的作戰(zhàn)場(chǎng)景范圍為[Xleft,Xright]×[Ylower,Yupper],集群彈藥集合為U={U1,U2,…,UM},任務(wù)目標(biāo)集合為T={T1,T2…,TN},其中M和N分別表示集群彈藥規(guī)模和任務(wù)目標(biāo)個(gè)數(shù)。
圖1 集群彈藥作戰(zhàn)場(chǎng)景Fig.1 Swarm munitions combat scenarios
針對(duì)每個(gè)目標(biāo)Tj∈T,定義其位置posj,價(jià)值wj表示選擇目標(biāo)時(shí)的優(yōu)先級(jí),價(jià)值越高的目標(biāo)在分配時(shí)被更優(yōu)先考慮,防御能力dj表示在此目標(biāo)所需要的打擊能力要求。針對(duì)每枚彈藥Ui∈U,將彈藥的航跡分隔為K個(gè)航點(diǎn),定義其各航點(diǎn)位置pik、航點(diǎn)速度vik,航向headi。
在本文考慮目標(biāo)僅需要一種打擊能力,且彈藥能力單一,所以任務(wù)目標(biāo)防御能力dj可以簡(jiǎn)單地理解為完成任務(wù)所需的彈藥數(shù)量。集群彈藥任務(wù)分配中,對(duì)于每個(gè)目標(biāo)需求能力的滿足程度為一個(gè)重要指標(biāo),且每個(gè)目標(biāo)個(gè)體都有其自身的價(jià)值,也就是攻擊時(shí)的優(yōu)先順序。
本文基于雙層優(yōu)化模型理論,對(duì)集群彈藥協(xié)同攻擊地面群體目標(biāo)進(jìn)行建模。其中,底層優(yōu)化問(wèn)題為各彈藥的航跡規(guī)劃問(wèn)題,頂層優(yōu)化問(wèn)題為群體地面目標(biāo)的分配。
(1)
s.t.
xij∈{0,1},?i∈{1,2,…,M},j∈{1,2,…,N}
(2)
vmin≤vik≤vmax,?i∈{1,2,…,M},k∈{1,2,…,K}
(3)
(4)
s.t.
(5)
(6)
?i∈{1,2,…,M},k∈{1,2,…,K}
(7)
式(1)中,fupper表示上層優(yōu)化的目標(biāo)函數(shù);valuej表示指定目標(biāo)Tj完成同時(shí)打擊任務(wù)的收益;timej表示同時(shí)打擊指定目標(biāo)Tj的代價(jià)。式(2)和式(3)為上層優(yōu)化的約束,其中xij為任務(wù)分配的決策變量,xij=1時(shí),表示彈藥Ui分配給指定目標(biāo)Tj;否則,xij=0表示彈藥Ui未分配給指定目標(biāo)Tj。vik為航跡規(guī)劃中每個(gè)航點(diǎn)的速度變量,其大小處于最小航行速度vmin和最大航行速度vmax之間。
在時(shí)間協(xié)同攻擊規(guī)劃算法中,每枚彈藥都具有相同的處理單元,各彈藥根據(jù)各自的處理單元進(jìn)行決策,每個(gè)決策周期包含以下過(guò)程。
首先,基于彈藥自身的感知能力,彈藥所能感知的環(huán)境信息包括友方彈藥、地面目標(biāo)以及障礙物的位置及速度信息等,由此獲得環(huán)境的原始信息。獲取環(huán)境信息后,集群彈藥依賴于自身的協(xié)同任務(wù)單元、路徑規(guī)劃單元和目標(biāo)分配單元之間相互協(xié)同,最終共同為彈藥生成對(duì)指定目標(biāo)的最優(yōu)航跡。集群彈藥的任務(wù)規(guī)劃框架如圖2所示。其中,路徑規(guī)劃單元生成從指定彈藥到特定目標(biāo)的最優(yōu)路徑,并根據(jù)任務(wù)協(xié)同單元得到協(xié)調(diào)變量,將相應(yīng)的航行速度賦予最優(yōu)路徑中的每一個(gè)航點(diǎn)。路徑規(guī)劃單元返回關(guān)于每條路徑的信息。目標(biāo)分配單元和協(xié)同任務(wù)單元都調(diào)用路徑規(guī)劃單元。目標(biāo)分配單元是為每枚彈藥分配一個(gè)特定目標(biāo)。協(xié)同任務(wù)單元的作用是確保當(dāng)目標(biāo)分配單元將多枚彈藥分配給同一目標(biāo)或目標(biāo)群體時(shí),集群彈藥同時(shí)到達(dá)目標(biāo)攻擊位置。
圖2 任務(wù)規(guī)劃系統(tǒng)架構(gòu)Fig.2 Task planning system architecture
首先,路徑規(guī)劃單元從目標(biāo)分配單元中得到目標(biāo)位置,從而得到各彈藥到目標(biāo)的最優(yōu)路徑,各路徑點(diǎn)表示為pik,最終將所得到的航點(diǎn)發(fā)送到協(xié)同任務(wù)單元。
隨后,協(xié)同任務(wù)單元收到來(lái)自路徑規(guī)劃單元的航點(diǎn)信息后,根據(jù)彈藥自身的可行航行速度范圍,給各路徑點(diǎn)賦予航行速度,并用vik表示,從而得到完整的各路徑點(diǎn)信息(pik,vik),并根據(jù)協(xié)調(diào)函數(shù)將各路徑信息轉(zhuǎn)化為一維的協(xié)調(diào)變量,用Time來(lái)表示,將所得的協(xié)調(diào)變量可行范圍集TIMEij和共有協(xié)調(diào)變量Time*發(fā)送給目標(biāo)分配單元。
接下來(lái),目標(biāo)分配單元收到來(lái)自協(xié)同任務(wù)單元發(fā)送的協(xié)調(diào)變量后,根據(jù)內(nèi)部的評(píng)價(jià)函數(shù)為每枚彈藥決策出其任務(wù)目標(biāo)和對(duì)應(yīng)的航點(diǎn)速度,根據(jù)共有的協(xié)調(diào)函數(shù)Time*,決策出各自的最佳協(xié)調(diào)變量并發(fā)送到協(xié)同任務(wù)單元。
最終,協(xié)同任務(wù)單元把各自的最佳協(xié)調(diào)變量和指定目標(biāo)轉(zhuǎn)發(fā)給路徑規(guī)劃單元,并由路徑規(guī)劃單元規(guī)劃完整的路徑點(diǎn)信息。
集群彈藥打擊地面目標(biāo)時(shí),由于探測(cè)范圍遠(yuǎn)大于打擊范圍,發(fā)現(xiàn)目標(biāo)后可充分地調(diào)整飛行航向及航跡長(zhǎng)度。因此,路徑規(guī)劃單元的主要功能是生成最優(yōu)的可行航跡,并及時(shí)響應(yīng)協(xié)同任務(wù)單元的指令進(jìn)行路徑的微調(diào)。根據(jù)彈藥的飛行特點(diǎn),將整條航跡簡(jiǎn)單地分為盤旋航跡和直線航跡,因此Dubins航跡規(guī)劃中的RS和LS更為適用。其中,R為right,L為left,S為straight;RS表示航跡由向右的圓弧和直線構(gòu)成,LS則表示航跡由向左的圓弧和直線構(gòu)成。
2.3.1 多模式路徑規(guī)劃
為了實(shí)現(xiàn)同時(shí)打擊的任務(wù)需求,如圖3所示,藍(lán)紅粉分別表示不同的彈藥航跡,圖標(biāo)中LS和RS表示彈藥生成Dubins航跡類型。本文設(shè)計(jì)了3種模式來(lái)規(guī)劃滿足要求的飛行航跡。
圖3 三彈同時(shí)到達(dá)Fig.3 Three munitions arriving simultaneously
(1) 直線加速模式
當(dāng)彈藥平飛時(shí),其受力平衡,處于穩(wěn)定狀態(tài)。根據(jù)彈藥的巡航速度范圍,在此狀態(tài)下對(duì)其速度進(jìn)行調(diào)整。
(2) 方向調(diào)優(yōu)模式
當(dāng)彈藥收到航跡規(guī)劃指令時(shí),其初始的航向與目標(biāo)位置均有一定的角度偏差。在進(jìn)入平飛狀態(tài)前,對(duì)彈藥的航向進(jìn)行調(diào)整,規(guī)劃部分盤旋航跡來(lái)滿足彈藥航向的需求。
(3) 路徑微調(diào)模式
當(dāng)僅通過(guò)速度調(diào)整無(wú)法滿足同時(shí)打擊的任務(wù)需求時(shí),協(xié)同任務(wù)單元將會(huì)再次調(diào)用路徑規(guī)劃單元,對(duì)當(dāng)前航跡重新進(jìn)行規(guī)劃,為滿足彈藥的動(dòng)力學(xué)約束,采用改變盤旋航跡半徑的方法,增加一定的盤旋航跡來(lái)保證航行時(shí)間的一致性。但值得注意的是:此模式僅可增加部分路徑來(lái)滿足航行時(shí)間要求,若航行時(shí)間相差過(guò)大,該模式也將失效。
路徑微調(diào)模式的路徑調(diào)整如圖4所示,彈藥初始位置為(0,0),目標(biāo)位置為(500,500),當(dāng)初始紅色航跡無(wú)法滿足要求時(shí),路徑微調(diào)模式將路徑重新規(guī)劃為藍(lán)色航跡。
圖4 路徑微調(diào)Fig.4 Path adjustment
2.3.2 航跡估算
本文將彈藥Ui規(guī)劃出的航跡用K個(gè)航點(diǎn)pik表示,估算pik的航跡長(zhǎng)度:
(8)
式中:R表示盤旋航跡的半徑。
可得出路徑規(guī)劃中的目標(biāo)函數(shù):
(9)
式中:flower表示所有彈藥規(guī)劃航跡的總長(zhǎng)度。
單枚彈藥難以徹底摧毀地面目標(biāo),故需要組成滿足作戰(zhàn)能力的團(tuán)隊(duì)來(lái)保證任務(wù)的完成。團(tuán)隊(duì)成員協(xié)同打擊地面目標(biāo)時(shí),各成員同時(shí)到達(dá)攻擊范圍的時(shí)機(jī)至關(guān)重要,就需要所有個(gè)體同時(shí)對(duì)所探測(cè)到的目標(biāo)進(jìn)行航跡規(guī)劃。根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)和彈藥動(dòng)態(tài)能力確定作戰(zhàn)團(tuán)隊(duì)的最佳同時(shí)到達(dá)時(shí)間為任務(wù)的關(guān)鍵所在。協(xié)同任務(wù)單元為各彈藥航跡決策出共有的協(xié)調(diào)函數(shù),集群中的個(gè)體根據(jù)協(xié)調(diào)函數(shù),規(guī)劃出具有速度信息的最優(yōu)航跡,使得集群同時(shí)到達(dá)指定地面目標(biāo)區(qū)域。
協(xié)同任務(wù)單元接收到來(lái)自路徑規(guī)劃單元的航跡信息后,需要根據(jù)彈藥動(dòng)力學(xué)約束為每枚彈藥的每條航跡擬定合適的航行速度。彈藥Ui對(duì)探測(cè)到目標(biāo)的候選航跡由航點(diǎn)pik和彈藥航行速度vik表示,故彈藥Ui到達(dá)特定目標(biāo)Tj的航行時(shí)間可表示為具有航行速度的航跡函數(shù):
Sij=f(pik,vik)
(10)
式中:Sij為協(xié)調(diào)函數(shù)。由于要使得多枚彈藥最終同時(shí)到達(dá)指定目標(biāo),就必須要進(jìn)行相互協(xié)商,與友方個(gè)體之間交換候選路徑信息。由于各彈藥的候選航跡和速度信息各不相同,彈間相互傳遞pik和vik的方法較為低效,故采用上述更為有效的信息,即協(xié)調(diào)函數(shù)Sij。
協(xié)調(diào)變量Timeij由協(xié)調(diào)函數(shù)Sij決定。根據(jù)路徑規(guī)劃單元確定的候選路徑和彈藥航行速度的可行范圍,可確定作戰(zhàn)團(tuán)隊(duì)中每枚彈藥協(xié)調(diào)變量可行范圍集TIMEij。由于路徑規(guī)劃單元采用多模式的規(guī)劃方法,彈藥的完整航跡可分為直線航跡和盤旋航跡。故彈藥Ui到達(dá)地面目標(biāo)Tj的協(xié)調(diào)變量表示為
(11)
2.4.1 直線航跡協(xié)調(diào)變量計(jì)算
(12)
式中:Vi表示當(dāng)前航點(diǎn)到下一航點(diǎn)的航行速度;Lenstraight表示速度恒定為Vi時(shí)的航跡長(zhǎng)度。
2.4.2 盤旋航跡協(xié)調(diào)變量計(jì)算
(13)
式中:θ表示盤旋航跡的對(duì)應(yīng)旋轉(zhuǎn)角度;Vcircle表示彈藥盤旋模式的恒定航行速度,盤旋航跡如圖5所示。
圖5 盤旋航跡Fig.5 Circle path
彈藥Ui對(duì)指定目標(biāo)Tj的協(xié)調(diào)變量Timeij的可行范圍集用TIMEij表示,該范圍集在集群個(gè)體之間相互交換,最終被目標(biāo)分配單元接收,并完成打擊目標(biāo)的分配、航行速度以及航跡的選擇。
協(xié)同任務(wù)單元通過(guò)要求每枚彈藥匹配共有的協(xié)調(diào)變量Time*的團(tuán)隊(duì)最佳值,得以確保集群彈藥間的合作。
確定共有協(xié)調(diào)變量Time*有兩種方案如下。
(1) 選用到達(dá)目標(biāo)航跡最短的彈藥為基準(zhǔn),航行時(shí)間選為最慢航行速度時(shí)的到達(dá)時(shí)間為Time*。
(2) 選用到達(dá)目標(biāo)航跡最長(zhǎng)的彈藥為基準(zhǔn),航行時(shí)間選為最快航行速度時(shí)的到達(dá)時(shí)間為Time*。
協(xié)同打擊地面目標(biāo)時(shí),過(guò)長(zhǎng)的航行時(shí)間將會(huì)增加集群被雷達(dá)探測(cè)到的風(fēng)險(xiǎn),故第(1)種方案更為貼合真實(shí)戰(zhàn)場(chǎng)要求。
為了確保協(xié)同打擊任務(wù)的完成,所得的共有協(xié)調(diào)變量Time*必須在到達(dá)同一目標(biāo)成員的可行范圍集TIMEij中,即Time*∈TIMEij。若其不滿足此約束,將啟用路徑規(guī)劃單元中路徑微調(diào)模式,增加盤旋航跡的半徑來(lái)滿足任務(wù)約束。
一旦協(xié)同任務(wù)單元收到從目標(biāo)分配單元發(fā)送的目標(biāo)信息和協(xié)調(diào)變量Timeij后,將該變量轉(zhuǎn)發(fā)給路徑規(guī)劃單元,每枚彈藥必須確定要選擇的最佳航跡pik和適當(dāng)?shù)暮叫兴俣葀ik,匹配自身的值Timeij。協(xié)同任務(wù)單元僅通過(guò)搜索協(xié)調(diào)變量可行范圍集TIMEij,而不是路徑規(guī)劃單元的原始航跡信息(pik,vik),極大簡(jiǎn)化了優(yōu)化問(wèn)題的復(fù)雜度。例如,在協(xié)調(diào)同時(shí)到達(dá)問(wèn)題中,協(xié)調(diào)變量Time是一維的變量,而原始航跡信息的維數(shù)要高得多。但實(shí)際上,確定共有協(xié)調(diào)變量Time*到指定目標(biāo)Tj的最佳路徑,只需在協(xié)同任務(wù)單元中查找協(xié)調(diào)變量可行范圍集TIMEij即可。
將航跡的協(xié)調(diào)變量等時(shí)間約束變量納入任務(wù)分配的考慮范疇,以保證同時(shí)達(dá)到任務(wù)完成的前提下,最大化作戰(zhàn)效能。根據(jù)上述任務(wù)需求,集群彈藥分配目標(biāo)有兩個(gè)考慮的指標(biāo):
(1) 對(duì)指定目標(biāo)最小化各協(xié)調(diào)變量的差值;
(2) 最大限度增加每個(gè)目標(biāo)所分配的彈藥個(gè)數(shù)。
將以上兩個(gè)指標(biāo)分別用同時(shí)達(dá)到time以及飽和攻擊value表示。其中,同時(shí)達(dá)到是必要目標(biāo),飽和攻擊則是集群目標(biāo)。
2.5.1 必要目標(biāo)
使用路徑規(guī)劃單元生成到每個(gè)目標(biāo)的最優(yōu)航跡起初是沒(méi)有速度變量的,在協(xié)同任務(wù)單元之中將航跡中的每個(gè)航點(diǎn)都賦予合理的速度值,并經(jīng)過(guò)協(xié)調(diào)函數(shù)的計(jì)算簡(jiǎn)化為一維變量協(xié)調(diào)變量。在任務(wù)分配的過(guò)程中,若要滿足于同時(shí)到達(dá)特定目標(biāo)的約束,需使得各枚彈藥的協(xié)調(diào)變量Timeij盡可能地接近。
由于在協(xié)調(diào)任務(wù)單元中對(duì)于航跡中每一個(gè)航點(diǎn)的速度均進(jìn)行合理的選取且確定了對(duì)指定目標(biāo)的共有協(xié)調(diào)變量Time*,根據(jù)自身協(xié)調(diào)變量和共有協(xié)調(diào)變量的差值timej:
(14)
表示從協(xié)同任務(wù)單元收到的協(xié)調(diào)變量可行范圍集TIMEij中,找到與共有的協(xié)調(diào)變量Time*最接近的航跡。
2.5.2 集群目標(biāo)
從飽和攻擊價(jià)值函數(shù)value(·)的角度來(lái)看,分配給指定目標(biāo)的彈藥數(shù)量越多越好。由一個(gè)值來(lái)表示每個(gè)指定目標(biāo)的團(tuán)隊(duì)規(guī)模,可使用一個(gè)單調(diào)遞增的函數(shù)來(lái)表示。團(tuán)隊(duì)成員數(shù)量在達(dá)到任務(wù)需求前,該函數(shù)的值急劇增加,表明最小可接受團(tuán)隊(duì)規(guī)模為任務(wù)的需求數(shù)量。設(shè)Uj={U1,U2,…,UMj}表示分配給指定目標(biāo)Tj的一組彈藥;Uij是分配給制定目標(biāo)Tj的彈藥。函數(shù)valuej可表示為
(15)
設(shè)Tassignment={T1,T2,…,Tna}表示在分配中被分配到彈藥的所有目標(biāo)集合,那么最終的分配效能:
value=∏Tj∈Tassignmentvaluej
(16)
該值取每個(gè)團(tuán)隊(duì)規(guī)模值與指定目標(biāo)集Tassignment的乘積,該函數(shù)可以讓不滿足飽和攻擊的目標(biāo)顯著降低總體任務(wù)的價(jià)值。
但是,value僅解決了在團(tuán)隊(duì)目標(biāo)為主的需求,也就是在為每個(gè)目標(biāo)分配足夠數(shù)量彈藥的同時(shí),盡可能地為戰(zhàn)場(chǎng)所有目標(biāo)分配彈藥。若要滿足協(xié)同打擊任務(wù),需著重考慮同時(shí)達(dá)到time。
最終,提出了統(tǒng)一的分配指標(biāo)fupper,來(lái)平衡集群目標(biāo)和必要目標(biāo)之間的需求:
(17)
該算法從算法架構(gòu)、航跡生成和協(xié)同方案等多個(gè)方面考慮。在算法架構(gòu)方面,并沒(méi)有將任務(wù)分配和航跡規(guī)劃解耦為兩個(gè)獨(dú)立的問(wèn)題來(lái)求解,而是采用雙層優(yōu)化的方法將該問(wèn)題看作一個(gè)整體,避免了解耦而造成的局部最優(yōu);在航跡生成方面,多模式的航跡規(guī)劃方法在僅采用速度調(diào)整無(wú)法滿足任務(wù)要求時(shí),采用增加轉(zhuǎn)彎半徑的方式延長(zhǎng)路徑長(zhǎng)度,保證了任務(wù)的完成;在協(xié)同方案方面,采用速度調(diào)整方式,與傳統(tǒng)方式中采用延長(zhǎng)路徑的方式相比,保證了任務(wù)完成時(shí)間的最優(yōu)性。
本文任務(wù)場(chǎng)景設(shè)置(如初始位置、初始航向、初始速度等)環(huán)境參數(shù)如表1所示。任務(wù)區(qū)域大小為2 km×2 km,執(zhí)行協(xié)同打擊任務(wù)的彈藥選用固定翼巡飛彈。
表1 彈藥初始條件
3.2.1 算例設(shè)置
本文從目標(biāo)位置、目標(biāo)價(jià)值、防御能力等不同戰(zhàn)場(chǎng)環(huán)境因素考慮,設(shè)計(jì)了5種算例(每個(gè)算例分別進(jìn)行10次實(shí)驗(yàn))來(lái)測(cè)試算法性能,具體設(shè)置如表2所示。本文從任務(wù)完成時(shí)間和打擊效能等兩個(gè)方面對(duì)該算法性能進(jìn)行評(píng)估。
3.2.2 評(píng)價(jià)指標(biāo)
本文從任務(wù)完成時(shí)間、打擊效能等兩個(gè)方面對(duì)該算法性能進(jìn)行評(píng)估。
對(duì)于時(shí)間消耗,將從目標(biāo)平均打擊時(shí)間和單個(gè)目標(biāo)打擊時(shí)間兩個(gè)維度分別進(jìn)行比較。
(1) 目標(biāo)平均打擊時(shí)間
協(xié)同打擊地面目標(biāo)執(zhí)行任務(wù)的時(shí)間越長(zhǎng),彈藥暴露的風(fēng)險(xiǎn)越大,導(dǎo)致整個(gè)任務(wù)失敗的概率越大。提出目標(biāo)平均打擊時(shí)間指標(biāo)Timeave:
(18)
式中:Mj表示同時(shí)打擊指定目標(biāo)Tj的彈藥成員數(shù)量;timeij表示彈藥Ui對(duì)指定目標(biāo)Tj的實(shí)驗(yàn)航行時(shí)間。
(2) 單目標(biāo)打擊時(shí)間差
(19)
式中:Timefirstarrive表示最先到達(dá)指定目標(biāo)彈藥的飛行耗時(shí);Timelastarrive表示最后到達(dá)指定目標(biāo)彈藥的飛行耗時(shí)。
(3) 打擊效能
協(xié)同打擊地面目標(biāo)存在優(yōu)先級(jí)的情形下,需要在戰(zhàn)場(chǎng)資源有限的情形下,盡可能地提高同時(shí)打擊任務(wù)完成度。由此,提出打擊效能評(píng)估指標(biāo):
(20)
(21)
式中:ωj表示指定目標(biāo)Tj的戰(zhàn)場(chǎng)價(jià)值,χj表示指定目標(biāo)Tj在打擊任務(wù)中及時(shí)打擊的彈藥數(shù)量;xij為彈藥打擊時(shí)效指標(biāo),表示彈藥Ui打擊目標(biāo)任務(wù)Tj是否及時(shí),若彈藥Ui與首先到達(dá)目標(biāo)的彈藥時(shí)間差小于6 s,xij=1;否則,xij=0。(考慮到敵方目標(biāo)做出防御和反擊指令需要時(shí)間,經(jīng)查閱資料,確定此時(shí)間為6 s較為合適)Mj表示分配給指定目標(biāo)Tj的彈藥數(shù)量。
為了更為直觀地驗(yàn)證算法性能,本文通過(guò)與最優(yōu)協(xié)調(diào)路徑規(guī)劃[12]和一致性交匯算法[9]的對(duì)比,進(jìn)一步分析所提算法的性能。算例1下時(shí)間協(xié)同攻擊規(guī)劃算法的各彈藥航跡以及航跡的直線航行速度如圖6所示。
圖6 協(xié)同打擊示意圖Fig.6 Schematic diagram of coordinated attacks
3.3.1 任務(wù)時(shí)間消耗
任務(wù)時(shí)間消耗方面,每個(gè)算例下3種算法的目標(biāo)平均打擊時(shí)間Timeave如表3所示。其中,加粗的數(shù)值為每個(gè)算例下每個(gè)目標(biāo)的最小平均打擊時(shí)間,表格中的數(shù)值均為10次實(shí)驗(yàn)的平均值??梢钥闯?同種算例的情況下,3種算法的目標(biāo)平均打擊時(shí)間Timeave表現(xiàn)如下:時(shí)間協(xié)同攻擊規(guī)劃算法打擊時(shí)間最短,最優(yōu)協(xié)調(diào)路徑規(guī)劃打擊時(shí)間最長(zhǎng),一致性交匯算法打擊時(shí)間介于兩者之間。正是由于采用控制速度和改變航跡長(zhǎng)度的規(guī)劃方法,相較于單一的等長(zhǎng)航跡的方法,可以具備更佳的打擊時(shí)效性。
表3 目標(biāo)平均打擊時(shí)間
圖7的柱狀圖更為直觀地表現(xiàn)了各目標(biāo)在5種算例下的平均打擊時(shí)間Timeave,一致性交匯算法在不同算例中的表現(xiàn)波動(dòng)較大,而時(shí)間協(xié)同攻擊規(guī)劃算法和最右協(xié)調(diào)路徑規(guī)劃算法表現(xiàn)較為穩(wěn)定,印證了將彈藥航行納入任務(wù)分配目標(biāo)函數(shù)對(duì)協(xié)同打擊目標(biāo)任務(wù)的重要性。
圖7 目標(biāo)平均打擊時(shí)間Fig.7 Average time to hit target
表4 單目標(biāo)打擊時(shí)間差
每個(gè)算例下3個(gè)目標(biāo)的打擊時(shí)間差的平均值如圖8所示。在各算例下,時(shí)間協(xié)同攻擊規(guī)劃算法的打擊時(shí)間差均為最小,在戰(zhàn)場(chǎng)資源相對(duì)緊缺(算例5)時(shí),該算法的穩(wěn)定性更為明顯。一致性交匯算法則表現(xiàn)最差,在算例5中出現(xiàn)了較多目標(biāo)的打擊任務(wù)失敗。最優(yōu)協(xié)調(diào)路徑規(guī)劃算法的表現(xiàn)則介于兩者之間。
圖8 任務(wù)目標(biāo)平均打擊時(shí)間差Fig.8 Average hit time difference of task target
3.3.2 戰(zhàn)場(chǎng)打擊效能
在戰(zhàn)場(chǎng)打擊效能方面,表5以算例5為例,展示了每個(gè)目標(biāo)3種算法的戰(zhàn)場(chǎng)打擊效能W。在戰(zhàn)場(chǎng)資源相對(duì)充足的情況下(如算例1~算例4),各算法的打擊效能W均較為接近,可以取得較好的戰(zhàn)場(chǎng)打擊效能。但在戰(zhàn)場(chǎng)資源相對(duì)緊缺時(shí),一致性交匯算法的戰(zhàn)場(chǎng)效能極具下降,航跡難以調(diào)節(jié),使得同時(shí)打擊任務(wù)失敗,而時(shí)間協(xié)同攻擊規(guī)劃算法仍可以達(dá)到較高的打擊效能,最優(yōu)協(xié)調(diào)路徑規(guī)劃算法依然介于兩者之間。
表5 打擊效能
由上述數(shù)值實(shí)驗(yàn)可以得出:時(shí)間協(xié)同攻擊規(guī)劃算法在平均打擊時(shí)間上取得了極大的性能提升,明顯優(yōu)于最優(yōu)協(xié)調(diào)路徑規(guī)劃算法和一致性交匯算法。由于本算法采用控制航行速度和改變航跡長(zhǎng)度的規(guī)劃方法,與僅采用單一等長(zhǎng)路徑或僅控制航行速度方法相比具有更好的打擊實(shí)時(shí)性。且在戰(zhàn)場(chǎng)資源較為緊張的場(chǎng)景時(shí),由于本算法采用雙層優(yōu)化的決策方法,與將任務(wù)分配和航跡規(guī)劃解耦的方法相比,可以保證規(guī)劃結(jié)果的性能最優(yōu)。
本文研究了固定翼集群彈藥協(xié)同打擊地面群體目標(biāo)問(wèn)題,提出的任務(wù)規(guī)劃方法在保證同時(shí)打擊時(shí)間約束的前提下,為各彈藥規(guī)劃分配結(jié)果和飛行航跡,并取得較好的作戰(zhàn)效能。數(shù)值實(shí)驗(yàn)中,同最優(yōu)協(xié)調(diào)路徑規(guī)劃和一致性交匯算法在多種算例下進(jìn)行對(duì)比,結(jié)果表明在任務(wù)時(shí)效性方面,本文所提出的時(shí)間協(xié)同攻擊規(guī)劃算法取得了較大的性能提升;在戰(zhàn)場(chǎng)資源較為緊缺的情況下,所提算法維持了較好的時(shí)效性和作戰(zhàn)打擊效果,且具有更好的魯棒性。
所提算法主要解決了協(xié)同打擊時(shí)效和同時(shí)打擊的問(wèn)題,但路徑規(guī)劃單元仍值得優(yōu)化,如何滿足極端條件下的同時(shí)到達(dá)問(wèn)題為下一階段的研究重點(diǎn)。