王淵,丁達(dá)理*,張鵬,謝磊,張曦文
(1.空軍工程大學(xué),西安 710038;2.中國人民解放軍第93069部隊(duì),大連 116000)
在近距空戰(zhàn)對(duì)抗中,敵我雙方具備較強(qiáng)的動(dòng)態(tài)性,相比于超視距空戰(zhàn),近距空戰(zhàn)決策雙方容錯(cuò)性更低,一旦發(fā)生決策失誤,將會(huì)直接導(dǎo)致戰(zhàn)局失利,因此近距空戰(zhàn)中快速準(zhǔn)確的態(tài)勢(shì)評(píng)估方法將是無人作戰(zhàn)飛行器(Unmanned Combat Aerial Vehicle,UCAV)進(jìn)行自主機(jī)動(dòng)決策的基本依據(jù)。通過構(gòu)建合理的空戰(zhàn)態(tài)勢(shì)評(píng)價(jià)函數(shù)和決策權(quán)重,能夠指導(dǎo)UCAV在近距空戰(zhàn)中實(shí)現(xiàn)有效的攻擊占位和保持自身機(jī)動(dòng)優(yōu)勢(shì),最大化武器系統(tǒng)的作戰(zhàn)效能??諔?zhàn)態(tài)勢(shì)評(píng)估是以當(dāng)前敵我相對(duì)狀態(tài)信息為依據(jù),對(duì)當(dāng)前敵我雙方的攻擊優(yōu)勢(shì)和受威脅程度的判斷。目前的研究方法主要分為參量法、非參量法[1]和基于數(shù)據(jù)的深度學(xué)習(xí)方法。
深度學(xué)習(xí)態(tài)勢(shì)評(píng)估方法利用歷史數(shù)據(jù)進(jìn)行知識(shí)提取,進(jìn)行態(tài)勢(shì)評(píng)估,文獻(xiàn)[2]建立了基于深度置信網(wǎng)絡(luò)的態(tài)勢(shì)評(píng)估模型,通過峰值密度聚類算法提取空戰(zhàn)數(shù)據(jù)特征,建立了標(biāo)準(zhǔn)態(tài)勢(shì)匹配集;文獻(xiàn)[3]提出了一種生成式對(duì)抗網(wǎng)絡(luò)的半監(jiān)督空戰(zhàn)態(tài)勢(shì)評(píng)估模型,利用差分方法將態(tài)勢(shì)信息相對(duì)化為一維特征向量送入網(wǎng)絡(luò)進(jìn)行半監(jiān)督訓(xùn)練。深度學(xué)習(xí)態(tài)勢(shì)評(píng)估方法對(duì)數(shù)據(jù)要求較高,一旦標(biāo)簽出現(xiàn)偏差會(huì)直接導(dǎo)致評(píng)估結(jié)果的錯(cuò)誤,甚至形成相反評(píng)估結(jié)論。
非參量法是對(duì)態(tài)勢(shì)樣本的總體分布不做假設(shè),在充分考慮敵我?guī)缀涡畔?、?dǎo)彈攻擊區(qū)和命中概率[4]以及探測(cè)能力的基礎(chǔ)上,構(gòu)造優(yōu)勢(shì)函數(shù)進(jìn)行量化,最后根據(jù)空戰(zhàn)專家的經(jīng)驗(yàn)設(shè)置優(yōu)勢(shì)函數(shù)的評(píng)估權(quán)重從而進(jìn)行統(tǒng)計(jì)推斷的方法。文獻(xiàn)[5]構(gòu)建了基于決策樹的非參量評(píng)估模型,以當(dāng)前敵我信息為輸入,從多個(gè)維度對(duì)當(dāng)前態(tài)勢(shì)進(jìn)行評(píng)估和決策;文獻(xiàn)[6]在導(dǎo)彈攻擊區(qū)實(shí)時(shí)解算的基礎(chǔ)上,考慮目標(biāo)攻擊威脅,提出了基于空空導(dǎo)彈攻擊區(qū)的態(tài)勢(shì)評(píng)估方法;文獻(xiàn)[7]分析了進(jìn)入角與方位角的耦合關(guān)系以及能量因子對(duì)態(tài)勢(shì)影響的非線性等問題,對(duì)態(tài)勢(shì)評(píng)估函數(shù)進(jìn)行了重構(gòu);文獻(xiàn)[8]針對(duì)多機(jī)協(xié)同情況下的空戰(zhàn)態(tài)勢(shì)評(píng)估問題,增加考慮了氣象條件和無人機(jī)可靠系數(shù)兩個(gè)影響因子,提出改進(jìn)層次分析法和熵權(quán)法解決非參量法評(píng)估權(quán)重固化的問題;文獻(xiàn)[9]利用粗糙集理論,通過建立態(tài)勢(shì)評(píng)價(jià)的云圖模型,對(duì)空戰(zhàn)態(tài)勢(shì)進(jìn)行評(píng)估,提高了態(tài)勢(shì)評(píng)估模型對(duì)模糊輸入的處理能力。
參量法是對(duì)態(tài)勢(shì)樣本的總體分布設(shè)置合理假設(shè),利用不確定性理論方法,包括決策樹、貝葉斯模型和神經(jīng)網(wǎng)絡(luò)等,構(gòu)建空戰(zhàn)信息與態(tài)勢(shì)指標(biāo)之間的近似推理網(wǎng)絡(luò)。文獻(xiàn)[10]針對(duì)無人機(jī)空戰(zhàn)評(píng)估的非線性耦合,多參量輸入和實(shí)時(shí)解算問題,提出了一種基于改進(jìn)決策樹的空戰(zhàn)態(tài)勢(shì)推理方法,以態(tài)勢(shì)分類規(guī)則作為推理依據(jù),建立了4類態(tài)勢(shì)輸出結(jié)果,該方法在分類規(guī)則和推理結(jié)果上仍具有較強(qiáng)主觀性;文獻(xiàn)[11]提出了基于高斯云貝葉斯網(wǎng)絡(luò)的多目標(biāo)態(tài)勢(shì)評(píng)估推理方法,推理結(jié)果可以給出不同目標(biāo)的評(píng)估數(shù)值和態(tài)勢(shì)等級(jí)分布;文獻(xiàn)[12]增加考慮了空戰(zhàn)能力指標(biāo),并應(yīng)用貝葉斯模型實(shí)時(shí)判斷當(dāng)前態(tài)勢(shì)類型從而實(shí)現(xiàn)態(tài)勢(shì)評(píng)估權(quán)重的自適應(yīng)調(diào)整;文獻(xiàn)[13]利用云模型理論形成空戰(zhàn)態(tài)勢(shì)云圖,通過云圖比較進(jìn)行態(tài)勢(shì)評(píng)估。可見基于非參量法的評(píng)估方法具有運(yùn)算量小,魯棒性和可擴(kuò)展性強(qiáng)的優(yōu)點(diǎn),但同時(shí)由于引入了人的主觀認(rèn)知和優(yōu)勢(shì)函數(shù)固化,導(dǎo)致其無法很好地反映空戰(zhàn)的全態(tài)勢(shì)集。相比于非參量法,基于參量法的評(píng)估方法更具有客觀性和全局適應(yīng)性,但其對(duì)于空戰(zhàn)數(shù)據(jù)的處理不能體現(xiàn)空戰(zhàn)態(tài)勢(shì)變化的連續(xù)性和時(shí)序性特征,難以輔助進(jìn)一步的機(jī)動(dòng)決策。本文針對(duì)非參量法的缺陷,將通過構(gòu)建角度、距離和能量優(yōu)勢(shì)評(píng)價(jià)函數(shù),設(shè)計(jì)一種自適應(yīng)當(dāng)前空戰(zhàn)態(tài)勢(shì)的決策權(quán)重模型,以期符合真實(shí)的空戰(zhàn)決策過程,使其具備一定的客觀性和對(duì)抗適應(yīng)性。
近距空戰(zhàn)的態(tài)勢(shì)評(píng)估主要根據(jù)雙方的空間位置、姿態(tài)角和速度信息來確定,對(duì)抗雙方的相對(duì)運(yùn)動(dòng)關(guān)系決定了空戰(zhàn)態(tài)勢(shì)的未來變化趨勢(shì)[14]。如圖1所示,在“北-天-東”絕對(duì)坐標(biāo)系中,設(shè)UCAV與目標(biāo)的絕對(duì)位置坐標(biāo)分別為Pu=[xu,yu,zu]和Pt=[xt,yt,zt];R為UCAV指向目標(biāo)的距離矢量;qu為我機(jī)視線角(提前角),qt為目標(biāo)提前角;γu為UCAV航跡傾角,γt為目標(biāo)航跡傾角;φu為UCAV航跡傾角,φt為目標(biāo)航跡傾角;Vu為UCAV速度矢量,Vt為目標(biāo)速度矢量,定義為
圖1 雙機(jī)空間幾何關(guān)系Fig.1 Geometric relationship between UCAV and target
空戰(zhàn)態(tài)勢(shì)決策函數(shù)輸入的態(tài)勢(shì)描述參數(shù)越多、耦合性越強(qiáng),則提取的空戰(zhàn)態(tài)勢(shì)信息越多,越能全面反映實(shí)際空戰(zhàn)狀況,但相應(yīng)地主觀的評(píng)價(jià)函數(shù)越難以量化當(dāng)前的空戰(zhàn)態(tài)勢(shì)值,同時(shí)對(duì)于非合作目標(biāo)探測(cè)的信息存在較大誤差和欺騙信息導(dǎo)致評(píng)價(jià)函數(shù)可能出現(xiàn)未知的非線性變化。本文從雙機(jī)角度關(guān)系、距離關(guān)系和機(jī)動(dòng)能量三個(gè)主要方面綜合評(píng)價(jià)當(dāng)前的空戰(zhàn)態(tài)勢(shì),其中機(jī)動(dòng)能量主要包含重力勢(shì)能和動(dòng)能,重力勢(shì)能利用高度因子決策評(píng)價(jià)函數(shù)進(jìn)行量化表示,動(dòng)能利用速度因子決策評(píng)價(jià)函數(shù)。
在近距空戰(zhàn)中,特別是在對(duì)抗雙方不具備非對(duì)稱優(yōu)勢(shì)時(shí),高烈度的戰(zhàn)術(shù)機(jī)動(dòng)對(duì)抗主要是為了獲得尾后進(jìn)攻優(yōu)勢(shì)同時(shí)保證自身安全。依據(jù)雙機(jī)提前角判斷,從UCAV的位置來看,文獻(xiàn)[15]將雙機(jī)的近距空戰(zhàn)態(tài)勢(shì)簡單分為相對(duì)優(yōu)勢(shì)、相對(duì)劣勢(shì)、互為均勢(shì)和相互威脅四種,如圖2所示。表1給出了雙機(jī)態(tài)勢(shì)的相對(duì)角判據(jù)。
表1 雙機(jī)態(tài)勢(shì)的提前角判據(jù)Table 2 Advance angle criterion for the situation
圖2 近距空戰(zhàn)態(tài)勢(shì)關(guān)系Fig.2 Situation of close air combat
某型導(dǎo)彈具備大離軸角發(fā)射的能力,因此,當(dāng)載機(jī)的提前角滿足離軸發(fā)射條件和凝視鎖定條件時(shí),即達(dá)到攻擊條件,同時(shí)更小的導(dǎo)彈進(jìn)入角將增大導(dǎo)彈的可攻擊距離,如圖3所示,角度優(yōu)勢(shì)是近距空戰(zhàn)最重要的評(píng)價(jià)指標(biāo)之一。
圖3 導(dǎo)彈攻擊距離隨進(jìn)入角變化Fig.3 Missile attack distance varies with angle of entry
綜合考慮敵機(jī)可攻擊角度威脅和導(dǎo)彈的離軸攻擊特性,設(shè)計(jì)角度因子評(píng)價(jià)函數(shù)ηA:
式中,θ為導(dǎo)彈離軸發(fā)射所允許的最大離軸發(fā)射角,θ=80°;kθ為離軸發(fā)射角度值修正參數(shù),由于近距空戰(zhàn)態(tài)勢(shì)變化劇烈,以理論最大離軸角發(fā)射的命中概率會(huì)迅速下降,取kθ=0.8;fq(qt)為隨進(jìn)入角變化的導(dǎo)彈可攻擊距離函數(shù);wu和wt分別為未滿足角度發(fā)射條件下的進(jìn)攻與逃逸權(quán)重決策指數(shù)
UCAV角度優(yōu)勢(shì)如圖4所示,可以看出當(dāng)我方形成尾后攻擊條件時(shí)的角度優(yōu)勢(shì)最大,被尾追優(yōu)勢(shì)最小,同時(shí)在迎頭攻擊時(shí)由于同時(shí)受到敵方威脅,角度優(yōu)勢(shì)較小,與實(shí)際空戰(zhàn)情況相符。
圖4 角度優(yōu)勢(shì)評(píng)價(jià)函數(shù)Fig.4 Advantage evaluation function of angle
UCAV與敵機(jī)的空間距離是構(gòu)成導(dǎo)彈的可發(fā)射條件之一,同時(shí)也是判斷我方是否處于敵機(jī)導(dǎo)彈威脅區(qū)的判定條件。因而構(gòu)建距離因子決策評(píng)價(jià)函數(shù),通過距離評(píng)價(jià)函數(shù)引導(dǎo)UCAV機(jī)動(dòng)決策達(dá)成更優(yōu)的武器攻擊條件,構(gòu)建距離評(píng)價(jià)函數(shù)ηD,
式中,D為雙機(jī)距離;考慮到雙機(jī)機(jī)動(dòng)能力,穩(wěn)定發(fā)射范圍dr=?fq(qt);由于導(dǎo)彈發(fā)射前需持續(xù)鎖定目標(biāo)一定的時(shí)間,引入可攻擊區(qū)遠(yuǎn)邊界距離壓縮因子kd,kd=3‖Vu-Vt‖2/fq(qt);考慮到大氣高度的影響,引入標(biāo)準(zhǔn)高度修正因子mh,mh=0.5|1-h/6700|;由于可發(fā)射近邊界對(duì)于決策影響不大,固定近邊界Rmin=1000 m,距離優(yōu)勢(shì)評(píng)價(jià)函數(shù)如圖5所示,可以看出,在攻擊遠(yuǎn)邊界之外,隨著UCAV接近攻擊區(qū),評(píng)價(jià)值增大,當(dāng)相對(duì)距離小于最優(yōu)發(fā)射距離并向攻擊區(qū)內(nèi)邊界靠攏時(shí),評(píng)價(jià)值快速減?。煌瑫r(shí)當(dāng)高度低于6700 m并下降時(shí),態(tài)勢(shì)評(píng)價(jià)值減小,反映了隨著海拔降低載機(jī)和武器性能隨之降低的特點(diǎn)。
圖5 距離優(yōu)勢(shì)評(píng)價(jià)函數(shù)Fig.5 Advantage evaluation function of distance
為防止雙機(jī)在距離過大時(shí)距離優(yōu)勢(shì)函數(shù)鈍化失去引導(dǎo)作用,設(shè)
當(dāng)對(duì)戰(zhàn)空域大于30 km時(shí),超出近距空戰(zhàn)決策范圍,博弈停止。
由于本文的距離決策評(píng)價(jià)函數(shù)只考慮了進(jìn)攻方的進(jìn)攻優(yōu)勢(shì),考慮到在近距接敵時(shí)也可能同時(shí)進(jìn)入到敵機(jī)的攻擊范圍,綜合評(píng)價(jià)模型將在識(shí)別當(dāng)前雙機(jī)態(tài)勢(shì)的基礎(chǔ)上采用負(fù)權(quán)值進(jìn)行修正。
設(shè)計(jì)UCAV速度評(píng)價(jià)函數(shù)是為了實(shí)現(xiàn)UCAV在保證自身機(jī)動(dòng)能力的前提下以最短時(shí)間達(dá)成攻擊條件。在實(shí)際近距空戰(zhàn)中我方的最佳速度將根據(jù)目標(biāo)速度和相對(duì)距離實(shí)時(shí)變化,因此引入期望速度vd,定義為
式中,vmin和vmax代表UCAV允許的速度邊界,vt表示目標(biāo)速度大小,vd為UCAV的期望速度值,hu為我方載機(jī)高度,D表示雙機(jī)的相對(duì)距離,kdfq(qt)表示該型導(dǎo)彈在進(jìn)入角為qt時(shí)的實(shí)際遠(yuǎn)邊界。圖6展示了以攻擊遠(yuǎn)、近邊界為劃分的UCAV相對(duì)距離、目標(biāo)速度大小和期望速度值之間的三維關(guān)系圖。
圖6 期望速度Fig.6 expected speed
通過引入期望速度vd,實(shí)現(xiàn)了針對(duì)目標(biāo)當(dāng)前機(jī)動(dòng)狀態(tài)的跟蹤,具體的速度優(yōu)勢(shì)函數(shù)ηV定義為
期望速度值vd、UCAV速度vu與速度優(yōu)勢(shì)函數(shù)ηV的三維關(guān)系如圖7所示,可以看出當(dāng)UCAV速度大小靠近期望值時(shí),速度優(yōu)勢(shì)評(píng)價(jià)函數(shù)值最大。
圖7 速度評(píng)價(jià)函數(shù)Fig.7 Advantage evaluation function of speed
在近距空戰(zhàn)中,相對(duì)飛行高度高于目標(biāo)時(shí),載機(jī)將獲得機(jī)動(dòng)勢(shì)能優(yōu)勢(shì),但由于紅外導(dǎo)彈發(fā)射前要求載機(jī)略低于目標(biāo),所以實(shí)際空戰(zhàn)中以攻擊邊界為劃分,引入期望高度函數(shù),具體定義為
式中,hmin和hmax表示UCAV升限,ht表示當(dāng)前目標(biāo)高度,hd表示UCAV期望空戰(zhàn)高度。圖8展示了以實(shí)時(shí)攻擊邊界為劃分的目標(biāo)高度、雙機(jī)距離和期望高度值的三維關(guān)系圖。
圖8 期望高度Fig.8 expected height
參考期望高度,高度優(yōu)勢(shì)函數(shù)ηH定義為
圖9展示了期望空戰(zhàn)高度hd、UCAV高度hu和高度優(yōu)勢(shì)函數(shù)值之間的關(guān)系,可以看出,當(dāng)UCAV高度靠近期望值時(shí),高度評(píng)價(jià)函數(shù)值最大。
圖9 高度評(píng)價(jià)函數(shù)Fig.9 Advantage evaluation function of height
對(duì)角度優(yōu)勢(shì)、距離優(yōu)勢(shì)、速度優(yōu)勢(shì)和高度優(yōu)勢(shì)進(jìn)行綜合量化評(píng)價(jià)能夠反映當(dāng)前的綜合空戰(zhàn)態(tài)勢(shì)情況,為下一步的機(jī)動(dòng)決策提供依據(jù),針對(duì)不同對(duì)抗情況,構(gòu)建綜合機(jī)動(dòng)決策評(píng)價(jià)的自適應(yīng)權(quán)重模型,
式中,S為整體評(píng)價(jià)函數(shù)值,wA、wD、wV和wH分別表示四個(gè)決策因子的權(quán)值,
文獻(xiàn)[13]僅依據(jù)雙機(jī)角度關(guān)系將空戰(zhàn)態(tài)勢(shì)簡單分為相對(duì)優(yōu)勢(shì)、相對(duì)劣勢(shì)、互為均勢(shì)和相互威脅四種,然而近距空戰(zhàn)態(tài)勢(shì)復(fù)雜且變化劇烈,更精細(xì)的態(tài)勢(shì)劃分將提供更有效的態(tài)勢(shì)評(píng)估結(jié)果。由于在近距空戰(zhàn)對(duì)抗中雙方距離始終較近,角度態(tài)勢(shì)起著至關(guān)重要的作用,因此首先考慮角度因子決策評(píng)價(jià)函數(shù),根據(jù)相對(duì)提前角判據(jù)劃分為4個(gè)類別,對(duì)4個(gè)類別賦予不同角度權(quán)重;其次在角度評(píng)價(jià)完善后,通過武器攻擊區(qū)評(píng)價(jià)距離優(yōu)勢(shì),劃分為4個(gè)類別;之后通過速度優(yōu)勢(shì)函數(shù)將動(dòng)量劃分為2個(gè)類別,給出不同權(quán)值;最后利用高度優(yōu)勢(shì)函數(shù)將高度勢(shì)能劃分為2種類別,給出不同權(quán)值。如圖10所示,分級(jí)劃分為4類、共64種態(tài)勢(shì)。
圖10 自適應(yīng)分級(jí)決策模型Fig.10 Adaptive hierarchical decision model
對(duì)自適應(yīng)權(quán)值進(jìn)行歸一化處理
機(jī)動(dòng)對(duì)抗仿真以自適應(yīng)態(tài)勢(shì)評(píng)估模型為決策依據(jù),通過試探機(jī)動(dòng)尋找一步?jīng)Q策最優(yōu)控制量,使得我方平臺(tái)綜合評(píng)價(jià)值期望最大(即不考慮決策時(shí)間內(nèi)目標(biāo)的機(jī)動(dòng)變化)。文獻(xiàn)[16]提出的魯棒機(jī)動(dòng)決策模型,對(duì)試探機(jī)動(dòng)的決策結(jié)果進(jìn)行統(tǒng)計(jì)學(xué)意義上的評(píng)價(jià),即一種機(jī)動(dòng)執(zhí)行完畢后其期望代表了該機(jī)動(dòng)最終的收益。具體過程如下:
(1)在第k個(gè)決策時(shí)刻,決策評(píng)價(jià)函數(shù)的權(quán)值為對(duì)于第i種試探方案,相應(yīng)的k+1時(shí)刻的評(píng)價(jià)函數(shù)值為綜合評(píng)價(jià)函數(shù)值為
(2)對(duì)于第i種試探機(jī)動(dòng)的評(píng)價(jià)值的數(shù)學(xué)期望和方差,有
(3)通過對(duì)比各種試探方案下的期望和方差值,優(yōu)選期望值最大的機(jī)動(dòng)決策控制量;當(dāng)取最大值出現(xiàn)多個(gè)方案時(shí),從中選取最小的機(jī)動(dòng)決策方案。
綜上,通過對(duì)試探機(jī)動(dòng)結(jié)果的統(tǒng)計(jì)學(xué)篩選,實(shí)現(xiàn)了多決策因子向一致性收斂方向靠近,保證了綜合態(tài)勢(shì)評(píng)價(jià)函數(shù)值最終收斂與最優(yōu)解,提高了試探機(jī)動(dòng)尋優(yōu)方案的魯棒性。
為充分驗(yàn)證所設(shè)計(jì)的自適應(yīng)分級(jí)機(jī)動(dòng)決策評(píng)價(jià)模型對(duì)不同初始空戰(zhàn)態(tài)勢(shì)的有效性,對(duì)4種一級(jí)態(tài)勢(shì)下的采用自適應(yīng)分級(jí)策略的藍(lán)方UCAV與采用滾動(dòng)時(shí)域?qū)<蚁到y(tǒng)的固定對(duì)抗策略[17]的紅方UCAV進(jìn)行近距空戰(zhàn)對(duì)抗仿真。由于UCAV初始條件隨機(jī)產(chǎn)生,為體現(xiàn)實(shí)驗(yàn)結(jié)論的一般性,分別對(duì)4種態(tài)勢(shì)各進(jìn)行150次蒙特卡洛仿真[18],并各選取其中1組空戰(zhàn)對(duì)抗仿真結(jié)果進(jìn)行描述。設(shè)置實(shí)驗(yàn)仿真步長為1 s,對(duì)抗終止條件為:雙機(jī)距離大于近距決策空域,即d>30 km;或達(dá)到最大對(duì)抗仿真時(shí)間1000 s;或雙機(jī)空間關(guān)系滿足某一方空空導(dǎo)彈發(fā)射距離條件、角度條件和載機(jī)姿態(tài)限制,且可攻擊時(shí)間窗口連續(xù)大于3 s。雖然實(shí)際空戰(zhàn)中進(jìn)攻方在達(dá)成攻擊條件后為提高導(dǎo)彈命中率會(huì)進(jìn)一步優(yōu)化發(fā)射條件,但本文通過導(dǎo)彈不可逃逸攻擊區(qū)判定連續(xù)可攻擊窗口大于3 s時(shí)實(shí)現(xiàn)空戰(zhàn)勝利。
(1)雙方初始條件為相互威脅態(tài)勢(shì):紅方初始速度矢量為[100 100 5] m/s,初始位置[1000 1000 6700];藍(lán)方初始速度矢量為[-100 -100 5] m/s,初始位置[13000 13000 6700];雙方初始飛行姿態(tài)均處于勻速直線飛行狀態(tài)。仿真結(jié)果如圖11、圖12所示。藍(lán)方在迎頭對(duì)攻初始條件下,通過右斜爬升、斜筋斗機(jī)動(dòng)誘使紅方做置尾機(jī)動(dòng)進(jìn)攻,在仿真第297 s,藍(lán)方實(shí)現(xiàn)絕對(duì)優(yōu)勢(shì),達(dá)成尾后攻擊條件。藍(lán)方能夠在完全對(duì)稱的初始態(tài)勢(shì)下取得空戰(zhàn)勝利,說明了自適應(yīng)分級(jí)機(jī)動(dòng)決策模型在該類型空戰(zhàn)對(duì)抗情形下的有效性和優(yōu)越性。
圖11 紅藍(lán)對(duì)抗三維視圖(互為威脅態(tài)勢(shì))Fig.11 Three dimensional view of red versus blue (mutual threat situation)
圖12 雙機(jī)綜合態(tài)勢(shì)評(píng)價(jià)值(互為威脅態(tài)勢(shì))Fig.12 Situation assessment value (mutual threat situation)
(2)雙方初始條件為互為均勢(shì)態(tài)勢(shì):紅方初始速度矢量為[-70 -70 5] m/s,初始位置[1000 1000 6700];藍(lán)方初始速度矢量為[70 70 5] m/s,初始位置[5500 5500 6700] m/s;雙方初始飛行姿態(tài)均處于勻速直線飛行狀態(tài)。仿真結(jié)果如圖13、圖14所示。在水平方向上雙機(jī)均采用了對(duì)稱盤旋的機(jī)動(dòng)策略,在垂直方向上紅方選擇斜向下盤旋并拉升,藍(lán)方選擇斜向上盤旋并俯沖,藍(lán)方在仿真第67 s以后開始持續(xù)保持相對(duì)優(yōu)勢(shì)并于仿真第192 s達(dá)成攻擊條件。藍(lán)方能夠在完全對(duì)稱的初始態(tài)勢(shì)下取得空戰(zhàn)勝利,說明了自適應(yīng)分級(jí)機(jī)動(dòng)決策模型在該類型空戰(zhàn)對(duì)抗情形下的有效性和優(yōu)越性。
圖13 紅藍(lán)對(duì)抗三維視圖(互為均勢(shì)態(tài)勢(shì))Fig.13 Three dimensional view of red versus blue (mutual equal situation)
圖14 雙機(jī)綜合態(tài)勢(shì)評(píng)價(jià)值(互為均勢(shì)態(tài)勢(shì))Fig.14 Situation assessment value (mutual equal situation)
(3)雙方初始條件為紅方優(yōu)勢(shì)態(tài)勢(shì):紅方初始速度矢量為[70 80 5] m/s,初始位置[1000 1000 6700];藍(lán)方初始速度矢量為[100 100 -5] m/s,初始位置[8000 9000 6700];雙方初始飛行姿態(tài)均處于勻速直線飛行狀態(tài)。仿真結(jié)果如圖15~16所示。藍(lán)方在第88 s成功逆轉(zhuǎn)被尾追的劣勢(shì),并保持一定的占位優(yōu)勢(shì)。藍(lán)方能夠在完全劣勢(shì)的情況下擺脫敵機(jī)威脅,說明了自適應(yīng)分級(jí)機(jī)動(dòng)決策模型在該類型空戰(zhàn)對(duì)抗情形下的有效性和優(yōu)越性。
圖15 紅藍(lán)對(duì)抗三維視圖 (紅方優(yōu)勢(shì)態(tài)勢(shì))Fig.15 Three dimensional view of red versus blue (red advantage situation)
圖16 雙機(jī)綜合態(tài)勢(shì)評(píng)價(jià)值(紅方優(yōu)勢(shì)態(tài)勢(shì))Fig.16 Situation assessment value(red advantage situation)
(4)雙方初始條件為藍(lán)方優(yōu)勢(shì)態(tài)勢(shì):紅方初始速度矢量為[-110 -100 5] m/s,初始位置[1000 1000 6700];藍(lán)方初始速度矢量為[-80 -80 -5] m/s,初始位置[6500 6500 6700];雙方初始飛行姿態(tài)均處于勻速直線飛行狀態(tài)。仿真結(jié)果如圖17、圖18所示。藍(lán)方持續(xù)保持優(yōu)勢(shì)占位,并于仿真第106 s達(dá)成攻擊條件,證明了自適應(yīng)分級(jí)機(jī)動(dòng)決策模型在該類型空戰(zhàn)對(duì)抗情形下的有效性。
圖17 紅藍(lán)對(duì)抗三維視圖(藍(lán)方優(yōu)勢(shì)態(tài)勢(shì))Fig.17 Three dimensional view of red versus blue (blue advantage situation)
圖18 雙機(jī)綜合態(tài)勢(shì)評(píng)價(jià)值(藍(lán)方優(yōu)勢(shì)態(tài)勢(shì))Fig.18 Situation assessment value (blue advantage situation)
本文對(duì)角度、距離、速度和高度4個(gè)關(guān)鍵空戰(zhàn)態(tài)勢(shì)參數(shù)設(shè)計(jì)了量化評(píng)價(jià)函數(shù);同時(shí)綜合考慮機(jī)動(dòng)占位優(yōu)勢(shì)和目標(biāo)導(dǎo)彈威脅,將近距空戰(zhàn)態(tài)勢(shì)細(xì)分為4級(jí)、共64種不同態(tài)勢(shì)情況,構(gòu)建了基于空戰(zhàn)態(tài)勢(shì)評(píng)估模型。仿真結(jié)果表明:
(1)添加自適應(yīng)空戰(zhàn)態(tài)勢(shì)評(píng)估模型的機(jī)動(dòng)決策系統(tǒng)在對(duì)稱空戰(zhàn)條件下優(yōu)于基于滾動(dòng)時(shí)域的決策系統(tǒng)。
(2)由于決策模型綜合考慮了進(jìn)攻占位和敵機(jī)導(dǎo)彈威脅,對(duì)處于被尾追劣勢(shì)條件下的空戰(zhàn)情形,本文所提出的態(tài)勢(shì)評(píng)估模型能夠引導(dǎo)UCAV機(jī)動(dòng),實(shí)現(xiàn)擺脫敵方威脅的目的。
(3)在不同空戰(zhàn)情形下,自適應(yīng)空戰(zhàn)態(tài)勢(shì)評(píng)估模型均能有效指導(dǎo)載機(jī)實(shí)現(xiàn)近距空戰(zhàn)自主攻擊占位。
自適應(yīng)當(dāng)前空戰(zhàn)態(tài)勢(shì)的態(tài)勢(shì)評(píng)估方法可以為空戰(zhàn)機(jī)動(dòng)決策系統(tǒng)提供靈活的態(tài)勢(shì)信息支撐,參考經(jīng)量化后的態(tài)勢(shì)評(píng)估量,有助于在基于強(qiáng)化學(xué)習(xí)的決策方法中構(gòu)造稠密獎(jiǎng)勵(lì),引導(dǎo)智能體根據(jù)當(dāng)前態(tài)勢(shì)進(jìn)行空戰(zhàn)機(jī)動(dòng)決策。