丁 鵬,宋亞飛*,夏智權(quán)
(1.空軍工程大學(xué)防空反導(dǎo)學(xué)院,西安 710051;2.解放軍93126 部隊(duì),北京 100875)
科技水平的飛速發(fā)展,極大推動(dòng)了武器裝備的多樣化、智能化發(fā)展。在現(xiàn)代防空作戰(zhàn)中,武器的價(jià)值、性能各有不同,如何結(jié)合武器性能和目標(biāo)特點(diǎn)確定最科學(xué)、最合理的武器-目標(biāo)分配(weapon-target assignment,WTA)策略是制勝強(qiáng)敵的關(guān)鍵。因此,迫切需要找到一種WTA 規(guī)則,為防空作戰(zhàn)指揮決策提供可靠依據(jù)[1-3]。
近年來,為了滿足武器目標(biāo)分配決策需求,在軍事領(lǐng)域開展了大量相關(guān)研究。文獻(xiàn)[4]將WTA 與交叉熵-遺傳算法結(jié)合起來,構(gòu)建離散概率分布矩陣,使得矩陣滿足武器- 目標(biāo)分配方案,進(jìn)而根據(jù)矩陣得到解的多個(gè)樣本,并通過實(shí)驗(yàn)驗(yàn)證了其有效性。文獻(xiàn)[5]構(gòu)建了一個(gè)地面目標(biāo)攻擊WTA(GTAWTA)模型,并設(shè)計(jì)了一種基于遺傳算法的變量值控制方法,以解決一些智能算法由于問題的規(guī)模大,而在解決GTA-WTA 問題時(shí)太慢或無法獲得可行解的問題。LIU 等研究了多個(gè)攔截器協(xié)同攻擊多個(gè)地面目標(biāo)時(shí)的多目標(biāo)分配問題,最大限度地提高攻擊效率,根據(jù)攻擊效能的優(yōu)勢建立了有效合理的適應(yīng)度函數(shù)[6],并提出了一種自適應(yīng)模擬退火粒子群優(yōu)化算法,該算法可以提高收斂速度,克服粒子群算法容易陷入局部極值的缺點(diǎn)。文獻(xiàn)[7]提出了一種多階段攻擊WTA 方法,結(jié)合覆蓋狀態(tài)和覆蓋層數(shù),提出了一種多階段攻擊規(guī)劃方法,建立了多階段攻擊目標(biāo)函數(shù)模型。對交互式防御作戰(zhàn)場景進(jìn)行了仿真,比較了傳統(tǒng)WTA 方法和多階段WTA 方法,并用蒙特卡洛方法驗(yàn)證了目標(biāo)函數(shù)模型。文獻(xiàn)[8]根據(jù)多種武器與敵方目標(biāo)之間的戰(zhàn)術(shù)關(guān)系,提出了一種指標(biāo)函數(shù),建立了多攔截器的目標(biāo)分配模型,設(shè)計(jì)了一種改進(jìn)的混合粒子群優(yōu)化算法,采用線性加權(quán)遞減法,來解決全局搜索能力與收斂精度之間的矛盾。仿真結(jié)果表明,所設(shè)計(jì)的算法能夠較好地解決多種武器的目標(biāo)分配問題。文獻(xiàn)[9]通過鯨魚優(yōu)化算法解決了WTA 問題,并通過引入自適應(yīng)變量調(diào)整位置更新過程,對鯨魚優(yōu)化算法進(jìn)行了改進(jìn),實(shí)驗(yàn)表明模型提高了分配收益和分配速度。文獻(xiàn)[10]考慮了具有自適應(yīng)分組和視場角度約束的攔截多目標(biāo)的武器目標(biāo)分配問題。針對影響分配效率的因素,提出了一種武器-目標(biāo)分配方法,以實(shí)現(xiàn)對所有目標(biāo)的有效攔截,避免導(dǎo)彈的過度分配。仿真結(jié)果驗(yàn)證了該策略具有令人滿意的性能。
上述方法都是以我方的防空行動(dòng)作為主觀角度,對于敵方則是僅考慮敵方目標(biāo)的被動(dòng)屬性,如敵方武器的價(jià)值、敵我距離、敵機(jī)飛行高度等等。事實(shí)上,態(tài)勢智能認(rèn)知是分配決策的關(guān)鍵,認(rèn)知的核心在于對敵方意圖的準(zhǔn)確判斷和對戰(zhàn)場變化的迅速理解,從而才能作出準(zhǔn)確的預(yù)測和決策,并規(guī)劃和實(shí)施有效的作戰(zhàn)行動(dòng)。在防空作戰(zhàn)中,受目標(biāo)特性、對抗環(huán)境、攔截資源等因素的影響,戰(zhàn)前籌劃難以滿足實(shí)時(shí)變化的戰(zhàn)場環(huán)境,迫切需要在戰(zhàn)中根據(jù)實(shí)時(shí)戰(zhàn)場態(tài)勢進(jìn)行臨機(jī)規(guī)劃,目標(biāo)意圖從本質(zhì)上反映了目標(biāo)“想干什么”,對實(shí)時(shí)態(tài)勢具有重要影響,是武器-目標(biāo)分配必須考慮的關(guān)鍵因素。因此,本文從防空作戰(zhàn)武器- 目標(biāo)分配對于目標(biāo)意圖識別的迫切需求出發(fā),研究意圖驅(qū)動(dòng)武器-目標(biāo)分配的機(jī)理,探索空中目標(biāo)的意圖識別方法,為武器- 目標(biāo)分配提供智能支撐,提出一種意圖驅(qū)動(dòng)的防空作戰(zhàn)動(dòng)態(tài)武器目標(biāo)分配模型。
本文重點(diǎn)研究了防空作戰(zhàn)動(dòng)態(tài)武器- 目標(biāo)分配需求分析、意圖驅(qū)動(dòng)武器-目標(biāo)分配的機(jī)理、基于深度學(xué)習(xí)的空中目標(biāo)作戰(zhàn)意圖識別方法、基于意圖識別的動(dòng)態(tài)武器-目標(biāo)分配方法。
作戰(zhàn)意圖通過影響實(shí)時(shí)態(tài)勢來服務(wù)于動(dòng)態(tài)任務(wù)規(guī)劃,作戰(zhàn)意圖驅(qū)動(dòng)武器-目標(biāo)分配是將信息優(yōu)勢轉(zhuǎn)化為決策優(yōu)勢的重要抓手和實(shí)現(xiàn)途徑,也是軍事智能化轉(zhuǎn)型的有力牽引。
在防空作戰(zhàn)中,各種類型的地空導(dǎo)彈構(gòu)成了我方的作戰(zhàn)力量,多種多樣的戰(zhàn)機(jī)構(gòu)成了敵作戰(zhàn)力量,由于它們的價(jià)值和打擊能力存在差異,瞬息萬變的戰(zhàn)場環(huán)境也在很大程度上影響戰(zhàn)局,敵方采取的不同作戰(zhàn)行動(dòng)對于我方?jīng)Q策至關(guān)重要。然而,通過軍事專家的作戰(zhàn)經(jīng)驗(yàn)判斷進(jìn)行武器目標(biāo)分配的方式,存在速度慢、準(zhǔn)確率難以保證的問題,因此,迫切需要通過提取相應(yīng)戰(zhàn)場環(huán)境信息、敵我目標(biāo)的靜態(tài)屬性和實(shí)時(shí)動(dòng)態(tài)信息分析建模,識別出敵方不同作戰(zhàn)單元的意圖,進(jìn)而科學(xué)合理地確定武器目標(biāo)分配方法。本文首先通過空中作戰(zhàn)意圖數(shù)據(jù)集訓(xùn)練BiLSTM-Attention 網(wǎng)絡(luò)[11-12],使模型能夠準(zhǔn)確識別出敵機(jī)作戰(zhàn)意圖,然后根據(jù)敵不同作戰(zhàn)飛機(jī)的意圖以及敵機(jī)的被動(dòng)屬性、我方武器屬性、戰(zhàn)場環(huán)境信息和實(shí)時(shí)動(dòng)態(tài)信息,建立意圖驅(qū)動(dòng)的武器目標(biāo)分配模型(intent-WTA),通過費(fèi)用流算法得到最優(yōu)的分配方案[13]。模型結(jié)構(gòu)如圖1 所示。
圖1 武器-目標(biāo)分配模型結(jié)構(gòu)Fig.1 Weapon-target allocation model structure
在目標(biāo)分配過程中,在能夠完成防空任務(wù)的情況下,敵我武器的價(jià)值和武器目標(biāo)分配方案高度相關(guān),即希望用最小的打擊成本,獲得最大的打擊收益,期望我方武器價(jià)值的最小化以及擊落敵機(jī)價(jià)值的最大化。
從命中率的角度看,應(yīng)當(dāng)盡可能使用命中率最高的武器來打擊敵對我威脅度最大的戰(zhàn)機(jī),例如識別出的意圖為進(jìn)攻的戰(zhàn)機(jī)等,對于識別出掩護(hù)意圖等對我方威脅程度較小的敵機(jī),可以次要考慮。
我方防空作戰(zhàn)所需要的時(shí)間成本也是不可忽視的影響因素,如果攔截時(shí)間過長,可能導(dǎo)致在攔截成功之前敵機(jī)已經(jīng)達(dá)到作戰(zhàn)任務(wù)。影響時(shí)間成本的因素主要有敵機(jī)高度、敵我距離,即敵不同戰(zhàn)機(jī)和我方不同防空力量之間的距離、敵機(jī)的飛行速度和我方導(dǎo)彈的飛行速度,為簡化起見,本文使用敵我距離和我方導(dǎo)彈飛行速度。
根據(jù)文獻(xiàn)[14],對于空中敵目標(biāo)意圖識別的特征空間,使用{敵機(jī)飛行高度、敵我距離、敵機(jī)飛行速度、敵機(jī)飛行加速度、航向角、方位角、對空雷達(dá)狀態(tài)、對海雷達(dá)狀態(tài)、敵機(jī)類型、機(jī)動(dòng)類型、干擾狀態(tài)}11 維特征向量。
因此,本文建立的動(dòng)態(tài)武器-目標(biāo)分配特征空間如圖2 所示。包括{敵方武器價(jià)值、我方武器價(jià)值、我方武器命中率、我方導(dǎo)彈飛行速度、敵機(jī)飛行高度、敵我距離、敵機(jī)飛行速度、敵機(jī)飛行加速度、航向角、方位角、對空雷達(dá)狀態(tài)、對海雷達(dá)狀態(tài)、敵機(jī)類型、機(jī)動(dòng)類型、干擾狀態(tài)}15 維特征向量,并區(qū)分為數(shù)值型特征與非數(shù)值型特征兩類。
戰(zhàn)爭由于其靈活性,敵機(jī)不同作戰(zhàn)力量所采取的作戰(zhàn)意圖存在多樣化,本文充分考慮防空作戰(zhàn)的特點(diǎn),針對敵機(jī)不同意圖對防空武器目標(biāo)分配的影響,選取了6 種典型的目標(biāo)意圖空間,建立的敵方目標(biāo)的意圖空間包括{突防、佯攻、攻擊、偵察、撤退、干擾}。
確定意圖空間后,由相關(guān)領(lǐng)域?qū)<腋鶕?jù)經(jīng)驗(yàn)確定作戰(zhàn)模擬中心得到的作戰(zhàn)數(shù)據(jù)的敵機(jī)意圖,將專家經(jīng)驗(yàn)封裝成標(biāo)簽來訓(xùn)練BiLSTM-Attention 模型,得到敵機(jī)不同作戰(zhàn)單元的意圖后,以不同敵機(jī)對我方的威脅度的方式影響武器目標(biāo)分配,敵機(jī)意圖對我方防空作戰(zhàn)威脅度由大到小排序?yàn)楣簦緜刹欤就环溃靖蓴_>佯攻>撤退。
防空作戰(zhàn)的武器目標(biāo)分配問題,根據(jù)是否考慮時(shí)間因素的影響,通常劃分為靜態(tài)武器目標(biāo)分配模型(static weapon target as-signment,SWTA)和武器目標(biāo)動(dòng)態(tài)分配模型(dynamic weapon target assignment,DWTA)[15]。SWTA 模型強(qiáng)調(diào)在不考慮時(shí)間因素的情況下,在單個(gè)階段內(nèi)一次性求解分配方案,僅將毀傷概率、目標(biāo)威脅和目標(biāo)價(jià)值等因素作為優(yōu)化對象,在求解效率上表現(xiàn)較好,但模型過于簡單,與作戰(zhàn)貼合不夠緊密,實(shí)戰(zhàn)過程中的實(shí)用性受限。DWTA 模型則是將分配過程以時(shí)間因素劃分成多個(gè)階段執(zhí)行,從而使模型更貼近實(shí)戰(zhàn)化,更加貼合戰(zhàn)場實(shí)際。
本文通過采集24 幀的目標(biāo)特征信息作為一個(gè)階段,識別出敵機(jī)本階段意圖,確定本階段的武器目標(biāo)分配方案,通過識別下階段敵機(jī)毀傷情況以及敵機(jī)意圖確定后續(xù)分配方案,使模型能夠隨時(shí)結(jié)合戰(zhàn)場實(shí)時(shí)情況調(diào)整分配方案,實(shí)現(xiàn)由意圖驅(qū)動(dòng)的動(dòng)態(tài)武器目標(biāo)分配。
為兼顧模型準(zhǔn)確率、復(fù)雜程度和運(yùn)行速度,根據(jù)采集到的敵機(jī)特征,建立BiLSTM-Attention 模型進(jìn)行意圖識別,該模型由輸入層、隱含層和輸出層3部分組成。
輸入層的作用主要是處理數(shù)據(jù)集中的防空作戰(zhàn)數(shù)據(jù),并且將處理后的數(shù)據(jù)輸入BiLSTM 層。預(yù)處理層將數(shù)值型特征數(shù)據(jù)進(jìn)行歸一化處理,非數(shù)值型數(shù)據(jù)編碼后進(jìn)行歸一化處理,以此消除量綱對于模型訓(xùn)練的影響,提高網(wǎng)絡(luò)收斂速度。對于第x 種特征數(shù)據(jù);n 為數(shù)據(jù)總數(shù)。將第x 種特征數(shù)據(jù)的原始數(shù)據(jù)值fxi歸一化后的結(jié)果為,如式(1)所示:
式中,minFx為第x 維特征Fx的最小值;maxFx為第x 維特征Fx的最大值。
將歸一化后所得到的數(shù)據(jù)隨機(jī)初始化,按8∶2的比例劃分為訓(xùn)練集和測試集。
隱含層由BiLSTM 層(LSTM 的基礎(chǔ)上引入雙向循環(huán)機(jī)制)、Attention 層(捕捉深層特征的注意力層)和Dense 層(全連接層)3 部分組成[16-18]。
輸出層使用softmax 函數(shù)通過隱含層的輸出轉(zhuǎn)得到可能為各種意圖的概率,概率最高的意圖即為識別出的敵機(jī)意圖。具體如式(2)所示:
其中,W 表示權(quán)重系數(shù)矩陣,b 表示偏置系數(shù)向量;yk為輸出層的預(yù)測標(biāo)簽。
BiLSTM-Attention 意圖識別模型的結(jié)構(gòu)如圖3所示。
2.1.1 BiLSTM 層
在LSTM 體系中,通過遺忘門、更新門、輸出門以及記憶單元實(shí)現(xiàn)信息的輸入和輸出,LSTM 的單元結(jié)構(gòu)如圖4 所示。其中,xt表示在t 時(shí)刻時(shí)的輸入特征;ct-1為更新前的神經(jīng)元;ct為更新后的神經(jīng)元;ht-1和ht 分別表示前一時(shí)刻和當(dāng)前時(shí)刻的輸出狀態(tài);Γf、Γu和Γo分別為LSTM 結(jié)構(gòu)的遺忘門、更新門和輸出門;為候選神經(jīng)元;σ 為Sigmoid 激活函數(shù)。具體如式(3)~式(8)所示,其中,wf、wu、wo、wc為各部分的權(quán)重系數(shù)矩陣,bf、bu、bo、bc為各部分的偏移系數(shù)向量。
圖4 LSTM 結(jié)構(gòu)Fig.4 LSTM structure
由于僅僅使用單向的LSTM 只能提取到當(dāng)前時(shí)刻之前的信息,無法學(xué)習(xí)未來的信息與當(dāng)前時(shí)刻的信息之間的關(guān)系。因此,本文引入雙向循環(huán)機(jī)制,提高意圖識別的準(zhǔn)確率。BiLSTM 模型結(jié)構(gòu)圖如下頁圖5 所示。
圖5 BiLSTM 結(jié)構(gòu)Fig.5 BiLSTM structure
具體如式(9)~式(11)所示:
2.1.2 Attention 層
為使結(jié)構(gòu)能關(guān)注敵機(jī)眾多特征中的關(guān)鍵信息,提高識別準(zhǔn)確率,本文在BiLSTM 層后引入注意力機(jī)制。將BiLSTM 層輸出的每個(gè)狀態(tài)作為注意力層的輸入,通過注意力打分函數(shù),得到注意力分布,加權(quán)平均進(jìn)行匯總得到注意力值作為輸出。注意力機(jī)制模型結(jié)構(gòu)如圖6 所示。
圖6 Attention 機(jī)制模型Fig.6 Attention mechanism model
式(12)中,st為狀態(tài)向量;et表示其確定的能量值;wt、bt分別表示第t 個(gè)特征向量相對應(yīng)的權(quán)重系數(shù)矩陣和偏移系數(shù)向量。式(13)的作用是轉(zhuǎn)換注意力狀態(tài),使用式(14)計(jì)算得到狀態(tài)向量Y,將得到的狀態(tài)向量Y 與全連接層整合后,經(jīng)過softmax 層識別出敵機(jī)意圖。
2.2.1 作戰(zhàn)方式
在防空作戰(zhàn)的動(dòng)態(tài)武器目標(biāo)分配過程中,將敵我雙方分別看作作戰(zhàn)的主體,敵我雙方均為作戰(zhàn)的主動(dòng)方,每個(gè)時(shí)間階段我方根據(jù)敵意圖的改變,以及我方武器的價(jià)值、敵機(jī)價(jià)值敵我距離、命中概率等因素,確定當(dāng)前階段的靜態(tài)武器目標(biāo)分配,按時(shí)間要素將不同階段的靜態(tài)武器目標(biāo)分配進(jìn)行組合,從而實(shí)現(xiàn)動(dòng)態(tài)武器目標(biāo)分配,完成作戰(zhàn)任務(wù)。本文基于以上考慮,提出了意圖驅(qū)動(dòng)的武器-目標(biāo)分配模型(intent-WTA)。
一般情況下,分配過程包括4 個(gè)要素:1)作戰(zhàn)雙方,即我方武器和敵方目標(biāo);2)策略集,指的是雙方選擇的作戰(zhàn)策略集合;3)收益函數(shù),指的是我方根據(jù)選擇的策略獲得的收益值;4)均衡解,指的是我方最優(yōu)策略的組合。如圖7 所示,我方武器和敵方目標(biāo)采取各自的作戰(zhàn)策略,經(jīng)過收益函數(shù)計(jì)算得到均衡解。
圖7 分配過程示意圖Fig.7 Schematic diagram of distribution process
2.2.2 收益函數(shù)
作戰(zhàn)過程中,收益函數(shù)要體現(xiàn)我方的目標(biāo)盡可能擊落敵方價(jià)值最高的目標(biāo)、對我方威脅度最大的目標(biāo)以及距離我方最近的目標(biāo),同時(shí)也要考慮我方武器代價(jià)、命中率的高低對我方取得收益的影響[19]。
假設(shè)一次防空作戰(zhàn)中,我方武器有M 個(gè),敵方作戰(zhàn)單元有N 個(gè),我方武器的代價(jià)集合為D,敵方目標(biāo)的價(jià)值集合為K。
其中,Di表示第i 個(gè)武器的代價(jià)
其中,Kj表示第j 個(gè)目標(biāo)的價(jià)值。
我方不同武器的命中率集合為P。
其中,pi表示第i 個(gè)武器的命中率。
因此,我方第i 個(gè)武器打擊敵第j 個(gè)目標(biāo)的收益函數(shù)為:
其中,wj表示敵方第j 個(gè)目標(biāo)的威脅度,由BiLSTM-Attention 模型識別出的敵機(jī)意圖決定;α,β 為常數(shù),分別是武器攔截時(shí)間和武器代價(jià)對收益的影響系數(shù);lj表示敵方第j 個(gè)目標(biāo)與我方的空間直線距離;vi表示我方第i 個(gè)武器的飛行速度。
考慮對我方威脅較小的敵機(jī),可以通過時(shí)刻觀察監(jiān)視來保證我方安全,設(shè)置閾值,若所有武器打擊敵方的收益值低于閾值,我方則不需要使用武器進(jìn)行攔截。
我方的收益矩陣為:
本階段我方武器目標(biāo)分配收益函數(shù)為:
其中,hij有0、1 兩個(gè)取值。hij=1,表示我方的第i 個(gè)武器打擊敵方第j 個(gè)目標(biāo);hij=0,表示我方的第i 個(gè)武器沒有打擊敵方第j 個(gè)目標(biāo)。
2.3.1 帶權(quán)二分圖的最佳匹配模型
武器目標(biāo)分配問題根據(jù)武器集合和敵方目標(biāo)集合之間互不相交且各自集合內(nèi)部不存在分配關(guān)系的特點(diǎn),可以看作帶權(quán)二分圖的最佳匹配問題。G=(G,D,E,C,Z)表示帶權(quán)二分圖模型;W 為我方武器集合;D 為敵方目標(biāo)集合;E 為所有邊的集合;C表示邊的容量集合;Z 表示邊權(quán)集合,即武器打擊目標(biāo)獲得的收益值。
二分圖的所有匹配中,所含匹配邊數(shù)最多的匹配,稱為二分圖的最大匹配,其中,邊權(quán)和最大的匹配就是最佳匹配,通過費(fèi)用流尋找?guī)?quán)二分圖的最佳匹配獲得這一階段的收益值最大和[20],作為本階段的武器目標(biāo)分配策略。
2.3.2 最大費(fèi)用最大流算法
最大費(fèi)用最大流問題是運(yùn)籌學(xué)中的一類典型問題。在一個(gè)網(wǎng)絡(luò)中的每條邊都有“容量”和“費(fèi)用”兩個(gè)參數(shù)限制的條件下,試圖尋找出從源點(diǎn)到匯點(diǎn)的最優(yōu)流量分配,可以在流量最大的前提下,達(dá)到費(fèi)用最大的要求。
核心思想是總在費(fèi)用最大的增廣路上增加流值,直到流值達(dá)到v。
添加附加源S 和附加匯T,從S 向二分圖中的每個(gè)武器節(jié)點(diǎn)連接一條權(quán)值為0、容量為1 的有向邊,從二分圖中的每個(gè)目標(biāo)節(jié)點(diǎn)向T 也連接一條權(quán)值為0、容量為1 的有向邊。然后把原有的邊看作容量為1、權(quán)值不變的有向邊。求解從S 到T 的最大費(fèi)用最大流,就能得到該二分圖的最佳匹配,如圖8 所示。
圖8 最大費(fèi)用流模型Fig.8 Maximum cost flow model
可寫成如下規(guī)劃形式:
其中,xij表示每條邊通過的流量;v 表示流值;xjs,xsj分別表示源點(diǎn)流入流出的流量;xjt,xtj分別表示匯點(diǎn)流入流出的流量;xji,xij分別表示中間點(diǎn)的流入流出的流量;cij表示每條邊的容量。
最大費(fèi)用最大流的主要計(jì)算步驟為:
Step 1 對網(wǎng)絡(luò)G=(V,E,C,Z),給出流值為0 的初始流;
Step 2 作伴隨此流的增流網(wǎng)絡(luò)G'=(V',E',Z');
Step 3 若G'不存在S 至T 的路徑,則G 的流即為最大費(fèi)用最大流;否則,用標(biāo)號法找出S 至T的最長路徑P;
Step 4 根據(jù)最長路徑,在G 上增流;
Step 5 根據(jù)計(jì)算最長路徑時(shí)的各頂點(diǎn)的標(biāo)號值L(v),修改G 中邊的權(quán)重Z(e);
Step 6 將新流視為初始流,轉(zhuǎn)Step 2。
3.1.1 實(shí)驗(yàn)環(huán)境及參數(shù)
通過某作戰(zhàn)仿真系統(tǒng)中抓取的10 000 個(gè)作戰(zhàn)樣本作為實(shí)驗(yàn)數(shù)據(jù),針對每個(gè)樣本采集連續(xù)24 幀包括飛行速度、飛行高度、干擾狀態(tài)、雷達(dá)狀態(tài)等15個(gè)特征維度的作戰(zhàn)數(shù)據(jù)。
實(shí)驗(yàn)采用Python 語言,學(xué)習(xí)框架為Keras,運(yùn)行環(huán)境為Pycharm2021 軟件、Win11 系統(tǒng)、RTX3070Ti顯卡、16 GB 內(nèi)存。
針對防空作戰(zhàn)敵機(jī)作戰(zhàn)單元的意圖識別,首先通過軍事領(lǐng)域?qū)<腋鶕?jù)其作戰(zhàn)經(jīng)驗(yàn)編寫規(guī)則,然后根據(jù)專家編寫的規(guī)則生成全部數(shù)據(jù)集的意圖標(biāo)簽,篩選出明顯存在錯(cuò)誤的標(biāo)簽后由專家進(jìn)行修訂。專家主要包括在空戰(zhàn)領(lǐng)域具有較強(qiáng)的權(quán)威和足夠多作戰(zhàn)經(jīng)驗(yàn)的飛行員、指戰(zhàn)員等,確保了樣本標(biāo)簽的準(zhǔn)確性和作戰(zhàn)實(shí)用性。數(shù)據(jù)集中6 種敵機(jī)作戰(zhàn)單元的作戰(zhàn)意圖數(shù)據(jù)占比情況為攻擊意圖33.6%、偵察意圖19.2%、突防意圖18.3%、干擾意圖11.2%、佯攻意圖7.5%、撤退意圖10.2%。樣本規(guī)模為10 000,隨機(jī)篩選出8 000 個(gè)樣本作為訓(xùn)練集,剩余2 000個(gè)樣本作為測試集,訓(xùn)練集與測試集的比例為8∶2。使用準(zhǔn)確率作為指標(biāo)評價(jià)BiLSTM-Attention 模型。實(shí)驗(yàn)超參數(shù)如表1 所示。
表1 模型主要超參數(shù)Table 1 Main superparameters of the model
針對意圖識別后的武器目標(biāo)分配,由空戰(zhàn)領(lǐng)域?qū)<腋鶕?jù)空戰(zhàn)經(jīng)驗(yàn)確定模型參數(shù),隨機(jī)選取50 組樣本統(tǒng)計(jì)最優(yōu)解次數(shù)和運(yùn)行時(shí)間,作為評價(jià)武器目標(biāo)分配模型的指標(biāo)。
隨機(jī)選取100 組數(shù)據(jù)驗(yàn)證靜態(tài)武器目標(biāo)分配模型的有效性,通過空戰(zhàn)領(lǐng)域?qū)<覍δP洼敵鼋Y(jié)果的合理性進(jìn)行評定,以合理度(專家評價(jià)為合理的數(shù)據(jù)占測試數(shù)據(jù)總數(shù))作為評價(jià)模型有效性的指標(biāo)。
3.1.2 意圖識別效果評估
BiLSTM-Attention 模型經(jīng)訓(xùn)練后對測試集的樣本進(jìn)行測試,實(shí)驗(yàn)結(jié)果表明,模型在測試集的樣本上的準(zhǔn)確率達(dá)到了97.1%,說明在誤差允許的范圍內(nèi),模型結(jié)果可以用于武器目標(biāo)分配。為了體現(xiàn)識別各個(gè)意圖存在的誤差,表2 為混淆矩陣。
表2 意圖識別混淆矩陣Table 2 Confusion matrix of intention recognition
由表2 可知,BiLSTM-Attention 模型可以較為準(zhǔn)確地識別出敵機(jī)的作戰(zhàn)意圖,特別是對撤退和干擾意圖的識別表現(xiàn)出色,可以達(dá)到99%;對于佯攻的識別存在與攻擊混淆的情況,考慮是兩種意圖相似性較高,差別度較小導(dǎo)致的,誤差在可以接受的范圍內(nèi)。
能否精確地識別敵機(jī)意圖對于防空作戰(zhàn)成敗至關(guān)重要,為了更加清楚地表現(xiàn)BiLSTM-Attention模型的有效性,使模型更具有說服力,將BiLSTMAttention 模型與LSTM、BiLSTM、LSTM-Attention 模型在此數(shù)據(jù)集下做消融實(shí)驗(yàn),模型準(zhǔn)確率變化情況如圖9 所示。
圖9 模型準(zhǔn)確率變化情況Fig.9 Changes of model accuracy
由圖9 可知,BiLSTM-Attention 模型準(zhǔn)確率優(yōu)于LSTM、BiLSTM、LSTM-Attention 3 種模型,且LSTM的識別準(zhǔn)確率要明顯低于BiLSTM 和LSTM-Attention,說明了引用雙向循環(huán)機(jī)制和注意力機(jī)制對于模型性能提升的有效性。
3.1.3 Intent-WTA 效果評估
為驗(yàn)證費(fèi)用流在武器目標(biāo)分配過程中的有效性,選取50 組的樣本數(shù)據(jù),代入費(fèi)用流模型,統(tǒng)計(jì)最優(yōu)解的次數(shù)以及模型平均運(yùn)行時(shí)間,并與粒子群算法(PSO)、文獻(xiàn)[21]所用的鯨魚優(yōu)化算法(WOA)等智能優(yōu)化算法和搜索算法進(jìn)行對比實(shí)驗(yàn),結(jié)果如表3 所示。
表3 算法性能對比Table 3 Algorithm performance comparison
從實(shí)驗(yàn)結(jié)果可知,搜索算法、費(fèi)用流等精確求解算法求解最優(yōu)解的效果,明顯優(yōu)于粒子群算法、鯨魚算法等智能優(yōu)化算法,但是搜索算法在平均耗時(shí)上則是遠(yuǎn)遠(yuǎn)大于費(fèi)用流,特別是在武器數(shù)量20×敵機(jī)數(shù)量20 的分配中,有限時(shí)間內(nèi)無法得到結(jié)果,由此可見費(fèi)用流能夠準(zhǔn)確、高效地求得武器目標(biāo)分配的最優(yōu)解。現(xiàn)代空襲敵機(jī)飛行高度低、速度快、暴露時(shí)間短,留給指控系統(tǒng)分配決策的時(shí)間往往以ms計(jì)算,需要爭取最快時(shí)間進(jìn)行分配攔截,費(fèi)用流可以同時(shí)滿足準(zhǔn)確性和實(shí)時(shí)性的要求。
為驗(yàn)證Intent-WTA 模型的優(yōu)越性,使用本文所提模型,分別與棧式自編碼器(SAE)戰(zhàn)術(shù)意圖智能識別模型、基于LSTM 的戰(zhàn)場對敵目標(biāo)戰(zhàn)術(shù)意圖識別模型搭配粒子群算法(PSO)、鯨魚算法(WOA)、費(fèi)用流(Cost Flow)作對比實(shí)驗(yàn),通過選取100 個(gè)樣本數(shù)據(jù)對比其合理度,對比實(shí)驗(yàn)參數(shù)如表4 所示,實(shí)驗(yàn)結(jié)果如表5 所示。
表4 對比實(shí)驗(yàn)參數(shù)Table 4 Comparative experimental parameters
表5 對比實(shí)驗(yàn)結(jié)果Table 5 Comparison of experimental results
由表5 可以看出,Intent-WTA 模型武器目標(biāo)分配合理度達(dá)到了94%,遠(yuǎn)超過其他模型的組合,較傳統(tǒng)SAE+PSO 模型提升超過30%,充分展現(xiàn)了Intent-WTA 模型在防空作戰(zhàn)武器目標(biāo)分配中的優(yōu)越性。
為體現(xiàn)Intent-WTA 模型對于防空作戰(zhàn)的動(dòng)態(tài)武器目標(biāo)分配效果,本文從樣本數(shù)據(jù)中選取一組連續(xù)的動(dòng)態(tài)時(shí)序樣本,賦予其性能參數(shù)進(jìn)行模擬動(dòng)態(tài)武器目標(biāo)分配實(shí)驗(yàn),分析模型有效性。樣本數(shù)據(jù)中共有5 個(gè)敵機(jī)目標(biāo),我方配備5 枚地空導(dǎo)彈武器,90 s 作為一個(gè)防空作戰(zhàn)階段。目標(biāo)相關(guān)參數(shù)及我方武器相關(guān)參數(shù)如表6 和表7 所示。
表6 目標(biāo)相關(guān)參數(shù)Table 6 Target parameters
具體模擬實(shí)驗(yàn)過程如下:
第1 階段:敵機(jī)1 對我方發(fā)起進(jìn)攻,由敵機(jī)2和敵機(jī)3 執(zhí)行偵察任務(wù),敵機(jī)4 和敵機(jī)5 執(zhí)行干擾任務(wù);我方使用導(dǎo)彈3 攔截?cái)硻C(jī)1,導(dǎo)彈1 攔截?cái)硻C(jī)2,導(dǎo)彈2 攔截?cái)硻C(jī)3,敵機(jī)4 和敵機(jī)5 收益值未達(dá)到閾值,因此,不進(jìn)行攔截。
第2 階段:敵機(jī)1 和敵機(jī)2 被我方擊落,敵機(jī)3對我方發(fā)起進(jìn)攻,敵機(jī)4 執(zhí)行突防任務(wù),敵機(jī)5 執(zhí)行干擾任務(wù);我方使用導(dǎo)彈3 攔截?cái)硻C(jī)3,導(dǎo)彈4 攔截?cái)硻C(jī)4,敵機(jī)5 收益值未達(dá)到閾值,因此,不進(jìn)行攔截;
第3 階段:敵機(jī)1~敵機(jī)3 被我方擊落,敵機(jī)4執(zhí)行突防任務(wù),敵機(jī)5 撤退;我方使用導(dǎo)彈1 攔截?cái)硻C(jī)4,敵機(jī)5 收益值未達(dá)到閾值,因此,不進(jìn)行攔截;
第4 階段:敵機(jī)1~敵機(jī)4 被我方擊落,敵機(jī)5撤退,防空作戰(zhàn)結(jié)束。
實(shí)驗(yàn)結(jié)果如表8 所示。
表8 動(dòng)態(tài)武器-目標(biāo)分配實(shí)驗(yàn)結(jié)果Table 8 Experimental results of dynamic weapon-target allocation
由實(shí)驗(yàn)結(jié)果可知,Intent-WTA 模型對于識別到意圖為攻擊的敵機(jī)優(yōu)先考慮攔截,準(zhǔn)確體現(xiàn)了防空作戰(zhàn)任務(wù)的特點(diǎn),對于識別到作戰(zhàn)意圖為干擾等威脅度較低的敵機(jī),采取的應(yīng)對策略在確保我方安全的前提下節(jié)約了武器資源。模型對于防空作戰(zhàn)的全過程可以實(shí)施動(dòng)態(tài)武器目標(biāo)分配,隨時(shí)應(yīng)對復(fù)雜多變的戰(zhàn)場局勢,高效、準(zhǔn)確地滿足了作戰(zhàn)需求。
本文針對防空作戰(zhàn)中通過軍事專家的作戰(zhàn)經(jīng)驗(yàn),判斷進(jìn)行武器目標(biāo)分配的方式存在的速度慢、準(zhǔn)確率難以保證的問題,通過分析,認(rèn)識到敵我作戰(zhàn)的過程是一種雙方博弈的過程,雙方都應(yīng)當(dāng)是戰(zhàn)爭的主動(dòng)方,敵方采取的作戰(zhàn)意圖對我方的策略有著至關(guān)重要的影響,因此,構(gòu)建了意圖驅(qū)動(dòng)的防空動(dòng)態(tài)武器目標(biāo)分配模型。通過空中作戰(zhàn)意圖數(shù)據(jù)集訓(xùn)練BiLSTM-Attention 網(wǎng)絡(luò),將專家經(jīng)驗(yàn)封裝為標(biāo)簽,使模型能夠準(zhǔn)確識別敵機(jī)作戰(zhàn)意圖,通過挖掘意圖以及戰(zhàn)場環(huán)境信息、敵我目標(biāo)的靜態(tài)屬性和實(shí)時(shí)動(dòng)態(tài)信息,對于武器目標(biāo)分配的影響效果建立Intent-WTA 模型,通過費(fèi)用流算法得到最優(yōu)的分配方案。通過進(jìn)行實(shí)驗(yàn),結(jié)果顯示模型針對不同的作戰(zhàn)情況進(jìn)行武器目標(biāo)分配速度快、準(zhǔn)確率高,且能夠體現(xiàn)防空作戰(zhàn)動(dòng)態(tài)博弈的特點(diǎn)。本文模型對于作戰(zhàn)的實(shí)時(shí)交互性還略顯不足,采用的固定時(shí)間間隔檢測,不能做到隨時(shí)檢測戰(zhàn)場中敵機(jī)意圖的變化,這將是下一步研究的重點(diǎn)。