張先劍
(國防科技大學 智能科學學院, 湖南 長沙 410073)
武器目標分配是現(xiàn)代大規(guī)模攻防作戰(zhàn)的核心問題,它的最終目的是期望通過最優(yōu)的武器目標分配方案,充分發(fā)揮武器系統(tǒng)的整體效能,以實現(xiàn)攻防作戰(zhàn)的最佳結(jié)局。傳統(tǒng)研究主要利用動態(tài)規(guī)劃算法、粒子群優(yōu)化、蟻群優(yōu)化、類電磁算法等方法解決靜態(tài)或動態(tài)武器目標分配問題,但大部分研究[1-8]均把目標設想為無智慧、無對抗能力的被動防御對象,單一從己方角度考慮武器目標分配問題,忽略對手的策略和利益,沒有充分考慮實戰(zhàn)中的動態(tài)博弈特征——作戰(zhàn)雙方行動和策略的關(guān)聯(lián)性。攻擊與防御是互相對立的雙方,共存于博弈的統(tǒng)一體中,相互制約、相互激勵,沒有考慮對抗雙方動態(tài)博弈特性的攻防決策難以應用于實戰(zhàn)。具體到武器目標分配問題研究,必須同時兼顧作戰(zhàn)雙方的戰(zhàn)術(shù)策略[9-10]、效能指標等重要因素,這正是使用博弈論方法的優(yōu)勢之處。
針對動態(tài)武器目標分配問題,本研究將重點聚焦對抗建模,構(gòu)建了基于雙方動態(tài)博弈的綜合數(shù)學模型,并利用納什均衡和帕累托最優(yōu)算法進行求解。
博弈中競技者(決策主體)都是理性的,在選擇決策的時候都有著明確的“使自己的利益最大化”的目標。博弈論就是專門研究博弈現(xiàn)象中各方是否存在最合理的行動方案,以及如何找到合理的行動方案即均衡解的數(shù)學理論和方法。而這里的均衡解,就是一個能夠得以維持的結(jié)果,或者說是所有競技者不得不接受而又不可能更好的結(jié)果[11]。
定義1博弈可以描述為式(1)所示數(shù)學形式[12]。
Γ=[N,P,{SK},J,{J(xK)}]
(1)
式中:N為任意的競技者集合;P為聯(lián)合組織(機構(gòu))的集合;K表示具有共同行動和利益的競技者小組;SK為聯(lián)合K∈P的任意策略集合;J為在P上的所有博弈結(jié)果的任意集合;J(xK)為如果聯(lián)合K采取策略xK,那么在P上可能的結(jié)果集合。
一般情況下,博弈可以簡化為包含競技者、策略和盈利(損失)函數(shù)的表達形式。
Γ=[N,S,J]
(2)
式中,N=[1,2,…,n],S=[S1,S2,…,Sn],J=[J1,J2,…,Jn]。
定義2策略qr=(qr,1,…,qr,mk)是指標函數(shù)J的納什均衡解,如果對于任意的qi∈Si,有
(3)
并且有
考慮距離因素,如
(4)
那么,被擊中的第j類目標平均數(shù)量為:
(5)
(6)
式中,tk-1→tk為多個導彈發(fā)射裝置單次齊射周期。
那么目標損失函數(shù)可以表示為:
Je(ν)=∑aesJes
其中,索引i,j分別代表主動武器和被動目標。
損失函數(shù)有這樣的思想,即每一方都期望敵方主、被動目標最終數(shù)量最小,而使己方主、被動目標數(shù)量最大化,并且通過權(quán)重系數(shù)控制敵方主動武器數(shù)量的衰減速度。那么有J甲→min,J乙→min。
使用納什均衡的武器目標分配算法共分四個階段:在第一階段獲取作戰(zhàn)雙方的目標信息,如數(shù)量、速度、距離、飛近時間、方位等;在第二階段根據(jù)目標信息和命中率函數(shù)計算命中率;在第三階段構(gòu)建策略空間和策略收益;在第四階段尋找最優(yōu)策略。
1.3.1 獲取作戰(zhàn)雙方武器目標信息
在作戰(zhàn)期間,偵察預警探測系統(tǒng)全天候?qū)崟r監(jiān)測各種飛行目標,并獲得如出發(fā)位置、數(shù)量、速度、距離、實時空間位置、方位等信息,對獲取的敵方信息進行鑒別,如判斷是否佯攻、使用欺騙手段和制造假象等。分析敵方作戰(zhàn)行動意圖、策略和可能攻擊目標區(qū)域。
在獲取目標信息后,可以利用層次分析法(Analytic Hierarchy Process, AHP)等方法根據(jù)目標速度、高度、距離和方位角等因素進行多因素綜合威脅排序。
1.3.2 計算命中率
基于1.2節(jié)中獲得的距離、方位等信息,根據(jù)式(4)計算命中率。在計算命中率時,還應綜合考慮電子對抗環(huán)境對于導彈命中率的影響,比如地面防御系統(tǒng)電子干擾裝置會對空襲目標的命中率產(chǎn)生直接積極影響,也可能會對己方攔截導彈產(chǎn)生微弱消極影響。電子對抗影響因素主要跟電子干擾裝置的功率有關(guān)。
Pij=Pijmax·e-μi·λd·e-μj·λk
(7)
1.3.3 構(gòu)建策略空間和策略收益
策略空間與控制參數(shù)的數(shù)量和取值步長有關(guān),設步長為l,控制參數(shù)νij數(shù)量為q,則單次齊射目標分配策略空間數(shù)為(1/l)q。
1.3.4 尋找最優(yōu)策略
首先獲得所有符合策略收益的策略解集合,然后根據(jù)納什均衡解定義,在有效解的集合中選取符合作戰(zhàn)雙方目標損失函數(shù)的均衡解。在均衡解的選取過程中應注意,納什均衡解可能有一個或多個,此時應根據(jù)極大極小原理進行篩選(基于最壞情況考慮,爭取最好的結(jié)果)。
作戰(zhàn)想定:攻擊方首先使用陸、海、空平臺發(fā)射若干戰(zhàn)術(shù)導彈打擊防御方地面防御系統(tǒng),企圖癱瘓或消滅防御方防空力量,然后指派戰(zhàn)斗機編隊護航轟炸機編隊對防御方重要目標實施打擊。防御方實施分層分段攔截,轟炸機的威脅指數(shù)最高,戰(zhàn)術(shù)導彈其次。
所研究的目標動態(tài)分配是指在連續(xù)動態(tài)作戰(zhàn)中不同階段的目標分配,階段劃分是由地面攔截導彈的射程決定的,比如首先是遠程攔截,而后進行中近程攔截(如圖1所示)。
圖1 階段劃分示意圖Fig.1 Illustration of stage division
設甲乙兩方參與攻防作戰(zhàn),甲方為空襲系統(tǒng),組成包括轟炸機、導彈、戰(zhàn)斗機和電子戰(zhàn)飛機;乙方為地面防御系統(tǒng),組成包括導彈發(fā)射裝置、雷達站、電子對抗裝置和指令站等。
圖2 甲乙雙方對抗關(guān)系示意圖Fig.2 Illustration of A-B counters relationship
首輪(遠程攔截防御階段)雙方對抗過程如圖3所示,空襲系統(tǒng)首先發(fā)射導彈打擊地面防御系統(tǒng),防御系統(tǒng)遠程導彈實施攔截打擊。
圖3 首輪甲乙雙方對抗關(guān)系示意圖Fig.3 Illustration of A-B counters relationship in the first round
綜合數(shù)學模型有:
(8)
(9)
次輪(中程攔截防御階段)雙方對抗過程如圖4所示,首輪攔截打擊之后,由中近程導彈負責對成功突防的導彈和轟炸機進行攔截。
圖4 次輪甲乙雙方對抗關(guān)系示意圖Fig.4 Illustration of A-B counters relationship in the second round
綜合數(shù)學模型有:
(10)
(11)
假設初始條件如下:X1=14,X2=14,X3=12,X4=14,X5=8,X51=24,X52=32,X6=2,X7=4,X8=2;a11=0.25,a12=0.25,a13=0.45,a14=0.05,a21=0.35,a22=0.35,a23=0.25,a24=0.05,Р521=0.5,P522=0.5,P524=0.5,P3521=0.5,P3522=0.5,P3524=0.5。
首輪對抗結(jié)果如表1~3所示。
表1 首輪對抗后數(shù)量變化
表2 首輪打擊配額
表3 首次對抗損失和收益
次輪對抗結(jié)果如表4~6所示。
表4 次輪對抗后數(shù)量變化
表5 次輪打擊配額
表6 次輪對抗損失和收益
本文指出了國內(nèi)現(xiàn)有針對武器目標分配問題研究的優(yōu)勢和不足之處,重點闡述使用基于雙方動態(tài)博弈的思想解決大規(guī)模作戰(zhàn)武器目標分配問題的科學性和合理性,構(gòu)建了基于雙方博弈的攻防對抗綜合數(shù)學模型,并以實例證明使用納什均衡、帕累托最優(yōu)方法可以有效解決動態(tài)武器-目標分配問題。
1)基于博弈論方法綜合考慮作戰(zhàn)雙方的策略和行動方案,保證了決策方案在實戰(zhàn)應用中的科學有效性。
2)提出新穎的建模思維,通過引入狀態(tài)變量、控制參數(shù)和權(quán)重系數(shù)來構(gòu)建策略空間和策略收益,對武器目標分配問題進行了求解,獲得了作戰(zhàn)雙方各自最優(yōu)戰(zhàn)術(shù)策略。