宋貴寶,強裕功,劉 鐵,劉鎮(zhèn)毓
(海軍航空大學(xué) 岸防兵學(xué)院,山東 煙臺 264001)
武器目標(biāo)分配問題(weapon-target assignment,WTA),有時也被稱為導(dǎo)彈分配問題(MAP)[1],是軍事運籌學(xué)領(lǐng)域中一個經(jīng)典的約束組合優(yōu)化問題,最初由Manne引入作戰(zhàn)研究領(lǐng)域,尋求分配可用的武器攔截來襲導(dǎo)彈,以最小化導(dǎo)彈摧毀受保護資產(chǎn)的概率。WTA問題的目標(biāo)是將有限的防御武器分配給來襲目標(biāo),以最大化防御效能,是戰(zhàn)場決策需要解決的重要問題[2]。武器目標(biāo)分配問題是軍事指揮與控制(C2)自動化的關(guān)鍵問題之一,被認為是控制科學(xué)的一個挑戰(zhàn),已經(jīng)證明是NP完全問題[6]。目前WTA已經(jīng)廣泛應(yīng)用于防空、對地突襲等多個研究領(lǐng)域,為提高多武器平臺火力協(xié)同攻擊的整體作戰(zhàn)效果提供了一種優(yōu)化方案。
武器目標(biāo)分配問題的研究分為兩類:靜態(tài)武器目標(biāo)分配(SWTA)和動態(tài)武器目標(biāo)分配(DWTA)[3]。在SWTA問題中,所有武器都在單一階段與目標(biāo)交戰(zhàn),并且問題的所有參數(shù)都是已知的,SWTA問題的目標(biāo)是找到一個靜態(tài)防御階段的最優(yōu)分配方案。相反,DWTA問題考慮戰(zhàn)場的動態(tài)變化,是一個多階段問題,當(dāng)前階段的交戰(zhàn)結(jié)果影響著后續(xù)階段的分配方案,DWTA問題的目標(biāo)是找到整個防御過程的全局最優(yōu)解。直觀上可將DWTA問題看作若干SWTA問題的集合,但需注意SWTA問題的解僅能保證當(dāng)前階段的最優(yōu)性,若干SWTA問題解的集合并不一定是整個防御過程的最優(yōu)解。DWTA是一個多階段決策問題,在目標(biāo)分配過程中需要考慮戰(zhàn)場態(tài)勢的不斷變化。DWTA問題的常用射擊策略為“觀察-射擊-觀察”[2],如圖1所示。
圖1 “觀察-射擊-觀察”射擊策略框圖
在觀察階段,決策者根據(jù)戰(zhàn)場態(tài)勢確定可用的攻擊武器以及所需攻擊的目標(biāo),在射擊階段,根據(jù)計算的武器目標(biāo)分配方案對目標(biāo)進行攻擊。射擊、觀察交替進行構(gòu)成了整個動態(tài)打擊過程。武器目標(biāo)分配問題的復(fù)雜性使得現(xiàn)有研究主要針對SWTA問題,信息獲取技術(shù)、智能優(yōu)化算法等的發(fā)展使得解決更加貼近實戰(zhàn)的DWTA問題成為可能。
基于“射擊-觀察-射擊”策略,動態(tài)武器目標(biāo)分配問題的決策過程如圖2所示[2,9]:
圖2 DWTA問題決策過程框圖
目前對動態(tài)武器目標(biāo)分配問題的研究主要集中于問題模型和求解算法。
DWTA模型以SWTA模型為基礎(chǔ),在處理過程中引入對隨機事件的處理,主要內(nèi)容有[3]:
1) 模型假設(shè)。在實際戰(zhàn)場中存在多種不確定或無法準(zhǔn)確測定的因素,構(gòu)建模型時要進行合理的假設(shè),突出主要的研究內(nèi)容。
2) 目標(biāo)函數(shù)的選擇。DWTA問題的目標(biāo)函數(shù)主要有基于突防目標(biāo)和基于防御資產(chǎn)2種類型[4]。在基于目標(biāo)的問題中,其任務(wù)是最小化突防目標(biāo)威脅值;在基于資產(chǎn)的問題中,任務(wù)是最大化幸存資產(chǎn)的預(yù)期價值。
3) 約束條件的選取。在DWTA問題的決策過程中需要考慮武器性能、射擊策略、裝備彈藥數(shù)量、作戰(zhàn)可行性等約束條件[11]。
相比靜態(tài)WTA問題,動態(tài)武器目標(biāo)分配需要動態(tài)識別目標(biāo)并確定可用的武器,所使用的算法必須具有良好的實時性,以及時進行目標(biāo)分配決策。DWTA問題具有隨機性、非線性、大規(guī)模等特性,這使得采用精確算法對這一問題進行求解較為困難,目前的研究大部分采用隨機算法。應(yīng)用于DWTA問題求解的隨機算法主要有遺傳算法、蜂群算法以及文化基因算法等。
要研究DWTA問題,首先必須了解SWTA問題。SWTA是指為了獲得最優(yōu)或滿意的作戰(zhàn)計劃,在一定時間內(nèi)將防御武器分配給即將到來的目標(biāo)(進攻性武器)。在SWTA模型中,沒有考慮武器和目標(biāo)的時間屬性,DWTA能夠相對真實地反映作戰(zhàn)環(huán)境的變化,能夠根據(jù)戰(zhàn)場形勢變化進行決策,從而達到總體最優(yōu)的作戰(zhàn)效果。DWTA問題需要考慮攔截適宜性,為此文獻[10]引入了下面的基本概念:
1) 目標(biāo)時間窗(time window of target,TWT):防御武器能夠?qū)δ繕?biāo)進行射擊的時間段,即目標(biāo)暴露于防御武器射擊范圍內(nèi)的時間,記為tb。
2) 武器時間窗(time window of weapon,TWW):防御武器發(fā)現(xiàn)目標(biāo)到命中目標(biāo)所需的最短時間,包括武器系統(tǒng)的響應(yīng)時間及武器命中目標(biāo)所需飛行時間(或?qū)б龝r間),記為tr。
3) 武器-目標(biāo)時間窗(time window of weapon-target,TWWT):防御武器開始向目標(biāo)射擊的時間窗口,記為trb。只有在這一時間窗口組織射擊,目標(biāo)才有可能被集中。
根據(jù)以上定義可得trb=tb-tr,且有要能夠?qū)δ繕?biāo)進行射擊必須滿足TWW 在動態(tài)武器目標(biāo)分配問題中存在全局決策和執(zhí)行決策2種不同的決策。根據(jù)“射擊-觀察-射擊”策略,DWTA問題可劃分為若干防御階段,全局決策是指從當(dāng)前防御階段到最后防御階段的決策,包含若干子決策;執(zhí)行決策是指當(dāng)前階段的決策。執(zhí)行決策實施后,根據(jù)具體的毀傷效果再次做出全局決策,全局決策和執(zhí)行決策不斷循環(huán),直至毀傷所有目標(biāo)或彈藥耗盡[11]。根據(jù)上述分析,在每一防御階段,決策者從全局角度考慮問題,但實際上實施的是當(dāng)前階段的決策,因此,DWTA問題與SWTA問題的建模思路相同,但考慮的角度不同。下文介紹幾種WTA問題的常用模型: 1) 基于防御資產(chǎn)的WTA模型 基于防御資產(chǎn)的WTA模型強調(diào)對自有資產(chǎn)特別是重要資產(chǎn)的保護、強調(diào)WTA的最終目標(biāo)和本質(zhì),采用來襲目標(biāo)對防御資產(chǎn)的殺傷概率建立模型,不需要進行目標(biāo)威脅評估,通常以防御資產(chǎn)損失最小或幸存資產(chǎn)價值最大為優(yōu)化目標(biāo),現(xiàn)有研究多數(shù)采用這類模型。文獻[10]建立了以防御資產(chǎn)損失最小為優(yōu)化目標(biāo)的WTA簡化模型,僅考慮同一武器能同時射擊一個目標(biāo)的約束條件,這一模型相對簡單和基礎(chǔ),許多WTA問題的模型都可以由這一模型推導(dǎo)出。文獻[11]建立了以幸存防御資產(chǎn)價值最大為優(yōu)化目標(biāo)的多階段DWTA模型,將武器同時射擊多目標(biāo)能力、每一階段單一武器消耗量、武器總量、攔截適宜性判斷結(jié)果作為約束條件,文獻[13]使用了相同的模型,這一模型考慮的約束較為全面,更加貼近戰(zhàn)場實際,但模型較為復(fù)雜,計算時間成本較高。文獻[4]建立了基于資產(chǎn)的多目標(biāo)靜態(tài)WTA模型,以最大化幸存資產(chǎn)價值、最小化武器消耗為優(yōu)化目標(biāo),給出了各種武器消耗情況下的Pareto最優(yōu)解,實際決策時決策者根據(jù)防御要求、防御成本選擇合適的武器目標(biāo)分配方案。 2) 基于突防目標(biāo)威脅最小的WTA模型 基于突防目標(biāo)威脅最小的WTA模型屬于基于目標(biāo)的模型,通常以最小化突防目標(biāo)威脅值為優(yōu)化目標(biāo),模型的構(gòu)建依賴于目標(biāo)威脅評估結(jié)果。文獻[1]建立了以各階段突防目標(biāo)威脅均最小為優(yōu)化目標(biāo)的多階段動態(tài)WTA模型,這一模型考慮整個作戰(zhàn)過程,將DWTA問題看作若干SWTA問題的組合,但是這一模型在“射擊-觀察-射擊”的“觀察”階段只考慮了執(zhí)行決策針對當(dāng)前階段的作戰(zhàn)效果,沒有考慮執(zhí)行決策對整個作戰(zhàn)全局的影響。文獻[14]建立了以突防目標(biāo)威脅最小為優(yōu)化目標(biāo)的WTA模型,模型簡單、易于理解,但僅考慮了各武器數(shù)量約束,通常用作其他改進模型的初始模型,不難看出這一模型考慮的某一階段的分配問題,屬于靜態(tài)WTA模型。文獻[5]建立了與文獻[14]相似的模型,但文獻[5]將分配給各目標(biāo)的最小武器數(shù)作為約束條件考慮在內(nèi),防止分配方案未對目標(biāo)進行及時的攔截,并給出了這一非線性模型的線性簡化形式。文獻[16]在考慮攔截適宜性的基礎(chǔ)上求解“武器平臺-目標(biāo)”分配問題,建立了動態(tài)WTA模型,文獻[15]將武器平臺和制導(dǎo)平臺進行攔截組合,在考慮實時目標(biāo)威脅度、目標(biāo)突防概率的基礎(chǔ)上構(gòu)建了一體化的“武器平臺-制導(dǎo)平臺-目標(biāo)”動態(tài)WTA模型,將制導(dǎo)平臺納入分配范圍更加切合實際,但問題求解會變得更加復(fù)雜。 3) 基于最大化目標(biāo)毀傷的WTA模型 基于最大化目標(biāo)毀傷和突防目標(biāo)威脅最小的WTA模型均是針對目標(biāo)而言的,但存在一定的區(qū)別: ① 突防目標(biāo)威脅的WTA模型中目標(biāo)權(quán)重側(cè)重于目標(biāo)對防御資產(chǎn)的攻擊能力,模型考慮的是目標(biāo)未被毀傷的概率。 ② 最大化目標(biāo)毀傷的WTA模型中目標(biāo)權(quán)重側(cè)重于目標(biāo)在攻擊過程中發(fā)揮的作用,模型考慮的是殺傷目標(biāo)概率 文獻[17]針對“武器-目標(biāo)”分配問題,首先建立了以最大化目標(biāo)毀傷為優(yōu)化目標(biāo)的分配模型,然后采用罰函數(shù)法將約束優(yōu)化問題轉(zhuǎn)化為無約束優(yōu)化問題,避免了求解過程中解的可行性判斷,但這一模型沒有考慮目標(biāo)的攔截適宜性。文獻[18]考慮“發(fā)射節(jié)點-制導(dǎo)節(jié)點-目標(biāo)”三者的優(yōu)化匹配問題,根據(jù)求得的武器對目標(biāo)的殺傷概率以及各目標(biāo)的威脅度,建立了以敵方損失最大為優(yōu)化目標(biāo)的WTA模型,所建立的模型考慮了武器對目標(biāo)進行攔截的時間、空間適宜性,并指出了各種隨機事件對目標(biāo)分配的影響,但計算復(fù)雜度較高,對信息的實時、準(zhǔn)確獲取要求較高。文獻[19]指出動態(tài)武器目標(biāo)分配的依據(jù)主要是各火力單元情況、作戰(zhàn)意圖和任務(wù)、目標(biāo)情況、地形等,在此基礎(chǔ)上建立了與文獻[17]似的模型,但是文獻[19]采用矩陣形式對模型進行表征。文獻[20]建立了以成功攔截所有來襲目標(biāo)的概率最大化為優(yōu)化目標(biāo)的防空導(dǎo)彈目標(biāo)分配模型,這一模型較簡單,沒有考慮不同目標(biāo)的威脅程度不同,很可能為了最大化殺傷概率而沒有首先對威脅度較大的目標(biāo)實施攔截。 4) 其他模型 WTA問題的常用模型如上文式(1)-(3)所述,除此之外,一些研究人員基于WTA問題的特點從其他角度建立了WTA模型:文獻[21]建立了以資源消耗最小、我方作戰(zhàn)資源損耗最小、敵方剩余價值最小為優(yōu)化目標(biāo)的打擊決策模型,將問題轉(zhuǎn)化為多目標(biāo)決策問題;文獻[22-23]中區(qū)域防空協(xié)同中段制導(dǎo)算法的求解思路應(yīng)用于WTA問題中,引入最早攔截幾何、安全裕度的概念,通過幾何分析給出了相應(yīng)的計算公式,建立了以安全裕度最大為優(yōu)化目標(biāo)的目標(biāo)分配模型。 精確算法是一種確定性的算法,具有精確、易懂的優(yōu)點,求得的解具有可重復(fù)性?,F(xiàn)有研究表明WTA問題具有如下性質(zhì):1) 屬于NP完全問題,利用枚舉法求解問題能力有限。2) 隨機性,武器、目標(biāo)交戰(zhàn)屬于隨機事件。3)非線性,通常構(gòu)建的目標(biāo)函數(shù)均為非線性形式。 WTA問題的復(fù)雜性使得利用精確算法求解難度較大,一般對問題進行近似處理轉(zhuǎn)化為易于求解的形式,然后采用精確算法求得原問題的近似最優(yōu)解,目前采用精確算法求解WTA問題的研究較少。文獻[5]首先以目標(biāo)的總期望生存值最大為優(yōu)化目標(biāo)建立相應(yīng)的模型,采用矩陣的形式表示模型,然后根據(jù)全單位模矩陣(TUM)的相關(guān)性質(zhì),指出分配模型的非線性整數(shù)規(guī)劃與相應(yīng)線性整數(shù)規(guī)劃的關(guān)系,最后使用可行下降法求得問題的近似最優(yōu)解,算法邏輯清晰、易懂,但采用的近似算法實際上是用函數(shù)的一階泰勒展開式進行近似計算,可能會使所求結(jié)果誤差較大。針對DWTA問題,文獻[6]采用基于分布式協(xié)同拍賣思想的算法進行求解,所設(shè)計的算法具有Anytime特性,考慮了資源約束、時間約束和空間約束,但文獻[7]指出這種精確算法同樣只能求解小規(guī)模的WTA問題,在求解大規(guī)模問題時性能較差。 隨機算法引入隨機變量進行求解,搜索具有不確定性,相比精確算法,所得結(jié)果可能不是最優(yōu)的且不可復(fù)現(xiàn),但隨機算法一般采用計算機計算,能夠處理大規(guī)模的分配問題,決策者只需給出合適的初始參數(shù)和優(yōu)化參數(shù)便可以得到滿意解,求解速度較快,符合戰(zhàn)場決策的快速性要求。目前應(yīng)用于WTA問題的隨機算法主要有: 1) 遺傳算法 遺傳算法是一類借鑒生物界的進化規(guī)律演化而來的隨機搜索算法,其主要特點是直接對結(jié)構(gòu)對象進行操作,不存在求導(dǎo)數(shù)和函數(shù)連續(xù)性的限定,具有內(nèi)在的隱并行性和更好的全局尋優(yōu)能力[25]。關(guān)于遺傳算法的研究起步較早,相關(guān)研究也較為成熟,將遺傳算法與相關(guān)優(yōu)化操作結(jié)合解決WTA問題能夠得到較為滿意的分配方案。文獻[26]將非線性整數(shù)約束的WTA問題轉(zhuǎn)化為線性整數(shù)問題,提出采用以啟發(fā)式算法進行初始種群優(yōu)生的遺傳算法對問題進行求解,這種啟發(fā)式遺傳算法相較一般遺傳算法在處理大規(guī)模問題時優(yōu)勢明顯,但是這一算法并未考慮對目標(biāo)毀傷、新目標(biāo)出現(xiàn)等隨機事件的處理且沒有將武器攔截目標(biāo)的時間、空間適宜性考慮在內(nèi)。文獻[15]考慮了攔截適宜性的影響,針對傳統(tǒng)遺傳無法兼顧收斂精度和求解速度、實時性差的問題,提出了一種新型混合緊致遺傳算法(HCGA)對WTA問題進行求解,在保留CGA算法基本特性的基礎(chǔ)上,進一步改善了算法性能。文獻[17]同時考慮了攔截適宜性判斷和對隨機事件的處理,采用基于遺傳算法的Anytime算法求解WTA問題,anytime算法所產(chǎn)生的解的質(zhì)量隨計算時間增加而增加,在任意時刻中斷時,都能輸出到目前為止找到的最優(yōu)可行解[1],這一算法考慮較充分、所求結(jié)果的戰(zhàn)場參考價值較大,但對敵我信息獲取的實時性、精確性要求較高。 2) 蜂群算法 人工蜂群算法具有優(yōu)化性能好、控制參數(shù)少、實現(xiàn)簡單的優(yōu)點[25]。文獻[27]采用人工蜂群算法求解WTA問題,通過比較蜂群算法與幾種元啟發(fā)式算法解決給定實例的性能,驗證了人工蜂群算法解決WTA問題的有效性和高效性。文獻[2]采用改進的人工蜂群算法求解WTA問題,提出以排序選擇和精英引導(dǎo)策略提高算法的搜索效率,針對隨機生成的初始解質(zhì)量較低的問題,采用基于規(guī)則的啟發(fā)式方法進行種群初始化,這一改進的人工蜂群算法相較一般蜂群算法較為復(fù)雜、但求解問題性能得到了較大改善。 3) 文化基因算法 文化基因(Memetic)算法是一種基于種群的全局搜索和基于個體的局部啟發(fā)式搜索的結(jié)合體,能夠用于求解多種問題的滿意解,特別是在求解多極值問題中效果很好,該算法實質(zhì)上是一種框架,采用不同的全局算法和局部算法構(gòu)成不同的文化基因算法[25]。文獻[12]首先引入決策的虛擬表示以促進可行決策的生成,在此基礎(chǔ)上給出了將虛擬表示轉(zhuǎn)化為實際決策的構(gòu)造方法,最后給出了基于貪婪局部搜索和最陡峭局部搜索的2種文化基因算法,通過比較指出基于貪婪局部搜索的文化基因算法能夠產(chǎn)生更好的DWTA決策,但文獻中并未給出對可能出現(xiàn)的隨機事件的處理方法。文獻[29]提出了一種融合自適應(yīng)遺傳算法(AGA)和變鄰域搜索算法(VNSA)的文化基因算法,算法克服了現(xiàn)有大部分啟發(fā)式算法過早收斂的缺點,能夠得到較好的分配方案,但在處理大規(guī)模WTA場景時,所采用的鄰域構(gòu)造方法使得求解較為復(fù)雜、效率較低。 4) 其他算法 除了以上幾種常用的求解算法外,文獻[11]采用禁忌搜索算法(TS)求解基于資產(chǎn)的DWTA問題,算法采用貪婪構(gòu)造啟發(fā)式方法進行初始化,提出了2種種群多樣化策略。文獻[23]將離散粒子群算法(DPSO)與進化博弈論(EGT)相結(jié)合用于處理DWTA問題,與傳統(tǒng)的基于多階段的WTA算法不同,提出的算法考慮的是連續(xù)的時間域。文獻[6]提出了一種基于差分進化算法的武器目標(biāo)分配算法,將動態(tài)武器目標(biāo)分配離散為靜態(tài)武器目標(biāo)分配問題處理,采用隨機鄰域變異策略平衡差分進化算法全局探索和局部開發(fā)能力。文獻[30-31]采用博弈論的方法求解目標(biāo)分配問題,建立了動態(tài)博弈的數(shù)學(xué)模型,這種求解方法在分配方案求解時將攻防雙方考慮在內(nèi),所得結(jié)果更加合理,但對信息的及時、準(zhǔn)確獲取要求較高,求解較為復(fù)雜。 綜合考慮研究現(xiàn)狀及未來作戰(zhàn)需求,武器目標(biāo)分配未來的發(fā)展方向為: 1) 考慮武器平臺制導(dǎo)能力限制。 現(xiàn)有研究大多針對的是“武器平臺-目標(biāo)”分配問題,實際作戰(zhàn)中,武器平臺能否對目標(biāo)進行打擊還受到制導(dǎo)能力的限制,超出武器平臺制導(dǎo)能力的分配方案是不可行的,在制訂分配方案時要將武器平臺的制導(dǎo)能力限制考慮在內(nèi)。 2) 考慮目標(biāo)機動對分配方案的影響。 在攔截適宜性判斷時,目前的研究假設(shè)目標(biāo)的速度及方向恒定,實際作戰(zhàn)時,為了提高生存能力及突防能力,目標(biāo)會采用佯攻、機動的進攻方式,考慮這種情況的WTA問題更加復(fù)雜但更貼合戰(zhàn)場實際。 3) 考慮軟殺傷武器的應(yīng)用。 文獻[32-33]指出硬武器與軟武器相結(jié)合是對空防御常用的作戰(zhàn)方式,近年來箔條、電子對抗等軟殺傷武器發(fā)展迅速,具有經(jīng)濟、快速等優(yōu)點,現(xiàn)有研究考慮的都是對硬殺傷武器的分配,針對軟殺傷武器及軟硬殺傷武器組合的武器目標(biāo)分配研究較少。在分配方案求解時考慮軟殺傷武器及軟硬武器的組合使用是提高作戰(zhàn)效能的重要途徑。 武器目標(biāo)分配是戰(zhàn)場指揮決策需要解決的重要問題,在決策過程中要始終將戰(zhàn)場態(tài)勢的動態(tài)變化考慮在內(nèi),充分利用己方資源,達到滿意的作戰(zhàn)效果。3.2 DWTA問題模型
4 DWTA問題求解算法
4.1 精確算法
4.2 隨機算法
5 DWTA問題發(fā)展方向
6 結(jié)論