陳 晨,胥文欽,張明陽(yáng)
(1. 北京理工大學(xué) 自動(dòng)化學(xué)院, 北京 100081; 2. 復(fù)雜系統(tǒng)智能控制與決策國(guó)家重點(diǎn)實(shí)驗(yàn)室, 北京 100081)
戰(zhàn)場(chǎng)環(huán)境的動(dòng)態(tài)特性為防空作戰(zhàn)任務(wù)方案制定帶來(lái)了極大的挑戰(zhàn)。由于目標(biāo)軌跡改變、新目標(biāo)出現(xiàn)以及裝備故障等因素影響,戰(zhàn)場(chǎng)態(tài)勢(shì)處于時(shí)刻動(dòng)態(tài)變化中,這要求對(duì)既定的傳感器和武器作戰(zhàn)任務(wù)進(jìn)行及時(shí)有效的調(diào)整,以使其適應(yīng)新的態(tài)勢(shì)環(huán)境,充分發(fā)揮防空系統(tǒng)的作戰(zhàn)效能。
目前,對(duì)動(dòng)態(tài)任務(wù)管理問(wèn)題的研究集中在求解方法上,主要包括以下三個(gè)方面:第一,多階段匹配優(yōu)化算法,主要包括整數(shù)規(guī)劃法、動(dòng)態(tài)規(guī)劃法等;第二,分配策略優(yōu)化算法,主要包括基于馬爾可夫決策過(guò)程的策略迭代算法、值迭代算法以及二者的混合算法等;第三,anytime算法[1]。Zhang等[2]在研究單階段任務(wù)管理模型的基礎(chǔ)上,考慮時(shí)間等因素,以作戰(zhàn)效能最大、消耗最小為原則建立動(dòng)態(tài)多階段任務(wù)管理模型,并采用啟發(fā)式算法對(duì)每個(gè)階段任務(wù)管理問(wèn)題求解。楊奇松等[3]以對(duì)地攻擊作戰(zhàn)為背景,考慮武器數(shù)量、毀傷概率及目標(biāo)動(dòng)態(tài)變化情況,進(jìn)行合理假設(shè),建立分階段對(duì)地打擊任務(wù)管理問(wèn)題的局部模型與全局模型。郭繼周等[4]在研究單階段任務(wù)模型后,給出動(dòng)態(tài)變化的多階段任務(wù)系統(tǒng)的任務(wù)成功概率模型,在滿足系統(tǒng)任務(wù)成功概率約束條件下,給出了防空作戰(zhàn)單元備件攜行量?jī)?yōu)化模型,并運(yùn)用邊際分析法進(jìn)行求解。陳英武等[5-6]在已有的動(dòng)態(tài)任務(wù)管理馬爾可夫決策模型基礎(chǔ)上,針對(duì)大規(guī)模任務(wù)管理問(wèn)題中的策略優(yōu)化,提出一種混合的最優(yōu)策略改進(jìn)算法,對(duì)初始最優(yōu)策略的選取,最優(yōu)策略的改進(jìn)、判斷準(zhǔn)則做出調(diào)整。Bess等[7]為解決艦艇的多武器目標(biāo)分配問(wèn)題,提出基于馬爾可夫決策過(guò)程的動(dòng)態(tài)資源約束算法。anytime算法根據(jù)目標(biāo)當(dāng)前位置、軌跡及武器分布情況等信息,確定每個(gè)目標(biāo)的截止期,系統(tǒng)根據(jù)目標(biāo)截止期的先后,依次為每個(gè)目標(biāo)分配武器。anytime算法快速產(chǎn)生一個(gè)初始解,隨著算法計(jì)算時(shí)間的增大,解的質(zhì)量也隨之增大,算法可以在任意時(shí)刻終止輸出當(dāng)前最優(yōu)解,但付出更多時(shí)間的代價(jià)換來(lái)解的質(zhì)量稍有增大是否有意義。因此,Li等[8]引入解的效用概念,根據(jù)解的質(zhì)量增長(zhǎng)前景,新目標(biāo)的到來(lái)情況和當(dāng)前時(shí)間相對(duì)于截止期的大小來(lái)計(jì)算算法的停止時(shí)間。徐克虎等[9]結(jié)合分隊(duì)地面作戰(zhàn)特點(diǎn),采用隨局勢(shì)動(dòng)態(tài)變化的anytime算法應(yīng)對(duì)戰(zhàn)場(chǎng)上的緊急情況從而提升系統(tǒng)的整體作戰(zhàn)效能。
除此之外,一些學(xué)者還提出其他優(yōu)化算法解決動(dòng)態(tài)任務(wù)管理。王邑等[10]將機(jī)器學(xué)習(xí)應(yīng)用到動(dòng)態(tài)任務(wù)管理問(wèn)題中,進(jìn)行輔助戰(zhàn)場(chǎng)決策,通過(guò)已知的一些決策推理出戰(zhàn)場(chǎng)局勢(shì)發(fā)生變化時(shí)的新決策,從而縮短系統(tǒng)響應(yīng)時(shí)間,但此種方法僅適用于戰(zhàn)場(chǎng)局勢(shì)沒(méi)有劇烈變化的情形中。Khosla[11]提出時(shí)間窗的概念,在進(jìn)行武器任務(wù)管理的同時(shí)為其確定發(fā)射時(shí)機(jī),考慮時(shí)間約束與資源約束,并采用混合遺傳算法對(duì)其求解。何富貴等[12]提出了在優(yōu)先級(jí)數(shù)量有限的條件下的動(dòng)態(tài)調(diào)度算法,給出一個(gè)任務(wù)系統(tǒng)動(dòng)態(tài)調(diào)度所需的最小優(yōu)先級(jí)數(shù)量的算法,并對(duì)算法的復(fù)雜性進(jìn)行了分析。梁少帥等[13]以事件驅(qū)動(dòng)方式解決動(dòng)態(tài)任務(wù)管理問(wèn)題,當(dāng)有突發(fā)事件產(chǎn)生時(shí),動(dòng)態(tài)調(diào)整算法的參數(shù),從而達(dá)到動(dòng)態(tài)更改打擊方案的目的。
動(dòng)態(tài)任務(wù)管理主要解決連續(xù)交戰(zhàn)過(guò)程中作戰(zhàn)節(jié)點(diǎn)與來(lái)襲目標(biāo)之間的組合匹配問(wèn)題,要求算法具有實(shí)時(shí)性和靈活性。多階段匹配優(yōu)化算法將動(dòng)態(tài)交戰(zhàn)過(guò)程看成若干個(gè)階段,其模型簡(jiǎn)潔,實(shí)時(shí)性較優(yōu),能較靈活地調(diào)整打擊方案。因此本文采用多階段匹配算法進(jìn)行動(dòng)態(tài)聯(lián)合任務(wù)管理,并從何時(shí)進(jìn)入新階段以及新階段中如何調(diào)整兩個(gè)方面對(duì)多階段任務(wù)管理展開研究。
傳統(tǒng)任務(wù)管理方法必須等待當(dāng)前所有節(jié)點(diǎn)完成任務(wù)后才可進(jìn)行下一輪分配。這類方法在節(jié)點(diǎn)完成任務(wù)時(shí)間相近或戰(zhàn)場(chǎng)范圍不大的情形下可行。而隨著戰(zhàn)場(chǎng)區(qū)域的擴(kuò)大,作戰(zhàn)節(jié)點(diǎn)位置分布差異較大,導(dǎo)致不同節(jié)點(diǎn)完成任務(wù)的時(shí)間相差很大。因此傳統(tǒng)任務(wù)管理方法會(huì)使優(yōu)先完成任務(wù)的節(jié)點(diǎn)持續(xù)處于等待狀態(tài),因而降低了資源利用率,整體防御效果無(wú)法達(dá)到較優(yōu)。
在多階段任務(wù)管理中,進(jìn)行火力打擊和評(píng)估的同時(shí)不斷更新目標(biāo)、武器和傳感器的狀態(tài)信息,并根據(jù)它們的狀態(tài)信息決定是否進(jìn)入新的作戰(zhàn)階段,在進(jìn)入新階段后對(duì)任務(wù)進(jìn)行快速調(diào)整,這一過(guò)程重復(fù)直至所有目標(biāo)飛離戰(zhàn)場(chǎng)區(qū)域或被擊毀。相比傳統(tǒng)任務(wù)管理方法,多階段任務(wù)管理的優(yōu)勢(shì)在于更好地利用了空閑作戰(zhàn)資源,對(duì)動(dòng)態(tài)環(huán)境更具靈活性。
另外,為了保證階段內(nèi)任務(wù)調(diào)整的時(shí)效性,可選擇性地構(gòu)建分布式作戰(zhàn)體系實(shí)現(xiàn)作戰(zhàn)效能的提升。
分布式作戰(zhàn)體系通過(guò)在作戰(zhàn)節(jié)點(diǎn)的實(shí)際物理拓?fù)渖蠘?gòu)建如圖1所示的虛擬拓?fù)浣Y(jié)構(gòu),實(shí)現(xiàn)對(duì)作戰(zhàn)節(jié)點(diǎn)的分層分級(jí)管理,不同次級(jí)組合之間相互獨(dú)立,以期減小指揮控制中心的任務(wù)管理量,縮短任務(wù)調(diào)整的反應(yīng)時(shí)間以及提高作戰(zhàn)效能。在實(shí)際戰(zhàn)場(chǎng)中,目標(biāo)通常具有典型的集群特點(diǎn),它們具有相似的位置、軌跡及進(jìn)攻目標(biāo),利用態(tài)勢(shì)信息可對(duì)這些目標(biāo)進(jìn)行集群劃分,得到若干目標(biāo)組合。指揮控制中心基于此劃分構(gòu)建分布式作戰(zhàn)體系,將若干作戰(zhàn)單元聯(lián)合為一個(gè)次級(jí)作戰(zhàn)組合,并為每個(gè)目標(biāo)組合指派一個(gè)次級(jí)作戰(zhàn)組合。次級(jí)作戰(zhàn)組合中選擇一個(gè)有能力的節(jié)點(diǎn)作為信息融合及管理中心,即次級(jí)指揮中心。組合內(nèi)的傳感節(jié)點(diǎn)將目標(biāo)探測(cè)信息傳至次級(jí)指揮中心融合后提供給需要目標(biāo)指引的武器節(jié)點(diǎn)。因此后序作戰(zhàn)可直接在次級(jí)作戰(zhàn)組合內(nèi)進(jìn)行。合理的劃分能夠減小指揮控制中心的信息處理負(fù)擔(dān),可以避免任務(wù)管理問(wèn)題的維度爆炸,提高任務(wù)管理的時(shí)效性。但是構(gòu)建分布式作戰(zhàn)體系有時(shí)耗,而且組合間獨(dú)立任務(wù)管理意味放棄了任務(wù)管理問(wèn)題的全局最優(yōu)解,因此在任務(wù)管理問(wèn)題規(guī)模較小時(shí)構(gòu)建分布式作戰(zhàn)體系的時(shí)間代價(jià)可能不能彌補(bǔ)防御效果的提升,需根據(jù)實(shí)際情況抉擇是否選擇構(gòu)建分布式體系。若不構(gòu)建,指揮控制中心則對(duì)所有作戰(zhàn)節(jié)點(diǎn)采用集中式指揮方式,統(tǒng)一管理所有作戰(zhàn)節(jié)點(diǎn)任務(wù),融合傳感節(jié)點(diǎn)信息,并為武器節(jié)點(diǎn)提供目標(biāo)指引。
圖1 分布式作戰(zhàn)體系結(jié)構(gòu)Fig.1 Structure of distributed combat system
綜上分析,動(dòng)態(tài)多階段交戰(zhàn)過(guò)程任務(wù)管理流程如圖2所示。需要注意的是,所提出的聯(lián)合任務(wù)管理方法不考慮實(shí)際物理作戰(zhàn)網(wǎng)絡(luò)帶寬限制以及延時(shí),需要保證所有作戰(zhàn)節(jié)點(diǎn)之間連通,且多數(shù)作戰(zhàn)單元具有較強(qiáng)信息處理能力,所提出的方法適用于防空背景下的動(dòng)態(tài)傳感器武器聯(lián)合任務(wù)管理。
圖2 多階段任務(wù)管理流程Fig.2 Flowchart of multi-stage task management
根據(jù)上述多階段任務(wù)管理流程,動(dòng)態(tài)交戰(zhàn)過(guò)程被劃分為多個(gè)任務(wù)管理階段。隨著交戰(zhàn)的進(jìn)行,將不斷出現(xiàn)新目標(biāo)及空閑傳感器和武器。考慮到存在空閑傳感器可能無(wú)法對(duì)空閑武器進(jìn)行指引或空閑武器可能無(wú)法對(duì)新目標(biāo)進(jìn)行火力打擊的情況,有必要在進(jìn)行階段調(diào)整前通過(guò)預(yù)處理剔除這些無(wú)效對(duì)象以獲取真實(shí)任務(wù)調(diào)整規(guī)模的信息。這個(gè)過(guò)程可分為三步:
步驟1:根據(jù)武器傳感器之間的指引約束關(guān)系,剔除無(wú)空閑傳感器指引的武器。
步驟2:根據(jù)武器與新目標(biāo)之間的打擊約束關(guān)系,獲得可進(jìn)行火力打擊的武器與可被打擊的新目標(biāo),即有效的空閑武器,有效的新目標(biāo)。
步驟3:根據(jù)武器傳感器之間的指引關(guān)系獲得可對(duì)有效空閑武器指引的傳感器,即為有效空閑傳感器。
為了能更好地理解這個(gè)過(guò)程,用以下實(shí)例做進(jìn)一步說(shuō)明。假設(shè)在某個(gè)作戰(zhàn)時(shí)刻,我方所有作戰(zhàn)節(jié)點(diǎn)中空閑武器節(jié)點(diǎn)編號(hào)為2、3、5、6、7、8、9,空閑傳感器節(jié)點(diǎn)編號(hào)為1、2、3、6、8、9,新目標(biāo)編號(hào)為5、6、7、8,武器與傳感器間的指引約束關(guān)系和武器與目標(biāo)間的打擊約束關(guān)系如表1、表2所示。
表1 武器-傳感器指引約束關(guān)系
表2 武器-目標(biāo)打擊約束關(guān)系
由表1可以看出:雖然5號(hào)武器處于空閑狀態(tài),但沒(méi)有空閑傳感器可以對(duì)其進(jìn)行指引,無(wú)法完成任何作戰(zhàn)指令,因此其為無(wú)效的空閑武器,此時(shí)仍有效的空閑武器節(jié)點(diǎn)為2、3、6、7、8、9。由表2可以看出:2、6號(hào)武器無(wú)法打擊當(dāng)前任意新目標(biāo),因此也不需要對(duì)2、6號(hào)武器進(jìn)行任務(wù)管理,此時(shí)有效的空閑武器節(jié)點(diǎn)為3、7、8、9。最終得到可打擊的有效新目標(biāo)為6、7、8,可對(duì)有效空閑武器進(jìn)行指引的有效空閑傳感器為1、3、6、8、9。
假設(shè)戰(zhàn)場(chǎng)上某一時(shí)刻有效的空閑武器數(shù)量為wv、有效的空閑傳感器數(shù)量為sv以及有效的新目標(biāo)數(shù)量為tv,根據(jù)式(1)計(jì)算μ值。μ值表示當(dāng)前時(shí)刻所有有效的即可以進(jìn)入新一輪任務(wù)調(diào)整的對(duì)象總數(shù)量。若μ值很小時(shí)就進(jìn)入下一階段任務(wù)調(diào)整會(huì)導(dǎo)致系統(tǒng)任務(wù)調(diào)整頻繁,且打擊方案會(huì)過(guò)于片面,不能保證整個(gè)作戰(zhàn)過(guò)程的打擊質(zhì)量。而若μ值很大時(shí)才進(jìn)入下一階段,這些空閑對(duì)象將長(zhǎng)時(shí)間處于等待狀態(tài),系統(tǒng)響應(yīng)時(shí)間長(zhǎng),資源利用率低。因此需要合理設(shè)置階段響應(yīng)門限以控制進(jìn)入新一階段的任務(wù)調(diào)整問(wèn)題規(guī)模。一種合理的設(shè)定是當(dāng)μ值達(dá)到戰(zhàn)場(chǎng)總對(duì)象數(shù)量一定比例時(shí)進(jìn)入下一階段。如式(2)所示,W、S、T分別為戰(zhàn)場(chǎng)上所有武器節(jié)點(diǎn)數(shù)量、所有傳感器節(jié)點(diǎn)數(shù)量及預(yù)估所有武器能同時(shí)攔截的目標(biāo)數(shù)量,λ為預(yù)設(shè)的常數(shù)。階段門限值δ給出了階段劃分的依據(jù),階段s按式(3)所示更新。
μ=wv+sv+tv
(1)
(2)
(3)
在新一階段進(jìn)行聯(lián)合任務(wù)管理時(shí),作為實(shí)際作戰(zhàn)中的兩個(gè)重要因素,防御效果和系統(tǒng)響應(yīng)時(shí)間存在矛盾,特別是隨著任務(wù)調(diào)整問(wèn)題規(guī)模的增大,為了達(dá)到較好的防御效果,作戰(zhàn)方案生成算法的收斂時(shí)間也將增加。分布式作戰(zhàn)體系的引入能夠較好地解決這對(duì)矛盾。然而當(dāng)任務(wù)管理規(guī)模較小時(shí),構(gòu)建分布式體系的必要性不大。因此有必要合理設(shè)置臨界點(diǎn),以使防空系統(tǒng)在作戰(zhàn)過(guò)程中能夠更好地發(fā)揮作戰(zhàn)效能。以下從防御效果和系統(tǒng)響應(yīng)時(shí)間兩個(gè)方面來(lái)評(píng)判構(gòu)建分布式體系的優(yōu)劣,并結(jié)合給出綜合臨界指標(biāo)。
2.2.1 防御效果
任務(wù)管理過(guò)程制定的打擊方案的優(yōu)劣決定了系統(tǒng)最終的防御效果,用f表征某一打擊方案的適應(yīng)值,即總體毀傷的理論評(píng)估值。f越大,打擊方案越優(yōu),反之越差。用α表示構(gòu)建分布式體系對(duì)打擊方案適應(yīng)度值的影響。其中:fd為分布式體系打擊方案適應(yīng)度值,它是各個(gè)次級(jí)作戰(zhàn)組合對(duì)其目標(biāo)組合的打擊適應(yīng)度值之和;fc為集中式體系打擊方案適應(yīng)度值,它為指揮控制中心直接管理的所有作戰(zhàn)節(jié)點(diǎn)綜合作戰(zhàn)效能組成。
(4)
2.2.2 系統(tǒng)響應(yīng)時(shí)間
系統(tǒng)響應(yīng)時(shí)間為進(jìn)入新階段開始至調(diào)整任務(wù)方案生成完成之間的時(shí)間長(zhǎng)度。在集中式體系中,系統(tǒng)響應(yīng)時(shí)間為對(duì)有效對(duì)象直接解算任務(wù)分配方案的時(shí)間。而在分布式體系中,系統(tǒng)響應(yīng)時(shí)間主要包括目標(biāo)集群劃分、分布式次級(jí)作戰(zhàn)組合劃分及各個(gè)次級(jí)作戰(zhàn)組合任務(wù)分配方案解算三部分時(shí)間構(gòu)成。用β表示構(gòu)建分布式作戰(zhàn)體系對(duì)系統(tǒng)響應(yīng)時(shí)間的影響。其中,td為分布式作戰(zhàn)體系系統(tǒng)響應(yīng)時(shí)間,tc為集中式作戰(zhàn)體系系統(tǒng)響應(yīng)時(shí)間。
(5)
考慮系統(tǒng)響應(yīng)時(shí)間與防御效果兩個(gè)因素,給出綜合臨界指標(biāo)σ。當(dāng)σ大于零時(shí),表明構(gòu)建分布式作戰(zhàn)體系提升了系統(tǒng)的整體性能,在該階段應(yīng)先構(gòu)建分布式作戰(zhàn)體系,再進(jìn)行傳感器-武器聯(lián)合任務(wù)管理,反之降低了系統(tǒng)性能,因此無(wú)須構(gòu)建分布式作戰(zhàn)體系,可直接進(jìn)行聯(lián)合任務(wù)管理。
σ=α+β
(6)
如前所述,α與β主要與系統(tǒng)進(jìn)行階段任務(wù)管理規(guī)模相關(guān),為使系統(tǒng)在多階段任務(wù)管理過(guò)程中能夠根據(jù)規(guī)模大小,對(duì)當(dāng)前階段是否構(gòu)建分布式作戰(zhàn)體系做出合理判斷,對(duì)問(wèn)題規(guī)模從9個(gè)來(lái)襲目標(biāo)、18個(gè)武器節(jié)點(diǎn)、18個(gè)傳感器節(jié)點(diǎn)至14個(gè)來(lái)襲目標(biāo)、28個(gè)武器節(jié)點(diǎn)、28個(gè)傳感器節(jié)點(diǎn)的范圍內(nèi),選取幾種問(wèn)題規(guī)模分別在集中和分布式條件下進(jìn)行仿真,計(jì)算σ值,進(jìn)而擬合出σ值與問(wèn)題規(guī)模的對(duì)應(yīng)曲線。針對(duì)某一種問(wèn)題規(guī)模情形下,由于節(jié)點(diǎn)性能參數(shù)及目標(biāo)數(shù)據(jù)具有隨機(jī)性,因此二者的值會(huì)在一定范圍內(nèi)波動(dòng),可通過(guò)多次仿真計(jì)算此種問(wèn)題規(guī)模下二者的均值。分布式作戰(zhàn)體系與集中式作戰(zhàn)體系二者在時(shí)間與打擊方案適應(yīng)度值上的差異如圖3所示。
從圖3中可以清晰地獲得構(gòu)建分布式作戰(zhàn)體系能夠提升系統(tǒng)性能時(shí)問(wèn)題規(guī)模的臨界點(diǎn)。圖3作出了設(shè)定武器、傳感器數(shù)量為新目標(biāo)數(shù)量?jī)杀稌r(shí),系統(tǒng)響應(yīng)時(shí)間、打擊方案質(zhì)量關(guān)于問(wèn)題規(guī)模的曲線。如橫坐標(biāo)為10,則新目標(biāo)、武器、傳感器數(shù)量依次為10、20、20。從圖3中可以看出,當(dāng)問(wèn)題規(guī)模較小,集中式體系無(wú)論在防御效果還是響應(yīng)時(shí)間上都優(yōu)于分布式體系,此時(shí)對(duì)應(yīng)α和β都小于0的情形。隨著問(wèn)題規(guī)模的增大,分布式在兩方面都表現(xiàn)都超過(guò)集中式體系,此時(shí)對(duì)應(yīng)α和β都大于0的情形。在過(guò)渡期間存在一小段區(qū)間兩指標(biāo)一個(gè)大于0、一個(gè)小于0的情況,在這小段區(qū)間不會(huì)出現(xiàn)兩者極端大或極端小的情況,因此認(rèn)為用綜合臨界指標(biāo)作為是否構(gòu)建分布式體系的標(biāo)準(zhǔn)是合理的。
(a) 時(shí)間對(duì)比(a) Time comparison
(b) 適應(yīng)度值對(duì)比(b) Fitness value comparison圖3 分布式與集中式作戰(zhàn)體系仿真對(duì)比圖Fig.3 Simulation comparison between distributed combat system and centralized combat system
更一般情況下臨界指標(biāo)σ值如表3所示,采用最小二乘法對(duì)σ值與問(wèn)題規(guī)模進(jìn)行曲線擬合,獲得σ與武器數(shù)量w、傳感器數(shù)量s及目標(biāo)數(shù)量t之間的關(guān)系,如式(7)所示,此式適用于本文研究背景下σ值與問(wèn)題規(guī)模的對(duì)應(yīng)關(guān)系。在動(dòng)態(tài)任務(wù)管理中,進(jìn)入下一階段后,根據(jù)當(dāng)前問(wèn)題規(guī)模計(jì)算σ值,判斷是否構(gòu)建分布式體系。
表3 σ值與問(wèn)題規(guī)模對(duì)應(yīng)矩陣
σ=0.049 4t+0.007 1w+0.002 7s-0.765 6
(7)
若σ>0表示需構(gòu)建分布式作戰(zhàn)體系,中心節(jié)點(diǎn)需先根據(jù)態(tài)勢(shì)信息對(duì)目標(biāo)進(jìn)行分群,然后為每個(gè)目標(biāo)群分配作戰(zhàn)資源形成與目標(biāo)群相對(duì)應(yīng)的多個(gè)作戰(zhàn)單元組合。為簡(jiǎn)化問(wèn)題研究,假設(shè)來(lái)襲目標(biāo)都是以勻速直線運(yùn)動(dòng)飛向我方唯一的被保護(hù)單位,根據(jù)目標(biāo)當(dāng)前位置可確定目標(biāo)軌跡。根據(jù)目標(biāo)橫坐標(biāo)、縱坐標(biāo)及高度構(gòu)建目標(biāo)信息矩陣。
(8)
式中,來(lái)襲目標(biāo)共有T個(gè),xT1、xT2、xT3分別表示目標(biāo)T的橫坐標(biāo)、縱坐標(biāo)及高度。為防止目標(biāo)由于某一坐標(biāo)過(guò)大或過(guò)小產(chǎn)生錯(cuò)誤聚類結(jié)果,對(duì)每一個(gè)坐標(biāo)分別進(jìn)行歸一化處理。根據(jù)歸一化的目標(biāo)信息矩陣,采用式(9)計(jì)算目標(biāo)之間的差異度。其中,dt1t2為非負(fù)整數(shù),表示目標(biāo)t1與目標(biāo)t2的距離,其值越小,表征兩目標(biāo)間差異越小,軌跡越相近,反之,表征兩目標(biāo)差異較大。采用K-means算法對(duì)目標(biāo)進(jìn)行聚類,將所有目標(biāo)劃分為n個(gè)目標(biāo)群。
(9)
根據(jù)目標(biāo)分群結(jié)果為每個(gè)目標(biāo)組合分配作戰(zhàn)資源,得到與目標(biāo)組合一一對(duì)應(yīng)的n個(gè)次級(jí)作戰(zhàn)組合,構(gòu)建分布式作戰(zhàn)體系。n個(gè)作戰(zhàn)單元組合有多種劃分方案,為縮短系統(tǒng)響應(yīng)時(shí)間,需快速評(píng)估出某一劃分方案的優(yōu)劣,如式(10)所示。
(10)
式中,F(xiàn)表征某一劃分方案的優(yōu)劣,它由各個(gè)次級(jí)作戰(zhàn)組合p對(duì)其對(duì)應(yīng)的目標(biāo)組合所產(chǎn)生的最優(yōu)打擊效能fp(Xp,Yp)決定,其中Xp和Yp分別為組合p中武器和傳感器對(duì)目標(biāo)組合的打擊方案。要獲得每個(gè)次級(jí)作戰(zhàn)組合對(duì)其目標(biāo)組合最優(yōu)打擊效能fp(Xp,Yp)是非常困難的,這是在完成劃分后需要繼續(xù)去優(yōu)化的問(wèn)題。因此在劃分時(shí)必須采用一種估計(jì)的方法。本文在評(píng)估某一劃分方案優(yōu)劣時(shí),按照其目標(biāo)組合中目標(biāo)威脅度由大到小的順序依次為每一目標(biāo)分配武器、傳感器,當(dāng)對(duì)某一目標(biāo)的毀傷達(dá)到設(shè)定毀傷閾值時(shí),繼續(xù)為下一目標(biāo)分配。這一過(guò)程直至次級(jí)作戰(zhàn)組合資源耗盡或目標(biāo)全部被分配,以此制定出用于評(píng)估劃分方案優(yōu)劣的臨時(shí)分配方案,并得到次級(jí)作戰(zhàn)組合攔截相應(yīng)目標(biāo)群大概能產(chǎn)生的毀傷效能。利用差分進(jìn)化算法來(lái)求得一個(gè)可行的分布式體系次級(jí)作戰(zhàn)組合劃分方案。關(guān)于分布式體系構(gòu)建的更具體信息可參見文獻(xiàn)[14]。
構(gòu)建分布式作戰(zhàn)體系之后,每個(gè)作戰(zhàn)單元組合、目標(biāo)群中都包含若干個(gè)武器傳感器節(jié)點(diǎn)、來(lái)襲目標(biāo),次級(jí)作戰(zhàn)組合之間相對(duì)獨(dú)立地進(jìn)行傳感器武器聯(lián)合任務(wù)管理,制定最優(yōu)打擊方案。每個(gè)組合內(nèi)建立如下任務(wù)管理模型:
(11)
(12)
(13)
(14)
xik≤fiki=1,2,…,W;k=1,2,…,T
(15)
其中:T,W,S分別為某一組合內(nèi)目標(biāo)數(shù)目、武器數(shù)目、傳感器數(shù)目;thk表示目標(biāo)k的威脅值;βi為傳感器跟蹤精度對(duì)武器毀傷概率的影響;phik為武器i對(duì)目標(biāo)k的毀傷概率;ptjk為傳感器j對(duì)目標(biāo)k的探測(cè)概率;Pik為武器i攔截目標(biāo)k時(shí)傳感器提供的綜合探測(cè)概率;fik為武器目標(biāo)間打擊約束,其值為1表示武器i能夠打擊目標(biāo)k,0則不能,其主要由武器節(jié)點(diǎn)的剩余彈量以及在武器節(jié)點(diǎn)接收到作戰(zhàn)任務(wù)時(shí)目標(biāo)是否仍在武器的射擊范圍內(nèi)兩方面因素決定;zij表示傳感器j能否為武器i提供指引,當(dāng)武器攔截范圍與傳感器探測(cè)范圍存在重疊時(shí)zij=1,表示可以提供指引,否則為0;xik、yjk為決策變量,分別表示武器i和傳感器j是否分配給目標(biāo)k,1為是,0為否。約束(13)、約束(14)表示最多為每個(gè)武器和傳感器分配一個(gè)目標(biāo); 約束(15)表示武器對(duì)為其分配的目標(biāo)應(yīng)滿足打擊可行性約束條件。采用文獻(xiàn)[14]中的基于交叉策略離散粒子群算法對(duì)問(wèn)題求解,獲得最優(yōu)的打擊方案,其基本步驟如下:
步驟1:對(duì)粒子位置、算法參數(shù)進(jìn)行初始化。
步驟2:每隔一定代數(shù)對(duì)粒子的個(gè)體最優(yōu)進(jìn)行變異,計(jì)算變異后的適應(yīng)度值,若優(yōu)于原個(gè)體最優(yōu),則直接替換,否則以一定概率進(jìn)行替換。
步驟3:構(gòu)建一個(gè)全局最優(yōu)備選集合,采用聯(lián)賽選擇算子為每個(gè)粒子確定其全局最優(yōu)。
步驟4:粒子與其全局最優(yōu)進(jìn)行交叉操作。
步驟5:粒子與其個(gè)體最優(yōu)進(jìn)行交叉操作。
步驟6:粒子進(jìn)行變異操作。
步驟7:計(jì)算下一代粒子的適應(yīng)度值,更新粒子所經(jīng)歷的個(gè)體最優(yōu)與種群全局最優(yōu)。
步驟8:判斷是否達(dá)到算法終止條件,若達(dá)到,則終止算法跳出循環(huán),輸出最優(yōu)解,否則,返回步驟2,算法終止條件為到達(dá)最大迭代次數(shù)或若干次迭代中種群最優(yōu)個(gè)體保持不變。
若根據(jù)綜合臨界指標(biāo)選擇不構(gòu)建分布式作戰(zhàn)體系,則指揮控制中心直接根據(jù)上述模型生成所有作戰(zhàn)節(jié)點(diǎn)的任務(wù),即所有節(jié)點(diǎn)組成一個(gè)作戰(zhàn)組合。
為驗(yàn)證構(gòu)建分布式作戰(zhàn)體系的必要性,以MATLAB為工具進(jìn)行分布式作戰(zhàn)體系與集中式作戰(zhàn)體系對(duì)比仿真。集中式體系中指揮控制中心直接對(duì)戰(zhàn)場(chǎng)上的所有節(jié)點(diǎn)進(jìn)行任務(wù)管理;分布式體系根據(jù)綜合臨界指標(biāo)選擇是否構(gòu)建。仿真時(shí)設(shè)定戰(zhàn)場(chǎng)中我方存在一被保護(hù)資源,作戰(zhàn)單元隨機(jī)分布在戰(zhàn)場(chǎng)區(qū)域中,被保護(hù)資源間距離最近為10 km,最遠(yuǎn)為60 km,每個(gè)作戰(zhàn)單元包含1個(gè)武器節(jié)點(diǎn)、1個(gè)傳感器節(jié)點(diǎn),所有武器、傳感器對(duì)來(lái)襲目標(biāo)的毀傷概率、探測(cè)概率已知,并在一定范圍內(nèi)波動(dòng)。仿真中問(wèn)題規(guī)模為15個(gè)來(lái)襲目標(biāo),30個(gè)武器節(jié)點(diǎn),30個(gè)傳感器節(jié)點(diǎn)。為滿足戰(zhàn)場(chǎng)上的時(shí)間要求,在實(shí)際仿真實(shí)驗(yàn)中限定兩種管理中系統(tǒng)響應(yīng)時(shí)間為5 s,到達(dá)系統(tǒng)響應(yīng)時(shí)間上限后,終止算法,并輸出當(dāng)前最優(yōu)打擊方案。比較分布式與集中式打擊方案優(yōu)劣及目標(biāo)損毀數(shù)量,由于目標(biāo)、傳感器及武器的數(shù)據(jù)帶有隨機(jī)性,為降低隨機(jī)性對(duì)仿真結(jié)果的影響,本文對(duì)兩種管理方式進(jìn)行30次仿真,每次仿真中兩種管理方式打擊方案適應(yīng)度值對(duì)比情況如圖4所示,并統(tǒng)計(jì)仿真結(jié)果的平均值,如表4所示。
圖4 分布式與集中式作戰(zhàn)體系適應(yīng)度值散點(diǎn)圖Fig.4 Scatter figure of fitness value of distributed combat system and centralized combat system
綜合圖4與表4可以看出,由于目標(biāo)、作戰(zhàn)節(jié)點(diǎn)數(shù)據(jù)帶有隨機(jī)性,所以每次的仿真結(jié)果在一定范圍內(nèi)波動(dòng),但分布式體系最終打擊方案的適應(yīng)度值明顯優(yōu)于集中式,防御效果更好。分布式作戰(zhàn)體系通過(guò)降低問(wèn)題維度達(dá)到縮短算法求解時(shí)間的效果,使得算法在5 s時(shí)已經(jīng)收斂,解的質(zhì)量更優(yōu),而且由于解空間較小,算法不易于陷入局部最優(yōu)。而集中式體系解空間較大,算法找到最優(yōu)解并收斂所需時(shí)間較長(zhǎng),具有5 s的系統(tǒng)響應(yīng)時(shí)間,算法還沒(méi)有收斂卻強(qiáng)制退出,輸出當(dāng)前最優(yōu)解,解的質(zhì)量難以保證。因此構(gòu)建分布式作戰(zhàn)體系可以明顯提升系統(tǒng)性能。
表4 分布式作戰(zhàn)體系與集中式作戰(zhàn)體系仿真結(jié)果
采用多階段解決動(dòng)態(tài)交戰(zhàn)過(guò)程中作戰(zhàn)節(jié)點(diǎn)的任務(wù)管理問(wèn)題,將動(dòng)態(tài)交戰(zhàn)過(guò)程看成由若干個(gè)階段組成,并設(shè)定一個(gè)階段門限值,根據(jù)有效的新目標(biāo)數(shù)量、空閑武器傳感器數(shù)量判斷是否進(jìn)入下一階段。設(shè)定階段門限可以有效縮短作戰(zhàn)節(jié)點(diǎn)的等待時(shí)間,提高資源利用率,進(jìn)而提升系統(tǒng)的總體防御效果,尤其是隨著作戰(zhàn)時(shí)間的延長(zhǎng)、戰(zhàn)場(chǎng)范圍的擴(kuò)大,優(yōu)勢(shì)更加明顯。為做進(jìn)一步說(shuō)明,將對(duì)設(shè)定階段點(diǎn)與無(wú)階段點(diǎn)進(jìn)行對(duì)比仿真。
從來(lái)襲目標(biāo)被探測(cè)發(fā)現(xiàn)到其飛離戰(zhàn)場(chǎng)區(qū)域或被擊毀的動(dòng)態(tài)交戰(zhàn)過(guò)程中,為對(duì)比設(shè)定階段點(diǎn)與無(wú)階段點(diǎn)兩種管理方式打擊方案的優(yōu)劣、系統(tǒng)防御效果,采用式(11)作為適應(yīng)度函數(shù)評(píng)估任務(wù)管理算法輸出解質(zhì)量,動(dòng)態(tài)交戰(zhàn)過(guò)程中,會(huì)存在多個(gè)任務(wù)管理階段,統(tǒng)計(jì)所有階段輸出解的適應(yīng)度值之和,并在仿真結(jié)束后,統(tǒng)計(jì)來(lái)襲目標(biāo)被打擊次數(shù)、損毀數(shù)量及武器、傳感器使用次數(shù)。為降低目標(biāo)、武器及傳感器參數(shù)的隨機(jī)性對(duì)仿真結(jié)果的影響,本文對(duì)兩種管理方式進(jìn)行對(duì)比仿真,統(tǒng)計(jì)30次仿真結(jié)果的均值,如表5、表6所示。為更清晰地比較設(shè)定階段點(diǎn)與無(wú)階段點(diǎn)兩種管理方式在系統(tǒng)效能、資源利用率上的差異,本文在作戰(zhàn)時(shí)間較長(zhǎng)、戰(zhàn)場(chǎng)區(qū)域較大的30次仿真中,記錄每次仿真的總體適應(yīng)度值及武器傳感器節(jié)點(diǎn)使用次數(shù)之和,并繪制兩種管理方式對(duì)比散點(diǎn)圖,如圖5所示。
表5 作戰(zhàn)時(shí)間較短、戰(zhàn)場(chǎng)區(qū)域較小時(shí)仿真結(jié)果
表6 作戰(zhàn)時(shí)間較長(zhǎng)、戰(zhàn)場(chǎng)區(qū)域較大時(shí)仿真結(jié)果
當(dāng)戰(zhàn)場(chǎng)區(qū)域范圍較小時(shí),作戰(zhàn)單元之間的間距不大,因此作戰(zhàn)單元完成任務(wù)時(shí)間相差并不明顯,即使等待所有節(jié)點(diǎn)完成任務(wù)再進(jìn)入下一階段也不會(huì)過(guò)大增加節(jié)點(diǎn)等待時(shí)間,因此設(shè)定階段點(diǎn)優(yōu)勢(shì)并不明顯。當(dāng)戰(zhàn)場(chǎng)區(qū)域范圍較大時(shí),作戰(zhàn)單元完成任務(wù)的時(shí)間具有較大的差異,設(shè)定階段點(diǎn)實(shí)時(shí)根據(jù)戰(zhàn)場(chǎng)信息判斷是否進(jìn)入下一階段,因此其相比于無(wú)階段點(diǎn)的情況會(huì)明顯提升資源利用率,進(jìn)而提升系統(tǒng)防御效果。
(a) 適應(yīng)度值(a) Fitness value
(b) 作戰(zhàn)節(jié)點(diǎn)使用次數(shù)(b) Operational node usage times圖5 設(shè)定階段點(diǎn)與無(wú)階段點(diǎn)仿真結(jié)果對(duì)比圖Fig.5 Comparison of setting stage point and no stage point simulation results
本文研究了動(dòng)態(tài)條件下的傳感器-武器聯(lián)合任務(wù)管理方法。通過(guò)控制階段有效任務(wù)調(diào)整規(guī)模設(shè)計(jì)了階段門限,構(gòu)建了防空作戰(zhàn)的多階段動(dòng)態(tài)調(diào)整過(guò)程,相比傳統(tǒng)任務(wù)管理方法更有效地利用了空閑作戰(zhàn)資源。在階段任務(wù)調(diào)整時(shí),為了解決防御效果和系統(tǒng)響應(yīng)時(shí)間的矛盾,提出了分布式與集中式相結(jié)合的調(diào)整流程,使得系統(tǒng)可根據(jù)綜合臨界指標(biāo)來(lái)自主地確定是否需要構(gòu)建分布式作戰(zhàn)體系。分布式作戰(zhàn)體系快速將所有作戰(zhàn)節(jié)點(diǎn)和目標(biāo)劃分若干次級(jí)作戰(zhàn)組合,每個(gè)次級(jí)作戰(zhàn)組合獨(dú)立地進(jìn)行傳感器-武器聯(lián)合管理并對(duì)任務(wù)做出快速的調(diào)整。分布式作戰(zhàn)體系放棄了作戰(zhàn)效能的全局最優(yōu)性,然而仿真實(shí)驗(yàn)顯示在問(wèn)題規(guī)模較大時(shí)可得到相比集中式更好的效能,從而驗(yàn)證了其有效性。所提出任務(wù)管理方法能夠較好地適應(yīng)動(dòng)態(tài)戰(zhàn)場(chǎng)環(huán)境,使得防空系統(tǒng)能夠更高效地發(fā)揮作戰(zhàn)優(yōu)勢(shì)。