肖金科 李為民 江蕭君 潘帥
末段反導系統(tǒng)(Terminal Anti-missile System)是通過攔截末段飛行中的彈道導彈(Ballistic Missile,BM)、來防護所保衛(wèi)要地免遭BM攻擊的武器系統(tǒng).末段反導目標分配實質是在高實時、有限空域約束、目標行為約束等多約束條件下,以來襲BM相對保衛(wèi)要地的威脅度和武器單元的狀態(tài)為輸入,在一定的時間區(qū)間內,按照預定分配準則,以最小化目標總期望剩余價值為目標(根據(jù)目標分配準則不同而不同),以武器單元順次攔截來襲BM的“武器目標對(weapon target part)”為輸出,以武器目標分配策略為核心的動態(tài)循環(huán)分配的過程.
然而,與傳統(tǒng)的地面防空作戰(zhàn)相比,由于BM進攻的突然性、高速度、高機動性,在瞬息萬變的作戰(zhàn)環(huán)境中,留給作戰(zhàn)指揮員進行決策的時間極為有限,為此,必須采用高效、實時的輔助決策手段來支持作戰(zhàn),構建高效的末段反導目標分配輔助決策.現(xiàn)實作戰(zhàn)中,由于末段反導目標分配面臨著新目標的出現(xiàn)、舊目標被摧毀,武器裝備損毀或由于彈藥耗盡而失去戰(zhàn)斗力等隨機事件的影響,對現(xiàn)有目標分配模型的適應性及解算方法的時間約束處理能力提出新的要求.因此,本文著重在現(xiàn)有基礎上,提出高匹配與作戰(zhàn)環(huán)境的目標分配及解算需求,力求給相關人員啟發(fā).
武器目標分配(WeaponTargetAssignment,WTA)是作戰(zhàn)指揮決策中迫切需要解決的現(xiàn)實問題,其解空間隨著武器總數(shù)和目標總數(shù)的增加而呈指數(shù)級增長,使得其成為一個多參數(shù)、多約束的NP-complete問題.
現(xiàn)階段學術界對目標分配問題基本達成共識的是:從時間對目標分配的影響,將目標分配問題劃分為靜態(tài)武器目標分配(Static Weapon Target Assignment,SWTA)和動態(tài)武器目標分配(Dynamic Weapon Target Assignment,DWTA),前者僅僅考慮某個時間段的武器目標分配,不考慮時間屬性;而后者考慮武器目標的時間屬性.鑒于靜態(tài)目標分配沒有考慮武器對目標射擊諸元(比如殺傷概率、可發(fā)射時間窗口)的變化等諸多不足,為此,多數(shù)研究人員將時間屬性引入目標分配,動態(tài)目標分配問題逐步成為當前解決武器目標分配問題的熱點問題.
在研究團隊方面,國內方面針對末段反導目標分配進行了系統(tǒng)研究,集中到以下幾個團隊:中國電子科技集團劉興[1?2]、梁維泰團隊[3?4]針對空天防御指揮控制系統(tǒng)進行了研究,涉及到目標分配外部接口;航天二院的施榮團隊[5?6]對防空反導目標分配輔助決策進行了研究;空軍工程大學防空反導學院的李為民[7?8]、王剛團隊[9?10]有關目標分配的研究主要集中在終止控制、模型修正、解算方法方面.這些研究均取得了喜人的成果,推動著目標分配理論與實踐的不斷發(fā)展.
總結相關文獻,對動態(tài)目標分配模型研究是在目標分配流程下,集中在處理不同目標分配隨機事件的方法設計上.由于反導目標探測與跟蹤中的虛警概率隨態(tài)勢不斷變化,目標分配中的這些隨機事件干擾著常規(guī)的目標分配進程,具體表現(xiàn)在目標分配中經常出現(xiàn)各種隨機事件,目標分配中隨機出現(xiàn)的各類隨機事件主要包括如下4類:
2)目標消失.當某目標指示雷達前期誤判為真目標,隨著精度提高確定為假目標或者該目標被武器單元摧毀,這都標志著目標的數(shù)量突然減少,會直接影響著目標分配方案.
3)出現(xiàn)新目標.當某目標由于雷達系統(tǒng)前期誤判為假目標,隨著精度提高確定為真目標,標志著目標分配中目標數(shù)量的突然增加,會直接影響目標分配方案.
4)武器單元的損毀或者彈藥耗盡,標志著目標分配中武器單元數(shù)量的突然減少,亦會直接影響目標分配方案.
由于反導目標分配時間極為短暫,處理上述隨機事件并不需要中斷算法重新解算目標分配方案,而應該在原有目標分配方案的基礎上,改進新的目標分配方案,從而實現(xiàn)目標分配總體效能的螺旋式上升.為此,相關文獻提出的處理這些隨機事件的方法總結如下:
1)目標信息更新,目標分配模型中增加威脅程度更新方程,該方程與目標被攔截次數(shù)、武器殺傷概率等因素直接相關,目標分配模型應重新計算目標的威脅度和各個武器單元對目標的攔截概率,以使目標分配方案體現(xiàn)目標信息更新的影響;
2)目標消失,將武器單元對目標的攔截概率置0;
3)出現(xiàn)新目標,在原有目標分配方案基礎上進行進一步優(yōu)化調整;
這些天,我和阿花又跑來了四五筆訂單。每跑來一筆訂單,我們都很興奮,把那事發(fā)揮得淋漓盡致。完事了,阿花說,我還要。嚇得我的腿都軟了。我說有個笑話你沒聽說過嗎,男人喜歡女人說我要,最怕女人說我還要。阿花一逗就樂,笑得彎下了腰,笑夠了用拳頭來捶我,說什么呀,人家還要的是訂單,才不要你呢。于是我提起褲子,穿好西裝領帶,又跟著阿花四處奔波,跑淡水,跑橫崗、觀瀾、公明,還有東莞的長安、鳳崗等地。太陽熱氣騰騰像要把人的汗水烤干似的,那些樹草花木早就烤得服服帖帖了,動都不動一下。我說阿花你把空調打到最低,大汗淋漓去見客戶,人家肯定說咱倆沒干好事。
4)武器單元的損毀或者彈藥耗盡,將該武器單元對所有目標的攔截概率置0.
不同隨機事件的處理方法給出解決該類問題的基本思路,但是采取科學的數(shù)學語言詳細表達出不同隨機事件下的目標分配問題仍然是一個亟待解決的問題.
目標分配模型的解算方法經過多年的發(fā)展,目標分配結算方法集中在Hosein[11]、Nguyen Bao[12]提出的多階段匹配優(yōu)化算法、Orhan Karasakal[13]提出的分配策略最優(yōu)算法、Sandholm[14]、Aknine[15]市場機制算法及群智能優(yōu)化算法,其中群智能優(yōu)化算法相關的研究最多,具體如下:
目標分配問題是典型的動態(tài)多約束單目標優(yōu)化問題,為此需要構建多約束單目標優(yōu)化模型,并采取Anytime算法并隨時在求解質量與時間之間進行折中,從而實現(xiàn)動態(tài)輸出的功能[16].Anytime算法中,雖然進化方法是處理動態(tài)目標優(yōu)化問題理想工具[17?18],但是仍然存在一些公開的難點,比如動態(tài)環(huán)境監(jiān)測.生物系統(tǒng)高效的信息處理機制為目標分配解算方法提供重要參考,國內知名學者對此進行系統(tǒng)的研究,比如借鑒免疫系統(tǒng)的免疫機制開發(fā)新型的免疫優(yōu)化方法方面,西安電子科技大學的焦李成、公茂果和尚榮華等人[19?21]提出免疫優(yōu)勢克隆多目標優(yōu)化算法、非支配鄰域免疫算法等優(yōu)化方法,將人工免疫系統(tǒng)的相關機制成功應用于解決靜態(tài)多(單)目標優(yōu)化問題,取得了喜人的成果.東華大學的丁永生教授及其團隊[22?23]充分借鑒神經內分泌免疫系統(tǒng)提出多種免疫優(yōu)化控制方法,較好地應用到解決靜態(tài)環(huán)境下目標優(yōu)化難題.
但是如何高效地跟蹤動態(tài)變化環(huán)境并在當前環(huán)境可行域中尋找最優(yōu)解仍然是一個公開且熱門話題.約束優(yōu)化問題比非約束優(yōu)化問題要復雜得多,經常出現(xiàn)某些算法針對靜態(tài)約束優(yōu)化問題的特殊性進行求解,一旦帶有時間屬性的約束,解決動態(tài)約束優(yōu)化問題的效率可能會大大降低.處理該問題就需要進一步挖掘生物啟發(fā)式方法來發(fā)展新穎、可靠的優(yōu)化方法,為解決末段反導、乃至中段反導目標分配問題提供方法手段支撐.
立足目標分配研究現(xiàn)狀中,結合末段反導動態(tài)目標分配的特殊性,本節(jié)著重提出末段反導動態(tài)目標分配模型需求內容.末段反導動態(tài)目標分配模型主要是考慮目標函數(shù)與約束條件,目標函數(shù)的選擇通常選取使總的武器數(shù)消耗最少、防御方的資源損傷最小、敵方的潛在威脅最小、剩余目標數(shù)最少或者多個目標函數(shù)的組合,建立單(多)目標函數(shù)優(yōu)化問題;約束主要是物質約束、時間約束、空間約束等.末段反導動態(tài)目標分配由不同時間段內靜態(tài)目標分配組成,由動態(tài)環(huán)境中一系列事件驅動進而動態(tài)調整目標分配方案,以求能夠自適應動態(tài)變化環(huán)境、處理動態(tài)目標分配問題的目的.梳理末段反導動態(tài)目標分配模型需求如下:
一方面,末段反導目標分配需滿足目標分配問題的物質約束、時間約束、空間約束,即滿足物質約束表示被摧毀或者彈藥耗盡的武器單元不能分配目標;滿足時間約束表示每個“武器目標對”目標分配結果的誕生時刻需在武器對目標的最晚發(fā)射時刻之前;滿足空間約束表示武器不能攔截不進入該武器殺傷區(qū)的目標;另一方面,由于隨機事件的出現(xiàn),目標分配截止期不一定對應于目標分配的最晚可發(fā)射時刻,因此,該目標分配模型應能夠在滿足目標分配的物質約束、時間約束、空間約束的條件下,在優(yōu)化現(xiàn)有目標分配效能與處理隨機事件所付出時間代價、收益之間尋找平衡,獲取目標分配最優(yōu)的截止期,實現(xiàn)動態(tài)末段反導作戰(zhàn)過程中武器目標的最優(yōu)配對.
末段反導作戰(zhàn)中,由于BM高速度、突然性,隨機出現(xiàn)的各種事件會對目標分配方案產生不同的影響,這也要求構建的目標分配模型能夠自適應處理各類隨機事件.概而言之,末段反導目標分配中隨機出現(xiàn)的各類隨機事件主要包括如下4類:
1)目標信息更新.目標一旦進入目標分配流程,BM的飛行數(shù)據(jù)隨著時間而不斷發(fā)生變化,從而武器單元對BM的毀傷概率發(fā)生變化,進而影響著目標分配方案.
2)目標消失.當某目標指示雷達前期誤判為真目標,隨著精度提高確定為假目標或者該目標被武器單元摧毀,這都標志著目標的數(shù)量突然減少,會直接影響著目標分配方案.
3)出現(xiàn)新目標.當某目標由于雷達系統(tǒng)前期誤判為假目標,隨著精度提高確定為真目標,標志著目標分配中目標數(shù)量的突然增加,會直接影響目標分配方案.
4)武器單元的損毀或者彈藥耗盡,標志著目標分配中武器單元數(shù)量的突然減少,亦會直接影響目標分配方案.
由于末段反導目標分配時間極為短暫,這就要求目標分配模型能夠靈活處理動態(tài)的、隨機的事件,在原有目標分配方案的基礎上,改進新的目標分配方案,從而實現(xiàn)目標分配總體效能的螺旋式上升.
末段反導目標分配模型受制于包括來襲BM的威脅度更新、武器單元的殺傷區(qū)及“武器目標對”的可發(fā)射時間窗口、新目標的出現(xiàn)或被摧毀目標的消失等隨機事件在內的多種因素.因此,目標分配模型能夠盡量跟蹤、自適應實際末段反導動態(tài)變化的作戰(zhàn)環(huán)境,能夠有效處理目標信息的更新、新目標的出現(xiàn)、舊目標被摧毀,武器裝備損毀或由于彈藥耗盡而失去戰(zhàn)斗力等隨機事件及其對原有“武器目標對”目標分配時間窗口的影響;能夠在不影響當前優(yōu)化過程、不丟失已經優(yōu)化的目標分配信息且不重啟一次優(yōu)化過程的基礎上能夠隨時處理;對被摧毀而消失的目標,原來“武器目標對”對應的武器已經空閑,應能夠立即用于再次分配.
末段反導目標分配是在瞬息萬變環(huán)境下動態(tài)變化的,尤其是隨著來襲BM和武器單元數(shù)量的增加,其解空間隨著武器總數(shù)和目標總數(shù)的增加而呈指數(shù)級增長,末段反導目標分配模型是多武器數(shù)量約束、多武器攔截能力約束等多約束組合優(yōu)化問題,是一個多參數(shù)、多約束的NP-complete問題,具有如下特點:NP-完全的、非線性的、動態(tài)的、實時的、隨機的、離散的、大規(guī)模的.著眼于末段反導目標分配的任務多、時間短的現(xiàn)實需求,立足提高模型解算的實時性,壓縮目標分配時間,以求迅速轉入后續(xù)攔截作戰(zhàn),選擇一個合理的動態(tài)目標分配解算方法是關鍵.
動態(tài)目標分配中,隨機事件的出現(xiàn)導致隨機截止期的存在,要求動態(tài)目標分配算法必須具有及時響應隨機事件并隨時輸出可行解的能力,即算法能夠在任意時刻被停止并輸出一個合理解,以確保能及時響應隨機出現(xiàn)的緊急事件,亦即算法的任意時刻特性—-Anytime算法.Anytime算法能夠在動態(tài)截止期到來之前尋找到滿意解,是解決動態(tài)目標分配問題的理想方法之一.相對一般的Anytime算法而言,末段反導動態(tài)目標分配對Anytime算法有著特殊的需求:
現(xiàn)有Anytime算法不能總是在當前優(yōu)化沒有結束之前動態(tài)處理新出現(xiàn)目標的分配,即新出現(xiàn)的目標不能在算法沒有停止的時候動態(tài)地加入當前處理過程中,算法總是結束對一批目標的分配之后再進行對后續(xù)目標的分配.但對于同一批處于分配之中的目標,其來襲時間差別可能很大,對其完成目標分配時間窗口的長度及起止時間千差萬別,有些目標的分配截止期很短,不及時輸出目標分配方案,可能會越過所有武器的發(fā)射區(qū)而造成突防;但有些目標可能還有充分的優(yōu)化時間,優(yōu)化時間太短,其目標分配效能會大大降低.這就要求Anytime算法的處理框架應該在滿足時間約束的前提下能根據(jù)優(yōu)化效果依次輸出目標的武器分配決策,并能夠在保持當前優(yōu)化結果的基礎上接受新目標進入目標分配過程.
由于末段反導動態(tài)目標分配物質約束、時間約束、空間約束隨著時間變化而變化,一方面,由于物質約束、時間約束、空間約束,多個“武器目標對”會存在多種不同的集合,動態(tài)作戰(zhàn)環(huán)境變化較快,這就要求Anytime算法具備密切跟蹤動態(tài)變化環(huán)境的能力、具備在動態(tài)環(huán)境變化之前快速找到最優(yōu)解的能力;另一方面,與動態(tài)非約束優(yōu)化問題相比,動態(tài)多約束優(yōu)化問題的可行域或者目標函數(shù)隨著時間變化,最優(yōu)解可能運動到極小的區(qū)域甚至極小的可行域之間互不連通,這就要求Anytime算法具備動態(tài)多約束尋優(yōu)的能力.
時間約束的處理容易導致現(xiàn)有Anytime算法復雜度過高,優(yōu)化效率過低.武器、目標越多,“武器目標對”對應的時間窗口的數(shù)量會成倍增加,并且各個時間窗口相互間大量重疊,從而解空間過大,優(yōu)化效率低,很難在短時間之內找到滿意的解;若采取每個目標在其可行的時間窗口之內基于Anytime算法迭代優(yōu)化的方式,很容易導致解空間過大,優(yōu)化效率降低,很難在短時間之內找到滿意的解,甚至可能由于優(yōu)化時間過長,當前時間可能跨越了某些時間窗口,產生過期的分配決策.這就要求解決末段反導目標分配解算方法具備高效處理時間約束的能力.
鑒于末段反導目標分配的復雜性,本文初步研究了末段反導目標分配需求問題.在分析末段反導目標分配研究現(xiàn)狀的基礎上,初步提出末段反導目標分配模型需求及算法需求,為進一步結合具體場景構建目標分配模型及其求解方法提出總體指導.
下一步,模型建設方面嘗試著基于典型來襲場景的不同,構建交互多模型的目標分配模型;模型解算方法方面,將借鑒人工免疫系統(tǒng)的免疫監(jiān)控機制、免疫應答機制和免疫調節(jié)機制,在充分驗證高動態(tài)情景下收斂性的基礎上,嘗試著提出多種群協(xié)同動態(tài)多約束單目標優(yōu)化問題,力求為解決末段反導目標分配問題提供一種具體優(yōu)化解決算法.
1劉興,趙敏.網絡戰(zhàn)攻擊和防御技術—對蘇特計劃的分析[J].指揮信息系統(tǒng)與技術,2011,2(4):1?9.
2劉興,藍羽石.網絡中心化聯(lián)合作戰(zhàn)體系作戰(zhàn)能力及其計算[M].北京:國防工業(yè)出版社,2013:23?35.
3梁維泰,王俊,楊進佩.反彈道導彈指揮控制系統(tǒng)結構初探[J].指揮信息系統(tǒng)與技術,2010,1(1):5?9.
4梁維泰,肖其林,劉奎.基于CPN的聯(lián)合作戰(zhàn)自適應分隊分布式協(xié)同結構性能評價[J].解放軍理工大學學報(自然科學版),2004,5(5):46?51.
5施榮.國外網絡化作戰(zhàn)及其關鍵技術的進展[J].中國電子科學研究院學報,2007,2(2):206?210.
6施榮,陳兢,辜璐.美國一體化防空反導系統(tǒng)作戰(zhàn)能力分析[J].航天電子對抗,2008,42(2):1?4.
7賀筱軍,李為民.美軍反導體系建設中的幾個技術特點[J].飛航導彈,2014,44(11):88?92.
8肖金科,李為民,劉彬,等.空天防御作戰(zhàn)任務規(guī)劃關鍵技術分析[J].飛航導彈,2015,45(2):51?55.
9肖金科,王剛,劉昌云,等.多層反導目標分配建模及其優(yōu)化方法研究[J].電光與控制,2013,20(10):62?65.
10王剛,李為民.區(qū)域反導(ATBM)BM/C3I作戰(zhàn)體系結構研究[J].彈箭與制導學報,2003,24(2):29?32.
11 HOSEIN P,ATLANS M.An asymptotic result for the multi?stage weapon target allocation problem[R].LIDS-P-1945,MIT,1990.
12 BAO N,MIAH S.Analysis of maritime air defense scenarios[C]//Pro.of 2014 7thIEEE Symposlum on Computational Intelligence for Security and Defense Application,Hanoi,2014.
13 KARASAKAL O.Air defense missile?target allocation models for a naval task group[J].Computers&Operations Research,2008,35(6):1759?1770.
14 SANDHOLM T.Contract Types for Satisficin Task Allocation:I Theoretical Results[R].AAAI Technical Report SS?98?05.Stanford University,AAAI Press.1998:68?75.
15 AKNINES,PINSONS,SHAKUNMF.AnExtendedMulti?agentNegotiation Protocol[J].Autonomous Agents and Multi?Agent Systems,2004,8(1):5?45.
16 BODDY M,DEAN T.Deliberation scheduling for problem solving in time constrained environments[J].Artificia Intelligence,1994,67(2):245?285.
17 JIN Y C,BRANKE J.Evolutionary optimization in uncertain environments:a survey[J].IEEE Trans Evolutionary Computation,2005,9(3):303?317.
18 EUCHI J,CHABCHOUB H,YASSINE A.New evolutionary algorithm based on 2?Opt local search to solve the vehicle routing problem with private flee and common carrier[J].International Journal of Applied Metaheuristic,2011,2(1):58?82
19 SHANG R H,JIAO L C,REN Y J,etc.Quantum immune clonal coevolutionary algorithm for dynamic multiobjective optimization[J].Natural Computing,2014,18(3):421?445
20 LIU R C,MU C H,CHEN Y Y,etc.A novel cooperative coevolutionary dynamic multi-objective optimization algorithm using a new predictive model[J].Soft Computing,2014,18(10):1913?1929.
21戚玉濤,劉芳,常偉遠,等.求解多目標問題的Memetic免疫優(yōu)化方法[J].軟件學報,2013,24(7):1529?1544.
22丁永生.計算智能的新框架:生物網絡結構[J].智能系統(tǒng)學報,2007,2(2):26?30.
23 ZHANG T,JIN Y C,DING Y S,etc.A cytokine network-inspired cooperative control system for multi-stage stretching processes in fibe production[J].Soft Computing,2015,19(6):1523?1540