林 云, 粘松雷
(海軍航空工程學(xué)院指揮系,山東煙臺264001)
編隊協(xié)同任務(wù)分配問題是航空兵協(xié)同作戰(zhàn)的重要研究內(nèi)容之一,其目的是在滿足各項技戰(zhàn)術(shù)指標(biāo)的前提下,將不同位置、價值和威脅程度的目標(biāo)合理地分配給不同的任務(wù)兵力,并對兵力進行編組和設(shè)計粗略航跡,使得編隊的整體作戰(zhàn)效益最大,代價最小。協(xié)同任務(wù)分配是一個約束多而復(fù)雜的優(yōu)化問題,其解空間隨武器和任務(wù)總數(shù)的增加而呈指數(shù)級增加,使其成為一個多參數(shù)、多約束的網(wǎng)絡(luò)協(xié)議問題。合同網(wǎng)算法采用基于投標(biāo)、競標(biāo)等市場機制,協(xié)調(diào)多架航空兵的任務(wù),具有通信量少、魯棒性(robustness)好等優(yōu)點。其他相關(guān)文獻中的分配算法模型或同時,或部分存在以下問題,如:①缺乏考慮任務(wù)優(yōu)先權(quán)的影響;②難以有效處理隨機出現(xiàn)的新任務(wù);③局限單機分配單任務(wù)問題等。
針對編隊協(xié)同任務(wù)分配特點,綜合考慮以上存在的部分問題,論文中采用基于合同網(wǎng)協(xié)議(Contract Net Protocol)的任務(wù)分配算法,提出了編隊協(xié)同任務(wù)分配算法,考慮了任務(wù)優(yōu)先權(quán)的影響,實例證明能夠解決預(yù)先任務(wù)分配和任務(wù)執(zhí)行過程中隨機出現(xiàn)的新任務(wù)的實時分配問題。
以1架擔(dān)任指揮的飛機與多架擔(dān)任突擊任務(wù)的飛機編隊協(xié)同任務(wù)分配為背景進行研究。在復(fù)雜電磁環(huán)境下,由航空兵指揮中心或指揮機通過聯(lián)合戰(zhàn)術(shù)分發(fā)系統(tǒng)實現(xiàn)對編隊的指揮控制,由指揮中心完成編隊?wèi)?zhàn)術(shù)決策和任務(wù)控制,由突擊兵力完成對海攻擊任務(wù),能夠充分實現(xiàn)編隊之間的信息共享、可用資源的統(tǒng)一調(diào)度和作戰(zhàn)任務(wù)的綜合管理。圖1為航空兵對海作戰(zhàn)典型戰(zhàn)場態(tài)勢想定。
圖1 航空兵對海作戰(zhàn)典型戰(zhàn)場態(tài)勢想定
按照編隊系統(tǒng)組成和分工,將編隊中各組成實體分別視為兩類agent:管理agent和突擊agent。
圖2 編隊實體示意圖
編隊協(xié)同任務(wù)系統(tǒng)中,管理agent具有完全的智能性和自治性,是完全自治agent(autonomous agent),而突擊agent由于受指揮機指揮控制,具有部分自治性,是半自治agent(semi-autonomous agent),整個編隊構(gòu)成多智能體系統(tǒng)(Multi-agent System,MAS),通過各agent之間的交互和協(xié)同實現(xiàn)整個系統(tǒng)的任務(wù),實際上是一個有限中央控制下的分布式系統(tǒng)。如果是多編隊協(xié)同作戰(zhàn),則通過各編隊指揮控制飛機之間的交互實現(xiàn)各編隊之間的協(xié)同,如圖3所示。
合同網(wǎng)是Smith于1980年在研究分布式問題求解過程中提出來的,是分布式控制中常用的協(xié)商策略。合同網(wǎng)模型中的節(jié)點可以分為:①管理者:任務(wù)的擁有者,負(fù)責(zé)任務(wù)的分配和管理;②投標(biāo)者:有能力完成任務(wù)的節(jié)點,就所分配的任務(wù)參與競標(biāo);③中標(biāo)者:最后競標(biāo)的成功者,負(fù)責(zé)完成任務(wù)。
圖3 編隊MAS協(xié)同任務(wù)分配體系結(jié)構(gòu)
合同網(wǎng)的基本思想是將任務(wù)的分配通過節(jié)點之間的招投標(biāo)過程實現(xiàn),將協(xié)商引入到管理者和投標(biāo)者的雙向選擇過程中。當(dāng)管理者有任務(wù)需要其他結(jié)點幫助解決時,它就向其他結(jié)點廣播有關(guān)該任務(wù)信息,即發(fā)出任務(wù)通告(招標(biāo)),接到招標(biāo)的結(jié)點則檢查自己對解決該問題的相關(guān)能力,然后發(fā)出自己的投標(biāo)值并使自己成為投標(biāo)者,最后由管理者評估這些投標(biāo)值并選出最合適的中標(biāo)者授予任務(wù)。在招投標(biāo)過程中,利用通信機制對每個任務(wù)的分配進行協(xié)商,避免資源、知識等的沖突,即節(jié)點之間通過招標(biāo)—投標(biāo)—中標(biāo)這一市場投標(biāo)機制進行任務(wù)分配,使系統(tǒng)以較低的代價、較高的質(zhì)量完成分布式任務(wù)[1-5],如圖4所示。
圖4 基于合同網(wǎng)協(xié)議的任務(wù)協(xié)商分配過程
設(shè)有1架指揮飛機與N架殲擊機(V1,V2,…,VN)組成協(xié)同對海攻擊編隊,共有M個目標(biāo){T1,T2,…,TM}需要分配。
則有目標(biāo)分配矩陣XN×M為
其中:i=1,2,…,N;j=1,2,…,M。
目標(biāo)分配矩陣XN×M的構(gòu)造需要使編隊整體作戰(zhàn)效能最大,即目標(biāo)分配收益最大化,代價最小化。以下也將從收益和代價這兩方面構(gòu)造任務(wù)分配總體目標(biāo)函數(shù)。
目標(biāo)分配收益函數(shù)
式中:πj為目標(biāo)Tj被摧毀的概率函數(shù);Pj為目標(biāo)攻擊優(yōu)先權(quán)值,Pij為Vi攻擊Tj的效率,在此可理解為Vi能夠摧毀Tj的概率。
在式(2)中,將任務(wù)攻擊優(yōu)先權(quán)納入目標(biāo)分配收益函數(shù)中,用以表明相關(guān)聯(lián)任務(wù)的緊迫程度。優(yōu)先級的評估方法主要有兩種:①自主建立任務(wù)的優(yōu)先級,指由單一的作戰(zhàn)平臺根據(jù)戰(zhàn)場態(tài)勢信息確定任務(wù)的優(yōu)先級;②協(xié)調(diào)建立任務(wù)的優(yōu)先級,指兩個或兩個以上的作戰(zhàn)平臺之間的協(xié)同作戰(zhàn)考慮,統(tǒng)一排列任務(wù)[7-8]。
本文中由指揮飛機統(tǒng)一確定任務(wù)優(yōu)先權(quán),綜合進行目標(biāo)態(tài)勢評估及發(fā)布指揮控制飛機的指令,確定目標(biāo)優(yōu)先級Pj。首先根據(jù)任務(wù)緊迫程度的大小關(guān)系確定任務(wù)的優(yōu)先序Q,優(yōu)先序排第一的任務(wù),權(quán)值設(shè)為1,而優(yōu)先序為第 k的任務(wù),權(quán)值為 1/k,k=1,2,…,M。任務(wù)j的優(yōu)先權(quán)值Pj與任務(wù)優(yōu)先序qj的關(guān)系為
目標(biāo)分配代價函數(shù):
式中:i為損耗概率函數(shù);vi為Vi的價值,與其戰(zhàn)斗力、機載設(shè)備裝置相關(guān)。
式中:Li(Tj)為Vi攻擊Tj的損耗函數(shù);Li(Tj)=f(,為V到目標(biāo)T的路徑長度代價;為Viji到目標(biāo)Tj的平均路徑威脅代價;rij為Vi攻擊Tj的風(fēng)險,可理解為Vi攻擊目標(biāo)Tj過程中被擊毀的概率。f的形式依照具體算法確定。
E(X)= α·B(X)+β·C(X) (7)
其中,α、β為權(quán)重系數(shù)??蓪⑹?7)簡化為
則最優(yōu)分配方案對應(yīng)的分配矩陣最優(yōu)解為
在任務(wù)分配的過程中,可以為單架殲擊機分配多個目標(biāo),也可以將單個目標(biāo)分配給多架殲擊機,實施協(xié)同突擊。但為了實現(xiàn)總體效能最大,各殲擊機的任務(wù)量應(yīng)有所均衡。主要從以下兩式加以約束
式中:Nmax表示完成單一任務(wù)的殲擊機最大數(shù)量;Mmax表示分配給單架殲擊機的最大任務(wù)量。
式中,δ、ε分別為限制閾值。
預(yù)先任務(wù)分配一般是編隊在作戰(zhàn)任務(wù)確定之后,根據(jù)所有獲取到的情報信息,考慮各種約束條件,對作戰(zhàn)任務(wù)進行分配,并將規(guī)劃任務(wù)信息裝訂到各參戰(zhàn)殲擊機上。此時,針對初始目標(biāo)集{T1,T2,…,TM},根據(jù)單架殲擊機最大任務(wù)量Mmax的限制,構(gòu)造所有可能的目標(biāo)攻擊方案,然后各殲擊機分別計算各目標(biāo)攻擊方案的收益、代價,求得效能最大的方案,按照“貪婪”法則,將此方案作為自己的投標(biāo)方案。投標(biāo)時,由指揮飛機隨機生成各殲擊機的投標(biāo)順序,按照順序各殲擊機先后出示自己的“最優(yōu)方案”。待一輪投標(biāo)結(jié)束后,指揮飛機根據(jù)各殲擊機所出示的方案,構(gòu)造目標(biāo)分配XN×M矩陣,根據(jù)總體任務(wù)分配效能函數(shù),得到此輪投標(biāo)的效能值。如果時間允許,可進行多輪投標(biāo),從中得到相對最優(yōu)任務(wù)分配方案。
(1)成立對應(yīng)的施工環(huán)境衛(wèi)生管理機構(gòu),在工程施工過程中嚴(yán)格遵守國家和地方政府下發(fā)的有關(guān)環(huán)境保護的法律、法規(guī)和規(guī)章,加強對施工燃油、工程材料、設(shè)備、廢水、生產(chǎn)生活垃圾、棄渣的控制和治理,遵守有防火及廢棄物處理的規(guī)章制度,做好交通環(huán)境疏導(dǎo),充分滿足便民要求,認(rèn)真接受城市交通管理,隨時接受相關(guān)單位的監(jiān)督檢查。
設(shè)由初始目標(biāo)集構(gòu)造的目標(biāo)攻擊方案As={Tj1,Tj2,…,Tjmax}(As為有序集,表示殲擊機按照順序執(zhí)行任務(wù))。則有
(1)Vi選擇目標(biāo)攻擊方案As的收益
(2)Vi選擇目標(biāo)攻擊方案As的代價
其中 ηi∈[0,1],表示 Vi選擇目標(biāo)攻擊方案 As的損耗;Thri(As)為Vi選擇方案As的威脅代價;Leni(As)為Vi選擇方案As的路徑代價。
(3)Vi為目標(biāo)攻擊方案As的選擇函數(shù)
式中,ξ和ω分別為權(quán)重系數(shù)。則Vi選擇函數(shù)最大分配方案為 A(i)=E-1i[max(Ei)];投標(biāo)過程中,Vi將此方案作為最終選擇方案進行投標(biāo)。
編隊在動態(tài)作戰(zhàn)環(huán)境下執(zhí)行作戰(zhàn)任務(wù)的過程中,會出現(xiàn)許多預(yù)先規(guī)劃時無法預(yù)料的突發(fā)任務(wù),為保證任務(wù)完成,需要根據(jù)對戰(zhàn)場態(tài)勢的實時評估,通過實時控制對作戰(zhàn)任務(wù)進行調(diào)整。如果編隊內(nèi)探測到新的目標(biāo),或者由于某架殲擊機被擊毀,其剩余作戰(zhàn)任務(wù)無法按照原計劃完成,因此需要對新出現(xiàn)的任務(wù)進行分配。首先由指揮飛機對新目標(biāo)進行優(yōu)先級排序得到新目標(biāo)序列{T1,T2,…,TX},然后按照優(yōu)先級由高到低的順序就新目標(biāo)進行競標(biāo),設(shè)當(dāng)前競標(biāo)任務(wù)為Tk,則殲擊機Vi執(zhí)行任務(wù)Tk的效能函數(shù),
其中,Bi(Tk)、Ci(Tk)分別為Vi執(zhí)行任務(wù)Tk的收益和代價,殲擊機Vi以執(zhí)行任務(wù)Tk的效能Eik為投標(biāo)值參與投標(biāo),待所有可參與任務(wù)的殲擊機均投標(biāo)完成后,指揮飛機從中選擇效能值最高的殲擊機作為中標(biāo)者負(fù)責(zé)執(zhí)行此任務(wù)。這種競標(biāo)方式具有較小的通訊量和計算量,可以解決在時間緊迫的動態(tài)戰(zhàn)場環(huán)境中的任務(wù)分配[9-15]。
(1)紅方兵力部署在兩個機場A1,A2,兩種類型的飛機P1,P2。如圖5所示。
(2)藍(lán)方目標(biāo)為驅(qū)護艦艇編隊。
(3)實施對這三艘艦艇的打擊任務(wù){(diào)T1,T2,T3},T1為對目標(biāo)毀傷效果O1為重創(chuàng),T2為對目標(biāo)毀傷效果O2為重創(chuàng),T3為對目標(biāo)毀傷效果O3為擊沉。
圖5 初始戰(zhàn)場態(tài)勢示意圖
依據(jù)CNP進行預(yù)先任務(wù)分配,在時間允許的條件下進行了多次競標(biāo),仿真結(jié)果如圖6所示。
可見,隨著競標(biāo)次數(shù)的增多,整體效能不斷增加,
圖6 分配方案整體效能變化曲線
經(jīng)過競標(biāo)后,整體效能接近定值。經(jīng)過預(yù)先任務(wù)分配后得到的分配結(jié)果,如圖7所示。
圖7 預(yù)先協(xié)同任務(wù)分配
如果在任務(wù)執(zhí)行過程中出現(xiàn)新任務(wù)要求,可經(jīng)過實時任務(wù)分配算法進行新一輪競標(biāo),在激烈的戰(zhàn)場環(huán)境中得到了較優(yōu)解,實現(xiàn)了對態(tài)勢變化的快速反應(yīng),如圖8所示。
圖8 動態(tài)任務(wù)分配
協(xié)同任務(wù)分配是編隊作戰(zhàn)指揮決策的關(guān)鍵技術(shù)之一,論文針對相關(guān)文獻中任務(wù)分配方法中存在的問題,基于MAS理論和合同網(wǎng)協(xié)議,建立了編隊系統(tǒng)結(jié)構(gòu)和任務(wù)分配模型,將任務(wù)優(yōu)先權(quán)引入任務(wù)分配模型中,建立了預(yù)先任務(wù)分配和作戰(zhàn)過程中實時任務(wù)分配模型,可以實現(xiàn)單架殲擊機執(zhí)行多個任務(wù)和多架殲擊機協(xié)同執(zhí)行同一任務(wù)分配模式,最后對模型進行了仿真驗證,結(jié)果證明了該方法在編隊協(xié)同任務(wù)分配過程中的有效性。
[1] David C H.Germinating a new SEAD:The implications of executing the SEAD mission[D].Alabama:School of Advanced Airpower Studies Air University,2001.
[2] Wellman M,Wurman P.Market-aware agents for a multi-agent world[J].Robotics and Autonomous Systems,1998,24(3):115-125.
[3] Schumacher C,Chandler P R,Rasmussen S J.Task allocation for wide area search munitions via network flow optimization[C]∥AIAA Guidance,Navigation,and Control Conference and Exhibit.Montreal:AIAA Press,2001:1-8.
[4] Chandler P R,Pachter M.Hierarchical control for autonomous teams[C]∥ AIAA Guidance,Navigation,and Control Conference and Exhibit.Montreal:AIAA Press,2001:632-642.
[5] Smith R G.The contract net protocol:high level communication and control in distributed problem solver[J].IEEE Trans.on Computers,1980,29(12):1104-1113.
[6] 王向東,魏 蓉,王文杰.基于擴展合同網(wǎng)的多Agent協(xié)作研究[J].微電子學(xué)與計算機,2008,25(4):108-111.
[7] 郭銳鋒,于 東,劉明烈,等.基于合同網(wǎng)的任務(wù)分配方法的研究[J].小型微型計算機系統(tǒng),1999,20(10):740-743.
[8] 寇英信,王 琳,周中良.多目標(biāo)攻擊條件下的作戰(zhàn)任務(wù)分配模型研究[J].系統(tǒng)仿真學(xué)報,2008,20(16):4408-4411.
[9] 席裕庚.預(yù)測控制[M].北京:國防工業(yè)出版社1993.1-10.
[10] 王杏林,曹曉東.概念建模[M].北京:國防工業(yè)出版社,2007:1-24.
[11] 趙 宇.編隊對海戰(zhàn)斗協(xié)同評審專家系統(tǒng)研究[D].廣州:海軍兵種指揮學(xué)院,2006.
[12] 冷 鋒,鄒振寧,伍 波.反輻射導(dǎo)彈作戰(zhàn)效能分析[J].戰(zhàn)術(shù)導(dǎo)彈技術(shù).2005,21(6):5-7.
[13] 彭征明,李云芝,羅小明.反輻射導(dǎo)彈毀傷能力評估研究[J].裝備指揮技術(shù)學(xué)院學(xué)報.2005,16(3):15-18.
[14] 羅 宇,黃風(fēng)雷,劉 彥.反輻射導(dǎo)彈對某型雷達(dá)目標(biāo)毀傷能力的評估[J].彈箭與制導(dǎo)學(xué)報.2005,25(1):139-141.
[15] 孫治國.艦載反艦導(dǎo)彈變加速機動作戰(zhàn)效能分析[D].西安:西北工業(yè)大學(xué),2007.