宗方勇 張 森 楊立強(qiáng)
(海軍裝備部駐重慶地區(qū)軍事代表局 重慶 400023)
未來海上戰(zhàn)爭(zhēng)的主要作戰(zhàn)樣式之一是“網(wǎng)絡(luò)中心戰(zhàn)(Net-centric Warfare,NCW)”,即使用計(jì)算機(jī)、高速數(shù)據(jù)鏈和網(wǎng)絡(luò)軟件等,將海軍作戰(zhàn)艦艇、作戰(zhàn)飛機(jī)和岸基軍事力量聯(lián)結(jié)成一個(gè)高度集中的計(jì)算機(jī)/通訊網(wǎng)絡(luò)。在該網(wǎng)絡(luò)中,各作戰(zhàn)單元將在高速和連續(xù)的基礎(chǔ)上共享大量的關(guān)鍵信息,將會(huì)大大提高海軍作戰(zhàn)的反應(yīng)速度、精度和有效性。網(wǎng)絡(luò)中心戰(zhàn)系統(tǒng)是一個(gè)分布式實(shí)時(shí)系統(tǒng),具有動(dòng)態(tài)性、異構(gòu)性、適應(yīng)性和協(xié)同性,對(duì)傳統(tǒng)的分布實(shí)時(shí)計(jì)算技術(shù)提出了巨大的挑戰(zhàn)。在網(wǎng)絡(luò)中心戰(zhàn)環(huán)境的海上戰(zhàn)爭(zhēng),戰(zhàn)場(chǎng)態(tài)勢(shì)復(fù)雜,信息瞬息萬變,武器種類繁多,如何完成陸、海、空等多個(gè)平臺(tái)上的多種武器有效地協(xié)同作戰(zhàn)是一個(gè)極其復(fù)雜的問題[1]。
本文就是在以上背景的基礎(chǔ)提出了一種基于MAS的多平臺(tái)協(xié)同作戰(zhàn)目標(biāo)分配方法,該方法采用了先進(jìn)的分布式人工智能技術(shù)中的Agent理論[2],首先建立了基于MAS的分布式的體系結(jié)構(gòu),然后采用多個(gè)平臺(tái)分布式計(jì)算的思想建立了整個(gè)作戰(zhàn)過程的武器目標(biāo)分配模式,并采用了一種基于合同網(wǎng)協(xié)議的武器目標(biāo)分配策略,最后通過圖例展示與分析對(duì)算法的性能進(jìn)行了研究。
設(shè)海上的作戰(zhàn)平臺(tái)總數(shù)為I,每個(gè)平臺(tái)上有Ki種武器,主要是各種型號(hào)的艦炮和導(dǎo)彈,其中,i=1,2,…,I。其中,k=1,2,…,Ki,建立如圖1所示的網(wǎng)絡(luò)結(jié)構(gòu)。各平臺(tái)間通過傳感器網(wǎng)絡(luò)達(dá)到了數(shù)據(jù)共享,平臺(tái)上的各武器是在平臺(tái)之上并且受對(duì)應(yīng)平臺(tái)的直接控制。
圖1 多平臺(tái)協(xié)同作戰(zhàn)的平臺(tái)武器關(guān)系圖
要防御的目標(biāo)主要有彈道導(dǎo)彈、巡航導(dǎo)彈、反輻射導(dǎo)彈等,在網(wǎng)絡(luò)信息共享的條件下,幾個(gè)平臺(tái)的傳感器構(gòu)成傳感器網(wǎng)絡(luò),它們可以隨時(shí)感知目標(biāo),在整個(gè)防御過程中,如何制定有效的武器目標(biāo)分配策略才能達(dá)到最佳的防御效果。根據(jù)武器目標(biāo)分配實(shí)時(shí)性的特點(diǎn),其分配不可能是整個(gè)作戰(zhàn)過程的最優(yōu),為此,將每個(gè)平臺(tái)看作分布式計(jì)算的一個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)根據(jù)其傳感器信息向所有可能的武器發(fā)起一次目標(biāo)分配。此時(shí),若其它平臺(tái)也發(fā)現(xiàn)了目標(biāo)同樣可以向空閑的武器發(fā)起目標(biāo)分配,從而在整個(gè)網(wǎng)絡(luò)中形成一個(gè)分布式分配模式[3]。
為了實(shí)現(xiàn)上面的分配思想,首先應(yīng)建立基于MAS分布式分配的體系結(jié)構(gòu),由兩種智能體模型組成,分別是平臺(tái)智能體(Platform Agent,PA)、武器智能體(Weapon Agent,WA),其詳細(xì)結(jié)構(gòu)如圖2所示。
圖2中,T1、T2、…、Tn表示整個(gè)網(wǎng)絡(luò)中要執(zhí)行的任務(wù),任務(wù)一般由一個(gè)或多個(gè)要打擊的目標(biāo)構(gòu)成,存貯于相應(yīng)地PA中,并由PA根據(jù)傳感器的信息隨時(shí)進(jìn)行更新;WA(1,1)表示第1個(gè)平臺(tái)的第1個(gè)武器智能體(WA),一個(gè)平臺(tái)內(nèi)的指揮員、PA、WA和傳感器構(gòu)成局部網(wǎng)絡(luò),多個(gè)平臺(tái)間構(gòu)成完整的作戰(zhàn)網(wǎng)絡(luò)。
圖2 基于MAS的分布式目標(biāo)分配的體系結(jié)構(gòu)
WA接收來自PA的指揮并執(zhí)行由PA發(fā)布攻擊指令,具體的發(fā)射參數(shù)解算與發(fā)射控制由WA自己完成,此外在緊急可特殊情況下,WA也接收由指揮人員的直接控制。在WA進(jìn)行武器解算和發(fā)射的過程,其目標(biāo)的動(dòng)態(tài)信息直接來自于傳感器網(wǎng)絡(luò)。
從系統(tǒng)的體系結(jié)構(gòu)中可以看出,WA智能體是以平臺(tái)上的武器為基礎(chǔ)而建立的,以武器為單位選擇智能體是因?yàn)槊總€(gè)武器具有自己的能力,它的一些相關(guān)性能參數(shù)對(duì)每個(gè)武器系統(tǒng)來說是基本相同的,便于智能體對(duì)相關(guān)參數(shù)的計(jì)算。下面分別對(duì)平臺(tái)智能體和武器智能體進(jìn)行介紹。
PA對(duì)應(yīng)于網(wǎng)絡(luò)中的每個(gè)作戰(zhàn)平臺(tái)。平臺(tái)智能體PA主要由以下幾部分組成:知識(shí)庫、數(shù)據(jù)庫、任務(wù)分配模塊、推理決策模塊、任務(wù)管理模塊,以及通信模塊構(gòu)成,其結(jié)構(gòu)模型如圖3所示。
圖3 平臺(tái)智能體(PA)結(jié)構(gòu)示意圖
PA的設(shè)計(jì)原則是按照程序自動(dòng)執(zhí)行的,以獲得快速的反應(yīng)時(shí)間,其與指揮員交互的環(huán)節(jié)均由平臺(tái)指控系統(tǒng)或武器火控系統(tǒng)完成。
PA的知識(shí)庫內(nèi)容為靜態(tài)知識(shí),主要包括進(jìn)行作戰(zhàn)網(wǎng)絡(luò)武器目標(biāo)分配所需的信息,比如武器之間相互影響因素、火力和電磁兼容信息等。
數(shù)據(jù)庫的內(nèi)容為動(dòng)態(tài)信息,包括目標(biāo)的更新信息、武器當(dāng)前使用情況、作戰(zhàn)網(wǎng)絡(luò)態(tài)勢(shì)變換信息等動(dòng)態(tài)變化的信息。數(shù)據(jù)庫的動(dòng)態(tài)信息在需要的時(shí)候可以轉(zhuǎn)化為知識(shí)庫的靜態(tài)知識(shí),其自身的內(nèi)容也可通過通信模塊接收外部信息進(jìn)行更新。
任務(wù)分配模塊:與其余平臺(tái)協(xié)同完成武器目標(biāo)分配任務(wù);
任務(wù)管理模塊:對(duì)任務(wù)進(jìn)行管理,如增刪、修改等;
推理決策模塊:負(fù)責(zé)對(duì)PA接收到的協(xié)同指令進(jìn)行分析處理;
通信模塊為WA提供統(tǒng)一的接口形式,完成與WA、指揮員、傳感器和其它PA的通信。
WA對(duì)應(yīng)于編隊(duì)中的每個(gè)武器系統(tǒng),根據(jù)武器系統(tǒng)的特性[3]及模型的特點(diǎn),主要應(yīng)由知識(shí)庫、數(shù)據(jù)庫、學(xué)習(xí)模塊、效能評(píng)估模塊、目標(biāo)分配模塊、其它模塊等構(gòu)成,其基本結(jié)構(gòu)如圖4所示。在協(xié)同決策中用到的幾個(gè)部分介紹如下:
圖4 武器智能體(WA)的結(jié)構(gòu)示意圖
1)知識(shí)庫的內(nèi)容為靜態(tài)知識(shí),主要包括該WA自身的能力信息即有關(guān)的屬性、性能、效能評(píng)估參數(shù)、效能評(píng)估和目標(biāo)分配的工作日志文件等;其中有些信息和參數(shù)可以由學(xué)習(xí)模塊進(jìn)行修改。
2)數(shù)據(jù)庫的內(nèi)容為動(dòng)態(tài)知識(shí),主要有當(dāng)前WA的狀態(tài)和PA發(fā)送的實(shí)時(shí)目標(biāo)信息組成。
3)效能評(píng)估模塊主要是采用設(shè)定的數(shù)學(xué)模型對(duì)當(dāng)前幾個(gè)武器系統(tǒng)的打擊效能進(jìn)行評(píng)估。
4)目標(biāo)分配模塊主要完成合同網(wǎng)分配過程中的相關(guān)消息傳遞和合同建立行為。
5)通信模塊為WA提供和PA統(tǒng)一的接口形式,完成與PA、傳感器網(wǎng)絡(luò)和其它WA的通信。
合同網(wǎng)協(xié)議[4~5](Contact Net Protocol,簡(jiǎn)稱CNP)是MAS中經(jīng)典的資源分配算法,它模擬市場(chǎng)中的招投標(biāo)行為:招標(biāo)者有一項(xiàng)任務(wù)需要處理,將之在市場(chǎng)上招標(biāo),同時(shí)說明任務(wù)的性質(zhì)和要求。投標(biāo)者根據(jù)自身資源情況計(jì)算完成該任務(wù)的質(zhì)量、成本、時(shí)間等,折合成投標(biāo)值反饋給招標(biāo)者。招標(biāo)者根據(jù)投標(biāo)者的標(biāo)值選擇最后的中標(biāo)者,并與之簽訂合同,將任務(wù)交由它處理。其基本過程可以用以下四個(gè)過程來描述:
1)當(dāng)PA發(fā)現(xiàn)目標(biāo)時(shí),由PA的任務(wù)管理模塊將目標(biāo)轉(zhuǎn)化成任務(wù),然后由PA結(jié)合知識(shí)庫中所有WA的能力和狀態(tài)信息,選擇適當(dāng)能力和數(shù)目的WA,并同時(shí)向選中的候選WA發(fā)送當(dāng)前任務(wù);
2)候選WA根據(jù)當(dāng)前任務(wù),由其效能評(píng)估模塊根據(jù)知識(shí)庫的信息做出自己對(duì)任務(wù)完成情況的評(píng)估,并以參數(shù)Pij等的形式上報(bào)給PA;
3)PA根據(jù)任務(wù)分配模塊中的評(píng)價(jià)模型,結(jié)合候選WA發(fā)送的參數(shù)數(shù)據(jù),最終給出武器對(duì)目標(biāo)的分配方案,并將方案發(fā)送要執(zhí)行的候選WA;
4)選中的WA執(zhí)行指派的任務(wù),并隨時(shí)上報(bào)任務(wù)執(zhí)行情況。若任務(wù)完成,則由PA的任務(wù)管理模塊刪除該任務(wù),若沒有完成,則由PA作為新任務(wù)進(jìn)行重新分配。
以上就是一次分配中基于合同網(wǎng)協(xié)議的四個(gè)過程,可以總結(jié)為合同網(wǎng)協(xié)議中的招標(biāo)、發(fā)標(biāo)、中標(biāo)和建立合同的一個(gè)工作流程。這種分配方式可以很好得處理整個(gè)作戰(zhàn)網(wǎng)絡(luò)遇到的其它情況,充分表現(xiàn)了算法良好的適應(yīng)性,在此考慮兩個(gè)特殊情況的分配:
1)當(dāng)有新目標(biāo)出現(xiàn)時(shí)
當(dāng)系統(tǒng)檢測(cè)到新目標(biāo)時(shí),可以直接將新目標(biāo)作為新任務(wù)執(zhí)行。分配時(shí),在目標(biāo)出現(xiàn)前整個(gè)系統(tǒng)分配結(jié)果的基礎(chǔ)上,由某個(gè)PA主持對(duì)新任務(wù)進(jìn)行基于合同網(wǎng)的分配,將新任務(wù)分配給空閑的WA。
2)當(dāng)有平臺(tái)損失時(shí)
當(dāng)系統(tǒng)檢測(cè)有平臺(tái)損失時(shí),可以將損失平臺(tái)的任務(wù)作為新任務(wù)來執(zhí)行。分配時(shí),同樣在平臺(tái)損失前整個(gè)系統(tǒng)分配結(jié)果的基礎(chǔ)上,由某個(gè)PA主持對(duì)新任務(wù)進(jìn)行基于合同網(wǎng)的分配,將新任務(wù)分配給空閑的WA。
現(xiàn)采用提出的分布式模式及合同網(wǎng)協(xié)議對(duì)多平臺(tái)協(xié)同作戰(zhàn)情況下遇到的情況進(jìn)行分配,具體的態(tài)勢(shì)如下:
圖5 基于CPN的分布式分配
1)t1時(shí)刻,PA1平臺(tái)對(duì)任務(wù)T1進(jìn)行分配;
2)t2時(shí)刻,PA4平臺(tái)對(duì)任務(wù)T2進(jìn)行分配;
3)t3時(shí)刻,PA3平臺(tái)對(duì)任務(wù)T3進(jìn)行分配;
4)t4時(shí)刻,PA1平臺(tái)對(duì)任務(wù)T1重新進(jìn)行分配;
5)t5時(shí)刻,PA4平臺(tái)退出戰(zhàn)斗。
從整個(gè)分配算法及思想來看,該分布式武器協(xié)調(diào)算法充分體現(xiàn)了以下三個(gè)特點(diǎn):
1)首先是整個(gè)分配的體系結(jié)構(gòu)是分布式,進(jìn)行分配的算法也是分布式。各平臺(tái)和武器之間是平行關(guān)系,在整個(gè)分配過程中沒有主次之分,任何一個(gè)平臺(tái)都可以做為一次分配的發(fā)起者,任何武器都可以做為一次分配的響應(yīng)者。
2)整個(gè)分配過程體現(xiàn)了動(dòng)態(tài)性。該武器協(xié)調(diào)算法可以很方便地應(yīng)對(duì)作戰(zhàn)過程中敵我發(fā)生的新情況,如發(fā)現(xiàn)新目標(biāo),或者個(gè)別平臺(tái)和武器因某種原因退出戰(zhàn)斗等。
3)整個(gè)分配過程充分利用了各平臺(tái)和武器的交互。各平臺(tái)通過與位于不同平臺(tái)的武器進(jìn)行交互完成武器協(xié)調(diào),通過交互使武器協(xié)調(diào)是在共享整個(gè)網(wǎng)絡(luò)信息的基礎(chǔ)上合理有效進(jìn)行。
多平臺(tái)海上協(xié)同作戰(zhàn)面臨的環(huán)境極其復(fù)雜,必須實(shí)時(shí)處理大量的動(dòng)態(tài)信息,隨時(shí)做出攔截決策,遠(yuǎn)非指揮員人力可以勝任,因此自動(dòng)化、智能化的輔助決策系統(tǒng)是提高協(xié)同作戰(zhàn)效能的重要保證。本文提出利用MAS技術(shù)來分析、構(gòu)建多平臺(tái)協(xié)同作戰(zhàn)的分布式空輔助決策系統(tǒng),建立了系統(tǒng)的體系結(jié)構(gòu)模型,并重點(diǎn)研究了相關(guān)的基于合同網(wǎng)的分布式目標(biāo)分配算法。當(dāng)然本文也只是提出了一個(gè)初步的結(jié)構(gòu)體系,諸如整個(gè)系統(tǒng)的仿真及其分配算法的改進(jìn)這將在以后的工作中進(jìn)一步進(jìn)行完善。
[1]郁軍,賁可榮等譯.網(wǎng)絡(luò)中心戰(zhàn)與復(fù)雜性理論[M].北京:電子工業(yè)出版社,2004,9
[2]賈得民,劉剛,秦勇.基于智能Agent的動(dòng)態(tài)協(xié)作任務(wù)求解[M].北京:科學(xué)出版社,2007,9
[3]邢昌風(fēng),李敏勇,吳玲.艦載武器系統(tǒng)效能分析[M].北京:國防工業(yè)出版社,2007,10
[4]Smith,R.G.The contract net protocol:High-level communication and control in a distributed problem solver[J].IEEE Transaction on computers,1980(12)
[5]張海俊,史忠植.動(dòng)態(tài)合同網(wǎng)協(xié)議[J].計(jì)算機(jī)工程,2004,30(21):44~57