李 維 ,萬曉冬
(1.南京航空航天大學(xué) 自動(dòng)化學(xué)院, 南京 211100;2.通信網(wǎng)信息傳輸與分發(fā)技術(shù)重點(diǎn)實(shí)驗(yàn)室, 石家莊 050000)
近年來,軍用無人機(jī)迅速發(fā)展成了一種新型武器,在幾次高技術(shù)局部戰(zhàn)爭(zhēng)中發(fā)揮了重要作用。美軍在海灣戰(zhàn)爭(zhēng)、科索沃戰(zhàn)爭(zhēng)、阿富汗戰(zhàn)爭(zhēng)、伊拉克戰(zhàn)爭(zhēng)中對(duì)無人機(jī)的大量軍事運(yùn)用,特別是“捕食者”直接發(fā)射導(dǎo)彈攻擊地面目標(biāo),更是將無人機(jī)的發(fā)展與使用推向了新的高潮[1-2]。
在現(xiàn)代空戰(zhàn)中,無人機(jī)需具備自主作戰(zhàn)的能力。在實(shí)際作戰(zhàn)中,指揮員難以處理大量的戰(zhàn)場(chǎng)信息,無法滿足作戰(zhàn)的實(shí)時(shí)性和適應(yīng)性的需求;并且為了應(yīng)對(duì)UAV 與地面任務(wù)控制站之間可能出現(xiàn)的通信中斷等突發(fā)狀況,提高作戰(zhàn)無人機(jī)自主決策能力是適應(yīng)現(xiàn)代化戰(zhàn)爭(zhēng)的必然趨勢(shì)[3-4]。
目前關(guān)于自主決策的方法有許多,如神經(jīng)網(wǎng)絡(luò)、基于黑板模型、基于案例推理[5-7]。為了充分利用指揮員已有的作戰(zhàn)經(jīng)驗(yàn)以提高無人機(jī)自主決策的能力,本文提出基于知識(shí)庫的自主決策方法。將指揮員的作戰(zhàn)經(jīng)驗(yàn)以特定的方式存入知識(shí)庫。無人機(jī)將結(jié)合作戰(zhàn)任務(wù)、目標(biāo)狀態(tài)以及系統(tǒng)狀態(tài),依據(jù)知識(shí)庫中的作戰(zhàn)規(guī)則來制定一系列的作戰(zhàn)行動(dòng)。
無人機(jī)自主決策過程是對(duì)人腦思維模式和思維過程的模擬,其核心是知識(shí)庫。知識(shí)庫包括了模型庫(事實(shí)庫)、評(píng)估模型、規(guī)則庫。無人機(jī)平臺(tái)將傳感器系統(tǒng)的輸出處理為對(duì)狀態(tài)的認(rèn)知,然后通過知識(shí)庫來決定作戰(zhàn)行動(dòng)。知識(shí)庫好比指揮員的大腦,存儲(chǔ)了作戰(zhàn)經(jīng)驗(yàn),比如攻擊煉油廠時(shí),較好的攻擊武器是AGM-65“小?!笨盏貙?dǎo)彈,因?yàn)檫@類帶導(dǎo)彈擊中目標(biāo)后容易引起大火,以達(dá)到最好的攻擊效果。這類簡(jiǎn)單直接的知識(shí)經(jīng)驗(yàn)很難用算法或者數(shù)據(jù)模型表達(dá),若直接以if的方式鑲嵌到控制主系統(tǒng)中,將增大決策系統(tǒng)的耦合性,使系統(tǒng)變得臃腫不可維護(hù)。所以本文將上述類的作戰(zhàn)經(jīng)驗(yàn)以規(guī)則的方式存儲(chǔ)在知識(shí)庫中的規(guī)則庫中,將規(guī)則與程序隔離。還有些作戰(zhàn)規(guī)則是針對(duì)模糊的判斷做出的選擇,比如敵方目標(biāo)對(duì)我方威脅度大,應(yīng)立刻對(duì)其采取措施。其中威脅程度的大小是指揮員根據(jù)目標(biāo)信息以及我方狀態(tài)得到的模糊的主觀評(píng)估,如何表達(dá)這樣的評(píng)估知識(shí)也是構(gòu)建知識(shí)庫的重點(diǎn)。
無人機(jī)自主決策流程如圖1所示。模糊化是對(duì)傳感器數(shù)據(jù)進(jìn)行模糊化處理,得到連續(xù)變量的隸屬度,然后傳遞給貝葉斯網(wǎng)絡(luò)進(jìn)行評(píng)估。動(dòng)態(tài)貝葉斯評(píng)估網(wǎng)絡(luò)根據(jù)各項(xiàng)評(píng)估模型建立對(duì)應(yīng)的貝葉斯網(wǎng)絡(luò),輸入離散變量與模糊后的連續(xù)變量證據(jù),結(jié)合知識(shí)庫中的專家經(jīng)驗(yàn)得到評(píng)估結(jié)果。推理引擎根據(jù)輸入的事實(shí)與評(píng)估當(dāng)前狀態(tài)的評(píng)估結(jié)果,與規(guī)則庫中的規(guī)則進(jìn)行匹配,若匹配成功,執(zhí)行相應(yīng)的決策結(jié)果。
圖1 無人機(jī)自主決策流程圖
無人機(jī)平臺(tái)在執(zhí)行任務(wù)的過程中利用其自身的傳感器(如雷達(dá)、敵我識(shí)別器、電子支援設(shè)備等)對(duì)來自戰(zhàn)場(chǎng)的信息進(jìn)行采集,采集戰(zhàn)場(chǎng)信息經(jīng)過各傳感器的響應(yīng)處理后形成對(duì)戰(zhàn)場(chǎng)信息不同的表達(dá),如戰(zhàn)場(chǎng)目標(biāo)的類型,特征,敵我屬性等。這些戰(zhàn)場(chǎng)信息經(jīng)過傳感器信息的處理和知識(shí)表達(dá)之后,無人機(jī)利用所建立的相應(yīng)貝葉斯網(wǎng)絡(luò)對(duì)傳感器信息和數(shù)據(jù)庫信息進(jìn)行融合,并將評(píng)估結(jié)果輸入規(guī)則引擎,規(guī)則引擎結(jié)合自身情況、數(shù)據(jù)庫信息以及各方面評(píng)估效果做出戰(zhàn)術(shù)性決策,決定下一步的行動(dòng)。
知識(shí)庫是自主決策系統(tǒng)的核心部分。知識(shí)庫包括了模型庫(事實(shí)庫)、評(píng)估模型、規(guī)則庫。
模型庫主要存儲(chǔ)目標(biāo)、無人機(jī)平臺(tái)、任務(wù)載荷的參數(shù)信息。
其中目標(biāo)主要指地面實(shí)體,包括動(dòng)態(tài)實(shí)體與靜態(tài)實(shí)體單元。動(dòng)態(tài)實(shí)體主要指具有機(jī)動(dòng)能力的作戰(zhàn)實(shí)體,如坦克、裝甲車輛;靜態(tài)實(shí)體主要指靜止的建筑、工事,如橋梁、指揮所、煉油廠等。
無人機(jī)的任務(wù)載荷主要涉及三類,分別是偵察監(jiān)視載荷、武器載荷、干擾載荷。其中偵察監(jiān)視載荷主要用于對(duì)目標(biāo)進(jìn)行搜索、識(shí)別跟蹤等。可通過測(cè)量與分析提供目標(biāo)的類型、位置、速度等信息,并提供武器瞄準(zhǔn)、發(fā)射所需數(shù)據(jù)。武器載荷指在無人機(jī)上進(jìn)行投射用于攻擊敵方目標(biāo)的武器裝備,根據(jù)用途可分為航空火箭彈、航空炸彈、制導(dǎo)炸彈、空空導(dǎo)彈、空地導(dǎo)彈等。進(jìn)行武器載荷選擇時(shí)可根據(jù)任務(wù)類型攜帶相應(yīng)的武器型號(hào),由于選定的無人機(jī)平臺(tái)載重有一定的限制,所以對(duì)攜帶的武器數(shù)量也有相應(yīng)的約束。干擾載荷是指為無人機(jī)提供電子防護(hù),還可用來干擾敵方雷達(dá)與攻擊武器的裝備,其中電子干擾機(jī)可與對(duì)敵方雷達(dá)進(jìn)行壓制,降低敵方搜索能力;另一種是干擾彈,如紅外干擾彈,用于制造假目標(biāo),可誘騙敵方發(fā)射的紅外制導(dǎo)方式的武器,使無人機(jī)躲過敵人的攻擊。
這些實(shí)體與裝備模型可用動(dòng)態(tài)與靜態(tài)兩種參數(shù)描述。動(dòng)態(tài)參數(shù)用于描述當(dāng)前各實(shí)體的運(yùn)動(dòng)狀態(tài)、工作狀態(tài)、評(píng)估結(jié)果、屬性,其可作為條件用于觸發(fā)決策規(guī)則;靜態(tài)參數(shù)包括各實(shí)體的重量、長(zhǎng)度、體積、適用距離等常識(shí)性知識(shí),用于決策過程中進(jìn)行與實(shí)際情況對(duì)比參考。
規(guī)則庫存放的是專家經(jīng)驗(yàn)的決策知識(shí),描述不同態(tài)勢(shì)與戰(zhàn)斗階段下無人機(jī)應(yīng)做出怎樣的行動(dòng)。為了對(duì)規(guī)則進(jìn)行統(tǒng)一的存儲(chǔ)管理,需要對(duì)作戰(zhàn)規(guī)則進(jìn)行形式化描述。因此選擇何種描述方法成為建立規(guī)則庫的關(guān)鍵。
規(guī)則庫采用產(chǎn)生式規(guī)則來描述作戰(zhàn)經(jīng)驗(yàn)知識(shí),有作戰(zhàn)經(jīng)驗(yàn)的軍事人員將對(duì)地攻擊時(shí)用到的推斷與決策經(jīng)驗(yàn)總結(jié)出的一套戰(zhàn)術(shù)描述,作為制定產(chǎn)生式規(guī)則的基礎(chǔ),然后經(jīng)過專家的分析和改進(jìn),去掉冗余的態(tài)勢(shì)判斷,補(bǔ)全未知情況下的行動(dòng)措施,最后建立邏輯全覆蓋、合理完善的規(guī)則庫。
產(chǎn)生式規(guī)則由條件(IF)和結(jié)論(THEN)兩部分組成。具體結(jié)構(gòu)如下:
if 子句 1 or/and 子句 2
then 子句 3 or/and 子句4
通過深入研究無人作戰(zhàn)活動(dòng)的分類特點(diǎn)和組織形式,建立了將無人機(jī)各模塊屬性、狀態(tài)、行動(dòng)相結(jié)合的規(guī)則模型。
事實(shí)庫中使用面向?qū)ο蟮姆椒ǘx各個(gè)領(lǐng)域:目標(biāo)、無人機(jī)平臺(tái)(包括武器系統(tǒng)、雷達(dá)系統(tǒng)、飛控系統(tǒng)),環(huán)境等。根據(jù)實(shí)體的功能定義不同的狀態(tài)信息與數(shù)據(jù)信息。規(guī)則的前件包括對(duì)象的屬性以及狀態(tài)信息,屬性信息是對(duì)當(dāng)前數(shù)據(jù)的表示,狀態(tài)信息確定了當(dāng)前作戰(zhàn)階段,可用于控制流程;后件部分描述對(duì)情況下應(yīng)采取的作戰(zhàn)行動(dòng)。決策時(shí),使用Rete算法進(jìn)行前向規(guī)則匹配[8],當(dāng)滿足前件條件時(shí),則觸發(fā)規(guī)則,執(zhí)行后件動(dòng)作。表1是部分規(guī)則示例。
表1 規(guī)則示例
在戰(zhàn)場(chǎng)中,指揮員需要根據(jù)戰(zhàn)場(chǎng)中態(tài)勢(shì)進(jìn)行決策。例如敵方目標(biāo)對(duì)我方產(chǎn)生較高威脅時(shí),應(yīng)立刻對(duì)該目標(biāo)采取應(yīng)對(duì)處理。判斷目標(biāo)的威脅程度,即對(duì)傳感器得到而數(shù)據(jù)進(jìn)行融合形成對(duì)當(dāng)前態(tài)勢(shì)的描述,如何對(duì)這類評(píng)估知識(shí)進(jìn)行表達(dá)是本章的主要內(nèi)容。
本文采用了動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(DBN)[9]來進(jìn)行戰(zhàn)場(chǎng)態(tài)勢(shì)的評(píng)估,包括目標(biāo)威脅評(píng)估、打擊效果評(píng)估等。下面將以基于DBN的目標(biāo)威脅程度評(píng)估模型為例。
運(yùn)用貝葉斯網(wǎng)絡(luò)進(jìn)行威脅評(píng)估,首先需要確定影響目標(biāo)威脅程度判斷節(jié)點(diǎn)因素及其狀態(tài),即確定貝葉斯網(wǎng)絡(luò)中的時(shí)間節(jié)點(diǎn)及其對(duì)應(yīng)的狀態(tài);然后按照各事件之間的因果關(guān)系建立節(jié)點(diǎn)間的有向弧,表示事件之間的層次關(guān)系;然后確定貝葉斯網(wǎng)絡(luò)參數(shù),及網(wǎng)絡(luò)中各節(jié)點(diǎn)的先驗(yàn)概率或邊緣概率;最后選擇合適的算法進(jìn)行推理[10]。
影響地面目標(biāo)威脅程度的因素是多樣的,結(jié)合空對(duì)地作戰(zhàn)的實(shí)際,得到影響目標(biāo)威脅評(píng)估的因素主要包括目標(biāo)企圖、目標(biāo)毀傷能力、我方目標(biāo)價(jià)值、目標(biāo)面向速度、目標(biāo)距離、方向、干擾能力、目標(biāo)類型?;陟o態(tài)貝葉斯網(wǎng)絡(luò)的目標(biāo)威脅評(píng)估網(wǎng)絡(luò)圖2,其對(duì)應(yīng)的節(jié)點(diǎn)狀態(tài)如下:
目標(biāo)威脅程度(TH):高(H),中(G),低(L);
目標(biāo)企圖(IN):火力攻擊(A),預(yù)警探測(cè)(S),防空攔截(P),電子干擾(E);
毀傷能力(DE):強(qiáng)(S),中(M),弱(W);
我方價(jià)值(VA):高(H),較高(E),中(M),低(L);
面向速度(V):快(Q),中(M),慢(S);
距離(S):遠(yuǎn)(F),中(M),近(C);
方向(D):靠近(E),遠(yuǎn)離(L);
干擾能力(G):強(qiáng)(H),中(M),弱(L);
目標(biāo)類型(T):雷達(dá)(T1),裝甲車輛(T2),導(dǎo)彈陣地(T3),高炮陣地(T4)。
圖2 目標(biāo)威脅評(píng)估網(wǎng)絡(luò)圖
在實(shí)際作戰(zhàn)過程中,目標(biāo)的狀態(tài)信息不是一成不變的,若只以某一時(shí)刻的信息作為后續(xù)決策的判斷依據(jù)將會(huì)造成巨大的誤差。所以本文采用了動(dòng)態(tài)貝葉斯網(wǎng)絡(luò),在靜態(tài)貝葉斯網(wǎng)絡(luò)中加入時(shí)間節(jié)點(diǎn),將前一時(shí)刻的評(píng)估結(jié)果作為后一時(shí)刻的評(píng)估依據(jù),能夠?qū)v史信息與最新的證據(jù)信息結(jié)合,提高評(píng)估系統(tǒng)的實(shí)時(shí)性與魯棒性。
在實(shí)際中,由于戰(zhàn)場(chǎng)信息的高度保密性,很難獲取大量的樣本數(shù)據(jù)進(jìn)行貝葉斯網(wǎng)絡(luò)參數(shù)的學(xué)習(xí),因此本文采用專家知識(shí)來完成貝葉斯網(wǎng)絡(luò)的參數(shù)模型,并在實(shí)驗(yàn)中不斷優(yōu)化參數(shù),使其接近真實(shí)狀態(tài)。
在本文中的無人機(jī)自主決策作戰(zhàn)仿真過程中,當(dāng)無人機(jī)發(fā)現(xiàn)并鎖定目標(biāo)后,獲取目標(biāo)的類型、運(yùn)動(dòng)路徑、當(dāng)前位置等信息,加入無人機(jī)平臺(tái)的目標(biāo)集,決策模塊通過規(guī)則匹配,觸發(fā)目標(biāo)應(yīng)對(duì)規(guī)則,無人機(jī)平臺(tái)根據(jù)獲取的目標(biāo)信息進(jìn)行威脅評(píng)估,并根據(jù)相應(yīng)規(guī)則決定是攻擊、躲避還是忽略。若需要對(duì)目標(biāo)進(jìn)行打擊,觸發(fā)武器選擇規(guī)則,根據(jù)目標(biāo)類型、武器載荷等約束選擇合適的武器進(jìn)行打擊,打擊結(jié)束后進(jìn)行打擊效果評(píng)估,根據(jù)評(píng)估結(jié)果決定是否進(jìn)行二次打擊;若目標(biāo)威脅程度大,敵我勢(shì)力懸殊,無人機(jī)需要對(duì)目標(biāo)的攻擊進(jìn)行躲避,根據(jù)電子對(duì)抗規(guī)則,若被敵方雷達(dá)鎖定,可釋放金屬箔條對(duì)雷達(dá)進(jìn)行干擾,若敵方目標(biāo)發(fā)射紅外導(dǎo)彈,可使用紅外干擾機(jī)或紅外誘餌,在電子對(duì)抗的輔助下進(jìn)行機(jī)動(dòng)動(dòng)作對(duì)敵方的攻擊進(jìn)行規(guī)避,能有效逃離敵方的壓制;若目標(biāo)威脅程度低,無人機(jī)可忽略該目標(biāo)繼續(xù)進(jìn)行原偵察任務(wù)。在整個(gè)過程中,沒有依賴地面站的控制,無人機(jī)平臺(tái)一直循環(huán)更新目標(biāo)、態(tài)勢(shì)等信息,并根據(jù)獲取的信息不斷匹配相應(yīng)的規(guī)則,整個(gè)作戰(zhàn)流程根據(jù)無人機(jī)平臺(tái)以及目標(biāo)的狀態(tài)信息按照相應(yīng)的規(guī)則進(jìn)行驅(qū)動(dòng),完成自主決策。該決策過程流程如圖3所示。
圖3 自主決策流程圖
針對(duì)上述自主決策流程,進(jìn)行無人機(jī)執(zhí)行簡(jiǎn)單察打任務(wù)的仿真實(shí)驗(yàn)實(shí)例。
3.2.1 作戰(zhàn)想定
我方無人機(jī)在警戒區(qū)域執(zhí)行偵察任務(wù)時(shí),敵方裝甲車輛向我方軍事要地秘密潛入,且行進(jìn)速度較快。已知敵方裝甲車輛進(jìn)入無人機(jī)探測(cè)范圍。
3.2.2 實(shí)驗(yàn)平臺(tái)
本實(shí)驗(yàn)使用的是基于Agent[11]的仿真軟件:Repast[12]。實(shí)驗(yàn)中,進(jìn)行簡(jiǎn)單的戰(zhàn)場(chǎng)仿真[13],并創(chuàng)建兩個(gè)實(shí)體模型:UAVAgent與TargetAgent。TargetAgent代表我方察打無人機(jī),具有探測(cè)、決策、打擊功能;TargetAgent代表敵方裝甲車輛。下面主要介紹無人機(jī)Agent的構(gòu)建。
無人機(jī)Agent主要由五部分構(gòu)成,分別為無人機(jī)平臺(tái)、機(jī)載雷達(dá)模塊、飛行控制模塊、火力控制模塊、輔助防御模塊。
無人機(jī)平臺(tái):主要由無人機(jī)決策系統(tǒng)構(gòu)成,無人機(jī)通過機(jī)載雷達(dá)模塊獲取目標(biāo)及環(huán)境信息,所獲信息進(jìn)入由動(dòng)態(tài)貝葉斯與規(guī)則推理組成的決策系統(tǒng),得出決策結(jié)果,飛行控制、火力控制、輔助防御模塊根據(jù)該結(jié)果執(zhí)行相應(yīng)的動(dòng)作。
機(jī)載雷達(dá)模塊:該模塊執(zhí)行的動(dòng)作包括敵方地面目標(biāo)的搜索、目標(biāo)識(shí)別、目標(biāo)跟蹤、獲取目標(biāo)位置、速度、方位信息、目標(biāo)指示等。這些動(dòng)作的執(zhí)行根據(jù)無人機(jī)平臺(tái)的任務(wù)以及雷達(dá)模塊工作狀態(tài)由相應(yīng)的目標(biāo)探測(cè)規(guī)則觸發(fā)。 雷達(dá)模塊根據(jù)雷達(dá)的相關(guān)參數(shù),主要包括工作頻率、天線增益、發(fā)射機(jī)峰值功率、探測(cè)范圍、發(fā)現(xiàn)概率、虛警概率等。當(dāng)目標(biāo)進(jìn)入雷達(dá)探測(cè)距離后,并不一定能發(fā)現(xiàn)目標(biāo),可以通過產(chǎn)生一個(gè)范圍為0到1的隨機(jī)數(shù),將該數(shù)與發(fā)現(xiàn)概率相比較,若該隨機(jī)數(shù)大于發(fā)現(xiàn)概率,則目標(biāo)為被發(fā)現(xiàn),若小于發(fā)現(xiàn)概率,則判定雷達(dá)探測(cè)到該目標(biāo)。
飛行控制模塊:無人機(jī)的機(jī)動(dòng)主要包括無人機(jī)平飛、轉(zhuǎn)彎、俯沖、等動(dòng)作的執(zhí)行。大多數(shù)無人作戰(zhàn)飛機(jī)所需的升力基本全部來源與機(jī)翼上下面壓力差形成的升力,沒有飛行速度,光靠氣流吹襲產(chǎn)生的升力是遠(yuǎn)遠(yuǎn)不夠的,所以無人作戰(zhàn)飛機(jī)在鎖定目標(biāo)后,并不能執(zhí)行懸停動(dòng)作,這樣,無人機(jī)平臺(tái)機(jī)動(dòng)就可能導(dǎo)致敵方目標(biāo)脫離機(jī)載偵察設(shè)備的視場(chǎng)范圍。仿真實(shí)驗(yàn)中,無人機(jī)不做復(fù)雜的機(jī)動(dòng)動(dòng)作,在向目標(biāo)點(diǎn)飛行時(shí),主要采取直線平飛。當(dāng)在某區(qū)域執(zhí)行偵察任務(wù)時(shí),開啟巡航模式,即航行軌跡為圓周。當(dāng)無人機(jī)偵察到敵方目標(biāo)時(shí),為保持目標(biāo)在視場(chǎng)范圍內(nèi)執(zhí)行定常盤旋動(dòng)作。
火力控制模塊:當(dāng)無人機(jī)發(fā)射導(dǎo)彈后,導(dǎo)彈并不一定能夠擊中目標(biāo),可以通過產(chǎn)生一個(gè)范圍為0到1的隨機(jī)數(shù),將該數(shù)與導(dǎo)彈殺傷概率相比較,若該隨機(jī)數(shù)大于殺傷概率,則目標(biāo)未被擊中,若小于殺傷概率,則判定該目標(biāo)被擊中。目標(biāo)被擊中后不一定能被摧毀,因?yàn)槟繕?biāo)會(huì)有一定的裝甲、抗損傷能力,可將目標(biāo)裝甲能力用0到1之間的值標(biāo)定,將其與導(dǎo)彈殺傷力的乘積通過閾值比較進(jìn)行實(shí)際毀傷定性判定。
輔助防御模塊:該模塊主要?jiǎng)幼魇菈褐菩愿蓴_和防御干擾。當(dāng)無人機(jī)為躲避敵方地面警戒雷達(dá)探測(cè)時(shí),通過自衛(wèi)干擾設(shè)備進(jìn)行壓制性干擾躲避敵方的探測(cè)與跟蹤。當(dāng)無人機(jī)被敵方警戒雷達(dá)鎖定后,根據(jù)敵方發(fā)射導(dǎo)彈類型選擇釋放箔條彈或者紅外干擾彈,以躲避敵方導(dǎo)彈的攻擊。
3.2.3 實(shí)驗(yàn)結(jié)果
UAVAgent的決策日志見表2,仿真展示見圖4,整個(gè)決策流程通過改變無人機(jī)平臺(tái)與目標(biāo)的狀態(tài)控制流程,其對(duì)應(yīng)的狀態(tài)值記錄如表3。
圖4 仿真展示圖
表2 決策仿真日志
Tick1時(shí)刻,Target進(jìn)入U(xiǎn)AV的雷達(dá)探測(cè)范圍內(nèi),UAV的目標(biāo)隊(duì)列中加入該目標(biāo),由表3可見此時(shí)Target處于被警告狀態(tài),觸發(fā)UAV目標(biāo)應(yīng)對(duì)規(guī)則庫的相應(yīng)規(guī)則,對(duì)Target進(jìn)行威脅評(píng)估;Tick2時(shí)刻,威脅評(píng)估完成,Target處于評(píng)估完成狀態(tài),威脅評(píng)估結(jié)果為高,Target的威脅狀態(tài)置為高,此時(shí)UAV觸發(fā)目標(biāo)打擊規(guī)則,對(duì)目標(biāo)進(jìn)行打擊準(zhǔn)備;Tick3時(shí),Target處于打擊準(zhǔn)備狀態(tài),武器分發(fā)為等待狀態(tài),觸發(fā)武器選擇規(guī)則,并按照相應(yīng)的武器選擇規(guī)則進(jìn)行打擊武器選擇;Tick4時(shí),武器選擇完成后,武器分發(fā)狀態(tài)為已分配狀態(tài);Tick5時(shí)刻,Target處于UAV打擊范圍內(nèi)后,觸發(fā)相應(yīng)打擊規(guī)則,進(jìn)行武器發(fā)射,如圖4(b);Tick6時(shí),打擊結(jié)束,Target處于已攻擊狀態(tài),觸發(fā)相應(yīng)毀傷評(píng)估規(guī)則,進(jìn)行打擊效果評(píng)估;Tick7時(shí),打擊效果達(dá)標(biāo),目標(biāo)處于被摧毀狀態(tài),觸發(fā)相應(yīng)規(guī)則,UAV的目標(biāo)隊(duì)列中Target被移除,打擊任務(wù)完成,如圖4(c)。在上述仿真過程中,UAVAgent通過感知并使用評(píng)估網(wǎng)絡(luò)獲取當(dāng)前態(tài)勢(shì),設(shè)置各模塊的狀態(tài)值并觸發(fā)相應(yīng)的規(guī)則,做出對(duì)應(yīng)的行動(dòng),動(dòng)作完成時(shí)改變各模塊狀態(tài)值,觸發(fā)新的規(guī)則,以此不斷推進(jìn)任務(wù)的完成,完成自主決策。
表3 狀態(tài)值記錄表
結(jié)合人腦的思維模式和思維過程,提出基于知識(shí)庫來實(shí)現(xiàn)無人機(jī)的自主決策。知識(shí)庫主要用以存儲(chǔ)軍事作戰(zhàn)經(jīng)驗(yàn)。通過規(guī)則匹配的方式進(jìn)行決策,能避免神經(jīng)網(wǎng)絡(luò)等理論進(jìn)行模型構(gòu)建帶來的困難和一些不確定因素,而且從實(shí)驗(yàn)看,此決策過程是可行的。下一步工作是對(duì)無人機(jī)領(lǐng)域模型的完善,并加入環(huán)境態(tài)勢(shì),提高無人機(jī)復(fù)雜態(tài)勢(shì)下的自主決策能力。