亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于知識(shí)庫的無人機(jī)作戰(zhàn)自主決策方法的研究

2020-08-03 01:50:22萬曉冬

計(jì)算機(jī)測(cè)量與控制 2020年7期

李維，萬曉冬

(1.南京航空航天大學(xué) 自動(dòng)化學(xué)院，南京 211100；2.通信網(wǎng)信息傳輸與分發(fā)技術(shù)重點(diǎn)實(shí)驗(yàn)室，石家莊 050000)

0 引言

近年來，軍用無人機(jī)迅速發(fā)展成了一種新型武器，在幾次高技術(shù)局部戰(zhàn)爭(zhēng)中發(fā)揮了重要作用。美軍在海灣戰(zhàn)爭(zhēng)、科索沃戰(zhàn)爭(zhēng)、阿富汗戰(zhàn)爭(zhēng)、伊拉克戰(zhàn)爭(zhēng)中對(duì)無人機(jī)的大量軍事運(yùn)用，特別是“捕食者”直接發(fā)射導(dǎo)彈攻擊地面目標(biāo)，更是將無人機(jī)的發(fā)展與使用推向了新的高潮[1-2]。

在現(xiàn)代空戰(zhàn)中，無人機(jī)需具備自主作戰(zhàn)的能力。在實(shí)際作戰(zhàn)中，指揮員難以處理大量的戰(zhàn)場(chǎng)信息，無法滿足作戰(zhàn)的實(shí)時(shí)性和適應(yīng)性的需求；并且為了應(yīng)對(duì)UAV 與地面任務(wù)控制站之間可能出現(xiàn)的通信中斷等突發(fā)狀況，提高作戰(zhàn)無人機(jī)自主決策能力是適應(yīng)現(xiàn)代化戰(zhàn)爭(zhēng)的必然趨勢(shì)[3-4]。

目前關(guān)于自主決策的方法有許多，如神經(jīng)網(wǎng)絡(luò)、基于黑板模型、基于案例推理[5-7]。為了充分利用指揮員已有的作戰(zhàn)經(jīng)驗(yàn)以提高無人機(jī)自主決策的能力，本文提出基于知識(shí)庫的自主決策方法。將指揮員的作戰(zhàn)經(jīng)驗(yàn)以特定的方式存入知識(shí)庫。無人機(jī)將結(jié)合作戰(zhàn)任務(wù)、目標(biāo)狀態(tài)以及系統(tǒng)狀態(tài)，依據(jù)知識(shí)庫中的作戰(zhàn)規(guī)則來制定一系列的作戰(zhàn)行動(dòng)。

1 無人機(jī)自主決策模型

無人機(jī)自主決策過程是對(duì)人腦思維模式和思維過程的模擬，其核心是知識(shí)庫。知識(shí)庫包括了模型庫(事實(shí)庫)、評(píng)估模型、規(guī)則庫。無人機(jī)平臺(tái)將傳感器系統(tǒng)的輸出處理為對(duì)狀態(tài)的認(rèn)知，然后通過知識(shí)庫來決定作戰(zhàn)行動(dòng)。知識(shí)庫好比指揮員的大腦，存儲(chǔ)了作戰(zhàn)經(jīng)驗(yàn)，比如攻擊煉油廠時(shí)，較好的攻擊武器是AGM-65“小?！笨盏貙?dǎo)彈，因?yàn)檫@類帶導(dǎo)彈擊中目標(biāo)后容易引起大火，以達(dá)到最好的攻擊效果。這類簡(jiǎn)單直接的知識(shí)經(jīng)驗(yàn)很難用算法或者數(shù)據(jù)模型表達(dá)，若直接以if的方式鑲嵌到控制主系統(tǒng)中，將增大決策系統(tǒng)的耦合性，使系統(tǒng)變得臃腫不可維護(hù)。所以本文將上述類的作戰(zhàn)經(jīng)驗(yàn)以規(guī)則的方式存儲(chǔ)在知識(shí)庫中的規(guī)則庫中，將規(guī)則與程序隔離。還有些作戰(zhàn)規(guī)則是針對(duì)模糊的判斷做出的選擇，比如敵方目標(biāo)對(duì)我方威脅度大，應(yīng)立刻對(duì)其采取措施。其中威脅程度的大小是指揮員根據(jù)目標(biāo)信息以及我方狀態(tài)得到的模糊的主觀評(píng)估，如何表達(dá)這樣的評(píng)估知識(shí)也是構(gòu)建知識(shí)庫的重點(diǎn)。

無人機(jī)自主決策流程如圖1所示。模糊化是對(duì)傳感器數(shù)據(jù)進(jìn)行模糊化處理，得到連續(xù)變量的隸屬度，然后傳遞給貝葉斯網(wǎng)絡(luò)進(jìn)行評(píng)估。動(dòng)態(tài)貝葉斯評(píng)估網(wǎng)絡(luò)根據(jù)各項(xiàng)評(píng)估模型建立對(duì)應(yīng)的貝葉斯網(wǎng)絡(luò)，輸入離散變量與模糊后的連續(xù)變量證據(jù)，結(jié)合知識(shí)庫中的專家經(jīng)驗(yàn)得到評(píng)估結(jié)果。推理引擎根據(jù)輸入的事實(shí)與評(píng)估當(dāng)前狀態(tài)的評(píng)估結(jié)果，與規(guī)則庫中的規(guī)則進(jìn)行匹配，若匹配成功，執(zhí)行相應(yīng)的決策結(jié)果。

圖1 無人機(jī)自主決策流程圖

無人機(jī)平臺(tái)在執(zhí)行任務(wù)的過程中利用其自身的傳感器(如雷達(dá)、敵我識(shí)別器、電子支援設(shè)備等)對(duì)來自戰(zhàn)場(chǎng)的信息進(jìn)行采集，采集戰(zhàn)場(chǎng)信息經(jīng)過各傳感器的響應(yīng)處理后形成對(duì)戰(zhàn)場(chǎng)信息不同的表達(dá)，如戰(zhàn)場(chǎng)目標(biāo)的類型，特征，敵我屬性等。這些戰(zhàn)場(chǎng)信息經(jīng)過傳感器信息的處理和知識(shí)表達(dá)之后，無人機(jī)利用所建立的相應(yīng)貝葉斯網(wǎng)絡(luò)對(duì)傳感器信息和數(shù)據(jù)庫信息進(jìn)行融合，并將評(píng)估結(jié)果輸入規(guī)則引擎，規(guī)則引擎結(jié)合自身情況、數(shù)據(jù)庫信息以及各方面評(píng)估效果做出戰(zhàn)術(shù)性決策，決定下一步的行動(dòng)。

2 知識(shí)庫的構(gòu)建

知識(shí)庫是自主決策系統(tǒng)的核心部分。知識(shí)庫包括了模型庫(事實(shí)庫)、評(píng)估模型、規(guī)則庫。

2.1 模型庫(事實(shí)庫)

模型庫主要存儲(chǔ)目標(biāo)、無人機(jī)平臺(tái)、任務(wù)載荷的參數(shù)信息。

其中目標(biāo)主要指地面實(shí)體，包括動(dòng)態(tài)實(shí)體與靜態(tài)實(shí)體單元。動(dòng)態(tài)實(shí)體主要指具有機(jī)動(dòng)能力的作戰(zhàn)實(shí)體，如坦克、裝甲車輛；靜態(tài)實(shí)體主要指靜止的建筑、工事，如橋梁、指揮所、煉油廠等。

無人機(jī)的任務(wù)載荷主要涉及三類，分別是偵察監(jiān)視載荷、武器載荷、干擾載荷。其中偵察監(jiān)視載荷主要用于對(duì)目標(biāo)進(jìn)行搜索、識(shí)別跟蹤等。可通過測(cè)量與分析提供目標(biāo)的類型、位置、速度等信息，并提供武器瞄準(zhǔn)、發(fā)射所需數(shù)據(jù)。武器載荷指在無人機(jī)上進(jìn)行投射用于攻擊敵方目標(biāo)的武器裝備，根據(jù)用途可分為航空火箭彈、航空炸彈、制導(dǎo)炸彈、空空導(dǎo)彈、空地導(dǎo)彈等。進(jìn)行武器載荷選擇時(shí)可根據(jù)任務(wù)類型攜帶相應(yīng)的武器型號(hào)，由于選定的無人機(jī)平臺(tái)載重有一定的限制，所以對(duì)攜帶的武器數(shù)量也有相應(yīng)的約束。干擾載荷是指為無人機(jī)提供電子防護(hù)，還可用來干擾敵方雷達(dá)與攻擊武器的裝備，其中電子干擾機(jī)可與對(duì)敵方雷達(dá)進(jìn)行壓制，降低敵方搜索能力；另一種是干擾彈，如紅外干擾彈，用于制造假目標(biāo)，可誘騙敵方發(fā)射的紅外制導(dǎo)方式的武器，使無人機(jī)躲過敵人的攻擊。

這些實(shí)體與裝備模型可用動(dòng)態(tài)與靜態(tài)兩種參數(shù)描述。動(dòng)態(tài)參數(shù)用于描述當(dāng)前各實(shí)體的運(yùn)動(dòng)狀態(tài)、工作狀態(tài)、評(píng)估結(jié)果、屬性，其可作為條件用于觸發(fā)決策規(guī)則；靜態(tài)參數(shù)包括各實(shí)體的重量、長(zhǎng)度、體積、適用距離等常識(shí)性知識(shí)，用于決策過程中進(jìn)行與實(shí)際情況對(duì)比參考。

2.2 規(guī)則庫

規(guī)則庫存放的是專家經(jīng)驗(yàn)的決策知識(shí)，描述不同態(tài)勢(shì)與戰(zhàn)斗階段下無人機(jī)應(yīng)做出怎樣的行動(dòng)。為了對(duì)規(guī)則進(jìn)行統(tǒng)一的存儲(chǔ)管理，需要對(duì)作戰(zhàn)規(guī)則進(jìn)行形式化描述。因此選擇何種描述方法成為建立規(guī)則庫的關(guān)鍵。

規(guī)則庫采用產(chǎn)生式規(guī)則來描述作戰(zhàn)經(jīng)驗(yàn)知識(shí)，有作戰(zhàn)經(jīng)驗(yàn)的軍事人員將對(duì)地攻擊時(shí)用到的推斷與決策經(jīng)驗(yàn)總結(jié)出的一套戰(zhàn)術(shù)描述，作為制定產(chǎn)生式規(guī)則的基礎(chǔ)，然后經(jīng)過專家的分析和改進(jìn)，去掉冗余的態(tài)勢(shì)判斷，補(bǔ)全未知情況下的行動(dòng)措施，最后建立邏輯全覆蓋、合理完善的規(guī)則庫。

產(chǎn)生式規(guī)則由條件(IF)和結(jié)論(THEN)兩部分組成。具體結(jié)構(gòu)如下:

if 子句 1 or/and 子句 2

then 子句 3 or/and 子句4

通過深入研究無人作戰(zhàn)活動(dòng)的分類特點(diǎn)和組織形式，建立了將無人機(jī)各模塊屬性、狀態(tài)、行動(dòng)相結(jié)合的規(guī)則模型。

事實(shí)庫中使用面向?qū)ο蟮姆椒ǘx各個(gè)領(lǐng)域：目標(biāo)、無人機(jī)平臺(tái)(包括武器系統(tǒng)、雷達(dá)系統(tǒng)、飛控系統(tǒng))，環(huán)境等。根據(jù)實(shí)體的功能定義不同的狀態(tài)信息與數(shù)據(jù)信息。規(guī)則的前件包括對(duì)象的屬性以及狀態(tài)信息，屬性信息是對(duì)當(dāng)前數(shù)據(jù)的表示，狀態(tài)信息確定了當(dāng)前作戰(zhàn)階段，可用于控制流程；后件部分描述對(duì)情況下應(yīng)采取的作戰(zhàn)行動(dòng)。決策時(shí)，使用Rete算法進(jìn)行前向規(guī)則匹配[8]，當(dāng)滿足前件條件時(shí)，則觸發(fā)規(guī)則，執(zhí)行后件動(dòng)作。表1是部分規(guī)則示例。

表1 規(guī)則示例

2.3 基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的評(píng)估模型

在戰(zhàn)場(chǎng)中，指揮員需要根據(jù)戰(zhàn)場(chǎng)中態(tài)勢(shì)進(jìn)行決策。例如敵方目標(biāo)對(duì)我方產(chǎn)生較高威脅時(shí)，應(yīng)立刻對(duì)該目標(biāo)采取應(yīng)對(duì)處理。判斷目標(biāo)的威脅程度，即對(duì)傳感器得到而數(shù)據(jù)進(jìn)行融合形成對(duì)當(dāng)前態(tài)勢(shì)的描述，如何對(duì)這類評(píng)估知識(shí)進(jìn)行表達(dá)是本章的主要內(nèi)容。

本文采用了動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(DBN)[9]來進(jìn)行戰(zhàn)場(chǎng)態(tài)勢(shì)的評(píng)估，包括目標(biāo)威脅評(píng)估、打擊效果評(píng)估等。下面將以基于DBN的目標(biāo)威脅程度評(píng)估模型為例。

運(yùn)用貝葉斯網(wǎng)絡(luò)進(jìn)行威脅評(píng)估，首先需要確定影響目標(biāo)威脅程度判斷節(jié)點(diǎn)因素及其狀態(tài)，即確定貝葉斯網(wǎng)絡(luò)中的時(shí)間節(jié)點(diǎn)及其對(duì)應(yīng)的狀態(tài)；然后按照各事件之間的因果關(guān)系建立節(jié)點(diǎn)間的有向弧，表示事件之間的層次關(guān)系；然后確定貝葉斯網(wǎng)絡(luò)參數(shù)，及網(wǎng)絡(luò)中各節(jié)點(diǎn)的先驗(yàn)概率或邊緣概率；最后選擇合適的算法進(jìn)行推理[10]。

影響地面目標(biāo)威脅程度的因素是多樣的，結(jié)合空對(duì)地作戰(zhàn)的實(shí)際，得到影響目標(biāo)威脅評(píng)估的因素主要包括目標(biāo)企圖、目標(biāo)毀傷能力、我方目標(biāo)價(jià)值、目標(biāo)面向速度、目標(biāo)距離、方向、干擾能力、目標(biāo)類型?；陟o態(tài)貝葉斯網(wǎng)絡(luò)的目標(biāo)威脅評(píng)估網(wǎng)絡(luò)圖2，其對(duì)應(yīng)的節(jié)點(diǎn)狀態(tài)如下：

目標(biāo)威脅程度(TH)：高(H)，中(G)，低(L)；

目標(biāo)企圖(IN)：火力攻擊(A)，預(yù)警探測(cè)(S)，防空攔截(P)，電子干擾(E)；

毀傷能力(DE)：強(qiáng)(S)，中(M)，弱(W)；

我方價(jià)值(VA)：高(H)，較高(E)，中(M)，低(L)；

面向速度(V)：快(Q)，中(M)，慢(S)；

距離(S)：遠(yuǎn)(F)，中(M)，近(C)；

方向(D)：靠近(E)，遠(yuǎn)離(L)；

干擾能力(G)：強(qiáng)(H)，中(M)，弱(L)；

目標(biāo)類型(T)：雷達(dá)(T1),裝甲車輛(T2)，導(dǎo)彈陣地(T3)，高炮陣地(T4)。

圖2 目標(biāo)威脅評(píng)估網(wǎng)絡(luò)圖

在實(shí)際作戰(zhàn)過程中，目標(biāo)的狀態(tài)信息不是一成不變的，若只以某一時(shí)刻的信息作為后續(xù)決策的判斷依據(jù)將會(huì)造成巨大的誤差。所以本文采用了動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)，在靜態(tài)貝葉斯網(wǎng)絡(luò)中加入時(shí)間節(jié)點(diǎn)，將前一時(shí)刻的評(píng)估結(jié)果作為后一時(shí)刻的評(píng)估依據(jù)，能夠?qū)v史信息與最新的證據(jù)信息結(jié)合，提高評(píng)估系統(tǒng)的實(shí)時(shí)性與魯棒性。

在實(shí)際中，由于戰(zhàn)場(chǎng)信息的高度保密性，很難獲取大量的樣本數(shù)據(jù)進(jìn)行貝葉斯網(wǎng)絡(luò)參數(shù)的學(xué)習(xí)，因此本文采用專家知識(shí)來完成貝葉斯網(wǎng)絡(luò)的參數(shù)模型，并在實(shí)驗(yàn)中不斷優(yōu)化參數(shù)，使其接近真實(shí)狀態(tài)。

3 自主決策作戰(zhàn)過程及仿真分析

3.1 自主決策過程分析

在本文中的無人機(jī)自主決策作戰(zhàn)仿真過程中，當(dāng)無人機(jī)發(fā)現(xiàn)并鎖定目標(biāo)后，獲取目標(biāo)的類型、運(yùn)動(dòng)路徑、當(dāng)前位置等信息，加入無人機(jī)平臺(tái)的目標(biāo)集，決策模塊通過規(guī)則匹配，觸發(fā)目標(biāo)應(yīng)對(duì)規(guī)則，無人機(jī)平臺(tái)根據(jù)獲取的目標(biāo)信息進(jìn)行威脅評(píng)估，并根據(jù)相應(yīng)規(guī)則決定是攻擊、躲避還是忽略。若需要對(duì)目標(biāo)進(jìn)行打擊，觸發(fā)武器選擇規(guī)則，根據(jù)目標(biāo)類型、武器載荷等約束選擇合適的武器進(jìn)行打擊，打擊結(jié)束后進(jìn)行打擊效果評(píng)估，根據(jù)評(píng)估結(jié)果決定是否進(jìn)行二次打擊；若目標(biāo)威脅程度大，敵我勢(shì)力懸殊，無人機(jī)需要對(duì)目標(biāo)的攻擊進(jìn)行躲避，根據(jù)電子對(duì)抗規(guī)則，若被敵方雷達(dá)鎖定，可釋放金屬箔條對(duì)雷達(dá)進(jìn)行干擾，若敵方目標(biāo)發(fā)射紅外導(dǎo)彈，可使用紅外干擾機(jī)或紅外誘餌，在電子對(duì)抗的輔助下進(jìn)行機(jī)動(dòng)動(dòng)作對(duì)敵方的攻擊進(jìn)行規(guī)避，能有效逃離敵方的壓制；若目標(biāo)威脅程度低，無人機(jī)可忽略該目標(biāo)繼續(xù)進(jìn)行原偵察任務(wù)。在整個(gè)過程中，沒有依賴地面站的控制，無人機(jī)平臺(tái)一直循環(huán)更新目標(biāo)、態(tài)勢(shì)等信息，并根據(jù)獲取的信息不斷匹配相應(yīng)的規(guī)則，整個(gè)作戰(zhàn)流程根據(jù)無人機(jī)平臺(tái)以及目標(biāo)的狀態(tài)信息按照相應(yīng)的規(guī)則進(jìn)行驅(qū)動(dòng)，完成自主決策。該決策過程流程如圖3所示。

圖3 自主決策流程圖

3.2 仿真實(shí)驗(yàn)

針對(duì)上述自主決策流程，進(jìn)行無人機(jī)執(zhí)行簡(jiǎn)單察打任務(wù)的仿真實(shí)驗(yàn)實(shí)例。

3.2.1 作戰(zhàn)想定

我方無人機(jī)在警戒區(qū)域執(zhí)行偵察任務(wù)時(shí)，敵方裝甲車輛向我方軍事要地秘密潛入，且行進(jìn)速度較快。已知敵方裝甲車輛進(jìn)入無人機(jī)探測(cè)范圍。

3.2.2 實(shí)驗(yàn)平臺(tái)

本實(shí)驗(yàn)使用的是基于Agent[11]的仿真軟件：Repast[12]。實(shí)驗(yàn)中，進(jìn)行簡(jiǎn)單的戰(zhàn)場(chǎng)仿真[13]，并創(chuàng)建兩個(gè)實(shí)體模型：UAVAgent與TargetAgent。TargetAgent代表我方察打無人機(jī)，具有探測(cè)、決策、打擊功能；TargetAgent代表敵方裝甲車輛。下面主要介紹無人機(jī)Agent的構(gòu)建。

無人機(jī)Agent主要由五部分構(gòu)成，分別為無人機(jī)平臺(tái)、機(jī)載雷達(dá)模塊、飛行控制模塊、火力控制模塊、輔助防御模塊。

無人機(jī)平臺(tái)：主要由無人機(jī)決策系統(tǒng)構(gòu)成，無人機(jī)通過機(jī)載雷達(dá)模塊獲取目標(biāo)及環(huán)境信息，所獲信息進(jìn)入由動(dòng)態(tài)貝葉斯與規(guī)則推理組成的決策系統(tǒng)，得出決策結(jié)果，飛行控制、火力控制、輔助防御模塊根據(jù)該結(jié)果執(zhí)行相應(yīng)的動(dòng)作。

機(jī)載雷達(dá)模塊：該模塊執(zhí)行的動(dòng)作包括敵方地面目標(biāo)的搜索、目標(biāo)識(shí)別、目標(biāo)跟蹤、獲取目標(biāo)位置、速度、方位信息、目標(biāo)指示等。這些動(dòng)作的執(zhí)行根據(jù)無人機(jī)平臺(tái)的任務(wù)以及雷達(dá)模塊工作狀態(tài)由相應(yīng)的目標(biāo)探測(cè)規(guī)則觸發(fā)。雷達(dá)模塊根據(jù)雷達(dá)的相關(guān)參數(shù)，主要包括工作頻率、天線增益、發(fā)射機(jī)峰值功率、探測(cè)范圍、發(fā)現(xiàn)概率、虛警概率等。當(dāng)目標(biāo)進(jìn)入雷達(dá)探測(cè)距離后，并不一定能發(fā)現(xiàn)目標(biāo)，可以通過產(chǎn)生一個(gè)范圍為0到1的隨機(jī)數(shù)，將該數(shù)與發(fā)現(xiàn)概率相比較，若該隨機(jī)數(shù)大于發(fā)現(xiàn)概率，則目標(biāo)為被發(fā)現(xiàn)，若小于發(fā)現(xiàn)概率，則判定雷達(dá)探測(cè)到該目標(biāo)。

飛行控制模塊：無人機(jī)的機(jī)動(dòng)主要包括無人機(jī)平飛、轉(zhuǎn)彎、俯沖、等動(dòng)作的執(zhí)行。大多數(shù)無人作戰(zhàn)飛機(jī)所需的升力基本全部來源與機(jī)翼上下面壓力差形成的升力，沒有飛行速度，光靠氣流吹襲產(chǎn)生的升力是遠(yuǎn)遠(yuǎn)不夠的，所以無人作戰(zhàn)飛機(jī)在鎖定目標(biāo)后，并不能執(zhí)行懸停動(dòng)作，這樣，無人機(jī)平臺(tái)機(jī)動(dòng)就可能導(dǎo)致敵方目標(biāo)脫離機(jī)載偵察設(shè)備的視場(chǎng)范圍。仿真實(shí)驗(yàn)中，無人機(jī)不做復(fù)雜的機(jī)動(dòng)動(dòng)作，在向目標(biāo)點(diǎn)飛行時(shí)，主要采取直線平飛。當(dāng)在某區(qū)域執(zhí)行偵察任務(wù)時(shí)，開啟巡航模式，即航行軌跡為圓周。當(dāng)無人機(jī)偵察到敵方目標(biāo)時(shí)，為保持目標(biāo)在視場(chǎng)范圍內(nèi)執(zhí)行定常盤旋動(dòng)作。

火力控制模塊：當(dāng)無人機(jī)發(fā)射導(dǎo)彈后，導(dǎo)彈并不一定能夠擊中目標(biāo)，可以通過產(chǎn)生一個(gè)范圍為0到1的隨機(jī)數(shù)，將該數(shù)與導(dǎo)彈殺傷概率相比較，若該隨機(jī)數(shù)大于殺傷概率，則目標(biāo)未被擊中，若小于殺傷概率，則判定該目標(biāo)被擊中。目標(biāo)被擊中后不一定能被摧毀，因?yàn)槟繕?biāo)會(huì)有一定的裝甲、抗損傷能力，可將目標(biāo)裝甲能力用0到1之間的值標(biāo)定，將其與導(dǎo)彈殺傷力的乘積通過閾值比較進(jìn)行實(shí)際毀傷定性判定。

輔助防御模塊：該模塊主要?jiǎng)幼魇菈褐菩愿蓴_和防御干擾。當(dāng)無人機(jī)為躲避敵方地面警戒雷達(dá)探測(cè)時(shí)，通過自衛(wèi)干擾設(shè)備進(jìn)行壓制性干擾躲避敵方的探測(cè)與跟蹤。當(dāng)無人機(jī)被敵方警戒雷達(dá)鎖定后，根據(jù)敵方發(fā)射導(dǎo)彈類型選擇釋放箔條彈或者紅外干擾彈，以躲避敵方導(dǎo)彈的攻擊。

3.2.3 實(shí)驗(yàn)結(jié)果

UAVAgent的決策日志見表2，仿真展示見圖4，整個(gè)決策流程通過改變無人機(jī)平臺(tái)與目標(biāo)的狀態(tài)控制流程，其對(duì)應(yīng)的狀態(tài)值記錄如表3。

圖4 仿真展示圖

表2 決策仿真日志

Tick1時(shí)刻，Target進(jìn)入U(xiǎn)AV的雷達(dá)探測(cè)范圍內(nèi)，UAV的目標(biāo)隊(duì)列中加入該目標(biāo)，由表3可見此時(shí)Target處于被警告狀態(tài)，觸發(fā)UAV目標(biāo)應(yīng)對(duì)規(guī)則庫的相應(yīng)規(guī)則，對(duì)Target進(jìn)行威脅評(píng)估；Tick2時(shí)刻，威脅評(píng)估完成，Target處于評(píng)估完成狀態(tài)，威脅評(píng)估結(jié)果為高，Target的威脅狀態(tài)置為高，此時(shí)UAV觸發(fā)目標(biāo)打擊規(guī)則，對(duì)目標(biāo)進(jìn)行打擊準(zhǔn)備；Tick3時(shí)，Target處于打擊準(zhǔn)備狀態(tài)，武器分發(fā)為等待狀態(tài)，觸發(fā)武器選擇規(guī)則，并按照相應(yīng)的武器選擇規(guī)則進(jìn)行打擊武器選擇；Tick4時(shí)，武器選擇完成后，武器分發(fā)狀態(tài)為已分配狀態(tài)；Tick5時(shí)刻，Target處于UAV打擊范圍內(nèi)后，觸發(fā)相應(yīng)打擊規(guī)則，進(jìn)行武器發(fā)射,如圖4(b)；Tick6時(shí)，打擊結(jié)束，Target處于已攻擊狀態(tài)，觸發(fā)相應(yīng)毀傷評(píng)估規(guī)則，進(jìn)行打擊效果評(píng)估；Tick7時(shí)，打擊效果達(dá)標(biāo)，目標(biāo)處于被摧毀狀態(tài)，觸發(fā)相應(yīng)規(guī)則，UAV的目標(biāo)隊(duì)列中Target被移除，打擊任務(wù)完成,如圖4(c)。在上述仿真過程中，UAVAgent通過感知并使用評(píng)估網(wǎng)絡(luò)獲取當(dāng)前態(tài)勢(shì)，設(shè)置各模塊的狀態(tài)值并觸發(fā)相應(yīng)的規(guī)則，做出對(duì)應(yīng)的行動(dòng)，動(dòng)作完成時(shí)改變各模塊狀態(tài)值，觸發(fā)新的規(guī)則，以此不斷推進(jìn)任務(wù)的完成，完成自主決策。

表3 狀態(tài)值記錄表

4 結(jié)束語

結(jié)合人腦的思維模式和思維過程，提出基于知識(shí)庫來實(shí)現(xiàn)無人機(jī)的自主決策。知識(shí)庫主要用以存儲(chǔ)軍事作戰(zhàn)經(jīng)驗(yàn)。通過規(guī)則匹配的方式進(jìn)行決策，能避免神經(jīng)網(wǎng)絡(luò)等理論進(jìn)行模型構(gòu)建帶來的困難和一些不確定因素，而且從實(shí)驗(yàn)看，此決策過程是可行的。下一步工作是對(duì)無人機(jī)領(lǐng)域模型的完善，并加入環(huán)境態(tài)勢(shì)，提高無人機(jī)復(fù)雜態(tài)勢(shì)下的自主決策能力。