李 波,越凱強(qiáng),范盤龍,田琳宇
(1 西北工業(yè)大學(xué) 電子信息學(xué)院,陜西 西安 710129;2 中國電子科技集團(tuán)公司 數(shù)據(jù)鏈技術(shù)重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710068;3 中國航空工業(yè)集團(tuán)公司 西安航空計(jì)算技術(shù)研究所,陜西 西安 710068)
空戰(zhàn)中,準(zhǔn)確及時(shí)地了解敵方作戰(zhàn)情報(bào)可以為我方作戰(zhàn)指揮決策提供有利的支撐[1-4],在交戰(zhàn)中如果能預(yù)先知道敵方目標(biāo)的作戰(zhàn)意圖[5],就能推測敵方作戰(zhàn)計(jì)劃,做到“知己知彼”,進(jìn)而“百戰(zhàn)不殆”。
明確了目標(biāo)的作戰(zhàn)意圖,即掌握了目標(biāo)作戰(zhàn)動(dòng)向和敵方作戰(zhàn)趨勢,我方?jīng)Q策者就可以根據(jù)這些意圖信息采取針對(duì)性的決策方案。在識(shí)別目標(biāo)意圖過程中[6-7],需要收集大量的領(lǐng)域?qū)<蚁闰?yàn)知識(shí)[8],并且用這些先驗(yàn)知識(shí)構(gòu)建基于模板匹配的意圖識(shí)別知識(shí)庫[9],以規(guī)則的形式表示目標(biāo)行為狀態(tài)與意圖的關(guān)系,一旦目標(biāo)狀態(tài)滿足某種規(guī)則,則觸發(fā)事件檢測[10],最后依據(jù)意圖推理機(jī)推理得出目標(biāo)作戰(zhàn)意圖。當(dāng)前研究利用專家知識(shí)和貝葉斯概念[11]構(gòu)建基于專家知識(shí)的貝葉斯意圖識(shí)別網(wǎng)絡(luò)[12-13],并且將貝葉斯意圖識(shí)別網(wǎng)絡(luò)作為意圖推理機(jī)使用。該方法可以較好地表達(dá)目標(biāo)狀態(tài)特征與具體意圖之間的關(guān)系,但是需要大量專家經(jīng)驗(yàn),對(duì)先驗(yàn)概率[14]進(jìn)行量化也較困難。意圖識(shí)別是一個(gè)系統(tǒng)性問題,如果不考慮時(shí)間的先后順序以及信息獲取的遞增性,就不能有效說明和利用戰(zhàn)場態(tài)勢信息中的時(shí)序特征和前后邏輯關(guān)系。因此,意圖識(shí)別既要考慮時(shí)效問題,同時(shí)也要綜合分析短期和長期戰(zhàn)場態(tài)勢[15]的特征。目前大部分文獻(xiàn)對(duì)目標(biāo)意圖識(shí)別中的時(shí)序性問題研究得不夠深入,意圖識(shí)別需要在該方面進(jìn)行突破。
三支決策[16-18]是近年來提出的一種處理不確定信息的方法,該方法根據(jù)一定的評(píng)價(jià)函數(shù)和閾值對(duì)整個(gè)區(qū)域進(jìn)行分類,將一個(gè)統(tǒng)一的集合劃分成3個(gè)互不相交的區(qū)域。與傳統(tǒng)的二支決策相比,三支決策在接受和拒絕2種決策之外給出了第3種選擇:延遲決策,從而避免了直接接受或者拒絕帶來的風(fēng)險(xiǎn)。本文將序貫思想[19]引入三支決策中,提出了一種基于多類別序貫三支決策的意圖識(shí)別模型,按照時(shí)間順序?qū)⒁鈭D識(shí)別過程分為多個(gè)階段,對(duì)于因目標(biāo)信息不充分而無法確定目標(biāo)意圖的情況,使用延遲決策,待下一階段獲得更多目標(biāo)信息后,繼續(xù)對(duì)目標(biāo)意圖重新進(jìn)行識(shí)別,以此來解決意圖識(shí)別中存在的時(shí)序性問題,降低意圖誤識(shí)別的損失。
多類別三支決策信息系統(tǒng)定義為
S=(U,A,V,f)。
(1)
式中:U為對(duì)象的集合;A=(C∪D)是信息系統(tǒng)上的屬性集合,C為條件屬性,D為決策屬性;V表示屬性的取值范圍;f表示從對(duì)象到屬性取值的信息函數(shù),即f:U×A→V,它指定了U中每個(gè)對(duì)象的屬性值。
D=(D1,D2,…,Dn)表示根據(jù)決策屬性形成的n個(gè)互不相交的決策狀態(tài)集合,對(duì)于每個(gè)決策類Dj(j=1,2,…,n),分別形成它的一個(gè)二分類{Dj,(Dj)C},(Dj)C=∪jt≠tDjt。給定行動(dòng)集合A={aP,aB,aN},其中aPj、aBj、aNj分別表示將對(duì)象x分類到P(Dj)、B(Dj)、N(Dj)的3種行為,Dj的正域、負(fù)域和邊界域的判別為
P(αj,βj)(Dj)={x∈U|r(Dj|x)≥αj},
B(αj,βj)(Dj)={x∈U|βj N(αj,βj)(Dj)={x∈U|r(Dj|x)≤βj}。 (2) 式中:x表示論域U中的對(duì)象;r(Dj|x)表示對(duì)象x屬于Dj的條件概率;(αj,βj)作為決策類Dj的三支決策閾值,計(jì)算公式為 αj=(λPN(Dj)-λBN(Dj))/((λPN(Dj)-λBN(Dj))+(λBP(Dj)-λPP(Dj))), βj=(λBN(Dj)-λNN(Dj))/((λBN(Dj)-λNN(Dj))+(λNP(Dj)-λBP(Dj)))。 (3) λPP(Dj)、λNP(Dj)、λBP(Dj)表示x∈Dj時(shí),將對(duì)象x放入Dj的正域、負(fù)域和邊界域時(shí)的損失函數(shù)值;λPN(Dj)、λNN(Dj)、λBN(Dj)表示x∈(Dj)C時(shí),將對(duì)象x分別放入Dj的正域、負(fù)域和邊界域時(shí)的損失函數(shù)值。 給定決策信息表 S=(U,A,V,f)。 (4) 論域U={x}表示戰(zhàn)場中敵方目標(biāo);A=(C∪D)是信息系統(tǒng)上的屬性集合,C為條件屬性集,表示戰(zhàn)場中獲得的目標(biāo)信息,D為決策屬性集,表示目標(biāo)意圖的集合。本文中設(shè)置的目標(biāo)可能意圖種類有5種,即D={D1,D2,…,D5},分別表示攻擊、偵察、突防、電子干擾和規(guī)避,這5種意圖涵蓋了空戰(zhàn)目標(biāo)的大部分可能意圖。C表示目標(biāo)信息,即包含了戰(zhàn)場中每一時(shí)刻的目標(biāo)特征向量,用Y=(yi1,yi2,…,yit)T表示第i時(shí)刻目標(biāo)的特征向量,(y1,y2,…,yt)分別表示數(shù)值化處理后目標(biāo)的高度、速度、航向角和敵我距離等t種目標(biāo)特征屬性,其中數(shù)值化處理采用的是最大最小歸一化處理方法[20]。 本節(jié)將結(jié)合序貫思想和多類別三支決策構(gòu)建多階段意圖識(shí)別結(jié)構(gòu),根據(jù)Yao提出的多類別三支決策模型[21],依次做出每個(gè)分類的三支決策,從而對(duì)每個(gè)階段的目標(biāo)意圖識(shí)別進(jìn)行多類別分類。對(duì)于因信息不足而被分類到邊界域或者負(fù)域的對(duì)象,將通過更新下一階段意圖識(shí)別中的條件屬性集C的信息,對(duì)信息不足的對(duì)象重新進(jìn)行決策,使得決策過程隨著時(shí)間的推移而逐漸精細(xì)化。 由于目標(biāo)特征信息的獲取存在時(shí)序性,所以在目標(biāo)意圖識(shí)別中,條件信息屬性應(yīng)按照時(shí)間段表示,即設(shè)條件屬性為 C={C1,C2,…,Ck}。 (5) 應(yīng)滿足C1?C2?…?Ck,表示在k個(gè)不同階段得到的目標(biāo)信息。D={D1,D2,…,Dn},表示目標(biāo)意圖空間,即每一個(gè)目標(biāo)都存在n個(gè)可能意圖。因此,一個(gè)完整的序貫三支決策應(yīng)該定義如下。 定義目標(biāo)意圖識(shí)別系統(tǒng)為 S=(S1,S2,…,Sk)。 (6) (7) (8) 表1 意圖決策損失函數(shù)矩陣 由2.1節(jié)的識(shí)別模型可知,目標(biāo)存在的n個(gè)意圖可能集合,會(huì)對(duì)論域?qū)ο蠹茨繕?biāo)x進(jìn)行n次決策劃分,也會(huì)依次形成n個(gè)意圖決策類的正域、邊界域和負(fù)域。但是,這種決策方法會(huì)使得意圖決策存在沖突,即同一目標(biāo)對(duì)象會(huì)被劃分到不同決策類的正域,或同一目標(biāo)對(duì)象被劃分到一個(gè)決策類的邊界域和另一個(gè)決策類的負(fù)域或正域等多種情況。針對(duì)這種情況,下面將給出幾種識(shí)別過程。 識(shí)別情形1給定第i階段決策結(jié)構(gòu)為 Si=(Ui,Ci,Di)。 (9) 識(shí)別情形2給定第i階段決策結(jié)構(gòu)為 Si=(Ui,Ci,Di)。 (10) Si+1=(Ui+1,Ci+1,Di+1), (11) 則有 Ui+1=Ui={x},Ci+1=Ci+Cnewii+1, (12) 式中:Cnewii+1表示第i階段到第i+1階段新獲取到的目標(biāo)的條件信息。對(duì)于單目標(biāo)意圖識(shí)別,每一階段決策結(jié)構(gòu)的論域是一樣的;對(duì)于多目標(biāo)意圖識(shí)別,則可將每一個(gè)目標(biāo)單獨(dú)按照單目標(biāo)識(shí)別來進(jìn)行。 識(shí)別情形3給定第i階段決策結(jié)構(gòu)為 Si=(Ui,Ci,Di)。 (13) Si+1=(Ui+1,Ci+1,Di+1), (14) 則有 Ui+1=Ui={x},Ci+1=Ci+Cnewii+1, (15) 對(duì)于可能出現(xiàn)的其他情形,根據(jù)其發(fā)生概率與決策閾值的關(guān)系,都可以劃分到本文給出的3種基本情形之中。具體算法如下。 算法1 多類別序貫三支決策解決目標(biāo)作戰(zhàn)意圖識(shí)別問題輸入:決策信息系統(tǒng)Si=(U,Ci∪D,Vi,fi),i=1,2,…,k;輸出:目標(biāo)作戰(zhàn)意圖T=Dj;初始化Ui=U,T=?;for i = 1 to k 設(shè)置目標(biāo)初始可能意圖集合D=(D1i,D2i,…,Dni); 獲取當(dāng)前目標(biāo)特征信息Ci; for j = 1 to n 計(jì)算P(αji,βji)(Dji)、B(αji,βji)(Dji)、N(αji,βji)(Dji) if P(αji,βji)(Dji)=? Dji+1=Dji-∪Dji//∪Dji∈N(αji,βji)(Dji) else Dji+1=∪Dji//∪Dji∈P(αji,βji)(Dji) Ti=∪Dji end if end for 更新目標(biāo)信息Cireturn T=Ti 在現(xiàn)實(shí)空戰(zhàn)中,戰(zhàn)場態(tài)勢變化速度快,目標(biāo)作戰(zhàn)意圖可能會(huì)隨著戰(zhàn)場態(tài)勢的變化而作出相應(yīng)的調(diào)整,倘若我方的戰(zhàn)術(shù)策略仍按照最先識(shí)別出的目標(biāo)意圖進(jìn)行決策,很可能會(huì)使我方飛機(jī)陷入困境,從而面臨威脅。因此,在多類別序貫三支決策目標(biāo)意圖識(shí)別模型的基礎(chǔ)上,對(duì)意圖識(shí)別過程稍加改進(jìn)。圖1為改進(jìn)后的意圖識(shí)別具體流程圖,對(duì)已經(jīng)明確識(shí)別出作戰(zhàn)意圖的目標(biāo),在原來信息的基礎(chǔ)上,每隔一定的時(shí)間Tit,對(duì)目標(biāo)意圖重新進(jìn)行識(shí)別。對(duì)未明確識(shí)別出作戰(zhàn)意圖的目標(biāo),則仍依照原有的方法繼續(xù)對(duì)目標(biāo)進(jìn)行意圖識(shí)別。 圖1 改進(jìn)型意圖識(shí)別流程圖 作戰(zhàn)設(shè)想:設(shè)定目標(biāo)的空間初始位置為(60,60,7),單位km;初始速度為270 m/s;初始方位角為-90°,朝y軸負(fù)方向飛行,俯仰角為0°。我方作戰(zhàn)飛機(jī)的空間初始位置為(10,10,6),單位km;初始速度為240 m/s;初始方位角為50°,俯仰角為0°。 圖2是雙方飛機(jī)的空戰(zhàn)三維軌跡圖。在發(fā)現(xiàn)目標(biāo)之后,我機(jī)便開始跟蹤目標(biāo),不斷獲取目標(biāo)的信息。目標(biāo)在發(fā)現(xiàn)我機(jī)之后,便開始以突防的形式向我方逼近。 圖2 空戰(zhàn)軌跡圖 本文直接給出各意圖的三支決策閾值,如表2所示。 表2 三支決策閾值表 圖3為序貫多類別三支決策模型下的目標(biāo)意圖識(shí)別結(jié)果示意圖。 圖3 實(shí)驗(yàn)一目標(biāo)意圖識(shí)別結(jié)果示意圖 如圖3a為傳統(tǒng)二支決策意圖識(shí)別結(jié)果,可以看出在意圖識(shí)別過程中沒有識(shí)別出目標(biāo)的準(zhǔn)確意圖。圖3b為三支決策意圖識(shí)別模型的識(shí)別結(jié)果。識(shí)別前期,目標(biāo)信息獲取較少,存在攻擊和突防意圖的可能。在識(shí)別中期,由于目標(biāo)下降到較低的飛行高度,符合目標(biāo)進(jìn)行低空偵察的可能,所以該時(shí)間段內(nèi)偵察意圖與攻擊和突防意圖同樣進(jìn)入了意圖結(jié)果的備選選項(xiàng)。到了后期,隨著敵我距離的不斷接近,突防意圖也就轉(zhuǎn)變成了攻擊意圖,這與實(shí)際空戰(zhàn)較為符合,因?yàn)樵谡鎸?shí)空戰(zhàn)中,若敵方飛機(jī)不斷接近且不做規(guī)避機(jī)動(dòng),則很大概率為攻擊意圖。 作戰(zhàn)想定:設(shè)定目標(biāo)的空間初始位置為(50,50,7),單位km;初始速度為270 m/s;初始方位角為-90°,朝y軸負(fù)方向飛行,俯仰角為0°;目標(biāo)當(dāng)前正在執(zhí)行偵察搜索任務(wù)。我方作戰(zhàn)飛機(jī)的空間初始位置為(10,10,6),單位km;初始速度為240 m/s;初始方位角為50°,俯仰角為0°。 圖4是雙方飛機(jī)的空戰(zhàn)三維軌跡圖。在發(fā)現(xiàn)目標(biāo)之后,我機(jī)便開始跟蹤目標(biāo),不斷獲取目標(biāo)的信息。 圖4 空戰(zhàn)軌跡圖 各意圖的三支決策閾值同表2。 圖5a為傳統(tǒng)二支決策意圖識(shí)別結(jié)果,識(shí)別結(jié)果最終為電子干擾和攻擊意圖,未能準(zhǔn)確識(shí)別敵機(jī)作戰(zhàn)意圖。圖5b為三支決策意圖識(shí)別模型的識(shí)別結(jié)果。識(shí)別前期由于目標(biāo)信息不充足,所以意圖識(shí)別結(jié)果存在多種可能;而到了識(shí)別后期,目標(biāo)信息逐漸增多,目標(biāo)意圖則確定為電子干擾,這與實(shí)際空戰(zhàn)較為符合,因?yàn)樵谡鎸?shí)空戰(zhàn)過程中,敵方飛機(jī)不斷做S型機(jī)動(dòng),在我方飛機(jī)靠近過程中,敵方未改變機(jī)動(dòng)方式,因此其作戰(zhàn)意圖為電子干擾的概率較大。 圖5 實(shí)驗(yàn)二意圖識(shí)別結(jié)果示意圖 本文針對(duì)三支決策方法具有延遲決策的特點(diǎn)以及意圖識(shí)別的時(shí)序性問題,提出了基于序貫三支決策的意圖識(shí)別模型,將多類別三支決策應(yīng)用到目標(biāo)意圖識(shí)別中,把意圖識(shí)別過程按照時(shí)序性分成了多個(gè)階段,對(duì)于某個(gè)階段未識(shí)別出目標(biāo)意圖的情況,意圖識(shí)別模型將會(huì)在下一階段獲得目標(biāo)新信息的基礎(chǔ)上,重新對(duì)目標(biāo)進(jìn)行意圖識(shí)別,進(jìn)而解決意圖識(shí)別中存在的時(shí)序性問題,提高意圖識(shí)別準(zhǔn)確性的同時(shí)有效降低意圖誤識(shí)別的代價(jià)損失。1.2 三支決策與意圖識(shí)別的對(duì)應(yīng)關(guān)系
2 基于序貫三支決策的目標(biāo)意圖識(shí)別
2.1 序貫三支決策意圖識(shí)別數(shù)學(xué)模型
2.2 意圖識(shí)別情形
3 仿真分析
3.1 實(shí)驗(yàn)一
3.2 實(shí)驗(yàn)二
4 結(jié)論