陳黎,李芳芳,鄒長虹
(北京電子工程總體研究所,北京 100854)
空中目標意圖識別是防空作戰(zhàn)態(tài)勢評估的關鍵,是準確完成目標威脅評估、正確進行作戰(zhàn)決策的重要基礎[1-2]。但是,空中目標意圖識別涉及眾多影響因素,包括來襲目標的類型、攜帶的武器、慣用戰(zhàn)術動作等,特別是為了掩蓋其真實作戰(zhàn)意圖會釋放電磁干擾或做出一些欺騙行動來誘使我方得到錯誤的識別結果,同時考慮到我方預警探測系統提供的信息具有一定程度的不確定性,因此,要實時完成對空中來襲目標的作戰(zhàn)意圖進行準確識別具有一定的難度。目前,該問題已成為防空作戰(zhàn)態(tài)勢估計領域的研究熱點。
現有的空中目標意圖識別方法大致分為基于規(guī)則推理的方法和基于數據驅動的機器學習方法2類。其中,基于規(guī)則推理的方法有貝葉斯網絡[3-5]、證據推理[6-7]、模板匹配等方法[8-9]。貝葉斯網絡方法是在概率論框架下提出的,能夠有效實現定性知識與定量推理結合;證據推理方法能夠表征比貝葉斯網絡更弱的條件,具有較好的不確定性表達能力;模板匹配方法需要依據作戰(zhàn)規(guī)則事先構建目標意圖模板。基于數據驅動的機器學習方法有支持向量機、深度神經網絡以及強化學習等方法[10-15],它們都需要大量的訓練數據。
受限于目標運動航跡無法進行長時預測,現有基于規(guī)則推理的方法在進行意圖預測時大都依據推理規(guī)則和實時感知的目標特征信息估計當前時刻的目標作戰(zhàn)意圖;而基于數據驅動的機器學習方法雖然能夠利用預測模型和訓練數據對目標意圖進行預測,但預測準確率過度依賴訓練數據的質量?;诖耍疚奶岢鲆环N基于動態(tài)貝葉斯網絡和模板匹配的意圖識別方法,將意圖識別分為行動推理和意圖預測2 個環(huán)節(jié)。在行動推理環(huán)節(jié),不是根據目標運動航跡,而是根據目標當前的作戰(zhàn)行動,預測目標可能的行動序列;在意圖預測環(huán)節(jié),進一步基于目標可能的行動序列,對目標的作戰(zhàn)意圖進行實時預測。意圖預測過程充分利用了實時感知的目標特征信息、領域專家知識以及積累的歷史作戰(zhàn)態(tài)勢數據,進一步提升了意圖識別的準確率。
假定來襲目標實現一個意圖通常會逐一采取一系列相關作戰(zhàn)行動的方式來實現。從意圖的實現方來看,是一個自上而下的過程,即根據一定的條例和規(guī)則,從作戰(zhàn)意圖出發(fā),將作戰(zhàn)意圖或者作戰(zhàn)任務分解為行動序列,然后依次執(zhí)行行動序列達到實現作戰(zhàn)意圖或者作戰(zhàn)任務的目的[3]。
反過來,對意圖的識別方而言,其分析推理思路是自下而上的。由于來襲目標作戰(zhàn)意圖或者作戰(zhàn)任務的不可觀測性,不能直接進行估計,同時還存在一定的隱蔽性和欺騙性,只能根據可感知的目標各特征狀態(tài),經過基于相應規(guī)則或邏輯的分析推理,得到來襲目標的作戰(zhàn)意圖或者作戰(zhàn)任務。作戰(zhàn)意圖推理流程如圖1 所示。
圖1 作戰(zhàn)意圖推理流程Fig. 1 Reasoning process of combat intention
由圖1 可知,意圖識別方需要進行2 個環(huán)節(jié)的推理:一是由各目標特征信息推理預測得到目標可能的作戰(zhàn)行動序列;二是由目標可能的作戰(zhàn)行動序列推理識別得到目標的作戰(zhàn)意圖。完成這2 個過程的推理分析,就能夠最終得出來襲目標的作戰(zhàn)意圖。
構建如圖2 所示的動態(tài)貝葉斯網絡推理模型,綜合利用領域專家知識和積累的歷史作戰(zhàn)態(tài)勢數據,并根據實時感知的特征信息推理來襲目標當前的作戰(zhàn)行動,根據目標當前的作戰(zhàn)行動預測來襲目標可能的行動序列。
圖2 動態(tài)貝葉斯網絡推理模型Fig. 2 Reasoning model of dynamic Bayesian network
step 1:建立貝葉斯網絡結構。分析提取與目標作戰(zhàn)意圖相關的要素變量,依靠領域專家的知識來建立貝葉斯網絡結構,如圖3 所示。
圖3 貝葉斯網絡結構圖Fig. 3 Structure of Bayesian network
這里主要通過目標的類型、距離、速度、航向、飛行高度等要素來推測目標的作戰(zhàn)行動。
各節(jié)點要素的屬性狀態(tài)劃分如下:
目標類型:固定翼飛機、武裝直升機、無人機等;
距離:遠、中、近;
速度:大、中、??;
航向:穩(wěn)定、小幅變化、大幅變化;
慣用高度:超高、高、中、低、超低;
飛行高度:超高、高、中、低、超低;
制空程度:掌握程度大于80%,掌握程度約為50%,掌握程度小于20%;
作戰(zhàn)行動:高空盤旋、高空巡航、中空巡航、中空機動、低空巡航、低空機動、俯沖、爬升。
step 2:對網絡節(jié)點狀態(tài)建立隸屬度函數。從圖3 中各變量節(jié)點屬性狀態(tài)劃分來看,各節(jié)點屬性狀態(tài)的模糊劃分構成模糊集,對各模糊集建立隸屬度函數。
step 3:確定貝葉斯網絡參數。參數學習方法是在已知網絡結構的條件下,利用歷史作戰(zhàn)態(tài)勢數據來學習節(jié)點的參數,包括邊緣概率和條件概率。邊緣概率表現為來襲目標先前的戰(zhàn)術運用特點,條件概率表現為各要素之間的依賴關系。
這里采用E-M 算法估計節(jié)點的先驗概率和條件概率,E-M 算法具體描述如下:
輸入:G——貝葉斯網絡NN的結構;D——一組關于N中變量的訓練數據;δ——收斂閾值;
輸出:θ——N的參數的估計。
過程:
t= 0,θt= 隨機參數值
oldScore =L(θt|D)
while( true)
M 步:按下式計算θt+1:
newSore =L(θt+1|D)
i(fnewSore > oldScore +δ)
oldScore = newSore
t=t+ 1
else
returnθt+1
end while
step 4:在確定了貝葉斯網絡模型的拓撲結構和相應參數的條件下,利用實時獲取的目標特征信息推理空中目標的作戰(zhàn)行動。
構建如圖4 所示基于馬爾科夫鏈的作戰(zhàn)行動預測模型θ=(A,B,π),式中:A為馬爾科夫作戰(zhàn)行動轉移概率矩陣;B為單位矩陣;π為初始作戰(zhàn)行動概率向量。
圖4 基于馬爾科夫鏈的作戰(zhàn)行動預測Fig. 4 Combat operation prediction based on Markov chain
預測過程如下所述:
step 1:利用樣本數據估計狀態(tài)轉移概率aij。采用極大似然估計法進行估計,即
step 2:基于當前作戰(zhàn)行動進行n步預測。這里基于馬爾科夫鏈模型θ進行預測,計算預測作戰(zhàn)行動的條件概率,并剔除條件概率低于預置門限的作戰(zhàn)行動。
step 3:計算n步預測作戰(zhàn)行動的聯合概率。采用馬爾科夫鏈前向算法進行計算:
step 4:對n步預測作戰(zhàn)行動的聯合概率進行排序,取聯合概率最大的l條n步作戰(zhàn)行動,連同前m步已發(fā)生的作戰(zhàn)行動構成l條m+n步作戰(zhàn)行動序列。
目標作戰(zhàn)意圖或者作戰(zhàn)任務主要包括偵察、通信、佯攻、防區(qū)外打擊、臨空攻擊等,在獲取目標m+n步作戰(zhàn)行動序列后,進一步采用基于態(tài)勢模板匹配的方法完成目標作戰(zhàn)意圖識別?;趹B(tài)勢模板匹配的意圖識別方法如圖5 所示。
圖5 基于態(tài)勢模板匹配的意圖識別Fig. 5 Intention recognition based on situation template matching
主要包括3 個步驟:
step 1:基于C 語言集成產生式系統(C language integrated production system,CLIPS)CLIPS 方法構建態(tài)勢模板知識庫,根據作戰(zhàn)規(guī)則、專家經驗、作戰(zhàn)條例、作戰(zhàn)時段、敵方常用戰(zhàn)法等因素建立作戰(zhàn)行動與作戰(zhàn)意圖的IF-THEN 規(guī)則。
step 2:根據目標m+n步作戰(zhàn)行動序列,綜合態(tài)勢模板知識庫里的模板進行診斷,建立特定態(tài)勢假設的模板結構。建立特定態(tài)勢假設模板結構的過程與人的認知過程相對應,即從態(tài)勢模板知識庫里裁剪出適應于特定態(tài)勢的模板結構。
step 3:計算m+n步作戰(zhàn)行動序列與特定態(tài)勢模板結構的匹配程度,當匹配程度高于預設門限時,這個特定態(tài)勢模板結構就可以用來解釋來襲目標的作戰(zhàn)意圖。
對作戰(zhàn)行動序列輸出的作戰(zhàn)意圖進行D-S 證據融合,在利用Dempster 規(guī)則對證據融合時,如果證據沖突太大,融合結果會出現不合理的現象。這里對各證據的沖突程度進行量化度量,當證據沖突程度低于預設門限時,將融合后的目標意圖作為目標的作戰(zhàn)意圖,證據融合流程如下所示。
step 1:根據證據可靠度對各證據進行折扣,折扣因子α根據該證據對應作戰(zhàn)行動序列的聯合概率進行計算:
step 2:對作戰(zhàn)行動序列輸出的作戰(zhàn)意圖進行D-S 證據融合:
式中:
step 3:計算證據間的平均證據距離:
式中:
step 4:如果滿足下述條件,則融合后的作戰(zhàn)意圖即為來襲目標的作戰(zhàn)意圖:
式 中:m(X1) = max {m(Xi)} ;m(X2) = max {m(Xi)且Xi≠X1};ε1和ε2為預設門限。
下面在要地防空作戰(zhàn)場景下固定翼飛機執(zhí)行臨空攻擊作戰(zhàn)任務,基于表1 所示歷史態(tài)勢數據,并采用本文所提基于動態(tài)貝葉斯網絡和模板匹配的空中目標意圖識別方法對來襲目標的作戰(zhàn)意圖進行識別。
表1 歷史態(tài)勢數據Table 1 Historical situation data
飛行高度隸屬度函數、飛行速度隸屬度函數、距離隸屬度函數以及航向隸屬度函數分別見表2~5。
表2 飛行高度隸屬度函數Table 2 Flight height membership function
表3 飛行速度隸屬度函數Table 3 Flight velocity membership function
表4 距離隸屬度函數Table 4 Distance membership function
表5 航向隸屬度函數Table 5 Heading membership function
對表1 所示歷史態(tài)勢數據采用E-M 算法進行迭代估計網絡節(jié)點的先驗概率和條件概率,得到如圖6 所示的貝葉斯網絡推理模型。
圖6 貝葉斯網絡推理模型Fig. 6 Reasoning model of Bayesian network
當目標類型為固定翼飛機、距離為遠、速度為高、慣用高度為高、制空程度為小于20%、飛行高度為高的證據出現后,推理模型給出當前作戰(zhàn)行動為“高空巡航”,如圖7 所示。
圖7 特征信息推理當前作戰(zhàn)行動Fig. 7 Reasoning of current combat operations by feature information
進一步利用基于馬爾科夫鏈的作戰(zhàn)行動預測模 型θ=(A,B,π) 對 目 標 可 能 的 行 動 序 列 進 行預測。
step 1:利用樣本數據構建作戰(zhàn)行動預測模型如下:
step 2: 基于當前作戰(zhàn)行動進行3 步預測:
第1 步預測:
取預測概率門限為ξ1= 0.2,則第1 步預測可能的 作 戰(zhàn) 行 動 為:“俯 沖”(0.304),“低 空 巡 航”(0.201)。
第2 步預測:
取預測概率門限為ξ2= 0.15,則第2 步預測可能的作戰(zhàn)行動為:“低空巡航”(0.312),“中空巡航”(0.154),“低空機動”(0.151)。
第3 步預測:
取預測概率門限為ξ3= 0.15,則第3 步預測可能 的 作 戰(zhàn) 行 動 為:“低 空 巡 航”(0.284),“爬 升”(0.204),“中空巡航”(0.192)。
step 3: 計算3步預測作戰(zhàn)行動序列的聯合概率。
step 4: 對3 步預測作戰(zhàn)行動的聯合概率進行排序,取聯合概率最大的5 條3 步作戰(zhàn)行動,連同前1步已發(fā)生的作戰(zhàn)行動(高空巡航)構成5 條4 步作戰(zhàn)行動序列,見表6 所示。
表6 聯合概率最大的5 條作戰(zhàn)行動序列Table 6 Five combat operation sequences with maximum joint probability
采用Rete 匹配器對5 條4 步作戰(zhàn)行動序列進行規(guī)則匹配,匹配結果如表7 所示。
表7 預測行動序列匹配作戰(zhàn)意圖Table 7 Predicted operation sequence matching combat intention
對作戰(zhàn)行動序列輸出的作戰(zhàn)意圖進行D-S 證據融合,首先根據聯合概率對各證據進行折扣:
m(1臨空攻擊)=1,m(1H)=0;
m(2防區(qū)外打擊)=1,m(2H)=0;
m(3臨空攻擊)=0.422,m(3H)=0.578;
m(4防區(qū)外打擊)=0.625,m(4H)=0.375;
m(5臨空攻擊)=0.375,m(5H)=0.625.
進一步對各證據進行D-S 證據融合:
m(臨空攻擊)=0.509 2,
m(防區(qū)外打擊)=0.490 6,
m(H)=0.000 2.
表明此時證據沖突較大,無法得到來襲目標的作戰(zhàn)意圖。
當目標類型為固定翼飛機、距離為中、速度為高、航向大幅變化、制空程度為小于20%、飛行高度為中的證據出現后,預測行動序列匹配的作戰(zhàn)意圖如表8 所示。
表8 預測行動序列匹配作戰(zhàn)意圖Table 8 Predicted operation sequence matching combat intention
對各證據進行D-S 證據融合:
m(臨空攻擊)=0.880 6,
m(防區(qū)外打擊)=0.119 3,
m(H)=0.000 1.
此時證據間的平均證據距離dˉ= 0.395 <ε2=0.6,同 時m(臨空攻擊)-m(防區(qū)外打擊) >ε1=0.5,表明證據沖突不大,故將融合識別結果“臨空攻擊”作為來襲目標的作戰(zhàn)意圖。
進一步采用本文所提方法在不同場景下對來襲目標的作戰(zhàn)意圖進行識別, 識別準確率如表9所示。
表9 不同場景下的識別準確率Table 9 Recognition accuracy in different scenarios
從上述仿真過程可以看出,該方法由于充分利用了積累的歷史作戰(zhàn)態(tài)勢數據、實時感知的目標運動、屬性等特征信息以及領域專家知識建立的行動預測模型對目標行動序列進行預測,因此能夠較早地準確識別出目標作戰(zhàn)意圖。這不僅提高了意圖識別的準確率,而且還能夠進一步縮短態(tài)勢評估的時間,為防空作戰(zhàn)贏得先機。同時,本文所提識別方法的準確率依賴于歷史作戰(zhàn)態(tài)勢數據的可信度,因此有必要對歷史作戰(zhàn)數據進行分析和整理,特別是需要對平時和戰(zhàn)時的作戰(zhàn)數據進行區(qū)分,進一步提升意圖識別方法的準確率。
為了解決意圖識別中的意圖預測問題,本文提出了一種基于動態(tài)貝葉斯網絡和模板匹配的意圖識別方法。該方法將意圖識別分為行動推理和意圖預測2 個環(huán)節(jié),在行動推理環(huán)節(jié)不是根據目標運動航跡而是根據目標當前的作戰(zhàn)行動預測目標可能的行動序列,在意圖預測環(huán)節(jié)進一步基于目標可能的行動序列對目標的作戰(zhàn)意圖進行實時預測。仿真結果表明,意圖識別過程充分利用了實時感知的目標特征信息、領域專家知識以及積累的歷史作戰(zhàn)態(tài)勢數據,能夠進一步提升意圖識別的準確率。