雷 濤,楊亞寧,唐佳璐,楊 玲,茍先太
(1.中國電子科技集團(tuán)公司 第二十九研究所,成都 614000;2.西南交通大學(xué) 電氣工程學(xué)院,成都 611756)
兩軍對壘的過程中,想要把握戰(zhàn)場主動權(quán)就必須得掌握敵方的行為意圖,而隨著信息技術(shù)的不斷發(fā)展與完善,戰(zhàn)場上的信息也變得繁雜起來,信息技術(shù)成為決勝戰(zhàn)場的主導(dǎo)因素之一[1],而面臨這些越來越多的復(fù)雜的戰(zhàn)場信息,如果還是像以往作戰(zhàn),單純的依靠指戰(zhàn)員的經(jīng)驗和臨時的判斷的話,將會嚴(yán)重影響我方的戰(zhàn)斗響應(yīng)時間,導(dǎo)致貽誤戰(zhàn)機,嚴(yán)重的甚至?xí)數(shù)粽麍鰬?zhàn)爭[2-3]。因此,我們迫切需要研究一種基于深度學(xué)習(xí)的對于場景行為識別的方法。本系統(tǒng)是通過捕捉敵方雷達(dá)的基礎(chǔ)電磁信息和外部特征信息[4-5],獲取敵方雷達(dá)的行為意圖從而判斷出敵軍的意圖行為。
對于作戰(zhàn)目標(biāo)的意圖識別問題,國外的研究要早于國內(nèi),對于信息融合的一些研究,國內(nèi)直到20世紀(jì)80年代才相繼展開[6]。而目前的對于作戰(zhàn)目標(biāo)的意圖識別的傳統(tǒng)方法,已經(jīng)出現(xiàn)了的有深度信念網(wǎng)絡(luò)、專家系統(tǒng)、貝葉斯網(wǎng)絡(luò)、模板匹配等[2]。
模板匹配法是一種最基礎(chǔ)的模式識別的方法,這種方法基本上是一種統(tǒng)計識別方法。文獻(xiàn)[6-7]引入模板匹配方法,對海戰(zhàn)場的作戰(zhàn)目標(biāo)進(jìn)行了意圖識別,并且提高了模型的容錯能力和辨識能力。但是由于模板匹配自身的局限性,其識別效果受到先驗?zāi)P偷母采w面、模板的普適性的約束,因此具有極大的不確定性。
專家系統(tǒng)是人工智能領(lǐng)域中的最重要的的一個應(yīng)用領(lǐng)域,被用來對人工難以解決的復(fù)雜問題進(jìn)行知識推導(dǎo)和表示。文獻(xiàn)[8-9]引入專家系統(tǒng),通過置信規(guī)則庫來對群體目標(biāo)進(jìn)行了威脅評估,從而提高了識別的計算效率和精度。但是由于專家系統(tǒng)只是單純的依靠機械式的推理計算,而缺乏知識的共享性和重用性,并不能滿足現(xiàn)在戰(zhàn)場上的復(fù)雜性和多變性。
貝葉斯網(wǎng)絡(luò)是一種圖形化網(wǎng)絡(luò),通常是基于概率推理的。貝葉斯網(wǎng)絡(luò)一般用于解決不確定的或者是數(shù)據(jù)缺失條件下的問題,而對于一些結(jié)果發(fā)生的可能性該方法還可以給予量化分析。文獻(xiàn)[10-11]引入貝葉斯網(wǎng)絡(luò),定義了空域作戰(zhàn)目標(biāo)的事件分類,并對后續(xù)事件進(jìn)行了學(xué)習(xí)更新。但是貝葉斯網(wǎng)絡(luò)非常依賴于經(jīng)驗知識,很難發(fā)現(xiàn)和處理抗性欺騙信息[12-13]。
深度信念網(wǎng)絡(luò)(DBN)的構(gòu)成是多層受限玻爾茲曼機(RBM)的堆疊[14-15],是由Hinton等人[14]在2006年提出的一個概念生成模型。在深度信念網(wǎng)絡(luò)中,這些網(wǎng)絡(luò)被限制為一個可視層和一個隱層,層間存在連接,但層內(nèi)的單元間不存在連接。深度信念網(wǎng)絡(luò)是模式識別領(lǐng)域新興的概率生成模型[15],可以用來進(jìn)行深層次的學(xué)習(xí)和對數(shù)據(jù)進(jìn)行深度的挖掘[16-17]。深度信念網(wǎng)絡(luò)現(xiàn)在主要用于語音[18-19]、情感[20-21]、文本[22-23]和圖像[24-25]的分類和識別。但由于這項技術(shù)發(fā)展時間不長,相比其他方法,這項技術(shù)的識別準(zhǔn)確率較低,學(xué)習(xí)過程較為緩慢。
本文概述了基于神經(jīng)網(wǎng)絡(luò)與知識圖譜的場景識別方法的研究現(xiàn)狀,通過了聚類算法、LSTM模型、知識圖譜分析以及Web仿真技術(shù)的運用,用信息融合方法對得到的原始戰(zhàn)場信息進(jìn)行知識的挖掘,從而得到戰(zhàn)場態(tài)勢信息,分析識別出戰(zhàn)場場景。再配合three.js動畫庫將實時場景進(jìn)行仿真模擬,實現(xiàn)基本三維場景創(chuàng)建,提高開發(fā)效率,降低開發(fā)成本[3]。
本文基于神經(jīng)網(wǎng)絡(luò)與知識圖譜的場景識別方法解決了傳統(tǒng)識別方法中存在的識別準(zhǔn)確率低、需要訓(xùn)練的數(shù)據(jù)量大、識別緩慢的的問題,能夠更加快速準(zhǔn)確,而且需要的數(shù)據(jù)更少,耗費的資源更少的實現(xiàn)高準(zhǔn)確率的識別。通過此種方法可以更好地擬悉敵方作戰(zhàn)意圖、提高我國電子對抗作戰(zhàn)實力、營造更安全的國家周邊環(huán)境。
為了更好地模擬雷達(dá)行為的仿真,我們建立了一個場景劇本,通過創(chuàng)建這個場景并實現(xiàn)仿真,通過對仿真數(shù)據(jù)進(jìn)行仿真并對數(shù)據(jù)進(jìn)行綜合處理。
圖1是整個仿真流程中所仿真的所有雷達(dá)行為,是仿真了從探測敵方雷達(dá)開始進(jìn)行搜索活動到失去目標(biāo)然后再進(jìn)行小范圍的精確搜索活動直到找到目標(biāo)并確認(rèn)目標(biāo),然后進(jìn)行制導(dǎo)活動的完整流程。
圖1 多雷達(dá)行為構(gòu)成的防空反導(dǎo)場景
在實戰(zhàn)過程中通過己方的雷達(dá)、聲納、紅外傳感器等獲取到的敵方雷達(dá)數(shù)據(jù),如位置坐標(biāo)、移動速度、平均功率、峰值功率等參數(shù)。本文則對獲取到的敵方雷達(dá)活動進(jìn)行仿真構(gòu)建。本文的仿真系統(tǒng)處理到的雷達(dá)數(shù)據(jù)包括了雷達(dá)的坐標(biāo)位置、速度信息、平均功率等,如表1所示。
表1 雷達(dá)相關(guān)數(shù)據(jù)參數(shù)
對于雷達(dá)的行為信息的判別,如處于搜索還是跟蹤狀態(tài),我們本文采用的是通過對于雷達(dá)幅度的大小變化來推斷出雷達(dá)此時的行為特征的,而主要步驟是通過從己方的雷達(dá)、聲納、紅外傳感器等獲取到敵方輻射源脈沖序列,然后對這個脈沖序列的峰值、谷值等參數(shù)進(jìn)行提取,將這些信息綜合分析后即可得出相關(guān)的行為識別結(jié)果,步驟如圖2所示。
圖2 對雷達(dá)的行為識別示意圖
依據(jù)雷達(dá)峰值與谷值識別行為狀態(tài)的具體流程如下所示:
1)首先對雷達(dá)的幅度直方圖進(jìn)行計算,在直方圖中依次添加脈沖的幅度,將其橫軸設(shè)置為幅度值,縱軸設(shè)置為脈沖的個數(shù),采用統(tǒng)計學(xué)中的“百分位數(shù)”方法進(jìn)行幅度峰值(Amax)與谷值(Amin)提取,通過Matlab進(jìn)行仿真模擬圖形,如圖3所示。
圖3 搜索和跟蹤目標(biāo)的幅度直方圖
峰值變化量:dAmax=dAmax(t)-dAmax(t-1)
谷值變化量:dAmin=dAmin(t)-dAmin(t-1)
隨后統(tǒng)計固定時間段內(nèi)的峰值變化量與谷值變化量:若峰值變化量絕對值>ΔA或者谷值變化量絕對值>ΔA,那么則判斷為搜索狀態(tài);如果峰值變化量絕對值<ΔA且者谷值變化量絕對值<ΔA,則判定為跟蹤狀態(tài)。
在雷達(dá)對抗領(lǐng)域采用人工智能技術(shù)作為新興技術(shù),將長短時記憶循環(huán)神經(jīng)網(wǎng)絡(luò)或知識圖譜應(yīng)用于雷達(dá)場景識別技術(shù),無疑能夠牢牢抓住電磁作戰(zhàn)領(lǐng)域的主動權(quán),拉開與對手的技術(shù)差距。而對敵場景識別包括了:從敵信息源獲取的信息進(jìn)行相關(guān)的特征提取,再通過識別推理,即可推理識別得到場景,場景識別的一般過程如圖4所示,下面將介紹本文中采用到的知識圖譜方法。
圖4 場景識別的一般過程
知識圖譜的構(gòu)建是為了描述場景中與目標(biāo)相關(guān)的各種實體與概念之間的關(guān)系。知識圖譜是一種基于圖的數(shù)據(jù)結(jié)構(gòu),由節(jié)點和邊組成,如圖5所示。知識圖譜最常用的語義關(guān)系為“實體-關(guān)系-實體”與“實體-屬性-屬性值”。通俗地講,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關(guān)系網(wǎng)絡(luò),它提供了從“關(guān)系”的角度去分析問題的能力。
圖5 知識圖譜結(jié)構(gòu)圖
依據(jù)雷達(dá)信號特征、雷達(dá)事件及時空信息與雷達(dá)場景之間的因果關(guān)系構(gòu)建知識圖譜根據(jù)專家在大量雷達(dá)場景數(shù)據(jù)中提取到的知識生成三元組,如在場景可能為防空反導(dǎo)場景識別(A)、場景B、場景C的前提下,根據(jù)雷達(dá)時空信息,可以推斷出場景可能為防空反導(dǎo)場景識別(A)、場景C對應(yīng)三元組為{(1,1,1), 航線在特定區(qū)域外行駛方向由我方至敵方,(1,0,1)},進(jìn)而挖掘雷達(dá)的特征信號、事件信息、時空信息與場景識別之間存在的關(guān)聯(lián),完成知識提取,如圖6所示。
圖6 知識提取
三元組G=(E,R,S)建立起兩個節(jié)點之間的聯(lián)系,無數(shù)個三元組建立起概念層之間的聯(lián)系。概念層建立在數(shù)據(jù)層之上,是知識圖譜的核心,豐富實體之間、邊之間的關(guān)系和屬性值。以場景識別過程建立知識庫,按照識別規(guī)則出現(xiàn)的先后順序,在初始數(shù)據(jù)至最終識別結(jié)果之間,必然存在實體和邊之間的上下層關(guān)系及同層關(guān)系,同一層實體之間label相同,為一種概念,上下層兩個實體之間由關(guān)系連接,建立起概念之間的上下位關(guān)系。結(jié)合實體和邊之間關(guān)系及其內(nèi)屬性等語義描述,即可建立起包含概念層和數(shù)據(jù)層的結(jié)構(gòu)化的可邏輯推理的知識庫,實現(xiàn)雷達(dá)場景識別過程信息的存儲。如圖7所示。
圖7 結(jié)合語義建立知識圖譜
將處理雷達(dá)數(shù)據(jù)進(jìn)行整合后,并將數(shù)據(jù)傳入Web端就行仿真,再通過聚類算法和LSTM綜合處理得到場景識別的仿真結(jié)果。
長短時神經(jīng)網(wǎng)絡(luò)(LSTM,long short-term memory)是一種時間循環(huán)神經(jīng)網(wǎng)絡(luò),它的誕生最開始是用于解決RNN循環(huán)神經(jīng)網(wǎng)絡(luò)中存在的長期依賴問題。LSTM的優(yōu)點是在較長的序列中,它的計算處理能力要強于普通的循環(huán)神經(jīng)網(wǎng)絡(luò),另外LSTM也能同時解決掉普通的循環(huán)神經(jīng)網(wǎng)絡(luò)中存在的梯度的爆炸和梯度的消失問題。而LSTM的主要組成是由3個門結(jié)構(gòu)構(gòu)成,分別是遺忘門、輸入門、輸出門,具體組成如圖8所示。
圖8 LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
本系統(tǒng)用到LSTM的流程如下:
ft=σ(wf·[ht-1,xt]+bf)
(1)
it=σ(wi·[ht-1,xt]+bi)
(2)
(3)
(4)
ot=σ(wo[ht-1,xt]+bo)
(5)
ht=ot·tanh(ct)
(6)
通過LSTM對雷達(dá)的數(shù)據(jù)的訓(xùn)練與分析,最后得出部分行為識別結(jié)果如圖9所示。
圖9 部分?jǐn)?shù)據(jù)的 A 雷達(dá)行為模式占比時序分布圖
由圖9可以看出A 雷達(dá)跟蹤在占比和雷達(dá)工作脈寬在攻擊、偵查和防御3個意圖的特征據(jù)中都出現(xiàn)了重合部分,并且圖中3種特征數(shù)據(jù)之間混疊嚴(yán)重,但是其中A 雷達(dá)的搜索模式占比中攻擊意圖和偵查意圖的特征數(shù)據(jù)重復(fù)部分較大,防御意圖與其他兩種意圖之間的重復(fù)程度較小,可以分析得出在這段時序內(nèi)的雷達(dá)意圖。
系統(tǒng)通過了聚類算法、LSTM模型、知識圖譜分析對上傳的數(shù)據(jù)進(jìn)行了分析和處理,在Matlab中計算出識別結(jié)果,然后通過服務(wù)器傳到Web客戶端,Web客戶端three.js動畫庫將實時場景進(jìn)行仿真模擬,其架構(gòu)如圖10所示。
圖10 仿真系統(tǒng)框架設(shè)計
系統(tǒng)通過使用Three.js中內(nèi)置的對象對仿真場景進(jìn)行初始化仿真,仿真的流程如下:首先在場景中創(chuàng)建一個盒子模型,之后的所有仿真皆在此盒模型中進(jìn)行,隨后再對背景元素進(jìn)行構(gòu)建,如相機、渲染器的創(chuàng)建等,由此創(chuàng)造出一個最基礎(chǔ)的仿真場景;然后再到場景中添加仿真的環(huán)境元素,如海洋、天空、日光等,添加完畢后再用這些環(huán)境元素的紋理對盒子模型的內(nèi)部進(jìn)行紋理映射,至此,整個場景的環(huán)境效果即可呈現(xiàn);再創(chuàng)建完場景和背景元素后就可以往盒子模型中加入仿真模型了,如雷達(dá)、預(yù)警機、驅(qū)逐艦等。本仿真系統(tǒng)的數(shù)據(jù)支持是進(jìn)行了LSTM運算的Matlab算法端,通過這些數(shù)據(jù),系統(tǒng)不斷加載渲染出模型以及通過內(nèi)置動畫展現(xiàn)出模型的空間信息。本系統(tǒng)中采用的是這6步:1)創(chuàng)建三維場景;2)設(shè)置攝像機;3)設(shè)置光源;4)設(shè)置渲染;5)加載 OBJ 文件;6)模型的平移、旋轉(zhuǎn)、縮放等。
三維模型的加載流程如圖11所示。
圖11 三維模型加載流程
雷達(dá)在搜索、小搜、跟蹤等行為轉(zhuǎn)變過程中,其相對于偵察設(shè)備的功率會發(fā)生變化。同時雷達(dá)的位置坐標(biāo)、移動速度、頻段、峰值數(shù)量、脈寬也會發(fā)生變化,因此測量觀測雷達(dá)的各項參數(shù)變化特征,可快速確定威脅目標(biāo)當(dāng)前的行為方式、意圖從而推導(dǎo)識別出現(xiàn)在的場景。記錄的部分?jǐn)?shù)據(jù)如表2所示。
表2 雷達(dá)部分?jǐn)?shù)據(jù)截取表
在對9 000組樣本進(jìn)行了訓(xùn)練與測試之后,得出了網(wǎng)絡(luò)模型LSTM和知識圖譜方法的識別準(zhǔn)確率,如表3所示,在選取的部分實驗中可得出LSTM的識別準(zhǔn)確率大致在82.3%左右,而知識圖譜的識別準(zhǔn)確率在86.1%左右,經(jīng)過
表3 雷達(dá)部分?jǐn)?shù)據(jù)截取表
實驗驗證識別準(zhǔn)確率達(dá)到了實戰(zhàn)的要求,相比較這知識圖譜與LSTM,知識圖譜的識別準(zhǔn)確率要更高一些,但并不意味著知識圖譜要更有優(yōu)勢,因為相對于知識圖譜來說,LSTM作為單向通道時的準(zhǔn)確率是可以通過拓展雙向通道提升準(zhǔn)確率的,即為雙向LSTM(Bi-LSTM)。
針對判斷實戰(zhàn)環(huán)境中進(jìn)行場景識別過程時受到的硬件設(shè)備和環(huán)境的限制。通過了聚類算法、LSTM模型、知識圖譜分析以及Web仿真技術(shù)的運用,用信息融合方法對得到的原始戰(zhàn)場信息進(jìn)行知識的挖掘,從而得到戰(zhàn)場態(tài)勢信息,分析識別出戰(zhàn)場場景。系統(tǒng)運行流暢,仿真效果良好,可視化程度高,兩種方法的識別準(zhǔn)確率都達(dá)到了80%以上,經(jīng)過測試達(dá)到了實驗要求,可以對數(shù)據(jù)進(jìn)行快速仿真,對場景進(jìn)行快速識別,對于三維場景在瀏覽器端的模擬實現(xiàn)和對海上模擬電子對抗具有一定的實際實用價值,但系統(tǒng)也還存在一些問題:
1)由于所研究問題的特殊性,無論是真實戰(zhàn)場的敵軍航艦外部信息、戰(zhàn)場雷達(dá)信號還是敵軍戰(zhàn)術(shù)意圖數(shù)據(jù)集合,都是無法獲取與準(zhǔn)確仿真的,因此在仿真數(shù)據(jù)以及選取特征數(shù)據(jù)都需要進(jìn)一步的考證和實踐。
2)現(xiàn)代軍事發(fā)展日新月異,雷達(dá)型號更新?lián)Q代較快,系統(tǒng)選取根據(jù)目前雷達(dá)型號得出的相關(guān)結(jié)論并不具有一定的時效性,因此需要在構(gòu)建模型的進(jìn)行算法計算的時候要充分考慮到雷達(dá)數(shù)據(jù)的更新?lián)Q代。