翟翔宇,楊風暴*,吉琳娜,李書強,呂紅亮
(1.中北大學信息與通信工程學院,太原 030051;2.中國電子科技集團第五十四研究所,石家莊 050000)
伴隨著高新技術(shù)的不斷發(fā)展和進步,當今社會已步入了信息化大數(shù)據(jù)時代,戰(zhàn)場態(tài)勢中蘊含著大量的不確定因素和非線性復雜信息,具有很多涌現(xiàn)性特征,態(tài)勢數(shù)據(jù)也呈現(xiàn)出了典型的大數(shù)據(jù)“4 V”特性[1]。大量先進電子偵察技術(shù)的運用提高了感知戰(zhàn)場態(tài)勢的能力,同時也帶來了如何處理戰(zhàn)場態(tài)勢大數(shù)據(jù)的問題[2]。此時,戰(zhàn)場態(tài)勢這個復雜系統(tǒng)更為復雜,戰(zhàn)場態(tài)勢動態(tài)變化的速度加快,對空中目標進行威脅評估成為當代空戰(zhàn)中必不可少的一環(huán)。研究空戰(zhàn)態(tài)勢中面向大樣本數(shù)據(jù)集的目標威脅評估技術(shù),不僅對飛行員分析當前空中態(tài)勢環(huán)境有益,還對今后發(fā)展的無人機空戰(zhàn)自主決策具有重要意義。深度學習具有強大的非線性處理能力,逐層理解、自動分析提取的結(jié)構(gòu)[3],自學習能力很強,為突破大樣本數(shù)據(jù)集戰(zhàn)場態(tài)勢,實現(xiàn)空戰(zhàn)目標威脅評估智能化提供了寶貴契機。
目前用于復雜戰(zhàn)場環(huán)境下解決目標威脅評估的方法主要有:貝葉斯網(wǎng)絡(luò)推理[4]、層次分析法(AHP)[5]、多屬性決策理論[6]、模糊綜合評價法[7]和灰色關(guān)聯(lián)法[8]等。文獻[9]提出一種基于云模型和改進熵權(quán)的威脅評估方法;文獻[10]將貝葉斯網(wǎng)絡(luò)推理法和層次分析法結(jié)合起來解決空戰(zhàn)目標威脅評估的問題;文獻[11]采用層次分析法和熵權(quán)法組合賦權(quán)。然而,上述的這些方法沒有自學習能力,智能化水平不足,依賴人的經(jīng)驗,缺少對數(shù)據(jù)的深入挖掘處理,面對大樣本數(shù)據(jù)集難以有效推理。
多層全連接神經(jīng)網(wǎng)絡(luò)具有很強的自學能力和強大的非線性處理能力,面對大樣本數(shù)據(jù)具有很強的推理能力,可以充分逼近任意復雜的非線性關(guān)系。網(wǎng)絡(luò)中神經(jīng)元的權(quán)值是通過訓練學習得到的,訓練過程中不存在專家賦權(quán)值的情況,專家經(jīng)驗可以運用到樣本的標記中,進而融入網(wǎng)絡(luò)的計算中。
針對傳統(tǒng)方法的不足,本文提出了一種基于標準化全連接殘差網(wǎng)絡(luò)的空戰(zhàn)目標威脅評估的方法。分析了全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),研究了影響空戰(zhàn)目標威脅的主要因素,利用批量歸一化算法提高收斂速度,運用殘差網(wǎng)絡(luò)增強網(wǎng)絡(luò)學習能力,構(gòu)建了基于標準化全連接殘差網(wǎng)絡(luò)的空戰(zhàn)目標威脅評估模型。最后,利用Tensorflow 仿真驗證了該方法的可行性。
圖1 是一個4 層的全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。4 層全連接神經(jīng)網(wǎng)絡(luò)由輸入層、輸出層和隱含層3 個部分組成,隱含層有兩個,相鄰兩層之間的節(jié)點全連接,同一層的節(jié)點之間無連接。相鄰的兩層之間,上一層的輸出即為下一層的輸入。
圖1 4 層全連接神經(jīng)網(wǎng)絡(luò)
輸入x 與輸出y 之間通常是非線性的關(guān)系,式(1)中括號里的部分表示了層與層之間的線性關(guān)系,激勵函數(shù)f 又添加了兩層之間的非線性關(guān)系,通過訓練調(diào)整層與層之間的參數(shù),實現(xiàn)從數(shù)據(jù)中學習輸入與輸出之間的關(guān)系。
為了加快算法的訓練速度與收斂速度,增強網(wǎng)絡(luò)的非線性擬合能力,本文運用了批量標準化優(yōu)化算法和殘差網(wǎng)絡(luò)優(yōu)化結(jié)構(gòu)。
1.2.1 批量標準化算法
對于包含很多隱含層的網(wǎng)絡(luò),在訓練過程中每層的參數(shù)不斷變化,每個隱含層都會面臨協(xié)變量移位(Covariate Shift)的問題:上一層網(wǎng)絡(luò)參數(shù)的不斷變化導致下一層隱含層的輸入分布不固定,訓練過程中隱含層的輸入分布總是變化不定。
1.2.2 殘差網(wǎng)絡(luò)
深度學習本質(zhì)上是通過多層非線性層堆疊無限逼近需要學習的復雜分布函數(shù)H(x),但H(x)過于復雜,直接擬合很困難,網(wǎng)絡(luò)不斷加深時,超高層網(wǎng)絡(luò)會出現(xiàn)梯度消失或者梯度爆炸的現(xiàn)象,網(wǎng)絡(luò)優(yōu)化困難,造成退化。殘差網(wǎng)絡(luò)[13]是一種跳躍結(jié)構(gòu),運用分步學習的思想,先學習殘差F(x),再計算H(x)=F(x)+x,普通網(wǎng)絡(luò)結(jié)構(gòu)和殘差網(wǎng)絡(luò)結(jié)構(gòu)如圖2、圖3 所示。網(wǎng)絡(luò)深度帶來的非線性層的增加會帶來復雜的非線性擬合能力,殘差網(wǎng)絡(luò)解決了網(wǎng)絡(luò)因深度增加而產(chǎn)生的網(wǎng)絡(luò)退化的問題,可以增強網(wǎng)絡(luò)的學習能力。
圖2 普通網(wǎng)絡(luò)結(jié)構(gòu)
圖3 殘差網(wǎng)絡(luò)結(jié)構(gòu)
本文針對的場景是空戰(zhàn)場,從戰(zhàn)斗機飛行員的角度考慮,結(jié)合空戰(zhàn)的實際情況,考慮飛行員在空戰(zhàn)中主要關(guān)注的以下7 個因素,應用G.A.Mllier 的9級量化理論[14],獲得各影響因素的特征值[15]:
1)目標導彈攻擊距離。使用導彈攻擊我方是來襲目標典型的攻擊手段,即使同一目標,目標導彈的攻擊距離直接影響對目標的威脅評估。通常,來襲目標導彈的攻擊距離越大,對我方的威脅程度越大。
2)目標航向角。目標航向角是指目標前進的方向與目標的實際位置到我方位置的連線的夾角。通常,目標航向角越小,目標越可能突然出現(xiàn),對我方的威脅也越大。
3)目標距離。目標與我方之間的距離越小,則留給我方的反應時間越少,防御時間越少,威脅程度越大。反之,目標與我方之間的距離越大,不僅我方的反應時間和防御時間越長,而且此時目標相對我方的攻擊意圖不明顯,威脅程度越低。
4)目標速度。目標的速度越快意味著目標到達我方位置的時間越短,同時速度越快也會相應提高我方導彈的攻擊難度,對我方的威脅程度越大。本文將這一指標按非常快、快、較快、一般、較慢、慢、非常慢一次量化為9、8、7、6、5、4、3。
5)目標高度。近距離時,飛行高度比我方高的目標對我方的威脅越大。本文使用目標與我方的飛行高度差來衡量這一指標,將這一高度差指標按超高、高、較高、中、較低、低、超低依次量化為8、7、6、5、4、3、2。
6)目標類型。目標的類型不同對我方的威脅程度也不同。本文將目標按偵察機、無人機、小型目標(戰(zhàn)術(shù)彈道導彈、隱身飛機)、大型目標(如轟炸機、殲擊機)4 類對目標的威脅屬性用9 級量化理論進行量化,按偵察機、無人機、小型目標、大型目標依次量化為2、4、6、8。
7)目標干擾能力。目標的干擾能力也是目標襲擊的手段之一,本文將指標按無、弱、中、強依次量化為2、4、6、8。
對上述這些因素量化進行仿真分析,得到訓練集測試集數(shù)據(jù)。本文最終選擇了23 組數(shù)據(jù),采用其中20 組數(shù)據(jù)作為訓練集樣本,3 組數(shù)據(jù)作為測試集樣本,部分樣本數(shù)據(jù)如下頁表1 所示。
本文提出一種使用批量歸一化全連接殘差模型算法進行空戰(zhàn)目標威脅評估的方法,旨在解決傳統(tǒng)評估方法存在自學習能力、智能化不足的問題。其核心的評估思想是:通過將數(shù)據(jù)映射到高維空間中,增加數(shù)據(jù)的可分性,增加數(shù)據(jù)間的相關(guān)性分析,利用優(yōu)化器訓練網(wǎng)絡(luò)確定參數(shù),進而智能地擬合數(shù)據(jù)的非線性分布。評估過程中不顯性地體現(xiàn)權(quán)值,隱性地弱化對評價結(jié)果影響較小的屬性因素。
本文提出的網(wǎng)絡(luò)模型結(jié)構(gòu)主要由全連接網(wǎng)絡(luò)、批量歸一化算法和殘差網(wǎng)絡(luò)組成。全連接網(wǎng)絡(luò)作為模型的主體結(jié)構(gòu),將輸入數(shù)據(jù)映射到高維空間,最終映射到樣本標記空間,起到分類器的作用。批量歸一化算法可以使網(wǎng)絡(luò)著重學習非線性,加快網(wǎng)絡(luò)收斂速度。殘差網(wǎng)絡(luò)可以在全連接網(wǎng)絡(luò)接近飽和時,繼續(xù)提升網(wǎng)絡(luò)的訓練精度和測試精度,在保持原有網(wǎng)絡(luò)性能的基礎(chǔ)上繼續(xù)提升網(wǎng)絡(luò)性能。故本文采用全連接網(wǎng)絡(luò)、批量歸一化算法和殘差網(wǎng)絡(luò)結(jié)合的方案,使模型快速精細地擬合數(shù)據(jù)分布的非線性。
表1 部分樣本數(shù)據(jù)
表2 網(wǎng)絡(luò)模型結(jié)構(gòu)
將影響空戰(zhàn)目標威脅評估的7 個主要因素作為網(wǎng)絡(luò)模型的輸入,輸入數(shù)據(jù)通過網(wǎng)絡(luò)模型的計算進行三分類,輸出相應威脅的概率預測,網(wǎng)絡(luò)模型結(jié)構(gòu)如表2 所示。網(wǎng)絡(luò)共有7 個全連接層,兩個殘差網(wǎng)絡(luò)層,每個全連接層都進行批量標準化。由于ReLu 函數(shù)具備計算過程簡化,在梯度下降或反向傳播時更有效,可避免梯度消失和梯度爆炸等的優(yōu)點,故網(wǎng)絡(luò)模型使用ReLu 函數(shù)作為激勵函數(shù)。殘差網(wǎng)絡(luò)層中包含兩層全連接網(wǎng)絡(luò),同時也進行了兩次批量歸一化。輸出層通過歸一化指數(shù)函數(shù)(Softmax函數(shù)),將最后的結(jié)果進行歸一化,使得輸出的向量分別對應屬于相應威脅的概率,更直觀地顯示威脅評估結(jié)果。將樣本標記和網(wǎng)絡(luò)輸出的交叉熵作為網(wǎng)絡(luò)的損失函數(shù)(簡稱損失)如式(4)所示,訓練過程中運用反向傳播算法[16]計算梯度,通過修改連接節(jié)點的參數(shù),使得損失最小化。訓練過程也是擬合數(shù)據(jù)集分布的過程,網(wǎng)絡(luò)從數(shù)據(jù)集中自學習分布規(guī)律,最終學習到的分布規(guī)律由各節(jié)點的參數(shù)共同計算得到。
目標威脅評估模型算法流程圖如下頁圖4 所示,使用本文提出的網(wǎng)絡(luò)模型進行威脅評估訓練模型是非常重要的一步。結(jié)合相應的威脅評估大樣本數(shù)據(jù),在訓練和測試過程中,通過分析網(wǎng)絡(luò)訓練以及測試的準確率和損失的變化判斷網(wǎng)絡(luò)的性能,對模型的超參數(shù)進行調(diào)整,必要時會替換優(yōu)化函數(shù)或?qū)δP徒Y(jié)構(gòu)進行微調(diào)。
圖4 目標威脅評估模型算法流程圖
使用MATLAB R2014b 對數(shù)據(jù)進行仿真,將仿真好的數(shù)據(jù)隨機分為訓練集樣本和測試集樣本,分別存儲在不同的文件中。使用Tensorflow 編程讀取訓練集樣本,對模型進行訓練,訓練集樣本共有20組,每組數(shù)據(jù)分為10 批進行訓練,每訓練一批數(shù)據(jù)將相應的損失和準確率記錄下來。模型既利用了全連接網(wǎng)絡(luò)自學習能力強的優(yōu)點,又添加了批量歸一化算法和殘差網(wǎng)絡(luò)結(jié)構(gòu)來增強網(wǎng)絡(luò)模型的自學習能力,同時防止網(wǎng)絡(luò)退化。
訓練結(jié)束后顯示實驗結(jié)果,圖5 和圖6 給出了20 組數(shù)據(jù)訓練模型時,準確率和損失的變化,圖7 和圖8 給出了20 組數(shù)據(jù)訓練好的模型在測試集數(shù)據(jù)測試時準確率和損失的變化圖。由上述4個圖可見,模型面對大量數(shù)據(jù)樣本時可以獲得很高的準確率。同時圖5 和圖7 顯示的損失相對較小,表明模型擬合的非線性規(guī)律與數(shù)據(jù)樣本規(guī)律近似,訓練模型可以使模型從數(shù)據(jù)樣本中學習到樣本的非線性規(guī)律。
圖5 模型訓練(20 組數(shù)據(jù))準確率變化
圖6 模型訓練(20 組數(shù)據(jù))損失變化
圖7 模型測試(20 組數(shù)據(jù))準確率變化
圖8 模型測試(20 組數(shù)據(jù))損失變化
減少訓練樣本,選取3 組樣本和5 組樣本分別進行訓練,得到的模型訓練準確率和損失變化結(jié)果分別如圖9~圖12 所示,可見模型在訓練初期準確率和損失變化幅度很大,表明模型訓練的收斂速度很快。圖13 和圖14 給出了訓練集樣本為3 組數(shù)據(jù)、5 組數(shù)據(jù)、20 組數(shù)據(jù)時,對應訓練好的模型在測試集上測試的準確率和損失變化的對比圖,經(jīng)計算可得3 種條件下訓練好的模型測試的平均準確率分別為89.7%、91.8%、93.0%。圖中數(shù)據(jù)結(jié)果顯示,在只有3 組數(shù)據(jù)訓練模型在測試集上的平均準確率仍高達89.7%,訓練數(shù)據(jù)量越大,模型的測試準確率越高。
圖9 模型訓練(3 組數(shù)據(jù))準確率變化
圖10 模型訓練(3 組數(shù)據(jù))損失變化
圖11 模型訓練(5 組數(shù)據(jù))準確率變化
圖12 模型訓練(5 組數(shù)據(jù))損失變化
圖13 模型測試準確率變化對比
圖14 模型測試損失變化對比
仿真結(jié)果表明,本文所提出模型訓練的較快收斂速度表明模型具備很強的學習能力,可以快速從數(shù)據(jù)中擬合出數(shù)據(jù)的非線性規(guī)律。訓練樣本較小時,準確率仍然很高;訓練數(shù)據(jù)量越大,模型測試的準確率越高,表明模型在訓練過程中對大樣本態(tài)勢數(shù)據(jù)進行了有效處理。
本文研究了全連接神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)以及批量標準化算法和殘差網(wǎng)絡(luò)兩種優(yōu)化方法的原理,分析了影響空戰(zhàn)目標威脅評估的主要因素,構(gòu)建了基于標準化全連接殘差網(wǎng)絡(luò)的空戰(zhàn)目標威脅評估模型,得出以下結(jié)論:
1)本文提出的模型具備很強的自學習能力,可以在數(shù)據(jù)中通過學習來提升模型本身對空戰(zhàn)目標威脅評估數(shù)據(jù)信息的處理能力;
2)模型克服了傳統(tǒng)空戰(zhàn)威脅評估方法缺少對數(shù)據(jù)的深入挖掘處理,和面對大樣本數(shù)據(jù)集難以有效推理的缺陷;
3)訓練好的模型測試威脅的平均準確率可以達到93.0%,增加訓練數(shù)據(jù)量繼續(xù)訓練模型,可以進一步提高模型測試準確率。
通過分析,該模型具有很好的評估能力,訓練出的模型可以快速準確地評估目標的威脅程度,可以為任務分配和自主決策技術(shù)提供支持,為空戰(zhàn)目標威脅評估提供了新的方法。