張靜克,戚宗鋒,王華兵,曾勇虎,汪連棟,王 偉
(1.電子信息系統(tǒng)復雜電磁環(huán)境效應國家重點實驗室,河南洛陽471000;2.中山大學電子與通信工程學院,廣東 深圳518000)
隨著現代戰(zhàn)爭日趨信息化、網絡化、智能化,擁有制信息權就意味著最可能獲取戰(zhàn)爭的勝利。雷達作為戰(zhàn)場偵察的一個關鍵節(jié)點,在戰(zhàn)場信息獲取中的作用日益突出。相應的,針對雷達的各種電子戰(zhàn)技術和設備層出不窮,導致雷達在遂行任務時面臨的電磁環(huán)境日趨復雜,因此對復雜電磁環(huán)境下特別是對抗環(huán)境下的雷達性能進行分析評估具有重要的軍事意義和價值[1]。雷達性能評估試驗是通過合理地設計試驗方案,構建相應的試驗環(huán)境,開展試驗并利用各種測量設備和錄取設備獲取必要的數據,然后對所得的數據進行處理和分析,進而對被試雷達系統(tǒng)的性能做出評價,為其設計定型、生產及使用提供決策依據[2-3]。由于復雜電磁環(huán)境下雷達性能評估試驗具有樣本空間大、試驗成本高等特點,無論是內場仿真試驗還是外場實裝實驗,均只能開展部分電磁環(huán)境下性能評估試驗,獲取的試驗數據具有不完備性,難以反映系統(tǒng)的全面性能,因此需要對試驗數據進行處理分析,建立雷達性能指標等效外推模型,實現未試驗條件下試驗結果的預測。
雷達性能評估試驗中,雷達性能指標多為連續(xù)變量,建立指標等效外推模型為數據挖掘中的回歸問題,機器學習中的線性/非線性回歸、支持向量機等一系列有監(jiān)督學習方法[4-7]均可用于解決此類問題。然而由于雷達性能評估試驗數據具有定性和定量因子混合、響應與因子間映射關系復雜且非線性等特點,常用的線性或多項式回歸分析通常存在模型失配、外推準確率較低的問題。實際上,在雷達性能評估試驗中,通常可根據雷達裝備的實際使用情況以及戰(zhàn)術用途將雷達性能指標劃分為不同的等級或類別,來反映雷達在復雜電磁環(huán)境下的適應性,此時雷達性能指標等效外推可建模為分類問題,利用機器學習中的分類方法可實現指標等效外推。近年來,隨著深度學習的迅速發(fā)展,各種深度學習模型如深度置信網絡、深度卷積神經網絡、深度遞歸神經網絡以及深度森林等層出不窮,因其強大的特征自動提取和抽象能力、復雜映射關系學習能力等,在圖像分類、目標檢測、文本分類、語音識別等領域得到了廣泛的應用[8-16],取得了經典機器學習無法比擬的效果。本文將深度學習應用于雷達性能指標等效外推,主要研究基于深度置信網絡和深度森林的雷達指標等效外推方法,并通過仿真試驗對比了基于深度學習和經典機器學習的指標等效外推性能。
以對抗環(huán)境下的雷達性能評估試驗為例,試驗因子由雷達系統(tǒng)參數和干擾機參數組成,試驗響應為待測的雷達性能指標。雷達系統(tǒng)參數通常包括發(fā)射功率、極化方式、抗干擾措施以及數據處理中的可調參數等;干擾機參數包括干擾發(fā)射功率、干擾樣式(噪聲調頻干擾、多假目標干擾等)以及干擾樣式相關參數(調頻斜率、調制噪聲標準差和調制噪聲帶寬等,多假目標干擾的假目標個數、位置及速度等),顯然試驗因子中定量因子和定性因子是混合存在的;雷達性能指標包括目標截獲時間、最大跟蹤時長、距離(角度)測量精度以及跟蹤目標消耗的資源率等,其測量值多為連續(xù)變量。
在雷達性能指標等效外推問題中,輸入數據為試驗因子,輸出數據為試驗響應也即雷達性能指標。由于將雷達性能指標等效外推建模為分類問題,需要先對試驗數據進行預處理,主要包括試驗因子歸一化和試驗響應類別劃分。試驗因子歸一化包括定性因子定量化和定量因子歸一化。對于定性因子如抗干擾措施,根據其是否使用可定量化為0和1,其中0表示未使用,反之為1;對于定量因子,由于因子取值相差范圍較大,在指標等效外推之前,需要將其因子的取值統(tǒng)一到某一較小的范圍,通常為[-1,1]或[0,1],歸一化方法有最小-最大歸一化、z分數歸一化等。試驗響應類別劃分可根據裝備的實際使用情況以及戰(zhàn)術用途將雷達性能指標劃分為不同的類別,反映雷達性能在干擾下的表現程度或雷達性能對干擾環(huán)境的適應性,這里類別數及含義可根據實際需求定義,但是最少應包含2種類別。
經過試驗數據預處理后,雷達性能指標等效外推問題可進一步描述為:已有N組雷達性能評估試驗數據{(X1,y1),(X2,y1),…,(XN,yN)},其中Xi=(xi1,xi2,…,xik)為輸入數據,yi為輸出數據,雷達性能指標等效外推是利用分類方法學習X→y的映射函數即等效外推模型。當一組新的試驗因子組合XN+1作為輸入時,使用等效外推模型可對輸出yN+1進行預測。
深度置信網絡(DBN)是Hinton提出的一種包括多個隱藏層的深度學習模型[8],由多個受限玻爾茲曼基(RBM)堆疊組成。DBN利用RBM將原始數據從一種特征空間轉換到另一種新的特征空間,通過無監(jiān)督自學習的方式進行特征提取,增加了神經網絡對數據特征的提取能力和網絡學習的抽象化,從而提高網絡的分類精度。
RBM由可見層V和隱藏層H組成??梢妼颖硎据斎霐祿奶卣?,隱藏層一般也叫做數據特征提取層,用來獲得相互連接的神經元之間的依賴關系。當RBM接收到輸入數據時,首先將數據特征從可見層V映射到隱藏層H,然后隱藏層輸出再重構到可見層V,并計算原始輸入數據和重構數據之間的誤差,根據二者誤差調整更新可見層和隱含層之間的參數使得誤差值最小,此時認為隱含層的輸出可很好地代表原始輸入數據,達到特征提取的目的。RBM的訓練通常采用對比散度方法實現,其具體求解和詳細步驟[8]這里不再贅述。
基于深度置信網絡的雷達性能指標等效外推模型的網絡結構如圖1所示,為一個全連接定向的多層神經網絡,包括一個輸入層h0,M個隱藏層h1,h2,…,h M和多類別輸出層,其中輸入層和M個隱藏層構成M個RBM。輸入層h0有k單元,對應于輸入數據X中特征個數。輸出層Y=[y1,y2,…,y C],等同于輸出數據中的類別數,其中W={w1,w2,…,w M+1}是深層架構中需要學習的參數。隱藏層的個數和每個隱藏層中的結點數可根據經驗或采用特定策略設置。構建等效外推模型,也即將尋找映射函數X→Y的問題轉換為利用深層架構尋找參數空間θ的問題。
圖1 基于深度置信網絡的指標等效外推方法網絡結構示意圖
由于雷達性能指標等效外推為多分類問題,因此可采用softmax()作為輸出層的激活函數,則最后一層各單元的輸出可表示為:
式中,y i c和分別為第i組訓練數據的輸出向量的第c個元素的真實值和預測值。
基于DBN的雷達性能指標等效外推模型的訓練可分為無監(jiān)督逐層預訓練和有監(jiān)督反饋微調2個步驟:1)無監(jiān)督逐層預訓練。該階段的訓練數據為無標簽數據,采用逐層貪婪算法,利用輸入數據訓練依次訓練各個RBM,計算每個RBM的參數。2)有監(jiān)督反饋微調。將經過堆疊RBM處理的數據作為輸出層的輸入,利用后向傳播算法基于公式(2)所示代價函數對深層架構進行訓練,獲取整個網絡的參數空間θ。
當整個網絡訓練完成后,輸入一個新的數據X N,可以根據深度置信網絡的輸出來判斷新輸入數據的所屬類別,進而完成雷達性能指標的等效外推。
深度森林[13]是周志華教授于2017年提出的一種新型基于多粒度掃描與級聯森林結構的深度學習模型??紤]到多粒度掃描是為了提取原始輸入數據的多粒度鄰域特征,而本文處理的雷達性能指標等效外推問題中的輸入數據也即試驗因子的順序是隨機的,不存在鄰域特征,因此只采用其中的級聯森林結構。
深度森林的每一層都是由多個不同類型的隨機森林組成的,每個森林中包含多顆決策樹,也就是說深度森林的每層都是“集成的集成”,基于深度森林的雷達性能指標等效外推結構示意圖如圖2所示。采用了深度網絡的一層疊一層的結構,其輸入為試驗因子,級聯森林每一層的輸出與原始輸入合并作為下一層的輸入,對最后一層的輸出取平均后再取其最大值即可得到等效外推結果。級聯森林的每一層包括2個普通隨機森林和2個完全隨機森林。每個普通隨機森林由多顆(一般選擇為500或者1 000顆)決策樹組成,通過隨機選取sqrt(k)(k表示輸入特征維度)個候選特征,然后選擇具有最佳gini值的特征分裂節(jié)點,直到每個葉節(jié)點只有1個類別或者少于規(guī)定的最少樣本數。同樣的,每個完全隨機森林是由多顆完全隨機決策樹組成,每顆決策樹會隨機選擇一個特征作為分裂樹的分裂節(jié)點。對于每個森林而言,每個樣本在森林中的每棵樹中都會按照一定的路徑去找到自身所對應的葉節(jié)點,但是在這個葉節(jié)點中的數據很有可能包含其他類別的,通過對該節(jié)點不同類別進行統(tǒng)計從而獲得各自所占的比例,然后對所有樹的比例進行求均值,生成的概率分布作為該森林對該樣本的預測。對于圖2所示三分類問題,每層的輸出的維度為3×4=12,下一層的輸入的維度為12+k。
圖2 基于深度森林的指標等效外推方法網絡結構示意圖
為了避免過擬合現象,每一層中每個森林的訓練都采用K折交叉驗證,也即將訓練子集分為K個大小相同的互斥子集,每次使用其中K-1個子集作為訓練集進行訓練得到分類模型,然后利用該模型預測得到剩下子集對應的輸出,重復K次得到所有訓練集對應的輸出,這也意味著每一層中每個森林實際上對應著K個訓練模型,因此當訓練完成后,利用模型進行等效外推時,每層中每個森林的輸出其實是K個模型的均值。在完成一層結構的添加和訓練后,會將該層所有訓練子集的輸出與其真實類別進行對比,來評估其性能是否有明顯的性能增益,如果沒有則訓練過程將結束。因此,深度森林能夠通過適當的終止來自動決定層數,也即決定其模型的復雜度,這就使得相對于深度神經網絡,深度森林在面對小數據集的情況下具有一定的優(yōu)勢。
為了驗證本文方法的有效性,利用自研的雷達對抗仿真平臺開展仿真試驗并生成仿真數據,根據雷達對抗仿真平臺輸出的雷達探測報表進行分析計算可以獲取雷達性能指標數據,比如目標截獲時間、最大跟蹤時長、距離測量精度等。仿真場景中設置1部X波段搜索雷達和1部噪聲調頻干擾機,其系統(tǒng)參數取值如表1所示。利用試驗設計方法生成500組試驗方案,運行該軟件獲取生成500組試驗的雷達探測報表,然后根據各雷達性能指標計算方法獲取500組試驗數據的響應結果。
為了利用基于深度學習的雷達性能等效外推方法構建外推模型,首先需要對試驗數據進行預處理,主要包括定量試驗因子歸一化、定性試驗因子數值化以及試驗響應標簽化。定量試驗因子(如表1中CFAR單邊參考單元數目、干信比)歸一化采用最小-最大歸一化將參數歸一化到[0,1]。定性試驗因子(如表1中的抗干擾措施:頻率捷變、燒穿、前沿跟蹤)數值化為0和1,其中0表示未使用,反之為1。對于試驗響應標簽化,將對應的試驗響應劃分為三個類別,分別用0、1和2表示。其中0表示雷達在該干擾條件下下降嚴重,無法根據雷達試驗數據獲取指標的有效值;1表示雷達性能不受在該干擾條件的影響;2表示雷達在該干擾條件下性能有一定的程度的下降,但是依然可以根據雷達試驗數據獲取指標的有效值。
表1 雷達和干擾機系統(tǒng)參數
對于基于深度置信網絡的試驗數據預測方法,設定一個四層網絡,其前三層組成2個為RBM,最后一層為輸出層。其中第一層網絡的規(guī)模為(9,18),輸入層為9是由于試驗參數的維數為9,第二層網絡的規(guī)模為(18,9),第三層網絡的規(guī)模為(9,3)。網絡的訓練速率設為0.05,迭代次數1 000,訓練中一次迭代的數據批次為50。有監(jiān)督訓練采用隨機梯度下降法。
對于基于深度森林的試驗數據預測方法,設定深度森林最多10層,每一層網絡由2個隨機森林和完全隨機森林組成,每個隨機森林的最大深度為5,每個森林中包含500棵樹。每個森林在訓練時采用5折交叉驗證。
為了驗證本文提出的基于深度學習的雷達性能指標等效外推方法性能,首先采用隨機抽取-訓練-測試的試驗流程。在每次試驗過程中,從500組試驗數據集中隨機抽取50組數據作為測試集,剩下450組的作為訓練集,利用訓練集按照深度學習的訓練步驟分別對每個性能參數進行訓練,然后基于訓練好的等效外推模型對測試集進行外推,并統(tǒng)計其外推正確率。重復上述操作10次,以其平均外推正確率來評價外推方法的性能。同時還選取了經典機器學習中l(wèi)ogistic回歸、支持向量機(SVM)以及隨機森林3種方法進行對比。以目標截獲時間和距離測量精度為例,各方法每組外推準確率與平均外推準確率如圖3所示。對于目標截獲時間,logistic回歸、SVM、隨機森林、深度森林和深度置信網絡這5種方法的平均外推準確率為83.6%、87.7%、86.8%、88.0%、89.2%;對于相對距離精度,平均外推準確率依次為75.2%、77.6%、79.8%、81.0%、83.6%,即基于深度置信網絡的雷達對抗試驗數據外推精度最高,深度森林次之。
圖3 各雷達性能指標等效外推模型準確率
為了進一步說明各方法的外推性能,表2以目標截獲時間為例,展示了不同訓練樣本量下各種方法等效外推的平均準確率,其中每種訓練樣本量下外推準確率最高的結果用加粗標出。由表2可以看出,當訓練樣本量較少時(≤30%),深度森林的外推準確率最高,隨機森林的外推準確率次之;當樣本量較多時(>30%),深度置信網絡的外推準確率最高,而SVM和深度森林的外推準確率次之。這表明了對于雷達性能指標等效外推而言,深度森林在小樣本數據上具有更好的優(yōu)越性,而深度置信網絡在大樣本情況下性能更優(yōu)。此外,由表2還可看出,隨著訓練樣本量的不斷增多,基于深度置信網絡的等效外推準確率提高幅度最大,而基于深度森林的等效外推方法在不同訓練樣本量情況下均可保持較高的外推準確率。這是由于深度置信網絡包含特征提取結構,當訓練集增大時能夠提取到更強更豐富的特征,因此能夠不斷地提升識別準確率;而深度森林有機結合了隨機森林的小樣本識別能力和分層設計所提供的特征提取能力,使其對不同訓練樣本量具有較好的適應性。
表2 不同訓練樣本量下各種方法的外推性能
本文將雷達性能指標等效外推建模為分類問題,提出了基于深度置信網絡的雷達性能指標等效外推方法和基于深度森林的雷達性能指標等效外推方法,并通過仿真試驗對比了基于深度學習等效外推方法與基于經典機器學習(Logistic回歸、SVM、隨機森林)的等效外推方法的性能。深度置信網絡通過堆疊多層RBM獲取強大的特征提取能力,使其在大樣本情況下具備高于經典機器學習的外推準確率;深度森林通過有機結合集成學習的小樣本識別能力和分層設計所提供的特征提取能力,能夠在小樣本情形下依然保持較高的外推準確率。