陶夢圓,張茜茜,王禹,楊潔
(南京郵電大學通信與信息工程學院,江蘇 南京 210023)
輻射源識別技術(shù)根據(jù)偵察技術(shù)獲取發(fā)射端的輻射源信號,通過分析信號的頻率特征、調(diào)制參數(shù)等信息,對信號特征進行測量與提取,最后,根據(jù)先驗信息對發(fā)射信號的輻射源個體進行分類與確認[1]。近年來,該技術(shù)在軍事和民用通信中的頻譜檢測與信號處理等方面發(fā)揮巨大的作用。
目前的輻射源識別方法可分為傳統(tǒng)識別方法與機器學習(ML,Machine Learning)方法,具體如圖1 所示:
圖1 輻射源識別方法
其中傳統(tǒng)的輻射源識別方法識別速度快且易于實現(xiàn),但此方法依賴先驗知識且泛化能力差,難以處理如今數(shù)量龐大且形式復雜的輻射源信號[1]。ML 為一種智能的數(shù)據(jù)分析方法,可以模仿人類學習方式,從而使計算機網(wǎng)絡(luò)程序隨著經(jīng)驗的增多而提高性能[2-4],因此基于ML 的輻射源識別方法可以解決傳統(tǒng)方法難以處理的大規(guī)模復雜輻射源信號識別問題。其中基于深度學習(DL,Deep Learning)的輻射源識別方法是如今最熱門的輻射源識別研究方向,該方法通過構(gòu)建深度神經(jīng)網(wǎng)絡(luò),如卷積神經(jīng)網(wǎng)絡(luò)、深度置信網(wǎng)絡(luò)、稀疏自編碼器等自動提取信號的復雜深層特征,進而實現(xiàn)輻射源的精確識別[5-9]。該方法在解決數(shù)量龐大、維度高、形式復雜的輻射源識別任務(wù)上表現(xiàn)出了優(yōu)異的識別性能,因此本文基于DL 算法,利用復數(shù)卷積神經(jīng)網(wǎng)絡(luò)(CVCNN,Complex Value Convolutional Neural Network)對進行預(yù)處理后的信號樣本進行特征提取與分類識別,完成輻射源信號識別任務(wù)。
基于復數(shù)卷積神經(jīng)網(wǎng)絡(luò)的輻射源識別方法系統(tǒng)模型如圖2 所示,在對接收到的信號樣本進行數(shù)據(jù)預(yù)處理后,輸入到CVCNN 中進行訓練,提取信號特征并存儲訓練好的網(wǎng)絡(luò)模型權(quán)重,最終用訓練好的網(wǎng)絡(luò)模型對待識別的輻射源信號樣本進行分類識別。
圖2 基于復數(shù)卷積神經(jīng)網(wǎng)絡(luò)的輻射源識別方法系統(tǒng)模型
實驗中使用的數(shù)據(jù)集為自動相關(guān)監(jiān)視系統(tǒng)(ADS-B,Automatic Dependent Surveillance-Broadcast)信號樣本,通過圖3 信號采集系統(tǒng)對航空器信息進行采集[10],具體過程如下:
第一步:利用軟件無線電設(shè)備用于檢測和捕獲ADS-B信號的基帶同相/正交(I/Q,In-phase/Quadrature)數(shù)據(jù);
第二步:使用自動解碼算法獲取飛機的個人身份標簽(ID,Identity Document);
第三步:使用自動聚類和標記算法將基帶I/Q 數(shù)據(jù)標以相應(yīng)的飛機ID,完成ADS-B 信號收集。
圖3 ADS-B信號采集系統(tǒng)
采集到的ADS-B 信號數(shù)據(jù)集s(t) 如式(1)。接收到的信號為I/Q 信號,包含實部與虛部兩部分,這也是在后續(xù)的輻射源識別網(wǎng)絡(luò)模型中選擇復數(shù)卷積神經(jīng)網(wǎng)絡(luò)進行訓練的原因,即避免分割復數(shù)ADS-B 信號的I/Q 數(shù)據(jù),保留了二者耦合所帶來的信息。
其中,h(t) 表示信道脈沖響應(yīng),m(t) 表示設(shè)備接收到的ADS-B 無線信號,n(t) 表示噪聲。
本文提出的輻射源識別方法設(shè)置在接收端,旨在將接收到的輻射源信號s(t)預(yù)處理為樣本信號S={x(0),x(1),…,x(N-1)},N代表接收的樣本信號數(shù),然后進一步把這些輸入信號分類為已知的不同輻射源信號k={yi,i=1,2,…,K},K表示輻射源信號種類數(shù)量,以完成輻射源分類識別任務(wù)。輻射源信號的分類處理中用到最大后驗概率準則(MAP,Maximum-A-Posteriori),即:
在進行CVCNN 模型的設(shè)計時[11-12],本文首先使用了復數(shù)卷積對輸入ADS-B 信號進行卷積操作,將信號的I 路和Q 路聯(lián)系起來,并提取出由I 路和Q 路之間的耦合性而帶來的特征,提高識別準確率。然后考慮到網(wǎng)絡(luò)參數(shù)量和計算復雜度問題,采用小卷積核進行多層卷積以減少模型參數(shù)。此外,整合多個非線性激活層來代替單一非線性激活層,以增強判別能力[13]。而在特征提取過程中,使用小卷積核會帶來能力不足、視野不夠的問題,所以采用增多卷積神經(jīng)網(wǎng)絡(luò)層數(shù)的方法來彌補這些問題。然而,神經(jīng)網(wǎng)絡(luò)深度的增加也會導致特征維度的增加,因此本文在每一個卷積層后都設(shè)置了池化層進行特征圖壓縮,同時對神經(jīng)網(wǎng)絡(luò)添加批標準化操作,以提升神經(jīng)網(wǎng)絡(luò)收斂速度,并且使用相對較大的學習率[14]。
本文設(shè)計的CVCNN 結(jié)構(gòu)如圖4 所示。
圖4 復數(shù)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
與實數(shù)卷積操作相比,復數(shù)卷積操作在進行卷積工作時其卷積核會將實部與虛部聯(lián)合起來,避免特征關(guān)系丟失。輸入ADS-B 信號樣本神經(jīng)網(wǎng)絡(luò)的復數(shù)卷積核可表示為W=A+iB,復數(shù)卷積形式如式(5),從而實現(xiàn)對信號實部與虛部的聯(lián)合操作。
此外,本文設(shè)計的CVCNN 還加入了批標準化(BN,Batch Normalization)層[15],把經(jīng)線性函數(shù)映射后的特征分布轉(zhuǎn)化為均值為0、方差為1 的正態(tài)分布。同時,考慮到如果只是簡單地變換為均值為0 方差為1 的線性表達,會導致CVCNN 的表達能力下降,因此還需要進行非線性變換操作。經(jīng)過非線性變換函數(shù)后的輸入值落入到對輸入比較敏感的區(qū)域,以此避免梯度消失問題。具體算法步驟如下:
在訓練階段,CVCNN 采用了前向傳播與反向傳播結(jié)合的算法,如圖5 所示,通過這個過程實現(xiàn)對權(quán)重與參數(shù)的更新,使損失函數(shù)最小化。
圖5 神經(jīng)網(wǎng)絡(luò)訓練模式
其中前向傳播階段信號由低維到高維進行傳播,CVCNN的卷積層、池化層、全連接層的數(shù)學模型表示如下[16]:
反向傳播階段計算權(quán)重的損失函數(shù)梯度,更新權(quán)重以最小化損失函數(shù)[17-18]。本文CVCNN 使用交叉熵損失作為損失函數(shù),其表達式為:
其中,yi為信號樣本的真實類別標簽,pi為通過CVCNN的Softmax 函數(shù)映射后的預(yù)測概率,。
確定損失函數(shù)后,根據(jù)損失函數(shù)求得梯度:
實驗環(huán)境的配置與參數(shù)的設(shè)置如表1 所示:
表1 實驗環(huán)境與參數(shù)設(shè)置
(1)識別性能
本文選取了CNN1[19]和CNN2[20]這兩種卷積神經(jīng)網(wǎng)絡(luò),以及與本文所設(shè)計的CVCNN 具有相似結(jié)構(gòu)的實數(shù)卷積神經(jīng)網(wǎng)絡(luò)(RVCNN,Real Value Convolutional Neural Network)作為CVCNN 對比的網(wǎng)絡(luò)進行實驗。
實驗選取準確率、精確度、召回率和查全率與混淆矩陣作為評估標準對識別性能進行評估,得到表2 所示的性能與圖6 所示的混淆矩陣。由表2 可以看出,與其他神經(jīng)網(wǎng)絡(luò)相比,本文所設(shè)計的CVCNN 在準確率、精確度、召回率和查全率這4 方面都有顯著提高;同樣地,由圖6 可以看出,CVCNN 的識別性能明顯優(yōu)于3 種對比神經(jīng)網(wǎng)絡(luò)。
表2 不同網(wǎng)絡(luò)模型識別性能
圖6 不同網(wǎng)絡(luò)模型的混淆矩陣
進而,本文分析了CVCNN 與3 種對比神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)復雜度,采用了模型參數(shù)量Parameters 與計算量FLOPs作為評估指標。其中神經(jīng)網(wǎng)絡(luò)的最大池化層不含參數(shù)量,且最大池化僅僅是比較操作,其計算量可以忽略不計;批標準化層為歸一化操作,該層的參數(shù)量與計算量與卷積層、全連接層相比也可忽略不計。因此本文選取卷積層和全連接層的參數(shù)量與計算量對神經(jīng)網(wǎng)絡(luò)的復雜度進行對比與分析。每層的參數(shù)量Pi與計算量Fi的計算方式如下:
神經(jīng)網(wǎng)絡(luò)復雜度計算結(jié)果如表3 所示??梢钥闯?,本文提出的基于CVCNN 的輻射源識別方法與同樣具有較高識別性能的RVCNN、CNN1 相比,模型參數(shù)量較小,且計算復雜度也沒有增加,即能在提高識別性能的同時不增加模型計算復雜度,便于實際應(yīng)用部署。
表3 不同網(wǎng)絡(luò)模型參數(shù)量與計算復雜度
(2)模型收斂過程
本文調(diào)查了不同神經(jīng)網(wǎng)絡(luò)模型的訓練過程,并分析了不同神經(jīng)網(wǎng)絡(luò)的損失收斂速度,如圖7 所示??梢钥闯?,與CNN1 和CNN2 網(wǎng)絡(luò)相比,本文所設(shè)計的CVCNN 的收斂速度明顯優(yōu)于CNN1 和CNN2,并且損失更趨近于零。
圖7 神經(jīng)網(wǎng)絡(luò)訓練過程
在無線通信環(huán)境日益復雜的大環(huán)境下,電磁戰(zhàn)場上的信號偵察干擾以及日常生活中的物聯(lián)網(wǎng)連接安全等問題都需要輻射源識別技術(shù)的支撐。本文提出基于CVCNN的輻射源識別方法,詳細闡述了復數(shù)卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)與算法流程,并采用100 類民航客機ADS-B 信號作為輸入數(shù)據(jù),對所提出的基于CVCNN 的輻射源識別方法進行仿真實驗。實驗結(jié)果表明,所提出的CVCNN識別準確率高、訓練速度快,且在一定程度上減少了網(wǎng)絡(luò)復雜度。在未來的工作中,考慮到模型實際部署的成本問題,將探索模型壓縮技術(shù)。在保證識別性能的前提下,通過壓縮模型參數(shù)進一步優(yōu)化所提出的基于CVCNN 的輻射源識別技術(shù),從而實現(xiàn)模型的低成本部署。