葉文強,俞志富,張 奎,王虎幫
(國防科技大學電子對抗學院, 合肥 230037)
雷達輻射源信號識別在現(xiàn)代化作戰(zhàn)中起到無可替代的作用,直接影響到電子偵察設備的發(fā)揮并對后續(xù)的作戰(zhàn)決策起到非常重要的影響。它不僅能夠偵察系統(tǒng)信號,而且又能夠判斷敵方武器是否構成威脅,對戰(zhàn)場走向有重要意義。隨著戰(zhàn)爭的演變和科技的發(fā)展,戰(zhàn)場對雷達輻射源信號識別有了更高的要求。傳統(tǒng)人工識別已經(jīng)不能夠滿足現(xiàn)代化戰(zhàn)爭的要求,需要引入人工智能,提出智能信息處理的方式[1]。雷達輻射源信號特征提取是信號分選和識別的重要基礎,并且能夠決定信號識別的準確性和高效性,最終影響電子情報偵察能力,對后續(xù)的戰(zhàn)爭決策有著至關重要的影響[2]。文獻[3]利用時頻圖像局部二值模式紋理特征,運算效率高,分類器結構簡單,具有較強的適應能力,但是在低信噪比情況下效果有待提高。文獻[4]利用稀疏自編碼器對信號時頻圖像進行分類識別,運行速度快,魯棒性較強,但是通過降維會導致數(shù)據(jù)特征缺失,導致識別效果下降。文獻[5]利用DBN結合快速傅里葉累加算法,對信號循環(huán)譜進行特征提取分類識別,復雜度低,相位編碼和頻率編碼區(qū)分效果明顯,但是對QPSK信號適應性差。文中針對低信噪比情況下識別效果較差,魯棒性不強的問題,提出了利用短時傅里葉變換結合DBN深度信念網(wǎng)絡框架結構,對信號時頻圖像進行識別的算法。
從圖1[6]中可以得知,雷達輻射源信號識別主要包括預處理、特征提取和分類識別3個過程。
圖1 信號識別流程圖
DBN網(wǎng)絡是由無監(jiān)督的受限玻爾茲曼機(restrited Boltzmann machine,RBM)和有監(jiān)督的反向傳播網(wǎng)絡(back-propagation,BP)構成的深層神經(jīng)網(wǎng)絡[7],在機器學習模型中,占有很重要的地位。
DBN網(wǎng)絡主要通過兩步來訓練模型:第一步,首先對每一層RBM網(wǎng)絡進行無監(jiān)督訓練,以保證在能夠讓特征向量映射到不一樣的特征空間之中,同時能夠保留更多的特征信息,形成的特征更加具有概念化。具體解釋,首先用沒有進行標簽的數(shù)據(jù)訓練第一層RBM網(wǎng)絡,這層網(wǎng)絡結構包括輸入層V0和第一個隱含層H0,輸入數(shù)據(jù)作為最原始的特征向量輸入到輸入層。首先訓練第一層RBM網(wǎng)絡參數(shù),即輸入層和第一層隱含層之間的參數(shù)W0。在訓練完第一層RBM網(wǎng)絡之后,開始訓練第二層RBM網(wǎng)絡參數(shù)W1,將上一層的輸出,也就是第一層隱含層的輸出H0作為第二層網(wǎng)絡的輸入V1進行訓練,即V1=H0。同理,重復這樣的訓練方式,將第(n-1)層的輸出作為第n層的輸入,得到第n層RBM網(wǎng)絡參數(shù)Wn-1。這樣DBN網(wǎng)絡每一個隱含層之間的參數(shù)都得到初始化。RBM網(wǎng)絡只能夠保證每一層的參數(shù)使該層的特征向量達到最優(yōu),不能夠保證整個DBN網(wǎng)絡達到最優(yōu),RBM學習到的是普遍的概念化特征,不能夠?qū)W習具體任務的特征。因此就要第二步訓練過程來完成這個任務。第二步是利用BP網(wǎng)絡有監(jiān)督訓練Softmax,將RBM學習的特征進行組合分類,將錯誤信息反向傳播到所有的RBM網(wǎng)絡,微調(diào)RBM之間的網(wǎng)絡參數(shù)。微調(diào)之后的參數(shù)就是整個DBN網(wǎng)絡的最優(yōu)參數(shù)[8]。
1986年,Smolensky提出一種生成式隨機網(wǎng)絡RBM,屬于無監(jiān)督的機器學習模型中的一種,是對玻爾茲曼機改進得到的[9]。
假設存在一個二部圖[10],一層是可視層(v),為輸入層,另一層是隱藏層(h),每一層之間的網(wǎng)絡節(jié)點不會存在連接,是相互獨立的。節(jié)點都是隨機二值變量節(jié)點,并且全概率分布p(v,h)滿足Boltzmann分布,就可以稱這種模型為RBM模型。RBM模型中,在已知可視層(v)的情況下,由于節(jié)點之間不存在連接,則所有的隱藏節(jié)點之間是條件孤立的,表達為p(h|v)=p(h1|v)…p(hn|v)。同樣的道理,如果已知隱藏層(h),所有可視點都是條件孤立的。由于所有的可視層和隱藏層都滿足Boltzmann分布。所以,當輸入v時,通過p(h|v)就可以得到可視層。
一個RBM模型,擁有n個可見單元v=(v1,v2,…,vn)和m個隱藏單元h=(h1,h2,…,hm),定義其能量函數(shù)為:
(1)
式中:v表示可視層的狀態(tài);h表示為隱藏層的狀態(tài);vi表示為第i個可視單元的狀態(tài);hj表示為第j個隱藏單元的狀態(tài);ai是可視單元的偏置;bj是隱藏單元的偏置;wij表示為可見單元i與隱藏單元j之間的連接權重。RBM處于狀態(tài)v,h的概率為:
(2)
(3)
同理可得第i個可見單元的激活概率為:
(4)
式(3)和式(4)中,σ(·)為sigmod激活函數(shù)。運用極大似然法法則[12],作用于最大化式(4),可以得到對數(shù)似然函數(shù):
(5)
式中:θ={wij,aj,bj}。該模型利用梯度下降法[13]可以推導出權值的更新公式;
(6)
式中:ε表示學習率,〈〉data表示數(shù)據(jù)上的平均值,〈〉model表示模型上的期望值。
常見的分類器主要有Softmax分類器、SVM分類器、貝葉斯分類器等。文中選用softmax分類器[14]。Softmax分類器可以用來解決多分類問題,即樣本類標簽y的可取值個數(shù)k滿足k>2?,F(xiàn)在有訓練集{(x(1),y(1)),…,(x(m),y(m))},其中的y(i)∈{1,2,…,k}。本模型是一種有監(jiān)督的學習算法,輸入的樣本間類別要十分明確,同一個樣本不能同時屬于多個類別。假設輸入為x,那么它是類別j的概率表示為p(y=j/k)。具體來說,該分類器所對應的神經(jīng)網(wǎng)絡的假設函數(shù)為:
(7)
對雷達輻射源信號進行短時傅里葉變換,得到時頻圖像,但是時頻圖像不能直接作為DBN網(wǎng)絡的輸入,因此需要對時頻圖像進行預處理。
以LFM信號s(t)為例說明,首先通過短時傅里葉變化得到LFM的時頻圖像S(t,f),如圖2所示。
圖2 LFM信號時頻圖像
對時頻圖像每個點做歸一化處理
(8)
對圖像進行灰度變換,灰度圖像如圖3所示。
圖3 時頻圖像灰度圖
為了將一部分噪聲去除,減少噪聲的影響,對灰度圖像進行閾值二值化操作:
(9)
(10)
提出的算法框架流程如下:
1)數(shù)據(jù)預處理。將輻射源信號進行短時傅里葉變換,然后對得到的時頻圖像進行圖像處理,歸一化、灰度、二值化操作、裁剪,最后將處理后的時頻圖像進行向量化操作,得到特征向量V。
圖4 文中算法識別框圖
2)特征提取。將V輸入到DBN網(wǎng)絡中,調(diào)節(jié)網(wǎng)絡參數(shù)。主要分為兩個步驟:第一,通過無監(jiān)督學習調(diào)節(jié)每一節(jié)隱藏層權值W;第二步,通過BP算法有監(jiān)督訓練,對整個網(wǎng)絡的參數(shù)進行微調(diào)。
3)分類識別。結合文中搭建的深度神經(jīng)網(wǎng)絡模型和目標信號識別任務,采用Softmax實現(xiàn)目標識別,輸出識別結果。
為了驗證算法有效性和對準確性,利用常見雷達輻射源信號進行仿真實驗,分別是常規(guī)信號(CW)、二相編碼壓縮信號(BPSK)、二頻率編碼信號(BFSK)和四頻率編碼信號(QFSK)、線性調(diào)頻信號(LFM)、非線性調(diào)頻信號(NLFM)。信號參數(shù)設置載頻為200 MHz,采樣率為2 GHz,BPSK和BFSK采用11位Barker碼,QFSK采用16位Frank碼,信號在信噪比-12 dB到4 dB的范圍內(nèi),每種信號每隔2 dB產(chǎn)生200個輻射源信號,作為測試集,在SNR∈[0 dB,10 dB]范圍內(nèi)每種信號隨機產(chǎn)生500個樣本,6種信號總共3 000個樣本作為訓練集。試驗硬件平臺為:CPUi5-7300,內(nèi)存為8 GB,MATLAB版本為R2014a。
定義雷達輻射源信號的總體識別正確率為:
(11)
定義單個種類雷達輻射源信號識別正確率:
(12)
在深度學習中包含很多重要網(wǎng)絡參數(shù),首先使用控制變量法,探究參數(shù)對識別率影響程度如何,采用SNR=-10 dB 6種輻射源信號進行對比實驗,網(wǎng)絡結構為[100],即隱藏層為一層,神經(jīng)元個數(shù)為100,取6種總識別率進行分析。
控制批訓練樣本數(shù)batchsize控制為10,動量momentum控制為0.01,改變學習率,觀察識別效果變化,如表1所示。
表1 不同學習率信號總識別率
從表1分析得到,識別率會因為學習率改變發(fā)生很大變化,如果學習率太小會容易造成局部最優(yōu),學習率太大,會造成超過極值,損失會停止下降,在某一位置反復震蕩。確定合適的學習率對識別效果有至關重要的作用。
批訓練樣本數(shù)batchsize控制為10,學習率控制為0.1,改變動量momentum,觀察識別效果變化,如表2所示。
表2 不同動量信號總識別率
從表2分析得到,識別率會因為動量的改變發(fā)生很大變換。主要是因為網(wǎng)絡權值更新的時候不能保證每一次初始化操作都能使得網(wǎng)絡初始值處于一個合適的位置,如果初始權值不正確,很有可能會造成網(wǎng)絡的損失函數(shù)在訓練過程中陷入局部最小值,無法達到全局最優(yōu)的理想狀態(tài)。合適的動量momentum能夠在一定程度上解決這個問題。
控制學習率為0.1,動量momentum為0.01,批訓練樣本數(shù)為10,改變信噪比,觀察6種信號單個信號種類具體識別結果,如圖5所示。
圖5 6種典型信號在不同信噪比下識別率
圖5為不同信噪比下DBN模型對不同類型輻射源信號識別效果對比曲線圖。表3為SNR=-10 dB時各類信號識別結果混淆矩陣。從圖5可以分析到在SNR≥-4 dB時,每一種信號識別率都能達到100%的效果,在SNR=-12 dB的時候,BPSK和BFSK信號識別率很低,識別率在55%~60%之間,CW與QFSK信號識別率較高,能保持在75%~80%之間,在SNR=-8 dB的時候,各類信號都能達到90%以上。單個信號識別率隨著信噪比的提高,識別效果逐步增強。從表3可以得到各類信號之間存在誤識。主要是因為信噪比低的時候,信號受到噪聲的嚴重影響,信號特征不明顯,時頻圖像主要信息微弱,有用信息被噪聲掩蓋,導致識別率很低。隨著信噪比的提高,時頻圖像中有用信息逐漸增強,噪聲減弱,特征更加顯著,識別效果更好。
表3 SNR=-10 dB時測試集下的混淆矩陣
為驗證文中算法有效性,將算法與文獻[3](LBPV)、文獻[16](TFAF)、文獻[4](SAE)針對信號總識別率進行對比,文獻[16]是基于時頻原子特征的識別方法。通過這4種算法的對比,在SNR<0 dB時,另外3種算法識別效果隨著信噪比降低下降明顯,文中算法識別效果比較穩(wěn)定,說明算法具有更強的魯棒性,并且在低信噪比情況下識別效果明顯優(yōu)于其它3種算法。特別是與SAE對比,SAE也是利用對時頻圖像處理之后進行分類識別,在SNR≥0 dB,兩種方法識別效果接近,但是在SNR<0 dB,DBN比SAE明顯識別效果更好。在利用不同方法提取信號時頻圖像特征時,說明DBN能夠挖掘信號更深層次特征,SAE還是停留在淺層特征。在低信噪比的情況下,文中算法能夠取得很好的識別效果。
圖6 不同模型下輻射源信號識別模型對比
針對傳統(tǒng)方法在雷達輻射源信號低信噪比情況下識別效果差的問題,提出了基于DBN的輻射源信號識別算法,首先通過對信號時頻變換,然后對時頻圖像進行圖像預處理,利用DBN網(wǎng)絡和Softmax分類器對處理后的信號進行分類識別。通過仿真驗證了算法的可行性,相對于傳統(tǒng)的識別算法,文中算法具有更好的識別精度和魯棒性,實現(xiàn)在低信噪比-10 dB的情況下也能實現(xiàn)較高的識別率。但是在更低的信噪比的情況下,識別效果明顯下滑,因此改進更有用的特征提取算法需要進一步研究。