姚 瑤,王戰(zhàn)紅
(1.鄭州工程技術(shù)學院信息工程學院,河南 鄭州 450044;2.鐵道警察學院圖像與網(wǎng)絡(luò)偵查系,河南 鄭州 450033)
在電子情報(Electronic Intelligence, ELINT)分析中,對雷達信號的識別是電子戰(zhàn)系統(tǒng)的關(guān)鍵技術(shù)之一[1-2]。隨著雷達技術(shù)的飛速發(fā)展,脈間參數(shù)提供的信息可能越來越少,更多的信息被掩藏在脈內(nèi)調(diào)制方式中,而其信號內(nèi)部的調(diào)制方式可以在提高雷達信號的參數(shù)估計精度、推測雷達工作模式,進而判斷雷達威脅程度等方面發(fā)揮重要作用[3]。因此,在信號脈內(nèi)調(diào)制越來越復(fù)雜的背景下,對信號調(diào)制方式的正確識別受到眾多學者的關(guān)注,同時也成為現(xiàn)代電子戰(zhàn)中亟需有效解決的問題。
時頻分析是處理非平穩(wěn)信號的重要工具之一,它相對于傅里葉變換等時域分析方法來說,將時間與頻率結(jié)合起來,有效地檢測到信號頻率與時間的變化規(guī)律,清楚地描述出在不同時間內(nèi)頻率的能量密度或強度[4-5],因此在雷達信號處理中,可以更好地反映信號調(diào)制方式的內(nèi)部結(jié)構(gòu)。國內(nèi)外許多學者在利用時頻變換得到的數(shù)據(jù)進行相關(guān)的特征提取,文獻[3]在利用CWD(Choi-Williams Distribution)變換的基礎(chǔ)上提取時頻圖像的奇異譜熵特征,再結(jié)合分形特征,使用8類雷達信號,在信噪比大于4 dB時,識別正確率都達到了100%。文獻[6]利用CWD時頻圖像,并從圖像中提取相關(guān)特征,在信噪比為-2 dB下識別率能達到94.7%。文獻[7]提出了多尺度小波熵以及特征權(quán)重選擇法,獲得了較高的識別效果。從上述文獻可知,在時頻變換的基礎(chǔ)上利用其他特征提取方法,可以得到各種各樣的識別方法,但是這些方法并沒有從時頻變換得到的圖像本身出發(fā),而是通過人工設(shè)計大量的特征組合在一起。對于人工選取特征這一類的方法,一方面是需要大量專業(yè)知識與經(jīng)驗,是相對困難的;另一方面,選取的特征在不同環(huán)境或者狀態(tài)下,其識別率也不穩(wěn)定,并且它們通常都屬于淺層特征[8]。
隨著人工智能的發(fā)展,深度學習的方法逐漸被引入雷達信號處理中[9-10],其能減少特征的選取過程以及能夠?qū)μ卣鬟M行深度提取,在識別中具有強大的優(yōu)勢。其中,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)相對于其他網(wǎng)絡(luò)能夠?qū)D像進行自動學習結(jié)構(gòu)化特征,可以自動學習到圖像數(shù)據(jù)中的結(jié)構(gòu)[11]。文獻[8]提出了利用棧式稀疏自編碼器作為提取特征和分類的工具,識別效果較為明顯,然而在預(yù)處理過程中容易保留不住信號特征,導(dǎo)致識別率提高不上去。
針對在預(yù)處理過程中時頻圖像的特征性可能會降低且人工選擇特征的復(fù)雜度較高的問題,提出了一種時頻預(yù)處理下卷積網(wǎng)絡(luò)的雷達信號識別算法,較好地在預(yù)處理過程中保留住時頻圖像的特征,為卷積網(wǎng)絡(luò)深層次提取具有判別性的特征提供保障,實現(xiàn)了在低信噪比下的信號識別。
SPWVD時頻分布是由WVD分布中加入兩個實的偶函數(shù)g(u)和h(τ)得來的,相對于WVD,SPWVD可以更好地削弱相干項的影響,能量和時頻聚集性更強,更容易看出信號的時頻關(guān)系。
對于截獲到的雷達信號x(t),可計算WVD分布:
(1)
進而加入兩個實偶窗函數(shù),其中g(shù)(u)為時域平滑窗和h(τ)為頻域平滑窗,得到SPWVD分布:
(2)
為直觀展現(xiàn)SPWVD與WVD在表達雷達信號時頻圖像上的差異,圖1為在信噪比為10 dB下,本文使用的8種典型雷達信號調(diào)制類型時頻變換上的圖像表達,包括常規(guī)信號、線性調(diào)頻、非線性調(diào)頻、二相編碼、四相編碼、頻率編碼、調(diào)頻連續(xù)波、COSTAS碼。
可以看出,SPWVD的時頻聚集性強于WVD,能量表達更為凸顯,且成像更為干凈,說明SPWVD受噪聲的影響也比WVD小。另外,從頻率編碼和COSTAS信號可以發(fā)現(xiàn),WVD在變換過程中會產(chǎn)生多余的分量,掩蓋了原信號的時頻特征。因此通過SPWVD更容易獲取信號的時頻特征,不受其他多余分量的干擾。
考慮到網(wǎng)絡(luò)的計算性能,對圖像的預(yù)處理目的在于進一步減少數(shù)據(jù)量,但在此基礎(chǔ)上一定要盡可能地保留圖像內(nèi)容的完整性以及特征的明顯性,避免在處理過程中使能夠判別類別的特征被削弱或被丟失。因此在本文對雷達信號的時頻圖像預(yù)處理中,首先需要進行對稱映射,增加特征信息;然后對信號的時頻曲線進行主能量脊提取,并二值化,提高抗噪性,突出特征信息的同時減少數(shù)據(jù)數(shù)值;最后對時頻圖像進行重置,減少數(shù)據(jù)量。
圖1 8種雷達信號SPWVD與WVD時頻圖Fig.1 The time-frequency images of SPWVD and WVD among 8 sorts of radar signal
從圖1可以看出,NS、LFM、BPSK、NLFM、QPSK五種調(diào)制方式以及FSK、COSTAS兩種調(diào)制方式,在時頻圖像表達上有一定的相似度,尤其在信噪比較低的情況下,噪聲的干擾可能會削弱調(diào)制方式之間的不同特征,會對分類器的學習、訓練、識別造成一定的影響。因此本文首先采取對稱映射的方式,增加不同調(diào)制信號間本身的特征信息,如圖2所示。
時頻圖像反映了信號在時域和頻域的能量分布,而能量的分布正是表征不同信號種類的特征。為了突出能量的分布狀態(tài),降低噪聲的干擾,在每一采樣點上可以獲得最大能量值Emax,文獻[12]則是連接每一采樣時刻的幅度峰值點,形成了一條特定的曲線,然而信號時頻能量的分布并不能僅僅用一條曲線來表示,更應(yīng)該用輪廓來表示,比如BPSK、QPSK信號,如果按照文獻[12]處理,則會得到幾乎一樣的直線,在識別中誤差會加大;另一方面,當信噪比較低時,噪聲能量可能比信號能量還要高,那么峰值點將會出現(xiàn)在噪聲處,這樣得到的曲線將已不是原來信號的模樣。
因此,本文對主能量脊提取方法為:在采樣點上獲得最大能量值后,降低判定為主能量脊的閾值,選擇E=Emax·σ,σ∈[0.5, 1)作為判斷依據(jù),即在采樣時刻大于E的點都可作為主能量脊,其中σ表示值在區(qū)間[0.5, 1)內(nèi)選擇,當噪聲逐漸增大時,區(qū)間的取值也逐漸增大,用以消除噪聲的影響。
圖2 對稱映射后的時頻圖Fig.2 The time-frequency images after symmetrical mapping
當對信號時頻圖像進行主能量脊提取后,則可以獲取時頻能量的分布狀態(tài),在隨后本文的算法中CNN學習不再關(guān)注能量的大小,而是關(guān)注能量的分布形狀,因此將圖像二值化可以在保留信號的完整特征信息的基礎(chǔ)上,進一步減少噪聲的干擾,也可以降低訓練中數(shù)據(jù)數(shù)值的計算,簡化識別部分的運算。
二值化處理的方法有很多,其中牛津法能夠自適應(yīng)確定分割閾值,也叫最大類間誤差法,其特點在于:能夠?qū)D像分為目標和背景兩個部分,目標和背景之間的類間差越大,說明構(gòu)成圖像的兩部分的差別也就越大。通過第二步主能量脊的提取,目標和背景已經(jīng)能夠在很大程度上區(qū)分,因此適合用最大類間誤差法進行二值化。
在CNN處理圖像時需要考慮到計算性能與識別效率,若圖像數(shù)據(jù)量大、維數(shù)大則會導(dǎo)致訓練的參數(shù)將成倍增加,在訓練學習中非常耗時,同時也影響識別效果。而在圖像重置中提供了許多不同的插值方法,其中雙3次插值在精度上能夠更好地插補圖像,對重置的效果最好。因此本文采用雙3次插值的方法進行時頻圖像的調(diào)整,并考慮到若重置太小,將模糊了信號的一些重要特征信息,最后將圖像調(diào)整為64×64。
經(jīng)過四步預(yù)處理,可以得到需要的信號時頻圖像,也是CNN的輸入數(shù)據(jù)。圖3(a),(b),(c)為在信噪比0 dB、-5 dB、-10 dB下LFM信號預(yù)處理后的圖像,可以看出,隨著信噪比的降低,時頻圖像開始出現(xiàn)其他的噪聲點,但是在低信噪比下依然能夠清楚看到信號調(diào)制方式樣式,極大地保持了原調(diào)試方式的特征,說明預(yù)處理對噪聲的抗干擾性較強。圖3(d),(e),(f)為LFM信號在信噪比為-10 dB下,σ=0.7,0.8,0.9時的情況,可以看出當σ逐漸增大時,噪聲點逐漸減少,說明了當信噪比較低時,適當提高σ值可以在一定程度上抑制噪聲點的干擾。
有著大量待學習參數(shù)的卷積神經(jīng)網(wǎng)絡(luò),若采用隨機初始化的方法,可能導(dǎo)致卷積核初始化欠優(yōu),產(chǎn)生權(quán)值和網(wǎng)絡(luò)參數(shù)的學習難度增大、網(wǎng)絡(luò)收斂時間長等問題,訓練的效果可能并不理想。若要達到較好的效果,則需要大量的標注的樣本,通過大量的迭代使網(wǎng)絡(luò)得到收斂。
圖3 預(yù)處理后的LFM圖像Fig.3 LFM image after preprocessing
而對于電子戰(zhàn)系統(tǒng)的截獲接收機來說,雖然復(fù)雜電子環(huán)境中有百萬級數(shù)量的電磁信號,實際上能夠截獲到攜帶輻射源信息的、能夠判定威脅程度的完整信號并不多,即在情報分析中能夠提供的信號樣本較少,因此很難通過上述所講的大量樣本來訓練網(wǎng)絡(luò)。從文獻[11—13]可知,使用一個在其他訓練集上訓練好的CNN模型,對另一個待學習的CNN模型進行訓練,能夠較快地使參數(shù)得到最優(yōu)化,網(wǎng)絡(luò)得到收斂,且不需要巨量的樣本數(shù)據(jù)。而文獻[14]又提到,使用大數(shù)據(jù)進行預(yù)訓練的方法,要在選用的數(shù)據(jù)集和目標數(shù)據(jù)之間差異較小的情況下才可能達到效果,同時也需要進行大規(guī)模的訓練才能遷移到目標數(shù)據(jù)集上。
鑒于MNIST手寫數(shù)據(jù)庫[15]中的手寫圖像是灰度的,且在分布形態(tài)上與本文處理后的信號時頻圖像都有著直觀上的相似度,因此本文使用MNIST手寫數(shù)據(jù)庫作為CNN模型的預(yù)訓練數(shù)據(jù)集,并通過預(yù)訓練將得到的卷積核對本文CNN模型的卷積層進行逐層初始化。
經(jīng)過網(wǎng)絡(luò)大小、計算性能、識別效果的綜合考慮,本文設(shè)計的CNN模型最終采用3個卷積層,3個池化層和1個全連接層。其中卷積層的卷積核大小分別為5,5,2,卷積核滑動都為1,卷積核的個數(shù)分別為16,32,64;池化層中均采用2×2最大池化(Max Pooling),滑動步長為2,分別緊接在前三個卷積層后,最后一個池化層緊接在全連接網(wǎng)絡(luò)前;所有中間層的激活函數(shù)均使用ReLU(Rectified Linear Unit)函數(shù)。具體結(jié)構(gòu)參數(shù)如表1所示。
表1 CNN結(jié)構(gòu)參數(shù)
最后,本文提出的雷達信號的識別算法如圖4所示,通過對截獲到的雷達信號進行時頻圖像預(yù)處理,得到保留信號調(diào)制方式特征的二值化圖像,輸入到經(jīng)過預(yù)訓練后初始化模型的CNN中進行學習、識別。
實驗測試平臺為:Win7、32位操作系統(tǒng),處理器Inter(R) Core(TM) i5-3210M,內(nèi)存4 GB,CPU主頻2.50 GHz。實驗仿真依然采用第2章提到的8種典型雷達信號,參數(shù)設(shè)置參考文獻[16],其中所有信號的采樣頻率為60 MHz,在載波頻率在7~13 MHz范圍內(nèi)均勻變化,其他參數(shù)具體如表2所示。
表2 信號主要參數(shù)范圍
圖4 本文信號識別算法Fig.4 Signal recognition algorithm
實際上對于截獲到的信號往往會有噪聲污染,因此在仿真實驗中,對每種信號添加高斯白噪聲,信噪比從10~-10 dB,以5 dB為步進間隔,且每種信號在不同信噪比下隨機產(chǎn)生1 000組訓練樣本,150組測試樣本。同時在同一信噪比下,將不同種類信號隨機排列形成混淆矩陣,測試時重復(fù)10次,識別結(jié)果取平均。
為了展示本文對時頻圖像預(yù)處理方法的優(yōu)勢,采取與文獻[8]使用的方法進行對比,使用本文產(chǎn)生的信號數(shù)據(jù)集,將同一信噪比下的每種信號樣本數(shù)量從200逐漸增加到1 000,以200為步進間隔,比較了信噪比為10 dB、0 dB、-10 dB下的識別正確率,如圖5所示。
圖5 在不同信噪比下預(yù)處理方法對比Fig.5 The comparison of preprocessing methods at different SNRs
從圖5可以看出,隨著訓練樣本數(shù)量的增加,識別正確率持續(xù)提高,說明網(wǎng)絡(luò)還是依賴于訓練規(guī)模的大小,但可以看出每種信號在樣本數(shù)量為800時,識別率將逐漸趨于平穩(wěn)。在10 dB和0 dB下,兩種方法得到的信號識別準確率基本上相差不大,但在信噪比為-10 dB時,本文方法較文獻[8]識別率平均提高了2.2%,一方面文獻[8]使用的CWD在時頻聚集性上相比于SPWVD較差;另一方面文獻[8]通過圖像的剪切獲取了具有信號特征的局部部分,而隨后的重置將圖像的分辨率進一步降低,而在低信噪比下噪點逐漸增加,若剪切重置后的圖像中有噪點,則該噪點被放大從而極大地干擾信號特征,本文則依然使用全局圖像,噪點的干擾相對來說影響要小。
為驗證預(yù)訓練CNN模型的效果,在此比較了直接使用新模型和使用預(yù)訓練后模型的訓練時間和識別正確率,為盡量避免偶然性的出現(xiàn),在信噪比為10 dB下,進行對比實驗并重復(fù)10次,最后結(jié)果取平均值,如表3所示。在訓練過程中,未進行預(yù)訓練的CNN識別率最低出現(xiàn)過96.4%的結(jié)果,而進過預(yù)訓練的CNN模型在這10次實驗中都是100%;另外預(yù)訓練后的CNN在訓練時間上減少了近三分之一,因此說明通過MNIST數(shù)據(jù)集訓練后的CNN,其得到的參數(shù)能夠較好地遷移到本文信號識別目標上來。
表3 有無預(yù)訓練過程的對比
為驗證本文識別算法的優(yōu)勢,與文獻[3]的SVEFD-CSVM算法、文獻[17]的CWD-ENN網(wǎng)絡(luò)(Elman Neural Network)分類系統(tǒng)在不同信噪比下進行識別正確率的對比,結(jié)果如圖6所示;其中利用文獻[3]提出的SVEFD方法處理本文信號數(shù)據(jù)集,然后輸入到CSVM中進行訓練、識別;利用文獻[17]基于CWD時頻圖像進行提取的方法處理本文信號數(shù)據(jù)集,然后輸入到ENN中進行訓練、識別。
圖6 算法對比Fig.6 Algorithm comparison
從圖6可以看出,本文算法的識別效果優(yōu)于另外兩種算法,尤其在低信噪比下優(yōu)勢明顯,識別正確率比文獻[3]平均提高了13.0%,比文獻[17]平均提高了9.2%。這是因為文獻[3]和文獻[17]都采用人工提取特征的方法,且使用的分類器屬于淺層分類器,當信噪比逐漸降低時,特征之間的區(qū)分度也隨之下降,分類器也不能進行有效分類;同時也說明了本文算法采用卷積神經(jīng)網(wǎng)絡(luò)相比于人工特征提取方法,在深度提取特征方面,能夠更好地把握信號圖像的內(nèi)部結(jié)構(gòu),從而在信噪比低的情況下,仍有較好地識別率。
本文提出了時頻預(yù)處理下卷積網(wǎng)絡(luò)的雷達信號識別算法。該算法通過將信號的SPWVD時頻圖像與CNN相結(jié)合,利用對稱映射、主能量脊提取、二值化以及重置的預(yù)處理過程,在極大地保留信號圖像特征的基礎(chǔ)上,降低數(shù)據(jù)量,減小噪聲干擾。最后利用預(yù)訓練后的CNN對圖像進行自動地深層特征提取,免去了人工特征提取的困難。
仿真結(jié)果表明,預(yù)處理方法在低信噪比下有著更好的保留特征的優(yōu)勢;提出的算法相比于兩種人工提取特征的方法,在低信噪比下識別率分別提高了13%,9.2%,較好地實現(xiàn)了在低信噪比下得到較高的識別率,為電子戰(zhàn)的情報分析提供了一種可行的方法。