劉亞沖,唐智靈
(桂林電子科技大學(xué) 廣西無線寬帶通信與信號處理重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541004)
由于制造工藝存在隨機(jī)性,即使是同一批次生產(chǎn)的不同輻射源電路之間具有細(xì)微的個體差異,反映在無線電信號上表現(xiàn)為輻射源的“指紋”特征。這種個體特征為通信輻射源個體的識別提供了可能性。研究通信輻射源個體識別方法在無線通信安全認(rèn)證、無線電監(jiān)測、電磁環(huán)境感知、信息作戰(zhàn)等領(lǐng)域具有應(yīng)用價值[1-4]。
通信輻射源特征識別的研究方向有:在理論上探索特征機(jī)理,為特征提取提供可靠依據(jù);在技術(shù)上設(shè)計(jì)特征提取和相對應(yīng)的分類器,作為特征識別系統(tǒng)的核心。目前,在理論和技術(shù)上仍然存在很多難點(diǎn)。已經(jīng)提出的輻射源個體特征大致可分為時域[5-7]、頻域[5,7]、其他變換域[8-9]3類,每一類特征又可包含多維特征,從而形成一個特征向量。但是由這3類特征組成的特征向量往往具有較大的特征維數(shù),這對算法的效率帶來了較大挑戰(zhàn)。針對上述問題,雖然通過神經(jīng)網(wǎng)絡(luò)分類[10]、雙譜特征分析[11]、支持向量機(jī)(Support Vector Machine,SVM)[12]等方法解決,但還存在著明顯的不足:隨著訓(xùn)練樣本數(shù)量的增加,神經(jīng)網(wǎng)絡(luò)和SVM的分類效率降低,時間加長。隨著測試樣本數(shù)的增加,識別率會有較大下降,識別效果差。
本文設(shè)計(jì)一種循環(huán)譜和Softmax回歸相結(jié)合的多分類識別器,在測試樣本數(shù)遠(yuǎn)大于訓(xùn)練樣本數(shù)的條件下,對輻射源信號進(jìn)行有效分類識別,并通過聯(lián)合主成分分析(Principal Component Analysis,PCA)降維算法提高識別效率。
Softmax回歸模型是logistic回歸模型在多分類問題上的推廣,主要用于解決多分類的問題,即分類識別的輸出結(jié)果y可以取2個以上的值。Softmax基本原理:在多分類的問題中,類標(biāo)簽y有k個不同的值。那么對于訓(xùn)練集{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))},有y(i)∈{1,2,…,k}。對于給定的測試輸入x,Softmax函數(shù)針對每一個類別J估算出概率值p(y=j|x),即估計(jì)x的每一種分類結(jié)果出現(xiàn)的概率。函數(shù)hθ(x)形式如下:
(1)
(2)
Softmax函數(shù)將k個可能的類別進(jìn)行了累加,即在Softmax回歸中將x分類為類別J的概率為:
(3)
其中,最大概率所對應(yīng)的類別即是x的分類類別。
在實(shí)際應(yīng)用中,通常在上訴代價函數(shù)中加入權(quán)重衰減以解決Softmax回歸的參數(shù)冗余導(dǎo)致的數(shù)值問題,則式(2)變?yōu)?
(4)
利用梯度下降法求解函數(shù)中的θ,對式(4)求導(dǎo)后,可以得到梯度公式為:
p(y(i)=j|x(i);θ))]+λθj
(5)
循環(huán)譜是循環(huán)平穩(wěn)分析的常用手段,它的定義域從頻率擴(kuò)展到了譜頻率與循環(huán)頻率的二維平面,利用循環(huán)譜的差異可以對參數(shù)不同的信號進(jìn)行分辨和識別。而且由于平穩(wěn)噪聲不具有循環(huán)平穩(wěn)特性,因此循環(huán)譜分析可以在很大程度上將信號與噪聲區(qū)分開,在信號分析中具有很大的優(yōu)越性[13]。本文采用循環(huán)譜手段,通過分析信號中的循環(huán)譜特征差異性,從而達(dá)到輻射源個體識別的目的。
假設(shè)隨機(jī)信號為x(t),那么,其自相關(guān)函數(shù)為[13]:
Rx(t+τ/2,t-τ/2)=E{x(t+τ/2)x*(t-τ/2)}
(6)
如果在時間域Rx(t,τ)是周期為T0的周期函數(shù),滿足下式:
Rx(t+τ/2,t-τ/2)=Rx(t+nT0+τ/2,t+nT0-τ/2)
(7)
則稱信號x(t)具有二階周期平穩(wěn)特性,并且Rx(t,τ)的Fourier的展開式為:
(8)
(9)
(10)
通信信號通常都是調(diào)制信號,在調(diào)制過程中經(jīng)常會將某些周期性引入到調(diào)制信號中,從而使調(diào)制信號具有循環(huán)平穩(wěn)特性。其循環(huán)譜不僅在α≠0出存在非零向量,而且在某些特定的循環(huán)平率上呈現(xiàn)峰值,所以,通過觀測在循環(huán)平率α≠0上的譜峰值的差異可以區(qū)分參數(shù)不同的通信信號,從而達(dá)到識別通信輻射源個體特征的目的。
循環(huán)譜特征的提取步驟如下:
1)對信號x(t)以采樣周期Ts均勻采樣N個樣本,得到長度Δt=NTS的離散序列x(n)。
2)對x(n)作離散傅里葉變換得到:xΔt(f)|f=kFs=TsXΔt(k)。
如果簡單地將循環(huán)譜密度函數(shù)作為輻射源特征識別分類器的訓(xùn)練樣本,往往會面臨樣本維數(shù)較高的問題[14]。分類器計(jì)算高維數(shù)的數(shù)據(jù),必然會降低分類識別的效率。因此,需要提取信號的循環(huán)譜密度函數(shù)作為初始高維特征,然后采用主成分分析法對其進(jìn)行降維處理。主成分分析是模式識別等領(lǐng)域最為成熟的算法,做為一種線性映射方法引入到分類識別器的構(gòu)建中來,可實(shí)現(xiàn)信號的重構(gòu),并最大限度地保留原信號的重要信息。
PCA的基本思想是將數(shù)量較多的具有一定相關(guān)性的變量變重新組合成一組數(shù)量較少的互不相關(guān)的變量。通常是將原始變量進(jìn)行線性加權(quán)組合成若干個不相關(guān)的綜合變量,從而能夠最大限度的保留原有的數(shù)據(jù)結(jié)構(gòu)分布,并從中選取最能代表原始數(shù)據(jù)的幾個成分進(jìn)行分析,實(shí)現(xiàn)對特征空間降維的目的,提升運(yùn)算效率[15]。
分類器的設(shè)計(jì)是調(diào)制信號自動識別技術(shù)的重點(diǎn)之一。如何設(shè)計(jì)出高效率,高識別率的分類器對其相當(dāng)重要。常見的分類器,如BP神經(jīng)網(wǎng)絡(luò)、徑向基神經(jīng)網(wǎng)絡(luò),屬于二分類分類器。如果想要對多個類別進(jìn)行分類,需要增加隱含層的數(shù)量,這將大大增加算法的復(fù)雜度。同時由于其輸出類別并不互斥,因此對大量相近的樣本分類效果較差。
針對多分類問題,本文構(gòu)建了循環(huán)譜計(jì)算與Softmax級聯(lián)的多分類識別器,其結(jié)構(gòu)如圖1所示。
圖1 循環(huán)譜計(jì)算與Softmax級聯(lián)的多分類識別器結(jié)構(gòu)
在圖1中,xI是通過循環(huán)譜特征提取得到的高維特征向量,XN是經(jīng)過PCA降維后的最終特征向量,同時作為神經(jīng)網(wǎng)絡(luò)的樣本輸入,wjN是多分類識別器通過樣本訓(xùn)練后得到的對輻射源信號分類的網(wǎng)絡(luò)權(quán)值,yJ是經(jīng)過循環(huán)譜與Softmax多分類識別器后得到的已識別信號。識別器對通信輻射源個體特征識別的步驟為:
1)采用循環(huán)譜算法對采集的樣本信號進(jìn)行循環(huán)譜密度特征提取,形成特征樣本集。
2)對得到的特征樣本集進(jìn)行PCA降維。
3)使用降維后的特征樣本集對Softmax多分類識別器進(jìn)行訓(xùn)練,得到分類識別模型。
4)對待識別的信號經(jīng)過第1)步的特征提取,再經(jīng)過第2)步的PCA降維,最后使用第3)步訓(xùn)練好的分類識別模型進(jìn)行特征識別。
實(shí)驗(yàn)采集5部移動電話的輻射信號,每個輻射源采集400個樣本,共2 000個樣本。從每個輻射源的樣本中隨機(jī)選取100個樣本組成訓(xùn)練集,剩下的樣本組成測試集。
首先對每份樣本計(jì)算其循環(huán)譜密度,得到初始的2 150維特征向量。其中兩部移動電話信號樣本的循環(huán)譜密度如圖2所示。因?yàn)樘卣飨蛄烤S數(shù)過多,所以只展示其中3部手機(jī)的第19維、20維特征,如圖3所示。由三維圖、等高圖可以看出,即使是兩部工作在相同條件下的手機(jī),它們的循環(huán)譜在不同的循環(huán)頻率處達(dá)到峰值;由特征樣本分布圖可以看出,兩部手機(jī)的循環(huán)譜密度函數(shù)存在一些細(xì)微的特征差異。通過分辨這些差異就能達(dá)到區(qū)分不同輻射源的目的。然后,對初始高維體征進(jìn)行PCA降維處理,得到的特征值用百分比形式表示如圖4所示。由圖4可見,越靠前的主成份包含的信息量越大。為了充分保留輻射源特征信息,本文選取包含了99%信息量的前899維主成分作為神經(jīng)網(wǎng)絡(luò)的輸入特征集。
圖2 2部手機(jī)樣本的循環(huán)譜密度函數(shù)對比
圖3 3部手機(jī)信號的指紋特征樣本分布
圖4 降維特征
最后,對降維獲得的特征向量,使用本文提出的多分類通信輻射源個體分類識別器進(jìn)行訓(xùn)練和識別。為了評估新識別器的性能,實(shí)現(xiàn)了2種分類識別器對本文的輻射源樣本進(jìn)行識別:分別為基于BP神經(jīng)網(wǎng)絡(luò)的輻射源識別器,基于Softmax回歸的輻射源多分類識別器,后者直接對未降維的循環(huán)譜密度特征進(jìn)行訓(xùn)練和識別。對3種方法得到的識別率和識別時間進(jìn)行了對比,結(jié)果如表1所示。從表1可以看出,采用循環(huán)譜結(jié)合BP神經(jīng)網(wǎng)絡(luò)的方法在測試樣本大于訓(xùn)練樣本的情況下,識別率會大幅度下降,并且識別率速度慢。本文構(gòu)建的多分類識別器具有與基于Softmax回歸的輻射源多分類識別器的方法相近的識別率,且不會因?yàn)闇y試樣本數(shù)的增加而產(chǎn)生較大變化。同時識別時間明顯縮短,以及識別效率有一定的提高。
表1 各方法性能對比
本文提出一種基于循環(huán)譜密度特征的通信輻射源個體識別方法。通過引入Softmax回歸模型實(shí)現(xiàn)多分類識別,彌補(bǔ)傳統(tǒng)方法在樣本數(shù)大的情況下識別率效果差、識別效率低的不足。在此基礎(chǔ)上,采用PCA算法對特征向量進(jìn)行降維,進(jìn)一步縮短識別的時間。實(shí)驗(yàn)結(jié)果表明,在大量測試樣本數(shù)的情況下,經(jīng)過降維改進(jìn)后的識別器仍然能保持較高的識別率,比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)識別器及高維Softmax回歸的多分類識別器的性能有一定改善。
[1] OROSCO E,DIEZ P,LACIAR E,et al.On the Use of High-order Cumulant and Bispectrum for Muscular-activity Detection[J].Biomedical Signal Processing and Control,2015,18:325-333.
[2] 肖樂群,張玉靈,趙擁軍.基于對角積分雙譜的雷達(dá)輻射源信號識別[J].信息工程大學(xué)學(xué)報(bào),2012,13(1):95-99.
[3] OLIVEIRAM D,BITMEAD R R.High-fidelity Modulation Parameter Estimation of Non-cooperative Transmitters:Baud-period and Timing[J].Digital Signal Processing,2011,21(5):625-631.
[4] 陳 紅,蔡曉霞,徐 云,等.基于多重分形特征的通信調(diào)制方式識別研究[J].電子與信息學(xué)報(bào),2016,38(4):863-869.
[5] 唐 哲,雷迎科,蔡曉霞.通信輻射源的潛在細(xì)微特征提取方法[J].電波科學(xué)學(xué)報(bào),2016,31(5):883-890.
[6] KAWALEC A,PIENIEZNY A.Radar Pulse Trains Classification[C]//Proceedings of Microwaves,Radar and Remote Sensing Symposium.Washington D.C.,USA:IEEE Press,2008:166-169.
[7] 王宏偉,趙國慶,王玉軍.基于脈沖包絡(luò)前沿高階矩特征的輻射源個體識別[J].現(xiàn)代雷達(dá),2010,32(10):42-45,49.
[8] 徐書華,黃本雄,徐麗娜.基于SIB/PCA的通信輻射源個體識別[J].華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,36(7):14-17.
[9] ZHANG Jingwen,WANG Fanggang,DOBRE O A,et al.Specific Emitter Identification via Hilbert-huang Transform in Single-hop and Relaying Scenarios[J].IEEE Transactions on Information Forensics & Security,2016,11(6):1192-1205.
[10] 陳 娟.雷達(dá)輻射源特征提取與個體識別[D].西安:西安電子科技大學(xué),2013.
[11] TANG Li,JIANG Ting.Target Identification Based on Diagonal Slice of The Complex Bispectrum[C]//Proceedings of IEEE International Conference on Communication Problem-solving.Washington D.C.,USA:IEEE Press,2015:303-306.
[12] SHOTTON J,SHARP T.Real-time Human Pose Recognition in Parts from Single Depth Images[J].Communications of the Association for Computing Machinery,2013,56(1):116-124.
[13] 李世平,陳方超,王 隆,等.多徑信道下基于循環(huán)譜特征的調(diào)制識別算法[J].計(jì)算機(jī)應(yīng)用,2012,32(8):2123-2127.
[14] 陳志偉,徐志軍,王金明,等.一種基于循環(huán)譜切片的通信輻射源識別方法[J].數(shù)據(jù)采集與處理,2013,28(3):284-288.
[15] HAO Zengcao,SINGH V P.Drought Characterization from a Multivariate Perspective:A Review[J].Journal of Hydrology,2015,527:668-678.