劉云飛 鄭文秀 劉悅凱
(西安郵電大學(xué)通信與信息工程學(xué)院 陜西 西安 710061)
?
基于頻譜包絡(luò)特征提取的PUE攻擊檢測(cè)研究
劉云飛 鄭文秀 劉悅凱
(西安郵電大學(xué)通信與信息工程學(xué)院 陜西 西安 710061)
提出一種基于頻譜包絡(luò)特征提取的PUE(Primary User Emulation)攻擊檢測(cè)方法。在論證頻譜包絡(luò)起伏特征可以作為指紋特征提取的基礎(chǔ)上,結(jié)合曲線擬合,選取特征參數(shù),構(gòu)建能夠明顯反映頻譜包絡(luò)起伏特征的向量,通過(guò)FCM聚類區(qū)分主用戶和PUE攻擊用戶。仿真實(shí)驗(yàn)表明,該方法能夠有效區(qū)分主用戶和PUE攻擊用戶,具有較好的可行性和可靠性。
PUE攻擊 輻射源 頻譜包絡(luò) 特征提取 曲線擬合
認(rèn)知無(wú)線電CR(Cognition Radio)技術(shù)是解決當(dāng)前無(wú)線電頻譜資源緊張和利用率低下的有效技術(shù)[1]。在CR網(wǎng)絡(luò)中,未授權(quán)的認(rèn)知用戶作為次用戶SU[2](Secondary User)可以動(dòng)態(tài)使用空閑的授權(quán)頻譜資源,而不對(duì)授權(quán)主用戶PU(Primary User)產(chǎn)生干擾。在CR網(wǎng)絡(luò)中,要求當(dāng)PU要使用某頻段或信道時(shí),SU就必須停止對(duì)該頻段或信道的占用,避免影響PU的正常通信。這項(xiàng)要求會(huì)被利用進(jìn)行仿冒主用戶攻擊PUE[3],即不端次用戶MU(Misbehavior Secondary User)仿冒PU長(zhǎng)時(shí)間占用信道。
現(xiàn)有的PUE攻擊檢測(cè)方法主要有無(wú)線定位法[4]、能量指紋匹配法[5]、HASH匹配技術(shù)檢測(cè)法[6]、支持矢量數(shù)據(jù)描述檢測(cè)法[7]等。這些方法雖然能有效地檢測(cè)PUE攻擊,但是對(duì)授權(quán)用戶有一定的前提限制,而且不能快速有效地分辨PU和PUE用戶,實(shí)時(shí)性不能滿足快速頻譜感知的要求。PUE攻擊用戶雖然可以模仿PU主用戶的調(diào)制方式,甚至模仿擴(kuò)頻信息,但是不同的輻射源發(fā)射的相同信號(hào)之間還是存在差異的。這種差異是由輻射源[8]本身的個(gè)體差異造成的無(wú)意調(diào)制,如寄生調(diào)制、雜散特性等,是一種指紋特征[9]。因此,從輻射源識(shí)別的角度,也可以通過(guò)輻射源的指紋特征進(jìn)行PUE攻擊檢測(cè)。
本文介紹的方法是從輻射源識(shí)別的角度,以信號(hào)頻譜的上包絡(luò)擬合曲線的參數(shù)為特征,區(qū)分主用戶和PUE用戶。首先是對(duì)頻譜進(jìn)行預(yù)處理,初步提篩選出頻譜的上包絡(luò)信息;然后用曲線擬合的方法,選取合適的函數(shù)擬合出頻譜上包絡(luò)曲線;最后以頻譜上包絡(luò)曲線的參數(shù)為特征,用FCM聚類的方法區(qū)分出不同的輻射源,即區(qū)分主用戶和PUE用戶。
本文所用的數(shù)據(jù)是兩個(gè)不同輻射源的實(shí)測(cè)信號(hào)的頻譜,共11組,每組頻譜數(shù)據(jù)頻率離散、幅值連續(xù),數(shù)據(jù)長(zhǎng)度為300 000個(gè)點(diǎn)。我們需要的是頻譜包絡(luò)的特征,一般情況下,均值曲線就能夠反映一個(gè)信號(hào)的起伏特征。通常用擬合求取均值曲線[10]的方法有兩類,一類是用包絡(luò)線擬合均值曲線,比如分別擬合信號(hào)的極大值點(diǎn)和極小值點(diǎn)來(lái)得到上、下包絡(luò)線,用上、下包絡(luò)線的平均值作為均值曲線的方法,但是這種方法存在著擬合出的均值曲線與實(shí)際的均值曲線之間存在著偏差的缺點(diǎn);另外一類是直接擬合均值曲線的方法。
本文采用的實(shí)測(cè)數(shù)據(jù)中,每組數(shù)據(jù)長(zhǎng)度有300 000個(gè)點(diǎn),且臨近點(diǎn)之間的差值變化范圍很大。如果直接對(duì)頻譜數(shù)據(jù)進(jìn)行擬合,求取均值曲線,不僅計(jì)算量大,而且不能較好反映出頻譜的特征。因此上述求取均值曲線的方法都不可取,為減少計(jì)算量并提取頻譜的明顯特征,本文僅改用頻譜的上包絡(luò)曲線為特征,這樣可以明顯減小計(jì)算量且頻譜上包絡(luò)特征明顯。最簡(jiǎn)單直接的做法是取曲線的極大值點(diǎn),然后擬合出上包絡(luò)。處理公式如下:
(1)
但本文中的實(shí)測(cè)信號(hào)的頻譜過(guò)于復(fù)雜,用極大值進(jìn)行擬合同樣計(jì)算量大且不能較好地反映出上包絡(luò)的特征,如圖1所示。
圖1 極大值擬合結(jié)果
若繼續(xù)迭代多次求極值,計(jì)算量就過(guò)于龐大且得不償失。改進(jìn)方法是用局部最大值代替極值,用這些局部最大值擬合出上包絡(luò)。簡(jiǎn)單概括可描述為以局部最大值為抽樣條件的非等間隔抽樣,具體做法是,先把頻譜分為若干小段,在每個(gè)小段中求出其最大值并保留該最大值所在位置,其他數(shù)據(jù)視為無(wú)效數(shù)據(jù)。這樣不僅可以節(jié)省計(jì)算量,還可以更好地反映出頻譜上包絡(luò)的特征。若每小段的最大值ymaxi=Max(yk×i+1,…,yk×i+k),其中i=1,2,…,表示小短序列的序號(hào),k為分段長(zhǎng)度,那么預(yù)處理后的頻譜信號(hào)可表示為:
(2)
如果忽略最大值點(diǎn)所在位置,全部按每段中間或者每段第一個(gè)點(diǎn)位置考慮,計(jì)算會(huì)更加迅速,那么處理后的信號(hào)可表示為:
(3)
這個(gè)方法的缺點(diǎn)是處理后的頻譜信號(hào)已經(jīng)和原頻譜有了一定的位移改變,對(duì)精度會(huì)有一定影響,處理對(duì)精度要求不高的問(wèn)題時(shí)可以考慮使用。綜合考慮,本文中采用式(2)所示方法。
頻譜數(shù)據(jù)中,每組頻譜有300 000個(gè)點(diǎn),綜合考慮實(shí)時(shí)性和準(zhǔn)確性,采用每100個(gè)點(diǎn)為一段。處理前后的頻譜數(shù)據(jù)如圖2-圖4所示。
圖2 原數(shù)據(jù)data0
圖3 數(shù)據(jù)data0極大值
圖4 數(shù)據(jù)data0分段最大值
按順序分別為處理前數(shù)據(jù),存留小段最大值處理后數(shù)據(jù)和存留極大值處理后的數(shù)據(jù)。從圖中可以看出經(jīng)過(guò)存留小段最大值方法處理后,頻譜的上包絡(luò)形狀已經(jīng)比較明顯。
(4)
用最小二乘法求擬合曲線時(shí),首先要確定φ(x)的形式。首先根據(jù)頻譜上包絡(luò)的顯著起伏特征,建立描述y=φ(x)的數(shù)學(xué)模型,再用曲線擬合的方法確定模型中的參數(shù)。Matlab擬合工具箱會(huì)給參數(shù)的確定帶來(lái)極大的方便。
作為算法的核心部分,包絡(luò)曲線的擬合將直接影響最終特征的提取,包絡(luò)曲線的擬合結(jié)果的好壞將直接影響最終的分類結(jié)果。
2.1 基于雙Sa曲線的包絡(luò)擬合方法
定義階躍函數(shù):
(5)
定義Sa函數(shù):
(6)
那么用兩個(gè)Sa函數(shù)擬合的公式為:
(7)
式(7)中a1、a2分別表示兩個(gè)Sa函數(shù)的最大幅值,b1、b2分別表兩個(gè)Sa函數(shù)的中心寬度,c1、c2分別為兩個(gè)Sa函數(shù)的中心位置。
由圖5可以看出,用Sa函數(shù)進(jìn)行擬合有很明顯的缺點(diǎn),一方面,兩側(cè)旁瓣的存在嚴(yán)重影響了擬合的精度,增加了誤差;另一方面,擬合曲線不能準(zhǔn)確反映出頻譜波峰的起伏特征。
圖5 數(shù)據(jù)data0Sa函數(shù)擬合結(jié)果
2.2 基于高斯函數(shù)組的曲線擬合方法
根據(jù)觀察,這些頻譜可以用三個(gè)峰值不同的高斯函數(shù)疊加的方式進(jìn)行擬合。其中中間高斯函數(shù)占主要部分,兩邊兩個(gè)位置對(duì)稱幅值不同的高斯函數(shù)輔助調(diào)整。擬合函數(shù)為:
(8)
式中:a1表示中間高斯函數(shù)的峰值,a2、a3分別表示兩側(cè)高斯函數(shù)的峰值,b1表示中間高斯函數(shù)的中心位置,b2表示兩側(cè)高斯函數(shù)和中間高斯函數(shù)的中心距離,c1、c2則和高斯函數(shù)的寬度相關(guān)。這些參數(shù)可以通過(guò)matlab的擬合工具箱直接得出。擬合結(jié)果如6圖所示。
圖6 數(shù)據(jù)data0三高斯函數(shù)擬合結(jié)果
從圖6中可以看出,用高斯函數(shù)組的擬合方法,擬合出的曲線能夠較好地反映出頻譜上包絡(luò)的起伏特征,且誤差比雙Sa函數(shù)擬合的方法小很多。
典型的聚類過(guò)程[12]包括數(shù)據(jù)準(zhǔn)備、特征選擇和特征提取、接近度計(jì)算、聚類、對(duì)結(jié)果評(píng)估分析等步驟。
劃分式聚類算法[13]需要預(yù)先指定聚類數(shù)目或聚類中心,通過(guò)反復(fù)迭代運(yùn)算,逐步降低目標(biāo)函數(shù)的誤差值,當(dāng)目標(biāo)函數(shù)值收斂時(shí),得到最終聚類結(jié)果。本文采用模糊C均值聚類算法(FCM)。按照模糊C劃分的概念,對(duì)每個(gè)樣本與每類原型間的距離用其隸屬平方加權(quán),從而把類內(nèi)誤差平方和目標(biāo)函數(shù)擴(kuò)展為類內(nèi)加權(quán)誤差平方和目標(biāo)函數(shù),得到了基于目標(biāo)函數(shù)模糊聚類的更一般的描述[14]。
FCM的主要特點(diǎn)是用模糊劃分,用[0,1]之間的值表示數(shù)據(jù)屬于各個(gè)分組的隸屬程度。數(shù)據(jù)的隸屬度有一個(gè)規(guī)定,也就是該數(shù)據(jù)屬于各個(gè)分組的隸屬度的總和為1:
(9)
由此,F(xiàn)CM的目標(biāo)函數(shù)為:
(10)
其中uij表示隸屬度,ci為第i組的聚類中心,dij為ci與第j個(gè)數(shù)據(jù)點(diǎn)間的歐式距離;且m是一個(gè)在[0,∞)取值的加權(quán)指數(shù)。
為使式(10)達(dá)到最小值,構(gòu)造如下目標(biāo)函數(shù):
(11)
其中λj是式(9)的n個(gè)約束式的拉格朗日乘子,j取1到n。對(duì)所有輸入?yún)⒘壳髮?dǎo),那么使式(10)取最小值就要滿足如下兩式:
(12)
(13)
由式(12)和式(13),模糊C均值算法就是簡(jiǎn)單的迭代過(guò)程。FMC算法具體流程[15]如下:第一步,隨機(jī)獲取c個(gè)聚類中心;第二步,對(duì)數(shù)據(jù)計(jì)算隸屬度矩陣;第三步,計(jì)算初始聚類中心;第四步,判斷聚類中心是否收斂,若收斂則結(jié)束,否則返回第二步。
仿真實(shí)驗(yàn)中是按照如圖7所示的過(guò)程步驟進(jìn)行的。實(shí)驗(yàn)采用數(shù)據(jù)是由兩個(gè)不同輻射源發(fā)射的信號(hào)的頻譜,實(shí)驗(yàn)的計(jì)算機(jī)仿真由Matlab完成,主要步驟是包絡(luò)擬合和聚類劃分兩部分。
圖7 仿真實(shí)驗(yàn)過(guò)程示意
4.1 高斯包絡(luò)擬合原理仿真
根據(jù)包絡(luò)擬合方法的對(duì)比分析,我們采用高斯函數(shù)組擬合的方法,即式(8)所示的擬合函數(shù)。擬合后的參數(shù)有a1、a2、a3、b1、b2、c1、c2。
由圖8和圖9的可以看出不同輻射源頻譜上包絡(luò)擬合結(jié)果的明顯不同。
圖8 數(shù)據(jù)data0擬合結(jié)果
圖9 數(shù)據(jù)data10擬合結(jié)果
所有數(shù)據(jù)的擬合結(jié)果見表1所示。
表1 各參數(shù)的擬合結(jié)果
4.2 FCM聚類仿真
表2 特征參數(shù)表
將上述數(shù)據(jù)輸入Matlab,運(yùn)行FCM分類程序,將上述數(shù)據(jù)分為兩類,得出聚類隸屬度矩陣和聚類中心。
聚類的隸屬矩陣如表3所示。
表3 隸屬矩陣表
聚類結(jié)果三維視圖如圖10所示。
圖10 FCM聚類三維視圖
由表3和圖10可以看出,通過(guò)仿真實(shí)驗(yàn)可以將數(shù)據(jù)明顯地分為兩類。
由于不同輻射源之間存在必然的指紋特征差異,如寄生調(diào)制和雜散特性,使得PUE攻擊露出了一定的破綻。因此本文通過(guò)提取輻射源頻譜包絡(luò)的起伏特征,提出了一種全新的PUE攻擊識(shí)別方法。該方法不考慮攻擊用戶的仿冒方式,直接從頻譜的特征差異識(shí)別用戶,相較于現(xiàn)有方法具有更好的應(yīng)用性和實(shí)時(shí)性。
Matlab仿真實(shí)驗(yàn)環(huán)節(jié)驗(yàn)證了不同輻射源頻譜上包絡(luò)起伏特征存在的差異,并檢驗(yàn)了以此特征為基礎(chǔ)的識(shí)別方法的可行性和可靠性。實(shí)驗(yàn)表明,基于頻譜包絡(luò)特征提取PUE攻擊檢測(cè)方法能夠?yàn)檎J(rèn)知網(wǎng)絡(luò)提供可靠的安全保障,是認(rèn)知網(wǎng)絡(luò)安全的重要內(nèi)容,對(duì)認(rèn)知網(wǎng)絡(luò)的研究具有深遠(yuǎn)意義。
雖然本文對(duì)認(rèn)知網(wǎng)絡(luò)安全的研究取得了一些進(jìn)展,但仍有一些內(nèi)容需要進(jìn)一步研究:
(1) 對(duì)于在不同的調(diào)制方式和仿冒方式下,基于頻譜包絡(luò)起伏特征的識(shí)別方法會(huì)受到什么樣的影響,以及應(yīng)對(duì)方法將是下一步研究的問(wèn)題。
(2) 在低信噪比,輻射源高速移動(dòng)等復(fù)雜環(huán)境下的識(shí)別性能也是重要的研究方向。
[1] Mitola J,Maguire G Q.Cognitive Radio:Making Software Radios More Personal[J].IEEE Personal Cotninun.,1999,6 (4):13-18.
[2] 肖天梅.認(rèn)知無(wú)線電PUE攻擊下次用戶性能分析[J].通信技術(shù),2013(4):22-27.
[3] 薛楠,周賢偉,辛?xí)澡?等.一種解決認(rèn)知無(wú)線電網(wǎng)絡(luò)模仿主用戶攻擊問(wèn)題的方案[J].計(jì)算機(jī)科學(xué),2009(8):45-48.
[4] Chen R,Park J,Reed J H.Defense against primary user emulation attacks in cognitive radio networks[J].IEEE Journal on Selected Areas in Communications,2008,26(1):25-37.
[5] 逄德明,胡罡,徐明.基于能量指紋匹配的無(wú)線認(rèn)知網(wǎng)絡(luò)仿冒主用戶攻擊檢測(cè)[J].計(jì)算機(jī)科學(xué),2011(3):28-33,69.
[6] 周曉.認(rèn)知無(wú)線電網(wǎng)絡(luò)及其安全性研究[D].北京交通大學(xué),2011.
[7] 趙陸文,繆志敏,周志杰,等.基于SVDD的認(rèn)知無(wú)線電網(wǎng)絡(luò)仿冒主用戶檢測(cè)技術(shù)[J].信號(hào)處理,2010(7):974-979.
[8] 任黎麗.輻射源指紋識(shí)別與細(xì)微特征提取方法研究[D].哈爾濱工程大學(xué),2012.
[9] 徐書華.基于信號(hào)指紋的通信輻射源個(gè)體識(shí)別技術(shù)研究[D].華中科技大學(xué),2007.
[10] 朱正.Hilbert-Huang變換及其在目標(biāo)方位估計(jì)和水聲通信中的應(yīng)用研究[D].哈爾濱工程大學(xué),2013.
[11] 唐家德.基于MATLAB的非線性曲線擬合[J].計(jì)算機(jī)與現(xiàn)代化,2008(6):15-19.
[12] 孫吉貴,劉杰,趙連宇.聚類算法研究[J].軟件學(xué)報(bào),2008(1):48-61.
[13] 王艷娥.劃分式聚類算法的初始化方法研究[D].陜西師范大學(xué),2014.
[14] 曾山.模糊聚類算法研究[D].華中科技大學(xué),2012.
[15] 余長(zhǎng)俊,張燃.云環(huán)境下基于Canopy聚類的FCM算法研究[J].計(jì)算機(jī)科學(xué),2014(S2):316-319.
RESEARCH ON PUE ATTACK DETECTION BASED ON SPECTRAL ENVELOPE FEATURE EXTRACTION
Liu Yunfei Zheng Wenxiu Liu Yuekai
(School of Communication and Information Engineering,Xi’an University of Posts and Telecommunications,Xi’an 710061,Shaanxi,China)
This paper presents a PUE (Primary User Emulation) attack detection method,which is based on spectral envelope feature extraction.On the basis of having demonstrated that the fluctuant features of spectral envelope can be extracted as the fingerprint features,we combine the curve fitting and select the characteristic parameters,and construct the vector which can obviously reflect the fluctuation characteristic of spectral envelope,then we differentiate the primary user from PUE attack user by fuzzy c-means clustering.Simulation experimental results show that this method can effectively distinguish primary user and PUE attack user,and has good feasibility and reliability.
PUE attack Emitter Spectral envelope Feature extraction Curve fitting
2015-07-16。國(guó)家自然科學(xué)基金項(xiàng)目(61301091)。劉云飛,碩士生,主研領(lǐng)域:現(xiàn)代信號(hào)處理與應(yīng)用。鄭文秀,副教授。劉悅凱,碩士生。
TP391.9
A
10.3969/j.issn.1000-386x.2016.11.064