楊 卓,李大超
基于核主成分分析的二次雷達脈沖信號初始特征提取*
楊 卓**1,李大超2
(1.中國電子科技集團公司第三十六研究所,浙江嘉興314033;
2.海軍駐上海地區(qū)電子設備軍代室,上海201800)
針對二次雷達脈沖信號的特征選擇與分類問題進行研究,提出了一種基于核主成分分析(KPCA)的初始特征提取方法。根據二次雷達脈沖信號的特點,首先經過數(shù)據整編、預處理,獲取樣本的初始特征參數(shù);然后利用KPCA方法對特征參數(shù)進行主成分組合,以消除信號特征間的相關性和壓縮特征向量的維數(shù),最后利用聚類工具進行分類。數(shù)學分析和可視化實驗結果都表明這種分析方法是有效的。試驗還表明,KPCA在特征選取方面性能優(yōu)于PCA。
二次雷達信號;脈沖信號;特征提?。缓酥鞒煞址治?;主成分分析
作為傳統(tǒng)雷達的補充,二次雷達最初是為了在空戰(zhàn)中分辨出敵我屬性而發(fā)展的,應答方通過固定的脈沖編碼格式來回報敵我屬性。隨著時代的發(fā)展,二次雷達在軍用和民用航空管制(Air Traffic Control,ATC)領域得到越廣泛的應用,多種調制、編碼方式、加密協(xié)議也開始應用于二次雷達。不局限于目標識別,應答方甚至可以按規(guī)定的格式回報地址碼、飛行高度、速度、航向等信息,和通信、數(shù)據鏈的界限越來越重疊。
對于偵察方來說,從情報效益來看,二次雷達雖然屬于非合作信號,其往往采用幾個固定頻點傳輸,截獲相對容易,攜帶的信息具有較高的情報價值。從情報分析難度來看,北約體制二次雷達應用最廣泛,主要分為1、2、3/A、4、C、S等6種模式,其傳輸規(guī)則和協(xié)議已經研究得比較透徹。但其他國家也在有針對性地發(fā)展自己的二次雷達,出于保密原因,其信息傳輸協(xié)議可能隨時間發(fā)生變化。實際環(huán)境中,在某一空域某一時間段內,有可能目標較多,導致同頻脈沖密度較高。不了解詢問應答雙方規(guī)則的前提下,人工進行信號分析判決需要耗費較大精力。
目前已經有不少文獻針對脈沖信號自動分類識別展開了研究。文獻[1]通過瞬時自相關提取脈沖信號的瞬時頻率特征,在此基礎上進行級聯(lián)歸一化處理,從而得到能表征脈沖信號調制特性的統(tǒng)計分類特征向量并實現(xiàn)了自動分類,獲得了較好的分類正確率。文獻[2-3]利用模糊聚類算法對脈沖信號進行分選,通過自適應確立聚類中心和聚類半徑,改善分選流程的同時,提高了分選正確率。文獻[4-5]利用神經網絡對脈沖信號進行分選,其中,文獻[4]將粒子群算法和神經網絡有機結合,文獻[5]則采用了自組織特征映射神經網絡算法,通過不斷訓練迭代,提高了類內聚斂性和類間離散性。文獻[6]針對雷達信號,利用特征提取算法得到特征向量,然后應用支持向量機(SuPPort Vector Machine,SVM)分類器對特征值進行識別,取得了較好的識別效果。
上述文獻主要對未知雷達脈沖信號進行分類、分選,可以自組織、無監(jiān)督地發(fā)現(xiàn)雷達輻射源在多維特征參數(shù)空間中的分布特征,從而對目標進行分類,但主要缺點在于計算量和復雜度較大。相比未知雷達信號而言,二次雷達具有其固有特征,如脈沖包絡形狀、脈沖寬度和脈沖間隔周期具有一定規(guī)律,且一般存在框架脈沖,作為信息傳輸?shù)南葘А?/p>
針對二次雷達脈沖信號的特性,本文基于模式識別的分析框架,在特征處理環(huán)節(jié)應用了核主成分分析法(Kernel PrinciPal ComPonent AnalYsis,KPCA)提取到多組規(guī)則脈沖串,得到了一些有意義的分析結果,可以作為后續(xù)協(xié)議分析的支撐。
根據實際操作經驗,對于未知協(xié)議二次雷達脈沖信號的分析識別,從模式識別的角度可以分為4個步驟,如圖1所示。
圖1 基于模式識別的脈沖信號分析流程Fig.1 The Process of Pulse signal analYsis based on Pattern recognition method
下面依次對每個階段的工作內容和步驟進行簡要介紹。
第一步 數(shù)據整編:該階段的主要目的是對原始脈沖信號的參數(shù)化輸出進行規(guī)范,按固定格式整編后的脈沖描述字(Pulse DescriPtion Word,PDW)樣本是下一階段分析識別的基礎。
第二步 樣本初步處理:該階段的主要目的是對整編數(shù)據進行預處理,去噪、去偏移、篩選后得到初始特征。預處理的方式依賴于數(shù)據的類型和來源,典型方法包括中心化變換、歸一化處理、正規(guī)化處理、標準化處理、Q檢驗法、特征篩選處理等。在實際操作中,根據樣本的方差、量綱差異等因素,可以靈活選用相應的方法。通過樣本初步處理,實現(xiàn)了從數(shù)據空間向特征空間的轉換。
第三步 特征處理:對于多特征的數(shù)據來說,很難用圖形直觀地表示所有特征的變化情況。特征處理的核心思路是空間維數(shù)壓縮,通過映射或變換的方式獲取最有效的特征,實現(xiàn)維數(shù)降維后,利用統(tǒng)計或圖形工具進行直觀分析,進而可以得到數(shù)據規(guī)律并實現(xiàn)分類。特征處理主要包括特征選擇和特征提取兩類方式,特征選擇是從原始特征中挑選出最直觀的特征,以達到降維的目的;特征提取則是通過線性或非線性變換,將原始特征降維,得到二次特征。
第四步 類型識別:經過特征處理后,特征仍不直觀的數(shù)據可以采取各種分類、聚類算法進行類型識別,也可以借助操作者的經驗進行輔助判別。以聚類分析為例,通常是在先驗知識不足的情況下,利用數(shù)學統(tǒng)計方法分析特征向量間的距離及離散程度,按照特征間的距離劃分類別,從而實現(xiàn)特征空間向類別空間的轉換。
在實際操作過程中,上述4個過程并不一定會依次遍歷。舉例來說,某樣本如果經歷了數(shù)據整編、樣本初步處理、特征處理3個過程后,特征非常明顯,經可視化顯示后,操作員可直接分類,不進入第4個步驟。
其次,特征處理、模式識別的方法較多,參數(shù)設置不同也會帶來較大差異,目前還不存在一種通用的理論可以遵循。在實際操作時,根據樣本統(tǒng)計特點,可能要不斷迭代、尋優(yōu),針對實際樣本尋找相對“適用”的處理方式。
本節(jié)結合實采二次雷達脈沖數(shù)據進行分析,目的是提取應答信號同步頭框架脈沖。
3.1 數(shù)據整編
對某一時段接收的疑似二次雷達脈沖信號進行整編處理,共計數(shù)萬個樣本,脈沖描述字主要包括幅度、脈寬、頻率、脈沖到達時間、脈相等變量。根據先驗知識,同個目標的信號幅度一般不會有太大突變;脈寬經過直方圖統(tǒng)計,絕大多數(shù)保持穩(wěn)定的值,經過分析員初判脈內波形,不太可能采用脈內相位調制,也不進行考慮。經過初步篩選,樣本可能采用頻率、脈位混合編碼,故主要對上述兩類變量進行分析。
3.2 樣本初步處理
根據二次雷達應答信號的規(guī)則,即一般帶有同步頭脈沖(或者稱框架脈沖)且結構固定、同步頭脈沖的時間間隔具有一定規(guī)律(方差不會太大),首先,制定匹配模板,從原始脈沖描述字中篩選出一組樣本,每個樣本賦予9個原始特征值,分別是起始5個脈沖的頻率值f1、f2、f3、f4、f5以及相應的脈沖間隔t1、t2、t3、t4;其次,進行去噪處理,基于脈沖間隔的方差、偏離度,刪除樣本中的噪聲(奇異點);最后,進行標準化處理,這種方法可將量綱不一(頻率和時間的單位不同)、范圍不同的各列特征值轉化為均值為0、標準差為1的數(shù)據。經過樣本初步處理,得到初始特征,可以進行后續(xù)的特征處理。
3.3 特征提取
主成分分析(PrinciPal ComPonent AnalYsis,PCA)是一種廣泛應用的特征提取方法,基本思想是將特征空間從n維映射到W維正交空間,具體計算方法參見文獻[7]。經PCA轉換后,其新特征(又稱為主成分)是線性無關的,信息量通過“方差貢獻率”(又稱為解釋方差)(Variance ExPlained)來評估。根據文獻[8],前3個主成分的解釋方差累計貢獻率應達80%以上為宜。這樣一來,通過對比有限幾個主成分的分布規(guī)律,就可以對數(shù)據進行融合歸類,并去除掉奇異樣本。
對初始特征進行PCA處理。特征空間內前兩個主成分的投影以二維平面圖繪出,如圖2(a)所示。特征空間內各主成分的方差貢獻率以帕累托圖的形式表示,如圖2(b)所示。可以觀察到,PCA的降維效果并不理想,前3個主成分的方差累計貢獻率不到50%,假如提取前3個主元進行歸類,則浪費掉大量原始信息,有可能導致后續(xù)的分析失真嚴重。這種現(xiàn)象是由于PCA的線性映射降維局限性造成的,抽取的特征并不一定是最優(yōu)解。本文采用核主成分分析方法,其基本理論是將低維空間線性不可分的樣本通過非線性映射到高維特征空間,然后使用PCA提取主成分,從而進行降維。
圖2 PCA特征提取結果Fig.2 The feature extraction results based on PCA
對于輸入空間的M個樣本xk(k=1,2,…,M),xk∈RN,確保其正規(guī)化,變換為特征空間中的樣本點Φ(x1),Φ(x2),…,Φ(xM)。假設特征空間中的樣本點符合正規(guī)化條件,其構成的協(xié)方差矩陣為
因此,特征空間中的PCA是求解方程
式中:λ代表特征值;v代表特征向量。注意到v可由Φ(xi)(i=1,2,…,M)線性表示:
將式(3)代入式(2),并在等式兩端對Φ(xk)作內積,得到
通常非線性變換函數(shù)Φ()非常復雜,核方法則通過向量的內積變換繞過了映射函數(shù)Φ()。通過構造一個核函數(shù),實現(xiàn)如下變換:
將式(5)中的K(xi,xj)代入式(4),并進行簡化,得到
式中:K是由K(xi,xj)構成的方陣,通過求解式(6),即可獲得特征值λ和特征向量α,進而得到樣本在特征空間的投影γW,見式(7):
式中:W由特征值λ的個數(shù)決定。
值得注意的是,在進行內積變換時,核函數(shù)必須滿足Mercer條件[9]。通常應用較廣的是高斯徑向基函數(shù)[10](Radial Basis Function,RBF),其形式如下:
式中:δ是函數(shù)的寬度參數(shù),需根據樣本的分散情況靈活設置。根據文獻[11-12],若δ→0,則測試樣本點容易出現(xiàn)“過分類”的現(xiàn)象,推廣能力較差;若δ→∞,則對測試樣本一視同仁,正確判別能力為零(把所有樣本均判為同一類)。在確定高斯徑向基函數(shù)的寬度δ時,比較典型的方法有梯度下降法[13]、交叉驗證法[14]和網格法等。本文采用網格法,搜索到最優(yōu)δ=2。將該值代入高斯徑向基函數(shù),進行KPCA處理。如圖3(a)所示,特征空間內前兩個主成分的投影以二維平面圖繪出;特征空間內各主成分的方差貢獻率以帕累托圖的形式表示,如圖3(b)所示。
圖3 KPCA特征提取結果Fig.3 The feature extraction results based on KPCA
不同參數(shù)下,KPCA和PCA的性能對比見表1,可見采用PCA法,前3個特征的方差貢獻率僅為50.9%;采用KPCA法,在最優(yōu)寬度參數(shù)條件下(δ=2),前3個特征的方差貢獻率達到82.8%,優(yōu)于PCA法。
表1 PCA與KPCA性能比較Tab.1 Performance comParison betWeen PCA and KPCA
3.4 類型識別
樣本經KPCA運算,選取合適的基函數(shù)和寬度參數(shù),主成分的方差貢獻率大大提升,更加易于歸類。值得注意的是,樣本在經過初步篩選后,仍不可避免的混有野點。野點樣本會對KPCA的主元產生影響,從圖3(a)來看,部分特征樣本產生交疊。
基于模糊聚類工具,我們對主成分的聚類中心點進行了提?。ㄈ鐖D3(a)中紅點所示),其對應的前3個主成分值見表2。為確保分類正確率,我們采用基于歐式距離的檢測方式,將范圍外的樣本剔除,得到的分類結果見圖4。
表2 特征空間內的分類中心Tab.2 Central classification results based on feature sPace
圖4 基于KPCA的分類結果Fig.4 Classification results based on KPCA
相比較而言,對圖2(a)所示的PCA主分量進行聚類,由于數(shù)據在特征空間的分布效果不理想,如聚類半徑設置過小,則容易識別出多個重復模式;如聚類半徑設置較大,又容易產生類間模糊,如圖5所示。將KPCA特征空間的主成分映射回數(shù)據空間進行平均處理,最后得到3組較規(guī)則的脈沖串結果,如表3所示。3組模式的頻率參量均遵循同樣的規(guī)律,具有明顯的框架脈沖的特征。PCA則得到兩組分類結果,相比KPCA少了一組結果,且第4個脈沖間隔也有一定模糊。
圖5 基于PCA的分類結果Fig.5 Classification results based on PCA
表3 框架脈沖分析結果Tab.3 AnalYsis results of Pulse brackets characters
本文將模式識別技術初步應用于二次雷達脈沖信號分析,對實際環(huán)境中采取的脈沖描述字采取如下處理步驟:
(1)基于先驗信息,采用9個原始參量f1、f2、f3、f4、f5、t1、t2、t3、t4構造樣本;
(2)基于脈沖間隔的方差、偏離度,刪除樣本中的噪聲(奇異點);
(3)對樣本進行標準化處理;
(4)采用RBF基函數(shù),構造K矩陣,搜索合適的寬度參數(shù),采用KPCA算法將樣本映射到特征空間;
(5)在特征空間采用合適的聚類半徑對主成分進行分類。
試驗結果表明,這種方法對于工程具有一定實用意義:
(1)基于KPCA的模式識別方法,降維的同時又盡可能多的反映原始信息,類內聚斂性和類間離散性優(yōu)于PCA法;
(2)聚類得到的結果做為篩選規(guī)則,可以支撐對海量樣本數(shù)據的進一步處理,有利于后續(xù)的信號協(xié)議分析工作;
(3)本文的推導方法基于框架脈沖的先驗知識,在實際應用中并不一定總能得到正確的先驗知識,未來計劃針對二次雷達信號在不確定情況下的分選識別進行更深入的研究;
(4)試驗中,發(fā)現(xiàn)方法還有改進的空間,初始樣本如包含過多野點,則可能會對KPCA的穩(wěn)健性產生影響,需要采用改進的魯棒KPCA算法對野點樣本進行剔除。
[1] 普運偉,金煒東,胡來招.基于瞬時頻率二次特征提取的輻射源信號分類[J].西南交通大學學報,2007,42(3):373-379. PU YunWei,JIN Weidong,HU Laizhao.Automatic classi_ fication of radar emitter signals based on cascade featureextractions[J].Journal of SouthWest Jiaotong UniversitY,2007,42(3):373-379.(in Chinese)
[2] 張中山,賈可新.粒子群優(yōu)化模糊聚類在信號分選中的應用[J].艦船電子對抗,2013,36(3):85-87. ZHANG Zhongshan,JIA Kexin.APPlication of PSO-FCM to signal sorting[J].ShiPboard Electronic Countermeas_ ure,2013,36(3):85-87.(in Chinese)
[3] 劉旭波,司錫才.基于改進的模糊聚類的雷達信號分選[J].彈箭與制導學報,2009,29(5):278-281. LIU Xubo,SI Xicai.Sorting of radar-signals based on modified fuzzY clustering[J].Journal of Projectiles,Rock_ ets,Missiles and Guidance,2009,29(5):278-281.(in Chinese)
[4] 何佃偉,楊承志,張榮.PSOM算法用于未知雷達信號分選[J].電子信息對抗技術,2012,27(3):20-24. HE DianWei,YANG Chengzhi,ZHANG Rong.The PSOM algorithm for unknoWn radar signal sorting[J].Electronic Information Warfare TechnologY,2012,27(3):20-24.(in Chinese)
[5] 鄭子揚,陳永游,張俊.基于SOFM網絡聚類雷達信號分選預處理改進算法[J].航天電子對抗,2013,29(3):42-45. ZHENG ZiYang,CHEN YongYou,ZHANG Jun.An im_ Proved Pre-Processing algorithm of radar signal sorting based on SOFM clustering[J].AerosPace Electronic War_ fare,2013,29(3):42-45.(in Chinese)
[6] 李輝,金寶龍,翟海天.高分辨雷達信號的平移不變KP_ CA特征提取算法[J].計算機仿真,2012,29(1):9-12. LI Hui,JIN Baolong,ZHAI Haitian.Translation invariant feature extraction algorithm of KPCA based on high reso_ lution radar signal[J].ComPuter Simulation,2012,29(1):9-12.(in Chinese)
[7] 肖健華.智能模式識別方法[M].廣州:華南理工大學出版社,2006. XIAO Jianhua.Methods of intelligence Pattern recognition [M].Guangzhou:South China UniversitY of TechnologY Press,2006.(in Chinese)
[8] 張紹璞.基于主成分分析中的幾類問題的計算公式及結論[J].天津科技大學學報,2010,25(2):76-78. ZHANG ShaoPu.Based on PrinciPal comPonent analYsis of the tYPes of Problems in the formulas for calculating and conclusions[J].Journal of Tianjin UniversitY of Sci_ ence&TechnologY,2010,25(2):76-78.(in Chinese)
[9] WANG H S,MOAYERI N.Finite-state markov channela useful model for radio communication channels[J]. IEEE Transactions on Vehicular TechnologY,1995,44(1):473-479.
[10] SCHLKOPF B,SMOLA A J.Learning With Kernel[M]. Cambridge:The MIT Press,2001.
[11] 張翔,肖小玲,徐光祐.一種確定高斯核模型參數(shù)的新方法[J].計算機工程,2007,33(12):52-55. ZHANG Xiang,XIAO Xiaoling,XU GuangYou.A neW method for determining the Parameter of gaussian kernel [J].ComPuter Engineering,2007,33(12):52-55.(in Chinese)
[12] COLLINS B,CRUZ R.Transmission PolicY for time varYing channel With average delaY constraints[C]//Proceedings of 1999 Allerton Conference on Communication Control and ComPutation.Monticello,IL:IEEE,1999:1-9.
[13] BERRY R A,GALLAGER R G.Communication over fa_ ding channels With delaY constraints[J].IEEE Transactions on Information TheorY,2002,48(5):1135-1149.
[14] DIMITRI P B.DYnamic Programming:Deterministic and Stochatic Models[M].UPPer Saddle River:Prentice Hall,1987.
楊 卓(1982—),男,貴州銅仁人,2009年于北京理工大學獲工學博士學位,現(xiàn)為高級工程師,主要研究方向為通信系統(tǒng)集成;
YANG Zhuo Was born in Tongren,Guizhou Province,in 1982.He received the Ph.D.de_ gree from Beijing Institute of TechnologY in 2009.He is noW a senior engineer.His research concerns com_ munication sYstems integration.
Email:sheePtable@aliYun.com
李大超(1985—),男,山東萊陽人,2010年于海軍工程大學獲工學碩士學位,現(xiàn)為工程師,主要研究方向為通信技術。
LI Dachao Was born in LaiYang,Shandong Province,in 1985.He received the M.S.degree from Naval UniversitY of Engineering in 2010.He is noW an engineer.His research con_ cerns communication technologY.
Initial Feature Extraction of Secondary Radar Pulse Signal Based on Kernel Principal Component Analysis
YANG Zhuo1,LI Dachao2
(1.No.36 Research Institute of CETC,Jiaxing 314033,China;2.Electronic EquiPment MilitarY RePresentatives Office of NavY in Shanghai Area,Shanghai 200233,China)
For the Problem of secondarY radar Pulse signal feature selection and classification,a recognition method based on kernel PrinciPal comPonent analYsis(KPCA)is Presented.According to the characteristic of Pulse signal,the initial feature Parameters are obtained using data PreProcessing aPProach.Then the e_ liminating correlation and dimensionalitY reduction for these feature Parameters are realized using a KPCA algorithm,Which effectivelY suPPorts character recognition algorithm.Both mathematical analYsis and visual results shoW the efficiencY and good Performance of the ProPosed method.ExPerimental result also demon_ strates that KPCA has a higher Performance in nonlinear classified feature than PrinciPal comPonent analY_ sis(PCA).
secondarY radar signal;Pulse signal;feature extraction;kernel PrinciPal comPonent analYsis;PrinciPal comPonent analYsis
TN971
A
1001-893X(2016)01-0076-06
10.3969/j.issn.1001-893x.2016.01.014
楊卓,李大超.基于核主成分分析的二次雷達脈沖信號初始特征提取[J].電訊技術,2016,56(1):76-81.[YANG Zhuo,LI Dachao. Initial feature extraction of secondarY radar Pulse signal based on kernel PrinciPal comPonent analYsis[J].Telecommunication Engineering,2016,56(1):76-81.]
2015-06-23;
2015-10-27 Received date:2015-06-23;Revised date:2015-10-27
**通信作者:sheePtable@aliYun.com Corresponding author:sheePtable@aliYun.com