劉 飛, 何明浩, 韓 俊
(1.空軍預(yù)警學(xué)院, 湖北 武漢 430019; 2. 中國人民解放軍95174部隊, 湖北 武漢 430040)
隨著數(shù)據(jù)采集、存儲、傳輸技術(shù)的快速發(fā)展,雷達(dá)輻射源信號(radar emitter signal,RES)識別方法逐漸從傳統(tǒng)的信號脈沖描述字轉(zhuǎn)向了基于脈沖波形數(shù)據(jù)的脈內(nèi)特征參數(shù)[1-2]。因此,挖掘和提取更能表征RES的脈內(nèi)特征參數(shù)成為研究熱點(diǎn),如:頻譜特征[3-4]、時頻特征[5-9]、雙譜特征[10]、模糊函數(shù)特征[11-12]、相像系數(shù)特征[13]、熵特征[14-17]、復(fù)雜度特征[18]等出現(xiàn)在各文獻(xiàn)研究中。各種脈內(nèi)特征參數(shù)的挖掘應(yīng)用一定程度上解決了傳統(tǒng)識別方法中的錯分誤判問題,提高了雷達(dá)輻射源識別的準(zhǔn)確率。
然而,脈內(nèi)特征參數(shù)在工程應(yīng)用中的一些局限性也慢慢涌現(xiàn)出來[19-20]。一個常見的局限性就是大多特征僅對限定調(diào)制類型的RES具有較好的識別性能,而難以識別其他調(diào)制類型的RES[21-22]。例如,時頻特征對單載頻信號、線性調(diào)頻信號、非線性調(diào)頻信號有很好的識別效果,但對頻率編碼信號和頻率分集信號卻無能為力;再如,模糊函數(shù)特征對頻率編碼信號和頻率分集信號有很好的識別效果,但對非線性調(diào)頻信號和線性調(diào)頻加二相編碼信號的識別率卻并不高。另一個局限性是單個特征的識別率隨仿真條件的變優(yōu)而有趨于“邊緣效應(yīng)”的現(xiàn)象,不能突破自身識別率的“瓶頸”[23-24]。在特征提取仿真試驗(yàn)中,當(dāng)特征維數(shù)達(dá)到一定值后,增加特征維數(shù)并沒有帶來明顯的識別率收益,相反,提取較高維數(shù)的特征會顯著提高識別時間成本。
針對上述問題,本文擬通過組合不同種類的特征,構(gòu)建特征參數(shù)集,集聚各特征參數(shù)在不同調(diào)制類型RES中的識別優(yōu)勢,提升基于特征參數(shù)集的識別方法的通用性和準(zhǔn)確性。
特征組合是指將兩種及以上不同特征參數(shù),通過特征數(shù)據(jù)的連接,變?yōu)橐环N新的特征的過程。給定兩種分別為m維和n維的特征,即A={a1,a2,…,am}和B={b1,b2,…,bn},則他們可以按以下方式組合,即
[A,B]={a1,a2,…,am,b1,b2,…,bn}
(1)
或:
[B,A]={b1,b2,…,bn,a1,a2,…,am}
(2)
上面2種組合方式,僅是2種特征參數(shù)特征數(shù)據(jù)連接順序的不同。由式可知,特征組合后的維數(shù)為2種對應(yīng)特征的維數(shù)之和,即A和B的特征組合維數(shù)為m+n。
討論不同類型的特征參數(shù)組合對識別性能的影響。對引言中提及的7種特征進(jìn)行仿真分析,仿真條件為:訓(xùn)練數(shù)據(jù)的樣本量為3 500(每種特征500個),測試數(shù)據(jù)的樣本量為700(每種特征100個),分類器為支持向量機(jī)(support vector machine,SVM),SVM核函數(shù)為徑向基函數(shù)(radial basis function,RBF),RBF參數(shù)γ=0.200 0,懲罰系數(shù)C=0.100 0。
分別以每種特征為對象,與其他特征進(jìn)行組合,特征組合性能仿真結(jié)果如圖1所示,圖1中,橫坐標(biāo)“1”至“6”分別代表其他特征,次序與頻譜特征、時頻特征、雙譜特征、模糊函數(shù)特征、相像系數(shù)特征、熵值特征、復(fù)雜度特征一致。
圖1 各種特征與其他特征組合識別性能Fig.1 Recognition performance of various characteristics combined with other characteristics
由圖可知,特征組合對識別性能的影響有以下3種情況:
(1) 組合特征識別率同時高于對象特征和其他特征,如雙譜特征、模糊函數(shù)特征、相像系數(shù)特征,說明此類特征與其他特征的組合對雙方均是有益的,屬于互利型特征;
(2) 組合特征識別率高于對象特征而部分低于其他特征,如時頻特征、復(fù)雜度特征,說明此類特征與其他特征的組合對自身是有益的,而對其他特征并不一定有益,屬于利己型特征;
(3) 組合特征識別率高于其他特征而部分低于對象特征,如頻譜特征、熵值特征,說明此類特征與其他特征的組合對其他特征是有益的,而對自身并不一定有益,屬于利它型特征。
總體來說,組合特征的識別性能與單個特征相比是提升的,在仿真中沒有出現(xiàn)組合特征識別率同時低于對象特征和其他特征的情況。
討論特征分別按照式(1)與式(2)進(jìn)行組合對識別性能的影響。將7種特征按頻譜特征、時頻特征、雙譜特征、模糊函數(shù)特征、相像系數(shù)特征、熵值特征、復(fù)雜度特征的次序兩兩進(jìn)行組合,由此得到的特征組合稱為順序組合;將上述組合的次序進(jìn)行交換,由此得到的特征組合稱為反序組合。在第1.1節(jié)的仿真條件下,各特征組合的順序和反序識別率如圖2所示。
圖2 特征組合順序?qū)ψR別性能的影響Fig.2 Effect of characteristic combination order on recognition performance
由圖2可知,各特征組合的反序識別率與順序識別率完全一致,說明特征組合排列次序的改變對識別性能是沒有影響的。通過對其他特征組合方式的仿真驗(yàn)證,均有此結(jié)論。因此,特征組合式(1)和式(2)是等效的。
討論不同個數(shù)的特征參數(shù)組合對識別性能的影響。為討論問題的完備性,將單個特征作為特征個數(shù)為1的情況納入對比分析。根據(jù)特征組合公式,對于N種不同類型的特征參數(shù),特征組合方式的總數(shù)為
(3)
在對7種特征所有組合方式的性能分析中發(fā)現(xiàn),特征組合可分為2種情況:
(1)優(yōu)型組合,如i=2、i=3、i=5時,識別率排名第1的組合方式等,他們的識別率高于對應(yīng)特征的其他所有組合情況,定義該類組合為優(yōu)型組合。優(yōu)型組合實(shí)現(xiàn)了特征參數(shù)識別率的提高,是在進(jìn)行組合時最希望得到的結(jié)果。
以i=5中排名第一的組合為例,其對應(yīng)特征為時頻特征、雙譜特征、模糊函數(shù)特征、相像系數(shù)特征、熵值特征,對應(yīng)特征的其他所有組合與該組合的識別率對比情況如圖3所示,圖3中橫坐標(biāo)為其他組合序號,虛線為該組合識別率參考線98.43%。
圖3 優(yōu)型組合示例圖Fig.3 Example diagram of optimal combination
由圖3可知,其他組合的識別率均低于該組合識別率,圖3中接近虛線的3個識別率分別為98.29%、98.14%、98.29%,故該組合為優(yōu)型組合。
(2)非優(yōu)型組合,如i=2至i=7時,識別率排名倒數(shù)第一的組合方式等,他們的識別率低于對應(yīng)特征的所有組合中的部分組合情況,定義該類組合為非優(yōu)型組合。非優(yōu)型組合并沒有實(shí)現(xiàn)相對所有特征參數(shù)識別率的提高,所以在實(shí)際應(yīng)用中往往舍棄這類組合。
以i=5中排名倒數(shù)第1的組合為例,其對應(yīng)特征為頻譜特征、時頻特征、雙譜特征、模糊函數(shù)特征、復(fù)雜度特征,對應(yīng)特征的其他所有組合與該組合的識別率對比情況如圖4所示,圖4中橫坐標(biāo)為其他組合序號,虛線為該組合識別率參考線77.57%。
圖4 非優(yōu)型組合示例圖Fig.4 Example diagram of non-optimal combination
由圖4可知,其他組合的識別率有低于該組合識別率的情況,也有高于該組合識別率的情況,故該類組合為非優(yōu)型組合。
特征參數(shù)集是特征組合(含單特征)中優(yōu)型組合的一種,若記某特征參數(shù)集為Θ,所有特征參數(shù)組合構(gòu)成的集合為Ω,則{Θ}為Ω的一個子集,即:{Θ}?Ω。所有特征參數(shù)集構(gòu)成的集合Ψ,Ψ是對Ω的精簡,即:Ψ?Ω,在識別率上Ψ和Ω是等效完備的。
根據(jù)第1.3節(jié)對優(yōu)型組合的定義,優(yōu)型組合的識別率高于對應(yīng)特征的其他所有組合情況,同樣,特征參數(shù)集的識別率應(yīng)高于組成參數(shù)集對應(yīng)特征的其他所有組合情況。設(shè)某特征參數(shù)集Θ={Θ1,Θ2,…,Θn},由對應(yīng)特征Θ1、Θ2、…、Θn的其他組合構(gòu)成的集合記為Λ,由Θ1、Θ2、…、Θn組成的特征參數(shù)集全集記為Ψ,則關(guān)于特征參數(shù)集Θ有以下結(jié)論成立:
(1)Θ的識別率高于Λ中所有元素的識別率,即
p(Θ)>p(κ|Λ)
(4)
式中,p(·)為識別率函數(shù),κ為Λ中的元素。
(2)Θ為Ψ中含特征參數(shù)個數(shù)最多的集合,當(dāng)θ為全特征參數(shù)集時,與Λ互為補(bǔ)集,即
(5)
式中,Φ為空集。
(3) 當(dāng)Θ為單特征參數(shù)集時,{Θ}=Ψ,Λ=Φ。
(4) 所有單特征構(gòu)成的組合{Θ1},{Θ2},…,均為特征參數(shù)集。
(5) 對于特征個數(shù)分別為n、n+1的特征參數(shù)集Θn和Θn+1,若滿足Θn?Θn+1,則稱Θn和Θn+1為同源特征參數(shù)集。同源特征參數(shù)集的最大識別率是隨特征個數(shù)遞增的,即
max(p(Θn+1(Θ1,Θ2,…,Θn)))>
max(p(Θn(Θ1,Θ2,…,Θn)))
(6)
因此,對于從特征參數(shù)組合中找出所有的特征參數(shù)集,可根據(jù)其構(gòu)建規(guī)則,按特征個數(shù)遞增的步驟進(jìn)行標(biāo)記。
步驟1標(biāo)記所有單特征組合為特征參數(shù)集;
步驟2對所有的兩個特征組合,與對應(yīng)的單特征組合進(jìn)行比較,若某組合識別率均高于單特征,則標(biāo)記該組合為特征參數(shù)集;
步驟3對所有的3個特征組合,與步驟1、步驟2中對應(yīng)的特征參數(shù)集進(jìn)行比較,若某組合識別率均高于已標(biāo)記的對應(yīng)特征參數(shù)集,則標(biāo)記該組合為特征參數(shù)集;
步驟4后續(xù)個數(shù)的特征組合,可類似步驟3,與之前所有已標(biāo)記的對應(yīng)特征參數(shù)集進(jìn)行比較,依次標(biāo)記是否為特征參數(shù)集。
對于同源特征參數(shù)集,特征個數(shù)越多識別率越高,然而,高的識別率有可能耗費(fèi)較高的時間成本。在RES識別中,由于SVM屬于基于統(tǒng)計學(xué)習(xí)的分類器[25-28],其分類模型可提前通過學(xué)習(xí)訓(xùn)練獲得,因此,參數(shù)集的時間成本主要由識別過程的2個環(huán)節(jié)產(chǎn)生,一是特征提取環(huán)節(jié)產(chǎn)生的特征提取時間,另一是分類識別環(huán)節(jié)產(chǎn)生的分類識別時間。
計算算法時間的常用方法有2種,一種是計算該算法中所有語句的頻度之和[29],另一種是計算算法執(zhí)行時用到的加減乘除等運(yùn)算的次數(shù)[30-31]。這2種方法通過對算法的詳細(xì)分析均能準(zhǔn)確地定量計算出算法的時間,但是,隨著算法開發(fā)平臺和對應(yīng)計算機(jī)語言的發(fā)展,大量使用各種算法包和隱性封裝各種函數(shù),使準(zhǔn)確分析出算法的步驟變得十分困難。因此,本文采用工程應(yīng)用中常用到的統(tǒng)計分析方法,來獲取特征提取時間和分類識別時間。
由于特征參數(shù)的提取時間和原始波形數(shù)據(jù)的長度有關(guān),而原始波形數(shù)據(jù)的長度與信號采樣率和脈沖寬度有關(guān),對于未知信號,信號的脈沖寬度是不能事先獲得的,所以,原始波形數(shù)據(jù)的長度也無法事先確定。但是,為便于統(tǒng)一決策參考,這里將原始波形數(shù)據(jù)的基準(zhǔn)長度定義為2 048(采樣頻率為120 MHz時,脈寬范圍為8.54~17.06 μs)。
分別根據(jù)特征提取算法,對隨機(jī)產(chǎn)生的不同調(diào)制類型的原始波形數(shù)據(jù)做特征提取實(shí)驗(yàn),記錄每次實(shí)驗(yàn)耗費(fèi)時間,如此進(jìn)行200次蒙特卡羅實(shí)驗(yàn),將實(shí)驗(yàn)時間均值作為特征提取時間。表1所示為各特征參數(shù)的提取時間,實(shí)驗(yàn)平臺參數(shù)為:英特爾i3雙核CPU,主頻1.70 GHz,內(nèi)存4.00 GB,Windows 8.1中文版64位操作系統(tǒng)。
表1 特征參數(shù)提取時間
SVM在進(jìn)行RES識別時,分類識別時間主要與樣本的維數(shù)有關(guān),在7種特征參數(shù)中,頻譜特征、時頻特征、雙譜特征、模糊函數(shù)特征的維數(shù)為256維,記為一次變換特征,相像系數(shù)特征、熵值特征、復(fù)雜度特征的維數(shù)為2維,記為二次變換特征。由于一次變換特征與二次變化特征在維數(shù)上相差較大,多次仿真實(shí)驗(yàn)表明,當(dāng)一次變換特征與二次變換特征組合時,二次變換特征的維數(shù)對分類識別時間的影響較小。0~4個一次變換特征及其分別與1~3個二次變換特征組合的分類識別時間如圖5所示,圖5中橫坐標(biāo)依次為1個二次變換特征的組合、2個二次變換特征的組合、3個二次變換特征的組合、1個一次變換特征的組合、1個一次變化特征與1個二次變換特征的組合、1個一次變化特征與2個二次變換特征的組合、……、2個一次變換特征的組合、2個一次變化特征與1個二次變換特征的組合、……、4個一次變化特征與3個二次變換特征的組合。
圖5 特征組合分類識別時間圖Fig.5 Time map of characteristic combination classification and recognition
由圖5可知,特征組合分類識別時間隨一次變換特征個數(shù)的增加呈階梯狀遞增,因此,按照一次變換特征的個數(shù),可將分類識別時間分為5個等級,分別對應(yīng)0~4個一次變換特征及其與二次變換特征組合方式。通過多次蒙特卡羅實(shí)驗(yàn),獲得不同等級的分類識別時間如表2所示(實(shí)驗(yàn)平臺參數(shù)同上)。
表2 特征組合分類識別時間
在RES識別中,特征提取環(huán)節(jié)和分類識別環(huán)節(jié)之間為串聯(lián)關(guān)系。因此,特征參數(shù)集的總時間成本為特征提取時間和分類識別時間之和,即
T=Tc+Ts
(7)
式中,T為參數(shù)集的總時間成本;Tc為特征提取時間;Ts為分類識別時間。
(8)
若Θ={Θ1,Θ2,…,Θn}中屬于一次變換特征的個數(shù)為m,則參數(shù)集分類識別時間為
(9)
根據(jù)上述特征參數(shù)集的構(gòu)建規(guī)則和時間成本計算方法,得出7種特征的所有參數(shù)集的識別率和時間成本如表3所示,表中,fft、stft、bi、amb、cr、en、cp分別代表頻譜特征、時頻特征、雙譜特征、模糊函數(shù)特征、相像系數(shù)特征、熵值特征、復(fù)雜度特征。
表3 特征參數(shù)集的識別率和時間成本
各特征參數(shù)集的對應(yīng)識別率和時間成本數(shù)據(jù)按式(10)進(jìn)行歸一化。
(10)
式中,dmax、dmin分別為數(shù)據(jù)序列{d1,d2,…,dn}中的最大值和最小值。
歸一化后的特征參數(shù)集識別率與時間成本之間的關(guān)系如圖6所示。
由圖6可知,特征參數(shù)集的識別率和時間成本之間并沒有出現(xiàn)嚴(yán)格一致的變化關(guān)系,也就是說特征參數(shù)集特征組成情況與識別率、時間成本之間沒有恒定的單調(diào)關(guān)系,因此,需要根據(jù)實(shí)際需求做出最優(yōu)的決策——在獲得較高識別率的同時消耗較小時間成本。
圖6 特征參數(shù)集識別率與時間成本對應(yīng)關(guān)系Fig.6 Relationship between recognition rate and time cost of characteristics parameters
在RES識別中,有2種情況是經(jīng)常遇見的,一是現(xiàn)場采集波形數(shù)據(jù),實(shí)時識別RES;二是采集存儲波形數(shù)據(jù),事后識別RES。對于第1種情況,最優(yōu)決策是在限定識別率條件下,選擇時間成本最小的特征參數(shù)集,該特征參數(shù)集定義為時效集;對于第2種情況,最優(yōu)決策是在限定時間成本條件下,選擇識別率最高的特征參數(shù)集,該特征參數(shù)集定義為精準(zhǔn)集。
記特征參數(shù)集為Θ,所有特征參數(shù)集構(gòu)成的集合為Ψ,則時效集為
ΘAE=
Θ|(Θ∈Ψ,min(T(Θ))|p(Θ)≥p0)
(11)
式中,T(Θ)為特征參數(shù)集的時間成本;p(Θ)為特征參數(shù)集的識別率;p0為限定識別率。
根據(jù)定義式(11),構(gòu)建特征參數(shù)時效集的方法步驟如下:
步驟1將所有特征參數(shù)集的識別率表和時間成本表按特征參數(shù)集的構(gòu)建方式進(jìn)行對應(yīng)合并整合;
步驟2找出所有識別率高于限定識別率的特征參數(shù)集;
步驟3找出步驟2中時間成本最小的特征參數(shù)集。
例如,某實(shí)時識別場合,給定最低識別率為85%,根據(jù)合并整合的特征參數(shù)集表(表3),篩選出特征參數(shù)集有序號1、4、8、9、10、……,上述特征參數(shù)集中,時間成本最小為10.58 ms,對應(yīng)序號1,特征參數(shù)集構(gòu)成為頻譜特征,此即為滿足需求的時效集。
記特征參數(shù)集為Θ,所有特征參數(shù)集構(gòu)成的集合為Ψ,則精準(zhǔn)集為
ΘCP=Θ|(Θ∈Ψ,max(p(Θ))|T(Θ)≤T0)
(12)
式中,p(Θ)為特征參數(shù)集的識別率;T(Θ)為特征參數(shù)集的時間成本;T0為限定時間成本。
根據(jù)定義式(12),構(gòu)建特征參數(shù)精準(zhǔn)集的方法步驟如下:
步驟1將所有特征參數(shù)集的識別率和時間成本按特征參數(shù)集的構(gòu)成方式進(jìn)行對應(yīng)合并整合;
步驟2找出所有時間成本小于限定時間的特征參數(shù)集;
步驟3找出步驟2中識別率最高的特征參數(shù)集。
例如,某實(shí)時識別場合,給定最低每次識別時間在1 s以內(nèi),根據(jù)合并整合的特征參數(shù)集表(見表3),篩選出特征參數(shù)集有序號1、2、3、……、27、……,上述特征參數(shù)集中,識別率最高為95.86%,對應(yīng)序號27,特征參數(shù)集構(gòu)成為頻譜特征、模糊函數(shù)特征、復(fù)雜度特征,此即為滿足需求的精準(zhǔn)集。
為突破單個脈內(nèi)特征參數(shù)識別性能的“邊緣效應(yīng)”,獲得更高的識別率,從特征參數(shù)的組合入手,提出特征組合的方式和相關(guān)約定,并重點(diǎn)研究了特征種類、特征個數(shù)、信號環(huán)境對特征組合識別性能的影響。在此基礎(chǔ)上,進(jìn)一步對特征組合中的優(yōu)型組合進(jìn)行研究討論,提出特征參數(shù)集的構(gòu)建規(guī)則和生成方法,并就特征參數(shù)集的時間成本進(jìn)行了分析。最后,根據(jù)識別率和時間成本因素,構(gòu)建了2種典型的特征參數(shù)集——時效集和精準(zhǔn)集,為脈內(nèi)特征參數(shù)集在RES監(jiān)測、偵察、分析等工程應(yīng)用方面奠定了良好的理論基礎(chǔ)。