董柏嫻,湯建龍
(西安電子科技大學(xué)電子信息攻防對(duì)抗與仿真技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,陜西 西安710071)
雷達(dá)信號(hào)分選是現(xiàn)代雷達(dá)偵察系統(tǒng)中必不可少的部分,它在電子對(duì)抗中起著極其重要的作用。隨著各種體制的雷達(dá)及精確制導(dǎo)武器的大量應(yīng)用,雷達(dá)對(duì)抗偵察系統(tǒng)面臨的信號(hào)環(huán)境日趨密集,信號(hào)更加復(fù)雜多變[1],而且對(duì)分選操作的實(shí)時(shí)性要求也越來越高。雷達(dá)信號(hào)分選的實(shí)時(shí)性、準(zhǔn)確性和可靠性均面臨嚴(yán)峻的挑戰(zhàn)。
近年來,聚類思想被越來越多地應(yīng)用于雷達(dá)信號(hào)分選中,并且取得了很好的效果。聚類分選的算法主要有基于密度的聚類算法、基于網(wǎng)格的聚類算法、基于劃分的聚類算法、基于層次的聚類算法以及基于模型的聚類算法等。例如文獻(xiàn)[2]運(yùn)用網(wǎng)格密度聚類的思想實(shí)現(xiàn)了雷達(dá)信號(hào)分選,但其存在的問題是必須在所有雷達(dá)信號(hào)均已獲得的情況下進(jìn)行整體聚類,不能滿足雷達(dá)信號(hào)分選中越來越高的實(shí)時(shí)性要求,不能動(dòng)態(tài)地得到分選結(jié)果。為了解決這一問題,本文基于網(wǎng)格密度聚類的思想,采用滑動(dòng)窗口機(jī)制來在線動(dòng)態(tài)地獲得雷達(dá)脈沖信號(hào)的分選結(jié)果,并且采用計(jì)數(shù)型滑動(dòng)窗口模型保存當(dāng)前的數(shù)據(jù)流來有效地節(jié)省系統(tǒng)資源。該在線聚類算法的優(yōu)點(diǎn)是在初始階段不需要獲得全部雷達(dá)脈沖信號(hào),計(jì)算量小,運(yùn)算速度快,隨著信號(hào)脈沖流的推進(jìn),不斷更新聚類情況,動(dòng)態(tài)地獲得分選結(jié)果,且其硬件實(shí)現(xiàn)簡(jiǎn)單。另外,通過設(shè)計(jì)優(yōu)化的網(wǎng)格合并和更新規(guī)則,使算法能夠區(qū)分?jǐn)?shù)據(jù)密集區(qū)域和稀疏區(qū)域,并較快地找到數(shù)據(jù)分布中存在的類,提高算法的實(shí)時(shí)性。
雷達(dá)對(duì)抗偵察接收機(jī)輸出到信號(hào)處理系統(tǒng)的是密集交疊的脈沖流,每個(gè)脈沖以脈沖描述字PDW 來表示其特征參數(shù)。PDW 包括脈沖到達(dá)時(shí)間(TOA)、脈沖到達(dá)角(AOA)、載頻(RF)、脈寬(PW)、脈沖幅度(PA)以及脈內(nèi)調(diào)制(PM)等特征參數(shù)值,聚類分選一般使用其中的AOA、RF 和PW 參數(shù)。如果將每個(gè)PDW 當(dāng)成一個(gè)空間向量,則PDW 流就構(gòu)成了一個(gè)三維空間[3]。該算法在進(jìn)行數(shù)據(jù)流挖掘聚類前,將數(shù)據(jù)流中的數(shù)據(jù)按比例縮放到相應(yīng)的網(wǎng)格單元中來提高數(shù)據(jù)質(zhì)量,從而提高聚類的質(zhì)量。
給定d 維空間D 中的一個(gè)點(diǎn),其屬性(D1,D2,…,Dd)都是有界的,設(shè)第i維的值在區(qū)間[li,hi]中,其中i=1,2,…,d,則D=[l1,h1]×[l2,h2]×…×[ld,hd]。將D 的每一維平均分成k個(gè)長(zhǎng)度相等的區(qū)間段,這樣將空間D 劃分為kd個(gè)子空間(即網(wǎng)格單元)[4]。若兩個(gè)網(wǎng)格單元有相鄰的邊界或頂點(diǎn),則這兩個(gè)網(wǎng)格互稱為鄰居。落入每個(gè)網(wǎng)格單元內(nèi)的數(shù)據(jù)點(diǎn)的個(gè)數(shù)稱為網(wǎng)格單元密度。一個(gè)網(wǎng)格單元的網(wǎng)格密度大于或等于給定密度閾值Minpts 時(shí),稱該單元為高密度網(wǎng)格,否則稱為低密度網(wǎng)格。如果一個(gè)低密度網(wǎng)格單元的所有鄰居都是低密度單元,那么該單元中的點(diǎn)為噪聲點(diǎn)。一個(gè)聚類是相鄰的高密度網(wǎng)格單元的集合。
本文算法采用計(jì)數(shù)型滑動(dòng)窗口模型,如圖1所示。設(shè)窗口容量為N,隨著時(shí)間的推移,數(shù)據(jù)流不斷向前移動(dòng)進(jìn)入窗口,窗口頭部每讀入1個(gè)新數(shù)據(jù),尾部相應(yīng)地會(huì)移出1個(gè)舊數(shù)據(jù)。其中,數(shù)據(jù)xi(i =1,2,…,N)落入網(wǎng)格單元gi(gi為第i個(gè)網(wǎng)格單元,i=1,2,…,kd),且不同的數(shù)據(jù)可能落入相同的網(wǎng)格單元。
圖1 滑動(dòng)窗口模型
設(shè)窗口滑動(dòng)1次產(chǎn)生的數(shù)據(jù)元素為尾部移出的舊數(shù)據(jù)xi-1和頭部進(jìn)入的新數(shù)據(jù)xi+N-1。滑動(dòng)窗口內(nèi)數(shù)據(jù)進(jìn)出的機(jī)制為:首先移除xi-1,更新網(wǎng)格單元gi-1的密度;然后映射xi+N-1到相應(yīng)網(wǎng)格單元,并更新gi+N-1網(wǎng)格單元密度。最后判斷網(wǎng)格單元密度變化情況,如果網(wǎng)格單元密度gi-1=gi+N-1,即進(jìn)出元素映射網(wǎng)格相同,或者gi-1、gi+N-1的疏密度均未發(fā)生改變,則不作處理;如果gi-1轉(zhuǎn)變?yōu)榈兔芏龋瑒t刪除gi-1,若刪除gi-1后引起原有類分裂,則重新生成不同的類;如果gi+N-1轉(zhuǎn)變?yōu)楦呙芏染W(wǎng)格單元,則將其加入鄰居類中,若存在連通的類,則進(jìn)行合并。
將待分選數(shù)據(jù)規(guī)范化后映射到對(duì)應(yīng)的網(wǎng)格單元中,依次掃描每個(gè)網(wǎng)格單元,統(tǒng)計(jì)落入每個(gè)單元格的數(shù)據(jù)點(diǎn)數(shù),并標(biāo)記高低密度網(wǎng)格。搜索未分類高密度網(wǎng)格單元的鄰居單元,如果鄰居單元中存在高密度網(wǎng)格單元,則繼續(xù)搜索,將搜索到的所有高密度網(wǎng)格單元中的數(shù)據(jù)點(diǎn)合并為一類。然后類號(hào)加1,重復(fù)以上步驟,直到所有的高密度網(wǎng)格單元都被遍歷。該優(yōu)化的網(wǎng)格合并規(guī)則不需要設(shè)置簇中心,通過高密度網(wǎng)格深度搜索、遍歷來實(shí)現(xiàn)聚類,聚類精度更高。根據(jù)文獻(xiàn)[5],當(dāng)進(jìn)行在線動(dòng)態(tài)聚類時(shí),刪除低密度網(wǎng)格單元并不影響聚類質(zhì)量,因此在該網(wǎng)格合并規(guī)則中對(duì)于低密度網(wǎng)格單元沒有進(jìn)行處理。
本文算法給出了雷達(dá)信號(hào)脈沖流在線聚類分選的過程,主要包括聚類初始化和聚類更新兩部分[6]。
1)當(dāng)滑動(dòng)窗口中的數(shù)據(jù)達(dá)到窗口容量N 時(shí),進(jìn)行聚類初始化。隨著信號(hào)脈沖流的推進(jìn),算法不斷地更新結(jié)果,從而實(shí)現(xiàn)雷達(dá)信號(hào)脈沖流的在線分選。在線聚類部分算法流程圖如圖2(a)所示。
圖2 算法流程圖
2)聚類初始化過程是當(dāng)滑動(dòng)窗口內(nèi)數(shù)據(jù)初次裝滿時(shí)進(jìn)行的聚類。首先,將滑動(dòng)窗口中規(guī)范化后的數(shù)據(jù)映射到相應(yīng)的網(wǎng)格結(jié)構(gòu)中,并根據(jù)網(wǎng)格密度標(biāo)記出高低密度網(wǎng)格;然后,對(duì)高密度網(wǎng)格單元進(jìn)行搜索,并對(duì)其鄰居網(wǎng)格進(jìn)行合并,直到所有的高密度網(wǎng)格單元都被遍歷。其流程圖如圖2(b)所示。
3)聚類更新過程采用滑動(dòng)窗口機(jī)制和網(wǎng)格存儲(chǔ)結(jié)構(gòu),隨著信號(hào)脈沖流的到達(dá),將按照滑動(dòng)窗口數(shù)據(jù)進(jìn)出機(jī)制產(chǎn)生的新舊數(shù)據(jù)映射到相應(yīng)的網(wǎng)格單元中,更新相應(yīng)的網(wǎng)格單元密度,進(jìn)而更新聚類結(jié)果。其流程圖如圖2(c)所示。
為了驗(yàn)證該算法在雷達(dá)信號(hào)分選方面的可行性、有效性及對(duì)噪聲脈沖的識(shí)別能力,在雷達(dá)脈沖數(shù)據(jù)流中加入了15%的噪聲?;瑒?dòng)窗口容量N 設(shè)置為250。實(shí)驗(yàn)仿真選用的輻射源類型、數(shù)目,以及特征參數(shù)信息如表1所示。為了更直觀地觀察分選結(jié)果,在實(shí)驗(yàn)的信號(hào)脈沖流中,4部雷達(dá)信號(hào)按輻射源類型標(biāo)號(hào)順序依次出現(xiàn),各仿真了250個(gè)數(shù)據(jù)。另外,考慮到誤差問題,在模擬雷達(dá)脈沖信號(hào)時(shí),給每個(gè)參數(shù)都加了隨機(jī)抖動(dòng)。
表1 雷達(dá)參數(shù)設(shè)置表
原始雷達(dá)信號(hào)參數(shù)分布如圖3(a)所示,聚類初始化結(jié)果如圖3(b)所示。在三個(gè)不同時(shí)刻獲得的在線聚類分選結(jié)果如圖3(c)~(e)所示,分別按時(shí)間順序描述了雷達(dá)信號(hào)脈沖流的進(jìn)化過程。其中,圖3(c)是窗口滑動(dòng)190次時(shí)的結(jié)果,此時(shí)窗口中第1類雷達(dá)信號(hào)數(shù)據(jù)逐漸減少,第2類逐漸增多,數(shù)據(jù)聚為兩類:類1和類2;圖3(d)是窗口滑動(dòng)420次時(shí)的結(jié)果,此時(shí)窗口中第1類雷達(dá)信號(hào)已經(jīng)全部出去,第2類逐漸減少,第3類逐漸增多,窗口中數(shù)據(jù)聚為兩類:類2和類3;圖3(e)為窗口滑動(dòng)663次時(shí)的結(jié)果,同理,此時(shí)窗口中數(shù)據(jù)聚為兩類:類3和類4。由圖可以看出,噪聲點(diǎn)幾乎被完全移除。
圖3 在線聚類分選結(jié)果
由實(shí)驗(yàn)結(jié)果可知,本算法在不事先提供雷達(dá)輻射源個(gè)數(shù)的情況下,針對(duì)頻率捷變、重頻參差、脈寬參差等復(fù)雜的雷達(dá)信號(hào),能自動(dòng)發(fā)現(xiàn)聚類,實(shí)時(shí)捕捉其動(dòng)態(tài)變化并且排除異常點(diǎn)的干擾,獲得了較好的分選結(jié)果。
本文算法不需要提前給定雷達(dá)輻射源的數(shù)目,基于網(wǎng)格密度聚類的思想,采用滑動(dòng)窗口機(jī)制、網(wǎng)格密度存儲(chǔ)結(jié)構(gòu)和優(yōu)化的網(wǎng)格合并規(guī)則,能在線動(dòng)態(tài)地分選出密集交疊的雷達(dá)脈沖信號(hào),且分選效率高。實(shí)驗(yàn)結(jié)果證明,該算法能夠成功地應(yīng)用到未知雷達(dá)輻射源信號(hào)的有效分選中?!?/p>
[1]國(guó)強(qiáng).雷達(dá)信號(hào)分選理論研究[M].北京:科學(xué)出版社,2010.
[2]向嫻.一種基于網(wǎng)格密度聚類的雷達(dá)信號(hào)分選[J].火控雷達(dá)技術(shù),2010,39(4):67-72.
[3]趙國(guó)慶.雷達(dá)對(duì)抗原理[M].西安:西安電子科技大學(xué)出版社,1999.
[4]邱磊,楊承志,何佃偉.一種新的基于網(wǎng)格聚類的雷達(dá)信號(hào)預(yù) 分 選 算 法[J].現(xiàn) 代 防 御 技 術(shù),2013,41(2):167-172.
[5]Chen Y,Tu L.Density-based clustering for real-time stream data[R].San Jose,California,USA:ACMKDD’07,2007:133-142.
[6]毛國(guó)君,王欣,竹翠.基于網(wǎng)格結(jié)構(gòu)的數(shù)據(jù)流在線快速聚類算法[J].北京工業(yè)大學(xué)學(xué)報(bào),2011(10):1575-1579.