賈然,胡進(jìn)
(南京船舶雷達(dá)研究所,江蘇 南京 211106)
一種基于數(shù)據(jù)場聚類的雷達(dá)信號分選算法*
賈然,胡進(jìn)
(南京船舶雷達(dá)研究所,江蘇 南京 211106)
針對傳統(tǒng)聚類算法在雷達(dá)信號分選中存在的一些問題,提出了一種基于數(shù)據(jù)場聚類的信號分選算法。首先所有數(shù)據(jù)樣本經(jīng)過歸一化計算,根據(jù)數(shù)據(jù)場理論計算樣本的勢值,通過尋找極大值點(diǎn)及其個數(shù)確定初始聚類中心和聚類數(shù)目,之后重新計算聚類中心。通過對頻率捷變雷達(dá)的實(shí)驗(yàn)仿真,驗(yàn)證了算法的有效性。
雷達(dá)信號分選;數(shù)據(jù)場;聚類;頻率捷變;等勢線;Matlab
復(fù)雜電磁環(huán)境下的雷達(dá)輻射源信號分選是雷達(dá)情報偵察的重要組成部分,是衡量雷達(dá)對抗情報處理能力的關(guān)鍵因素[1]。對于已知的雷達(dá)信號,依賴于先驗(yàn)知識,其處理的準(zhǔn)確性和實(shí)時性已經(jīng)得到了實(shí)踐驗(yàn)證。但對于未知雷達(dá)信號的分選則一直是雷達(dá)對抗情報處理中的難題[2]。雷達(dá)信號分選算法有待進(jìn)一步的發(fā)展,從而適應(yīng)如今日益復(fù)雜的信號環(huán)境。
聚類[3]是數(shù)據(jù)挖掘中的重要技術(shù),是將物理或者抽象對象的集合分成由類似的對象組成的多個類的過程,被廣泛地應(yīng)用于雷達(dá)信號分選當(dāng)中[4]。文獻(xiàn)[5]采用k- 均值聚類算法雷達(dá)信號進(jìn)行分選,利用歐式距離來描述脈沖之間的關(guān)聯(lián)性,取得了不錯的效果,但該算法需人為設(shè)定聚類數(shù)目,且噪聲數(shù)據(jù)對其影響很大。文獻(xiàn)[6]通過相似系數(shù)來代替歐式距離,用小波系數(shù)和傳統(tǒng)參數(shù)聯(lián)合分選,分選正確率達(dá)到96.2%,但是該算法不能動態(tài)獲取初始的聚類中心和聚類數(shù)目。文獻(xiàn)[7]提出了數(shù)據(jù)場的概念,將數(shù)據(jù)參數(shù)引入場空間,通過數(shù)據(jù)場中的輻射因子確定各層面數(shù)據(jù)的抱團(tuán)特征,精準(zhǔn)地找到初始中心聚類點(diǎn),具有較好的可行性。因此,本文提出了一種基于數(shù)據(jù)場聚類的雷達(dá)信號分選算法,將雷達(dá)信號數(shù)據(jù)引入數(shù)據(jù)場空間進(jìn)行處理,利用數(shù)據(jù)場中勢的概念,能夠自動形成聚類數(shù)目和聚類中心,用歐氏距離表征信號參數(shù)之間的關(guān)聯(lián)性。該算法適合于各類復(fù)雜體制雷達(dá)信號分選,對噪聲影響不敏感,不需要先驗(yàn)知識,具有較好的分選效果。
場的概念是英國物理學(xué)家法拉第在1837年提出的,開始是來描述物質(zhì)粒子間的非接觸互相作用。隨著場論思想的逐漸發(fā)展,其被抽象為一個數(shù)學(xué)概念,用于表征某個物理量或者數(shù)學(xué)函數(shù)在空間的分布規(guī)律。在實(shí)際世界里,各個對象之間是相互聯(lián)系、相互作用的,所以反映現(xiàn)實(shí)世界的數(shù)據(jù)之間也存在著相互聯(lián)系、相互作用。從而進(jìn)行聚類分析的數(shù)據(jù)并不是孤立空間中的每一個數(shù)據(jù),可能對整個空間中的其他數(shù)據(jù)都具有一定影響力,例如各個物體之間的萬有引力、點(diǎn)電荷之間的電場力,每個數(shù)據(jù)在整個數(shù)域空間的影響力可以看成一種數(shù)據(jù)場[8],數(shù)據(jù)場是一種客觀存在的媒介。數(shù)據(jù)通過數(shù)據(jù)場與其他數(shù)據(jù)發(fā)生相互作用,數(shù)據(jù)場是一種虛擬空間場,用于描述和計算單個數(shù)據(jù)對整個空間作用,數(shù)據(jù)在空間輻射能量的規(guī)律用場強(qiáng)函數(shù)[9-10]來表達(dá)。數(shù)據(jù)發(fā)射其能量的形式和特性的不同將導(dǎo)致描述數(shù)據(jù)場的場強(qiáng)函數(shù)的差異[11]。常用高斯影響函數(shù)來表述場強(qiáng)數(shù)據(jù)對象x在數(shù)據(jù)場中y點(diǎn)產(chǎn)生的場強(qiáng)函數(shù)度量如下:
(1)
式中:σ為輻射因子,表示數(shù)據(jù)點(diǎn)的影響力,在數(shù)據(jù)場中的影響就表現(xiàn)為等勢線的間距,取常數(shù);ρ反映該數(shù)據(jù)點(diǎn)的數(shù)據(jù)量,正常情況下取常數(shù);d(x,y)表示數(shù)據(jù)點(diǎn)x到點(diǎn)y的歐式距離。
勢函數(shù)定義為數(shù)據(jù)場中任何一點(diǎn)y上所有數(shù)據(jù)點(diǎn)的影響之和。對于由n個數(shù)據(jù)點(diǎn)構(gòu)成的場空間中任一點(diǎn)y的勢函數(shù)定義為
(2)
由式(2)可知,勢值和距離成反比,也就是說數(shù)據(jù)密集的地方勢值大,數(shù)據(jù)稀疏的地方密度小。
2.1 數(shù)據(jù)場聚類
雷達(dá)偵察接收機(jī)輸出到雷達(dá)信號處理的是密集重疊的脈沖流,每個脈沖以脈沖描述字(pulse description word,PDW)的形式來表示,每一個脈沖描述字主要包含以下5個參數(shù):到達(dá)時間(time of arrival,TOA)、脈沖幅度(pulse amplitude,PA)、脈沖頻率(radio frequency,RF)、脈沖寬度(pulse width,PW)、到達(dá)角(direction of arrival,DOA)。雷達(dá)信號分選就是從這種隨機(jī)交疊的脈沖流中分離出每一部雷達(dá)脈沖序列的過程[12]。數(shù)據(jù)場的引入一定程度上解決了空間信息和屬性信息相互分割的問題,為二者互相耦合解決實(shí)際問題提供了一個橋梁。
等勢線是一種把數(shù)據(jù)場勢值相等的點(diǎn)連起來形成的線,由等勢線圍繞形成的中心叫做勢心[13]。勢心是眾多數(shù)據(jù)樣本在單個或幾個以上的屬性數(shù)據(jù)值中所體現(xiàn)的極值特征。因?yàn)閯菪氖且欢ǚ秶鷥?nèi)勢值的極大值點(diǎn),通過勢心的數(shù)目和位置,就能找出初始聚類中心和初始聚類數(shù)目。但是通過抽象出來的勢心和樣本數(shù)據(jù)本身不一定重合,所以應(yīng)該選擇距離勢心最近的樣本數(shù)據(jù)作為初始聚類中心。根據(jù)等勢線圖,可以較為直接地發(fā)現(xiàn)勢心的位置,數(shù)學(xué)語言描述如下:
(3)
式中:Fmax為勢心值;F(i,j)為勢心周圍的勢值;(i,j)表示點(diǎn)所在的位置。
2.2 基于數(shù)據(jù)場聚類的雷達(dá)信號分選算法
雷達(dá)接收到的PDW中,根據(jù)到達(dá)時間(TOA)計算得到的脈沖重復(fù)頻率(pulse repetition frequency,PRF)工作方式多、變化快,一般不作為預(yù)分選的依據(jù),因此本文采用脈沖頻率(RF)、脈沖寬度(PW)、到達(dá)角(DOA)進(jìn)行分選。
為了確保聚類的科學(xué)性,多維聚類中信號的各維參數(shù)值要求處在同一數(shù)量級上。所以在參數(shù)進(jìn)行計算之前先進(jìn)行歸一化的處理,對于n個PDW=(RF,PW,DOA),其歸一化的過程如下:
(4)
式中:i=1,2,…,n。
經(jīng)過歸一化處理之后的脈沖描述字為
pdw=(rf,pw,doa),
式中:rf,pw,doa均為n維的列向量;pdw為n×3的矩陣。
數(shù)據(jù)場中任一點(diǎn)M的勢值為
(5)
(6)
式中:輻射因子σ值的大小會影響等勢線的間隔,σ值的大小與單個數(shù)據(jù)點(diǎn)的影響范圍成正比,與等勢線稀疏成反比;ρ反映該數(shù)據(jù)點(diǎn)的數(shù)據(jù)量,經(jīng)驗(yàn)證明對聚類結(jié)果沒有影響,ρ取常數(shù)1;pdwi表示pdw的第i行,即第i個數(shù)據(jù)樣本。通過計算找出數(shù)據(jù)場中點(diǎn)勢值的極大值,極大值的個數(shù)作為聚類數(shù)目k,距離極大值最近的點(diǎn)作為初始聚類中心pdwi(i=1,2,…,k);之后計算各個數(shù)據(jù)樣本點(diǎn)到每個聚類中心的距離,把數(shù)據(jù)樣本劃分到離它最近的那個中心所代表的類pdwj中,然后分別計算新產(chǎn)生的類中數(shù)據(jù)樣本的均值,把得到的均值作為新的聚類中心,把新的聚類中心和之前一次得到的中心進(jìn)行比較,如果沒有產(chǎn)生變化或者變化極小,則算法收斂,得到結(jié)果;反之假如新的中心和之前一次的中心對比產(chǎn)生了變化,就要依據(jù)新的聚類中心對所有數(shù)據(jù)樣本重新進(jìn)行劃分。直到滿足算法的收斂條件為止。本文收斂條件采取誤差平方和準(zhǔn)則函數(shù):
(7)
算法步驟總結(jié)如下:
(1) 根據(jù)式(4)樣本歸一化;
(2) 根據(jù)式(5),(6)計算每個點(diǎn)的勢值,再用式(3)找出數(shù)據(jù)場內(nèi)的極大值點(diǎn)最近的樣本點(diǎn)作為初始聚類中心,極大值的個數(shù)作為初始聚類數(shù)目;
(3) 計算每個數(shù)據(jù)點(diǎn)到這些聚類中心的距離,并把數(shù)據(jù)樣本劃分到相應(yīng)的類中;
(4) 對于每一類,重新計算其聚類中心,直到滿足收斂條件即聚類中心不再變化為止,算法結(jié)束,否則跳轉(zhuǎn)到步驟(3)。
為了驗(yàn)證本文算法的有效性,使用Matlab進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)仿真選用的4部頻率捷變雷達(dá)參數(shù)如表1所示。
表1所示的就是4部雷達(dá)的參數(shù),在不考慮脈沖丟失的情況下,每部雷達(dá)參數(shù)都有一定的測量誤差(誤差為高斯噪聲)。在較短的時間內(nèi),可以認(rèn)為DOA不發(fā)生變化,RF,PW是不斷變化的。
在實(shí)際仿真中,考慮到計算的復(fù)雜度問題,把三維的雷達(dá)參數(shù)降階為二維的來處理,選取RF,PW,DOA參數(shù)進(jìn)行兩兩計算,從而復(fù)雜度從原來的O(n3)降為O(n2)。經(jīng)過仿真處理,利用數(shù)據(jù)場理論得到的勢值分布通過等勢線的形式表示出來,如圖1~3所示(·代表雷達(dá)1,+代表雷達(dá)2,*代表雷達(dá)3,○代表雷達(dá)4)。
從圖1~3可以看出,輻射因子σ對等勢線的分布具有很大的影響。數(shù)據(jù)樣本的影響距離與σ值的大小成正比。圖1~3可以看出,σ取不同值時等勢線的分布情況。如果σ值取得很大,該數(shù)據(jù)場空間就看成僅有一個勢心的數(shù)據(jù)樣本,從而反映不了數(shù)據(jù)樣本準(zhǔn)確的分布情況,因此選取恰當(dāng)?shù)挠绊懸蜃应绎@得尤為重要。本文選取σ=0.1[14],圖1~3可以直觀地看出雷達(dá)信號分為4類,初步結(jié)果如表2所示。
表1 雷達(dá)仿真參數(shù)
初始聚類中心經(jīng)過重新計算得到最終聚類中心結(jié)果如表3所示。
本文算法與傳統(tǒng)的傳統(tǒng)聚類算法比如k- 均值聚類算法[15]相比較分選效果,由于k- 均值聚類算法會隨機(jī)選取聚類中心和數(shù)目,得到的結(jié)果也會不同,為了便于比較,仿真100次取平均值與本文算法相比較。本文算法的迭代次數(shù)為4,而k- 均值聚類算法平均迭代次數(shù)為13,大大降低了運(yùn)算量;正確分選概率的也從k- 均值聚類算法88.91%提高到98.59%。正確分選概率公式為
圖1 載頻和脈寬的等勢線分布Fig.1 RF and PW of the equipotential lines distribution
圖2 載頻和到達(dá)角的等勢線分布Fig.2 RF and DOA of equipotential lines distribution
圖3 脈寬和到達(dá)角的等勢線分布Fig.3 PW and DOA of equipotential lines distribution
雷達(dá)序號RFPWDOA10.52220.37600.030120.36660.48800.318630.82980.36910.677440.24180.71710.8918
表3 最終聚類中心
(8)
4部雷達(dá)的分選結(jié)果如表4所示。
表4 分選結(jié)果
針對傳統(tǒng)聚類算法需要預(yù)先設(shè)定聚類中心和聚類數(shù)目,無法有效應(yīng)用于雷達(dá)信號分選的情況,本文把數(shù)據(jù)場的概念應(yīng)用到信號分選領(lǐng)域并展開研究。本文算法通過對勢值的分析,就能確定聚類數(shù)目和聚類中心。經(jīng)過Matlab仿真驗(yàn)證,基于數(shù)據(jù)場聚類的雷達(dá)信號分選算法對復(fù)雜體制雷達(dá)具有較好的分選效果。
文中提到的算法雖然能夠完成對聚類數(shù)目和聚類中心的確定,使正確分選概率得到提高,但是沒有考慮脈沖丟失的情況,還需作進(jìn)一步的研究。輻射因子σ主要是通過經(jīng)驗(yàn)和實(shí)驗(yàn)得到,有關(guān)輻射因子σ的優(yōu)化和設(shè)定還有待探討。
[1] 陸志宏.雷達(dá)偵察系統(tǒng)信號處理技術(shù)探討[J].艦船電子對抗,2005,28(3):38-43. LU Zhi- hong.Research on Signal Processing Technology of Radar Reconnaissance System[J].Ship Electronic Countermeasure,2005,28(3):38-43.
[2] 何明浩.雷達(dá)對抗信息處理[M].北京:清華大學(xué)出版社,2010. HE Ming- hao.Radar Countermeasure Information Processing[M].Beijing:Tsinghua University Press,2010.
[3] XU Rui,WUNSCH D.Survey of Clustering Algorithms[J].IEEE Transactions on Neural Networks,2005,16(3):645-678.
[4] 岳宏偉,羅景青,呂久明,等.雷達(dá)信號非均勻粒度聚類分選方法[J].火力與指揮控制,2008,33(8):23-26. YUE Hong- wei,LUO Jing- qing,Lü Jiu- ming,et al.Non Uniform Particle Size Clustering Algorithm for Radar Signals[J].Fire Control & Command Control,2008,33 (8):23-26.
[5] 張莉,孫鋼,郭軍.基于K- 均值聚類的無監(jiān)督的特征選擇方法[J].計算機(jī)應(yīng)用研究,2004,23(3):23-24,42. ZHANG Li,SUN Gang,GUO Jun.Unsupervised Feature Selection Method Based onK- Mean Clustering[J].Research and Application of Computer,2004,23 (3):23-24,42.
[6] 馮明月,何明浩,王冰切.基于改進(jìn)相似熵的參數(shù)交疊雷達(dá)信號分選[J].電子信息對抗技術(shù),2013,28(4):1-4. FENG Ming- yue,HE Ming- hao,WANG Bing- qie.Improved Parameter Similar Entropy Overlapping Radar Signal Sorting[J].Electronic Warfare Technology Based on 2013,28(4):1-4.
[7] 王海軍,鄧羽,王麗,等.基于數(shù)據(jù)場的C均值聚類方法研究[J].武漢大學(xué)學(xué)報,2009,34(5):626-629. WANG Hai- jun,DENG Yu,WANG Li,et al.Research on the C- mean Clustering Method Based on Data Field[J].Journal of Wuhan University,2009,34(5):626-629.
[8] 淦文燕,李德毅,王建民.一種基于數(shù)據(jù)場的層次聚類方法[J].電子學(xué)報,2006,34(2):258-262. GAN Wen- yan,LI De- yi,WANG Jian- min.A Hierarchical Clustering Method Based on Data Field[J].Journal of Electronics,2006,34 (2):258-262.
[9] 李德仁,周月琴,金為銑.攝影測量與遙感概論[M].北京:測繪出版社,2001. LI De- ren,ZHOU Yue- qin,JIN Wei- xi.Photogrammetry and Remote Sensing Survey[M].Beijing:Surveying and Mapping Press,2001.
[10] 張紅昌,龔亮亮,阮懷林,等.一種新的未知雷達(dá)輻射源聚類分選方法[J].計算機(jī)工程與應(yīng)用,2008,44(27):200-202. ZHANG Hong- chang,GONG Liang- liang,RUAN Huai- lin,et al.An Unknown Radar Emitter Sorting Method Based on the New[J].Computer Engineering and Applications,2008,44 (27):200-202.
[11] 余建橋,基于數(shù)據(jù)場改進(jìn)的PAM聚類算法[J].計算機(jī)科學(xué),2005,32 (1):165-168. YU Jian- qiao,The Data Field Improved PAM Clustering Algorithm[J].Based on Computer Science,2005,32 (1):165-168.
[12] 羅景青,賀平.雷達(dá)對抗原理[M].合肥:解放軍電子工程學(xué)院出版社,2003. LUO Jing- qing,HE Ping.The Principle of Radar Countermeasure[M].Hefei:Electronic Engineering Institute Press,2003.
[13] 李興生.基于云模型和數(shù)據(jù)場的分類和聚類挖掘研究[D].南京:解放軍理工大學(xué),2003. LI Xing- sheng.Classification and Clustering Mining Based on Cloud Model and Data Field[D].Nanjing:PLA University of Science and Technology,2003.
[14] 國強(qiáng),宋文明,南浦龍,等.基于數(shù)據(jù)場與云模型的多模雷達(dá)信號分選算法[J].哈爾濱工業(yè)大學(xué)學(xué)報,2015,47(11),76-81. GUO Qiang,SONG Wen- ming,NAN Pu- long,et al.Data Field and Cloud Model of Multi- Mode Radar Signal Sorting Slgorithm[J].Journal of Harbin Institute of Technology,2015,47 (11),76-81.
[15] 聶曉偉.基于K- Means算法的雷達(dá)信號預(yù)分選方法[J].電子科技,2013,26(11):55-58. NIE Xiao- wei.Radar Signal Pre Sorting AlgorithmK- Means Algorithm[J].Electronic Science and Technology,2013,26 (11):55-58.
A Radar Signal Sorting Algorithm Based on Data Field Clustering
JIA Ran,HU Jin
(Nanjing Marine Radar Institute,Jiangsu Nanjing 211106,China)
Aimed at some problems existing in radar signal sorting based on the traditional clustering algorithm, a new signal sorting algorithm based on data field clustering is proposed. All data samples are calculated for normalization. According to the data field theory calculation sample of potential value, the initial clustering center and number are determined by finding the maxima and its numbers, and the cluster centers are recalculated. The effectiveness of the proposed algorithm is verified through the experimental simulation of frequency agility radar.
radar signal sorting;data field;clustering;frequency agility;equipotential line;Matlab
2016-09-18;
2016-11-18 作者簡介:賈然(1992-),男,江蘇泰州人。碩士生,主要研究方向?yàn)槔走_(dá)信號處理。
10.3969/j.issn.1009- 086x.2017.04.020
TN957.5;TP391.9
A
1009- 086X(2017)- 04- 0124- 06
通信地址:211106 江蘇省南京市江寧區(qū)長青街30號 E- mail:913117186@qq.com