廖 帥,王揚(yáng)鈞,姜 楠,段金虎
(北京市遙感信息研究所,北京 100094)
雷達(dá)輻射源信號(hào)由于受噪聲等多種因素影響,最重要的特征常常難以發(fā)現(xiàn),特征提取一般采用經(jīng)驗(yàn)式的方法,所提取出的特征往往帶有主觀性和猜測(cè)性,且由于大量噪聲的存在,信噪比通常在幾dB到幾十dB之間變化,這些因素易造成特征向量在特征空間中的無(wú)序分布,使不同類別的輻射源信號(hào)特征在特征空間中發(fā)生嚴(yán)重交疊而致使分類識(shí)別率降低。為了消除特征提取的主觀性和提高準(zhǔn)確識(shí)別率,需要采用特征選擇方法,按照與分類有關(guān)的評(píng)價(jià)準(zhǔn)則從高維特征中挑選最有效的特征集。
特征選擇的任務(wù)是利用特征模式樣本集的內(nèi)部信息,從一組特征中挑選出一些最有效的特征以達(dá)到降低特征空間維數(shù)的目的。特征選擇應(yīng)能有效降低特征向量的維數(shù)、減少特征提取的代價(jià)、簡(jiǎn)化分類器的設(shè)計(jì)和提高識(shí)別效率,因此,特征選擇是繼特征提取之后的一個(gè)重要研究課題,受到模式識(shí)別、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域研究人員的廣泛關(guān)注。
將分類器的錯(cuò)誤概率作為特征選擇準(zhǔn)則固然好,但即使在類條件概率分布密度已知的情況下錯(cuò)誤概率的計(jì)算也很復(fù)雜,何況實(shí)際問(wèn)題中通常不知道這一分布,這使得直接用錯(cuò)誤概率作為分類標(biāo)準(zhǔn)來(lái)分析特征的有效性變得十分困難。因此,在實(shí)際應(yīng)用中,需要尋求一種有效的解決方案來(lái)衡量各類別間的可分離性。
本文給出了一種類內(nèi)聚集度和類間離散度的定義,并提出一種基于類內(nèi)聚集度和類間離散度的特征集評(píng)價(jià)準(zhǔn)則。基于該準(zhǔn)則,采用特征排序選擇的搜索策略,可以從雷達(dá)輻射源信號(hào)原始特征集中挑選出品質(zhì)優(yōu)良的特征子集,從而實(shí)現(xiàn)對(duì)雷達(dá)輻射源信號(hào)的準(zhǔn)確識(shí)別。
物理意義上,可把雷達(dá)輻射源信號(hào)多模特征分為以下五個(gè)類別。
脈沖序列統(tǒng)計(jì)特征:載頻、重頻、脈寬等;
脈沖序列衍生特征:載頻、重頻、脈寬的相關(guān)性及組合變化特征等;
單脈沖脈內(nèi)調(diào)制特征:頻率、帶寬、調(diào)制類型、調(diào)制參數(shù)、零中頻相位曲線等;
單脈沖脈沖包絡(luò)特征:精測(cè)脈寬、上升沿夾角、下降沿夾角、頂部趨勢(shì)夾角、頂部波動(dòng)、包絡(luò)J特征、包絡(luò)差分J特征等;
雷達(dá)掃描特征:圓周掃描雷達(dá)掃描周期。
從識(shí)別的角度考慮,按照特征描述的方式,可把雷達(dá)輻射源信號(hào)多模特征分為以下三個(gè)類別。
連續(xù)取值類特征:脈沖載頻、帶寬、重頻、精測(cè)脈寬、上升沿夾角、下降沿夾角、頂部趨勢(shì)夾角、頂部波動(dòng)、包絡(luò)J特征、包絡(luò)差分J特征、掃描周期、脈內(nèi)調(diào)制參數(shù)等;
離散取值類特征:載頻統(tǒng)計(jì)類型、重頻統(tǒng)計(jì)類型、脈寬統(tǒng)計(jì)類型、脈內(nèi)調(diào)制類型、脈內(nèi)調(diào)制碼等;
曲線圖片類特征:脈沖序列載頻/脈寬/重頻的相關(guān)性臉譜圖、脈內(nèi)調(diào)制識(shí)別曲線、脈沖包絡(luò)曲線、零中頻相位曲線等。
按照第1節(jié)中對(duì)雷達(dá)輻射源信號(hào)特征的描述,特征可分為連續(xù)取值類、離散取值類以及曲線圖片類。對(duì)于離散取值類和曲線圖片類的特征,目前只能依賴人工分類判別及挑選,本文詳細(xì)討論了連續(xù)取值類特征的奇異樣本篩選及評(píng)價(jià)準(zhǔn)則。首先,給出了一種類內(nèi)聚集度和類間離散度的定義,依據(jù)類內(nèi)聚集度,通過(guò)設(shè)置合理的閾值,挑選并剔除奇異樣本。然后,提出了一種基于類內(nèi)聚集度和類間離散度的特征集品質(zhì)評(píng)價(jià)準(zhǔn)則函數(shù),基于該準(zhǔn)則函數(shù),采用相關(guān)的搜索策略,可從雷達(dá)輻射源信號(hào)原始特征集中挑選出品質(zhì)優(yōu)良的特征子集。
定義1 第i類信號(hào)的類內(nèi)聚集度Cii為:
(1)
定義2 第i類與第j類信號(hào)的距離Dij定義為:
(2)
定義3 第i類與第j類信號(hào)的類間離散度Sij定義為:
Sij=Dij/Cii+Cjj
(3)
式中,Dij是第i類與第j類信號(hào)的距離,Cii和Cjj分別為第i類與第j類信號(hào)的類內(nèi)聚集度。
如果待識(shí)別信號(hào)共有H類(H≥2),考慮識(shí)別的復(fù)雜度,選擇的特征子集維數(shù)越低越好,另外各類的類間離散度平均值越大越好。由此,根據(jù)定義1和定義3給出的類內(nèi)聚集度和類間離散度,設(shè)計(jì)評(píng)價(jià)特征集質(zhì)量的準(zhǔn)則函數(shù)為:
(4)
由式(4)可知,特征子集維數(shù)q越小,f值越大;各類的類間離散度Sij平均值越大,f值越大。準(zhǔn)則函數(shù)f值越大,表明選擇的特征子集越好。
在對(duì)某個(gè)雷達(dá)輻射源信號(hào)進(jìn)行特征提取及分析時(shí),依據(jù)信號(hào)分選結(jié)果提取的脈沖樣本可能會(huì)存在個(gè)別的錯(cuò)誤情況,即脈沖樣本不是該雷達(dá)輻射源真實(shí)脈沖或者選取的脈沖樣本體現(xiàn)出的特征不是雷達(dá)輻射源真實(shí)的特征,主要有以下幾類情況:
1) 由信號(hào)分選策略所導(dǎo)致的脈沖信號(hào)漏分選,造成頻率跳變或捷變的范圍沒(méi)有完整體現(xiàn),表現(xiàn)出雷達(dá)參數(shù)變化類型的錯(cuò)誤或不完整;
2) 分選出的脈沖列中包含個(gè)別其他輻射源的脈沖,或者挑選出的脈內(nèi)采集數(shù)據(jù)不是原脈沖列包含的樣本脈沖的采集數(shù)據(jù);
3) 當(dāng)脈沖功率較低,例如一個(gè)大脈寬的脈沖功率在接收機(jī)靈敏度附近起伏時(shí),會(huì)分裂成多個(gè)小脈寬的脈沖,造成分裂成小脈寬脈沖以及不規(guī)則小重頻;
4) 對(duì)于頻率分集信號(hào)和脈內(nèi)頻率跳變信號(hào),由接收機(jī)體制導(dǎo)致未能截獲部分頻點(diǎn)的脈沖,造成脈沖分裂,形成虛假脈沖現(xiàn)象。
因此,對(duì)樣本進(jìn)行統(tǒng)計(jì)分析時(shí),存在奇異值樣本是正常的,對(duì)特征進(jìn)行統(tǒng)計(jì)分析之前,有必要檢查樣本特征的統(tǒng)一性,剔除奇異樣本。由于樣本的數(shù)量較小,但每個(gè)樣本提取的原始特征種類多,表述樣式不統(tǒng)一,不便于用統(tǒng)一的方法去查找錯(cuò)誤樣本。對(duì)于離散取值類的特征,可通過(guò)統(tǒng)計(jì)樣本該特征不同取值的出現(xiàn)次數(shù),剔除出現(xiàn)次數(shù)很少的奇異樣本;對(duì)于圖片曲線類的特征,通過(guò)人工比對(duì)分析,挑選出差異較大的樣本;對(duì)于連續(xù)取值類的特征,本文結(jié)合聚類的思想,給出一種依據(jù)樣本特征值聚集度的挑選奇異樣本并分類的方法。
Step4:設(shè)σ為樣本類數(shù)量閾值,當(dāng)a<σ,第一類樣本因數(shù)量小于閾值判為奇異樣本,舍棄該類樣本,否則保留該類樣本;
Step6:對(duì)于保留的樣本,重復(fù)Step2,直到Δya/Δyb≤δ,結(jié)束流程。
樣本篩選完成后,對(duì)于同型雷達(dá)輻射源的幾個(gè)不同個(gè)體,依據(jù)樣本類內(nèi)聚集度及類間離散度排序的特征選擇方法,挑選合適的特征,以降低后面?zhèn)€體分類識(shí)別的特征維數(shù),提高分類效率和準(zhǔn)確率,具體步驟如下:
Step1:設(shè)某型待分類的雷達(dá)輻射源信號(hào)總共有H類信號(hào),共提取了q個(gè)特征,計(jì)算第i類與第j類信號(hào)的第n個(gè)特征的分離度Snij及準(zhǔn)則函數(shù)fn,其中i=1,2,…,q,n=1,2,…,q;
Step2:按各特征的準(zhǔn)則函數(shù)f由大到小進(jìn)行排序,結(jié)果為fA1≥fA2≥…≥fAq,其中fAi為第Ai個(gè)特征的類間離散度;
特征提取和特征選擇是雷達(dá)輻射源信號(hào)識(shí)別的重要課題之一,本文在給出的一種類內(nèi)聚集度和類間離散度定義的基礎(chǔ)上,提出了基于類內(nèi)聚集度和類間離散度的特征集品質(zhì)評(píng)價(jià)準(zhǔn)則函數(shù)。基于該準(zhǔn)則函數(shù),采用特征排序選擇的搜索策略,可從雷達(dá)輻射源信號(hào)原始特征集中挑選出品質(zhì)優(yōu)良的特征子集,從而實(shí)現(xiàn)了信號(hào)特征的高效描述,提高了雷達(dá)輻射源信號(hào)識(shí)別的準(zhǔn)確率。■
[1] 張葛祥,榮海娜,金煒東.基于小波包變換和特征選擇的雷達(dá)輻射源信號(hào)識(shí)別[J].電路與系統(tǒng)學(xué)報(bào),2006,11(6):46-49.
[2] 張靜遠(yuǎn),張冰,蔣興舟.基于小波變換的特征提取方法分析[J].信號(hào)處理,2000,16(2):156-162.
[3] 錢濤,馬健,劉凱,等.基于連通檢測(cè)和區(qū)域擴(kuò)展的多重聚類方法研究[J].航天電子對(duì)抗,2016,32(5):36-39.
[4] 楊建,周濤,何梓昂.一種有效的雷達(dá)信號(hào)快速識(shí)別方法[J].電訊技術(shù),2017,57(4):418-424.
[5] 普運(yùn)偉,金煒東,胡來(lái)招.基于瞬時(shí)頻率二次特征提取的輻射源信號(hào)分類[J].西南交通大學(xué)學(xué)報(bào),2007,42(3):373-379.
[6] 沈家煌,黃建沖,朱永成.特征參數(shù)匹配法在雷達(dá)信號(hào)識(shí)別中的應(yīng)用[J].航天電子對(duì)抗,2017,33(2):9-14.
[7] 吳振強(qiáng),常碩,張國(guó)毅.基于信號(hào)特征綜合處理的雷達(dá)輻射源識(shí)別[J].科學(xué)技術(shù)與工程,2015,15(25):12-17.
[8] 郭亞琴,王正群.基于類內(nèi)類間離散度的分類器設(shè)計(jì)方法[J].信息技術(shù),2010,5(1):35-37.