侯思堯 ,李 偉,李永光,凌 杰,黃黔川
(電子信息控制重點(diǎn)實(shí)驗(yàn)室,成都 610036)
輻射源信號(hào)個(gè)體識(shí)別首先利用表征個(gè)體指紋特征的屬性,如包絡(luò)上升沿、下降沿、頂部起伏等,通過(guò)傅里葉變換等手段完成指紋特征的提取,再采用相應(yīng)的個(gè)體識(shí)別方法實(shí)現(xiàn)對(duì)同類輻射源的不同個(gè)體的識(shí)別。
目前利用機(jī)器學(xué)習(xí)的個(gè)體識(shí)別方法方面主要包括深度學(xué)習(xí)和集成學(xué)習(xí)兩類,均需要根據(jù)個(gè)體樣本開展識(shí)別模型訓(xùn)練,然后根據(jù)訓(xùn)練后的模型完成未知個(gè)體的識(shí)別。其中,深度學(xué)習(xí)方法首先提取輻射源個(gè)體特征,然后構(gòu)建多層網(wǎng)絡(luò),將提取的特征作為輸入開展個(gè)體識(shí)別訓(xùn)練,訓(xùn)練期間利用多層網(wǎng)絡(luò)組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示,提升識(shí)別準(zhǔn)確率。典型深度學(xué)習(xí)方法包括卷積神經(jīng)網(wǎng)絡(luò)[1-4]、深度置信網(wǎng)絡(luò)[5]等,通過(guò)二維分布圖或多維的描述作為輸入,通常由于網(wǎng)絡(luò)層級(jí)較大,導(dǎo)致計(jì)算量大,不利于工程應(yīng)用。
集成學(xué)習(xí)首先組成一組個(gè)體學(xué)習(xí)器,再用某種策略將它們結(jié)合在一起,使其具有較好的分類效果和泛化性能,典型方法有隨機(jī)森林[6]、Adaboost[7]、GBDT[8]等。隨機(jī)森林具有高維特征處理、數(shù)據(jù)適應(yīng)性強(qiáng)和較好的抗噪能力,但在噪聲較大的分類或回歸問(wèn)題上容易出現(xiàn)過(guò)擬合;Adaboost方法在數(shù)據(jù)不平衡的情況下容易導(dǎo)致分類精度下降,訓(xùn)練耗時(shí)長(zhǎng)且易受噪聲干擾;GBDT方法的多個(gè)弱學(xué)習(xí)器之間存在依賴關(guān)系,難以并行訓(xùn)練數(shù)據(jù)。
本文采用優(yōu)勢(shì)互補(bǔ)的方式,將卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林方法進(jìn)行綜合,同時(shí),從工程化應(yīng)用角度考慮,減少卷積神經(jīng)網(wǎng)絡(luò)層數(shù),最終形成針對(duì)不同輻射源的綜合識(shí)別模型。通過(guò)仿真驗(yàn)證,本文提出的識(shí)別方法具有運(yùn)算時(shí)間短、識(shí)別概率高的特點(diǎn)。
本文提出的輻射源個(gè)體識(shí)別流程如圖1所示。
圖1 輻射源個(gè)體識(shí)別流程
Step1 將所有輻射源信號(hào)進(jìn)行預(yù)處理并建立標(biāo)簽,生成數(shù)據(jù)集M,隨機(jī)抽取其中的80%作為訓(xùn)練集T,剩余的20%作為測(cè)試集C,其中,抽取的輻射源信號(hào)滿足數(shù)據(jù)標(biāo)簽均勻分布,對(duì)于數(shù)據(jù)量少的個(gè)體通過(guò)同標(biāo)簽數(shù)據(jù)隨機(jī)填補(bǔ),以保證不同個(gè)體的訓(xùn)練樣本數(shù)量基本一致。
Step2 依次提取訓(xùn)練集T中各輻射源信號(hào)的指紋特征,生成輻射源特征矩陣A,用于下一步的訓(xùn)練與實(shí)際分類處理。
Step3 構(gòu)建基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型,考慮工程化應(yīng)用,采用3個(gè)卷積層、3個(gè)池化層、3個(gè)激活層以及輸入層和輸出層。將Step 2生成的輻射源特征矩陣作為輸入進(jìn)行訓(xùn)練,生成個(gè)體識(shí)別模型。
Step4 構(gòu)建基于隨機(jī)森林的集成學(xué)習(xí)模型,將Step 2生成的輻射源特征矩陣作為輸入進(jìn)行訓(xùn)練,生成個(gè)體識(shí)別模型。
Step5 將Step 2中的輻射源特征矩陣作為輸入,分別利用Step 3、Step 4的個(gè)體識(shí)別模型進(jìn)行個(gè)體識(shí)別,并基于兩種模型的識(shí)別結(jié)果,采用識(shí)別概率統(tǒng)計(jì)的方法生成不同輻射源個(gè)體的綜合權(quán)重向量,即卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林的權(quán)重值,最后根據(jù)綜合權(quán)重向量形成針對(duì)不同輻射源個(gè)體的綜合識(shí)別模型。
為了適應(yīng)實(shí)際應(yīng)用中電磁環(huán)境的變化,將新獲取的數(shù)據(jù)Madd添加到輻射源信號(hào)數(shù)據(jù)集M中形成新的數(shù)據(jù)集Mnew,定期執(zhí)行Step 1~5,對(duì)訓(xùn)練模型進(jìn)行更新。
Step6 依次提取測(cè)試集中各輻射源信號(hào)的指紋特征,生成輻射源特征矩陣,利用Step 5生成的綜合識(shí)別模型進(jìn)行個(gè)體識(shí)別驗(yàn)證。
構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),訓(xùn)練基于深度學(xué)習(xí)的個(gè)體識(shí)別模型。卷積層的卷積核為一維向量,激活層為ReLU函數(shù),輸出層由一層全連接網(wǎng)絡(luò)和Softmax分類器組成。其中,卷積層1的卷積核為1×25,步長(zhǎng)為2,卷積核個(gè)數(shù)為70;卷積層2的卷積核為1×16,步長(zhǎng)為2,卷積核個(gè)數(shù)為140;卷積層3的卷積核為1×8,步長(zhǎng)為2,卷積核個(gè)數(shù)為280。池化層1、2、3均采用最大池化,池化大小為1×4,步長(zhǎng)為2,如圖2所示。將特征矩陣A作為輸入,生成基于卷積神經(jīng)網(wǎng)絡(luò)的輻射源個(gè)體識(shí)別模型Mdpl。
圖2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
構(gòu)建隨機(jī)森林網(wǎng)絡(luò),訓(xùn)練基于集成學(xué)習(xí)的個(gè)體識(shí)別模型。通過(guò)K個(gè)決策樹和信息增益構(gòu)建隨機(jī)森林網(wǎng)絡(luò),其中K為輻射源個(gè)體數(shù)的20倍,用于分割節(jié)點(diǎn)的特征子集合個(gè)數(shù)為特征集合個(gè)數(shù)的均方根。將特征矩陣A作為輸入,生成基于隨機(jī)森林網(wǎng)絡(luò)的輻射源個(gè)體識(shí)別模型Meml。
將特征矩陣A作為輸入,分別利用識(shí)別模型Mdpl和Meml進(jìn)行個(gè)體識(shí)別,并基于識(shí)別結(jié)果的概率統(tǒng)計(jì)確定個(gè)體識(shí)別模型Mdpl的權(quán)重向量wdpl以及個(gè)體識(shí)別模型Meml的權(quán)重向量weml,并保存模型參數(shù)。權(quán)重向量算法如下:
根據(jù)給定的閾值Ftrust以及輻射源個(gè)體集合D={a1,a2,a3,…,az},得到識(shí)別結(jié)果為輻射源個(gè)體am的準(zhǔn)確率Fam為
(1)
式中:Sam是訓(xùn)練集中輻射源個(gè)體am的信號(hào)數(shù)量;fam表示某一信號(hào)識(shí)別為am的概率值;Bool(fam≥Ftrust)表示當(dāng)fam≥Ftrust時(shí)值為1,否則值為0。
通過(guò)上述方式可得到長(zhǎng)度為z的綜合權(quán)重向量wdpl和weml。
根據(jù)兩個(gè)識(shí)別模型及其對(duì)應(yīng)的權(quán)重向量生成不同個(gè)體的綜合識(shí)別模型,利用綜合識(shí)別模型計(jì)算某一信號(hào)識(shí)別為個(gè)體am的綜合概率如下:
(2)
本文在仿真環(huán)境下利用某型號(hào)雷達(dá)9個(gè)不同個(gè)體實(shí)際數(shù)據(jù)進(jìn)行仿真驗(yàn)證,數(shù)據(jù)集中每個(gè)個(gè)體的脈沖數(shù)為7 000~12 000,其中80%作為訓(xùn)練使用,剩余20%作為測(cè)試使用,如表1所示。置信度閾值Ftrust=0.6,訓(xùn)練用計(jì)算機(jī)的CPU為Intel Xeon Silver 4110,內(nèi)存32 GB,顯存16 GB。
表1 輻射源脈沖數(shù)統(tǒng)計(jì)表
利用卷積神經(jīng)網(wǎng)絡(luò)算法的識(shí)別結(jié)果如圖3所示,利用隨機(jī)森林算法的識(shí)別結(jié)果如圖4所示,利用本文所述算法的識(shí)別結(jié)果如圖5所示。
圖3 卷積神經(jīng)網(wǎng)絡(luò)算法得到的識(shí)別結(jié)果
圖4 隨機(jī)森林算法得到的識(shí)別結(jié)果
圖5 結(jié)合卷積神經(jīng)網(wǎng)絡(luò)與隨機(jī)森林算法得到的識(shí)別結(jié)果
通過(guò)圖3~5的對(duì)比分析可知,本文所提方法的平均識(shí)別準(zhǔn)確率為94.6%,卷積神經(jīng)網(wǎng)絡(luò)算法平均識(shí)別準(zhǔn)確率為88.4%,隨機(jī)森林算法平均識(shí)別準(zhǔn)確率為90.6%,因此本文方法能夠提升整體識(shí)別準(zhǔn)確率。針對(duì)單一算法識(shí)別準(zhǔn)確率較低的個(gè)體,如卷積神經(jīng)網(wǎng)絡(luò)對(duì)輻射源個(gè)體A44識(shí)別準(zhǔn)確率為38%,隨機(jī)森林對(duì)輻射源個(gè)體A46識(shí)別準(zhǔn)確率為49%,而本文所提方法對(duì)輻射源個(gè)體A44識(shí)別準(zhǔn)確率為92%,對(duì)輻射源個(gè)體A46識(shí)別準(zhǔn)確率為98%,識(shí)別正確率均高于單一算法,因此本文所提算法對(duì)于不同輻射源個(gè)體均有較好的適用性。
本文提出的輻射源個(gè)體識(shí)別算法選取了深度學(xué)習(xí)中的典型算法——卷積神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)中的典型算法隨機(jī)森林,目的在于提供一種思路,即如何將深度學(xué)習(xí)算法與集成學(xué)習(xí)算法相結(jié)合,通過(guò)減少深度學(xué)習(xí)網(wǎng)絡(luò)層數(shù),達(dá)到減少運(yùn)算時(shí)間的目的,從而提升工程化應(yīng)用能力。應(yīng)用分析結(jié)果顯示,本文所提方法具有良好的識(shí)別結(jié)果。
此外,應(yīng)用分析中用到的雷達(dá)數(shù)據(jù)不含多徑效應(yīng)以及噪聲干擾等情況,因此在工程應(yīng)用中,所述方法缺少對(duì)數(shù)據(jù)的預(yù)處理環(huán)節(jié),這也是本文的不足之處,后續(xù)應(yīng)該進(jìn)一步探索在復(fù)雜電磁環(huán)境下的輻射源個(gè)體識(shí)別問(wèn)題,以滿足實(shí)際需求。