孫藝聰,田潤(rùn)瀾,劉 沖,郭 揚(yáng)
(1.空軍航空大學(xué)航空作戰(zhàn)勤務(wù)學(xué)院, 長(zhǎng)春 130022; 2.空軍參謀部電子對(duì)抗雷達(dá)局, 北京 100000;3.空軍航空大學(xué)教研保障中心, 長(zhǎng)春 130022)
對(duì)于電磁環(huán)境日益復(fù)雜的今天,如何快速準(zhǔn)確地對(duì)未知雷達(dá)信號(hào)進(jìn)行分類和識(shí)別,一直是信號(hào)處理領(lǐng)域的重點(diǎn)研究方向,尤其是在軍事對(duì)抗中,能夠快速對(duì)未知信號(hào)進(jìn)行分類識(shí)別,對(duì)后續(xù)的戰(zhàn)爭(zhēng)行動(dòng)有著深遠(yuǎn)的影響[1-2]。圍繞著雷達(dá)信號(hào)識(shí)別與分類的問(wèn)題上,國(guó)內(nèi)外研究人員進(jìn)行了大量的研究。文獻(xiàn)[3]提出了一種基于時(shí)頻圖像的雷達(dá)波形識(shí)別系統(tǒng),能夠識(shí)別多種波形。文獻(xiàn)[4]提出了一種基于時(shí)頻圖像預(yù)處理下卷積網(wǎng)絡(luò)雷達(dá)信號(hào)識(shí)別方法,相比人工提取特征的準(zhǔn)確率有所提高。文獻(xiàn)[5]提出了一種基于積分旋轉(zhuǎn)因子的徑向積分方法,在時(shí)頻圖像的基礎(chǔ)上對(duì)信號(hào)進(jìn)行檢測(cè)。文獻(xiàn)[6]提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)和平均采樣技術(shù)的信號(hào)自動(dòng)識(shí)別方法,有效降低了處理信號(hào)時(shí)所需的大量計(jì)算成本。文獻(xiàn)[7]采用了特征融合和支持向量機(jī)的方法,具有較好的準(zhǔn)確性和魯棒性。文獻(xiàn)[8]提出了一種基于短時(shí)傅里葉變換與卷積神經(jīng)網(wǎng)絡(luò)的分類方法,具有較高的識(shí)別性能。但是上述方法在低信噪比情況下識(shí)別準(zhǔn)確率有限,且不同類型信號(hào)之間識(shí)別準(zhǔn)確率也有一定的差距,訓(xùn)練得到的網(wǎng)絡(luò)具有一定的偏向性,這就會(huì)導(dǎo)致特征明顯的信號(hào)類型更容易被識(shí)別出來(lái),而特征不明顯的信號(hào)類型更容易被判錯(cuò),不利于后續(xù)的分析處理。
為了改善上述問(wèn)題,本文提出一種雷達(dá)信號(hào)分類方法,首先利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)提取圖像的特征,得到初步的分類結(jié)果,然后利用Bagging集成方法對(duì)CNN得到的結(jié)果進(jìn)行集成決策,減少CNN網(wǎng)絡(luò)帶來(lái)的方差。本文首先介紹了特征提取方法和圖像預(yù)處理方法,接著介紹了Bagging框架和CNN的基本知識(shí)以及網(wǎng)絡(luò)結(jié)構(gòu),然后設(shè)計(jì)了Bagging-CNN分類方法的實(shí)現(xiàn)流程,最后設(shè)計(jì)了仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文提出的方法相比于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)方法整體識(shí)別效果更好,在低信噪比情況下也展現(xiàn)了較好的分類能力,同時(shí)類別之間的差距也有所減少。
不同調(diào)制方式的雷達(dá)信號(hào)在分辨力、精度、模糊度等方面有著不同的表現(xiàn),體現(xiàn)在模糊函數(shù)上的形式也有所不同。模糊函數(shù)在雷達(dá)信號(hào)分析方面有著很重要的作用[9],在雷達(dá)波形設(shè)計(jì)中,也常用模糊函數(shù)作為設(shè)計(jì)工具[10]。模糊函數(shù)的一般定義為:
(1)
式(1)中:τ表示時(shí)間延遲:fd表示多普勒頻移:x(t)表示信號(hào)的復(fù)包絡(luò)。
模糊函數(shù)具有許多重要的性質(zhì)[11]:
1) 唯一性。對(duì)于任意給定的信號(hào),它都有唯一的模糊函數(shù),不同信號(hào)有不同的模糊函數(shù)。
2) 原點(diǎn)對(duì)稱性。
|χ(τ,fd)|=|χ(-τ,-fd)|
(2)
3) 體積不變性。體積不變性也叫作模糊原理。它表示模糊函數(shù)圖中曲面下體積只取決于信號(hào)的總能量。
(3)
根據(jù)這些不同,可以將模糊函數(shù)圖像作為神經(jīng)網(wǎng)絡(luò)的輸入圖像特征。由于模糊函數(shù)圖是三維立體圖,為了使其能夠作為神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù),需要進(jìn)一步處理為二維平面圖[12]。本文主要選用5種信號(hào)類型,分別為BPSK、Costas、FMCW、Frank和P4,以各個(gè)類型信號(hào)的模糊函數(shù)的等高線圖作為輸入特征,如圖1所示。
圖1 5種雷達(dá)信號(hào)模糊函數(shù)等高線圖
在對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練之前,首先對(duì)要訓(xùn)練的數(shù)據(jù)集進(jìn)行預(yù)處理,以減少卷積神經(jīng)網(wǎng)絡(luò)輸入的數(shù)據(jù)量,同時(shí)對(duì)數(shù)據(jù)進(jìn)行增強(qiáng),以保留足夠多的特征用于后續(xù)分類工作的影響,提高神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率和訓(xùn)練效率。本文采用圖像閾值處理對(duì)圖像進(jìn)行預(yù)處理。
圖像閾值處理是一種常用的圖像處理方法。首先將圖像灰度化,然通過(guò)一定的規(guī)則對(duì)灰度化后的圖像設(shè)置閾值,根據(jù)閾值調(diào)整像素值,將圖像二值化。根據(jù)閾值設(shè)置的不同,可以分為全局閾值和局部閾值,也可以分為單閾值和多閾值。主要的圖像閾值處理方法有以下3種:簡(jiǎn)單閾值;Otsu’s二值化;自適應(yīng)閾值。
3種閾值處理方法的主要區(qū)別在于閾值的設(shè)定上。簡(jiǎn)單閾值是一種全局性的閾值,通過(guò)設(shè)定一個(gè)全局閾值,然后整個(gè)圖像與該閾值相比較;Otsu’s二值化適用于圖像灰度直方圖中具有雙峰的情況,通過(guò)算法在雙峰之間找到一個(gè)值作為閾值;自適應(yīng)閾值相對(duì)于簡(jiǎn)單閾值可以看作是局部性的閾值,通過(guò)規(guī)定一個(gè)一定大小的區(qū)域,比較某點(diǎn)與區(qū)域大小里面像素點(diǎn)平均值的大小來(lái)確定這個(gè)像素點(diǎn)是屬于黑或者白。圖2是對(duì)原始圖像分別進(jìn)行簡(jiǎn)單閾值、Otsu’s二值化和自適應(yīng)閾值處理的結(jié)果,其中自適應(yīng)閾值設(shè)定的區(qū)域大小為5×5。
圖2 原始圖像和3種閾值處理方法效果
在機(jī)器學(xué)習(xí)中,主要目標(biāo)是訓(xùn)練一個(gè)穩(wěn)定的對(duì)于每一類效果都好的網(wǎng)絡(luò)模型,然而實(shí)際情況下并不都是這樣。有時(shí)候我們會(huì)得到具有偏向性的模型,對(duì)于某些類的處理效果特別好,而對(duì)其他類的處理則特別差,這樣的網(wǎng)絡(luò)模型不適合于實(shí)際應(yīng)用中。集成學(xué)習(xí)[13]思想就是通過(guò)組合一些弱模型,使其能夠優(yōu)勢(shì)互補(bǔ),這樣即使是某個(gè)模型預(yù)測(cè)結(jié)果是錯(cuò)的,其他模型也能夠糾正過(guò)來(lái)。一般情況下,融合多個(gè)網(wǎng)絡(luò)的效果要優(yōu)于單個(gè)網(wǎng)絡(luò)的效果。
集成學(xué)習(xí)在如今的許多領(lǐng)域都有所應(yīng)用,在信用評(píng)估、價(jià)格預(yù)測(cè)、數(shù)據(jù)分析、情感分析等方面取得了不錯(cuò)的效果[14-15]。常見(jiàn)的集成學(xué)習(xí)方法有Bagging、Boosting和Stacking等3種方法。其中Bagging算法是常用的一種框架,它通過(guò)重采樣的方法在原始訓(xùn)練集中選擇自己的訓(xùn)練子集,從數(shù)據(jù)集中通過(guò)有放回的抽樣得到n個(gè)子樣本集,大小同原始訓(xùn)練集相同,而且每個(gè)訓(xùn)練子集都是相互獨(dú)立的。由于每一個(gè)樣本抽到的概率Pi為:
Pi=1-(1-1/N)N
(4)
式(4)中:i為第i個(gè)樣本;N為樣本的總數(shù)。當(dāng)N的數(shù)量足夠大時(shí),根據(jù)極限定理可得:
1-1/e≈0.632
(5)
這意味著有63.2%的數(shù)據(jù)參與了網(wǎng)絡(luò)的訓(xùn)練,而有36.8%的數(shù)據(jù)由于沒(méi)被選中而不參與網(wǎng)絡(luò)的訓(xùn)練,可以用來(lái)檢驗(yàn)網(wǎng)絡(luò)的泛化能力,而且對(duì)于原始樣本有噪聲數(shù)據(jù)時(shí),通過(guò)重采樣,就會(huì)有1/3的噪聲樣本不會(huì)被訓(xùn)練,這樣就不容易受到噪聲的影響,可以降低模型的方差。
Bagging算法的流程如圖3所示,通過(guò)圖3可以看出,Bagging框架下的個(gè)體學(xué)習(xí)器可以并行訓(xùn)練,具有很高的學(xué)習(xí)效率。Bagging算法通過(guò)重采樣方法得到n個(gè)不同的訓(xùn)練子集,進(jìn)而訓(xùn)練得到n個(gè)不同的且各自獨(dú)立的個(gè)體學(xué)習(xí)器,然后通過(guò)集成策略對(duì)這n個(gè)個(gè)體學(xué)習(xí)器的結(jié)果進(jìn)行集成,得到最終的預(yù)測(cè)結(jié)果。常見(jiàn)的集成策略有投票法和平均法,其中Bagging算法常用的方法是投票法,分為加權(quán)投票法和多數(shù)投票法。通過(guò)集成策略得到最終的識(shí)別結(jié)果。
Bagging算法的流程如下:
輸入:樣本集D={(x1,y1),(x2,y2),…,(xm,ym)},其中x為樣本,y為樣本標(biāo)簽;
輸出:分類器f(x);
1 fort=1,2,…,n
(1)有放回的選取樣本得到子樣本集Dt;
(2)根據(jù)子樣本集Dt訓(xùn)練得到子學(xué)習(xí)器ht;
End for
2 根據(jù)集成策略將ht結(jié)果集成得到最終分類器f(x)
Bagging算法的基學(xué)習(xí)器一般采用的是弱學(xué)習(xí)器,但是在實(shí)際中為了減少基學(xué)習(xí)器的數(shù)量,一般會(huì)采取比較強(qiáng)的學(xué)習(xí)器,如卷積神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等。本文主要采用卷積神經(jīng)網(wǎng)絡(luò)作為基學(xué)習(xí)器。
圖3 Bagging框架流程框圖
卷積神經(jīng)網(wǎng)絡(luò)[16-17]是一種帶有卷積結(jié)構(gòu)的深度學(xué)習(xí)網(wǎng)絡(luò),主要用于計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理領(lǐng)域。一般常見(jiàn)的卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、卷積層、池化層和全連接層組成,通過(guò)這些層的疊加,就可以構(gòu)成一個(gè)卷積神經(jīng)網(wǎng)絡(luò)。通常為了能夠提取深層次的特征,會(huì)采用將卷積層與池化層結(jié)合的方式,組成多個(gè)卷積-池化組,逐層提取特征信息,最終通過(guò)若干個(gè)全連接層完成分類。卷積神經(jīng)網(wǎng)絡(luò)最大的2個(gè)特征是局部連接和權(quán)值共享。局部連接的方式可以有效地減少參數(shù)的數(shù)量,提升網(wǎng)絡(luò)訓(xùn)練的效率,并且在一定程度上可以減小過(guò)擬合的風(fēng)險(xiǎn);權(quán)值共享的方法可以進(jìn)一步地減少參數(shù)的數(shù)量,通過(guò)相同的卷積核對(duì)圖像上的不同區(qū)域做卷積,以檢測(cè)相同特征。為了降低過(guò)擬合的影響,本文采用了2種方法來(lái)降低過(guò)擬合的影響:① 使用Dropout方法。讓每個(gè)神經(jīng)元以一定的概率被舍棄,以減少隱藏節(jié)點(diǎn)的相互作用,增強(qiáng)模型的泛化能力;② 采用交叉驗(yàn)證的方法。通過(guò)設(shè)置驗(yàn)證集,用來(lái)驗(yàn)證訓(xùn)練集得到的模型的性能和指標(biāo)。
本文設(shè)置輸入神經(jīng)網(wǎng)絡(luò)輸入圖像的大小為32×32,設(shè)置3組卷積層與池化層,卷積核的大小為3×3,卷積方式為same,步長(zhǎng)為1;池化方式采用2×2最大池化;所有中間層采用的激活函數(shù)為ReLU函數(shù),全連接層后采用的激活函數(shù)為softmax函數(shù)。具體網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。
圖5是本文提出的信號(hào)分類方法的流程框圖。整個(gè)流程分為特征提取模塊和網(wǎng)絡(luò)集成模塊,其中特征提取模塊主要完成對(duì)原始雷達(dá)信號(hào)的特征提取與數(shù)據(jù)的預(yù)處理,并形成能夠輸入到分類網(wǎng)絡(luò)模塊的數(shù)據(jù)集;分類網(wǎng)絡(luò)模塊由n個(gè)結(jié)構(gòu)相同的卷積神經(jīng)網(wǎng)絡(luò)通過(guò)Bagging集成方法組合而成,主要完成對(duì)輸入特征的學(xué)習(xí)和分類。具體實(shí)現(xiàn)步驟如下:
步驟1 將原始雷達(dá)信號(hào)求模糊函數(shù),并將模糊函數(shù)圖像轉(zhuǎn)換為二維圖像特征。
步驟2 將步驟1得到的二維圖像進(jìn)行圖像閾值處理和形態(tài)學(xué)處理。
步驟3 將預(yù)處理后得到的圖像作為數(shù)據(jù)集,采用重采樣的方法對(duì)數(shù)據(jù)集進(jìn)行采樣,得到n個(gè)新的子數(shù)據(jù)集,將這n個(gè)子數(shù)據(jù)集作為輸入對(duì)n個(gè)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到n個(gè)不同的基學(xué)習(xí)器。通過(guò)集成決策,將n個(gè)基學(xué)習(xí)器的學(xué)習(xí)結(jié)果進(jìn)行投票決策,得到最終的分類結(jié)果。
圖4 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)框圖
圖5 整體流程框圖
利用MATLAB產(chǎn)生仿真信號(hào),每種信號(hào)各產(chǎn)生800個(gè)樣本,用于對(duì)分類網(wǎng)絡(luò)的訓(xùn)練,訓(xùn)練樣本的信噪比在-2~10 dB 之間等概率取值;測(cè)試樣本在信噪比為-2~10 dB的范圍內(nèi)間隔2 dB取值,每類信號(hào)在每個(gè)信噪比下產(chǎn)生100個(gè)樣本。除Costas信號(hào)外,其他信號(hào)載頻均為10 MHz,采樣頻率均為70 MHz。噪聲類型為高斯白噪聲,具體參數(shù)設(shè)置如表1所示。
表1 信號(hào)主要參數(shù)范圍
一般來(lái)說(shuō),模型過(guò)于復(fù)雜或者輸入?yún)?shù)過(guò)多會(huì)導(dǎo)致模型出現(xiàn)過(guò)擬合的現(xiàn)象,圖6是本文提出的集成卷積網(wǎng)絡(luò)訓(xùn)練集與驗(yàn)證集損失與準(zhǔn)確度曲線。從圖6中可以看出,本文提出的集成卷積神經(jīng)網(wǎng)絡(luò)沒(méi)有出現(xiàn)過(guò)擬合的現(xiàn)象,在訓(xùn)練過(guò)程中集成卷積網(wǎng)絡(luò)在50個(gè)迭代周期后開(kāi)始收斂,訓(xùn)練集和驗(yàn)證集準(zhǔn)確率均達(dá)到了98%以上,在收斂后驗(yàn)證集損失和準(zhǔn)確率曲線較為平滑,波動(dòng)幅度比較小。網(wǎng)絡(luò)訓(xùn)練效果比較好,網(wǎng)絡(luò)識(shí)別精度高。
圖6 集成卷積網(wǎng)絡(luò)訓(xùn)練集及驗(yàn)證集損失和準(zhǔn)確度曲線
為了檢驗(yàn)網(wǎng)絡(luò)對(duì)5類信號(hào)的分類能力,利用實(shí)驗(yàn)1的神經(jīng)網(wǎng)絡(luò),同時(shí)設(shè)置一個(gè)單獨(dú)的卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)輸入相同,在信噪比為-2~10 dB之間,每隔2 dB測(cè)試2種分類網(wǎng)絡(luò)對(duì)5類雷達(dá)信號(hào)的分類的正確率。圖7是2類網(wǎng)絡(luò)的分類情況。從圖7中可以看出,相較于單個(gè)卷積神經(jīng)網(wǎng)絡(luò),集成卷積神經(jīng)網(wǎng)絡(luò)有更高的分類正確率,尤其是對(duì)容易混淆的Frank和P4碼信號(hào)來(lái)說(shuō),信號(hào)的準(zhǔn)確率提高了10%左右,有效減少了易混淆信號(hào)識(shí)別精度不高的問(wèn)題。這是由于集成網(wǎng)絡(luò)可以將不同網(wǎng)絡(luò)的結(jié)果進(jìn)行結(jié)合,可以進(jìn)行優(yōu)勢(shì)互補(bǔ),從而得到較好的識(shí)別結(jié)果。
圖7 單個(gè)網(wǎng)絡(luò)與集成網(wǎng)絡(luò)的識(shí)別正確率曲線
基學(xué)習(xí)器的數(shù)量對(duì)于分類器的性能也有很大的影響,為了研究基學(xué)習(xí)器數(shù)量對(duì)分類效果的影響,本文設(shè)置基學(xué)習(xí)器個(gè)數(shù)分別為2個(gè)、3個(gè)、4個(gè)和5個(gè),同時(shí)設(shè)置一個(gè)CNN作為對(duì)照(記為1個(gè)基學(xué)習(xí)器),分別比較他們的準(zhǔn)確度和所用時(shí)間,結(jié)果如表2所示。
表2 基學(xué)習(xí)器數(shù)量性能的準(zhǔn)確度和所用時(shí)間
從表2可以看出,相比于單個(gè)基學(xué)習(xí)器來(lái)說(shuō),增加基學(xué)習(xí)器的數(shù)量在不同程度上提升了模型識(shí)別的準(zhǔn)確度,其中在4個(gè)基學(xué)習(xí)器的時(shí)候準(zhǔn)確度最高,這說(shuō)明通過(guò)增加基學(xué)習(xí)器的數(shù)量可以有效地提高網(wǎng)絡(luò)的性能。但是,當(dāng)基學(xué)習(xí)器數(shù)量達(dá)到5個(gè)的時(shí)候,模型整體的識(shí)別準(zhǔn)確率相對(duì)于上一個(gè)有所下降,這說(shuō)明并不是基學(xué)習(xí)器數(shù)量越多越好,過(guò)多的基學(xué)習(xí)器不僅增加了學(xué)習(xí)訓(xùn)練的時(shí)間成本,同時(shí)也增加了模型的方差,使得網(wǎng)絡(luò)抑制過(guò)擬合的能力下降,最終導(dǎo)致了模型精度的下降。實(shí)驗(yàn)結(jié)果表明,基學(xué)習(xí)器數(shù)量在3~4個(gè)的效果相對(duì)較好。
本文提出了基于Bagging和CNN的雷達(dá)信號(hào)分類方法,使用了信號(hào)的模糊函數(shù)特征作為網(wǎng)絡(luò)的輸入特征,利用卷積神經(jīng)網(wǎng)絡(luò)作為基學(xué)習(xí)器進(jìn)行訓(xùn)練,然后將網(wǎng)絡(luò)的輸出特征進(jìn)行集合得到最終分類結(jié)果。仿真實(shí)驗(yàn)結(jié)果表明,相比于單個(gè)網(wǎng)絡(luò)訓(xùn)練的方法,集成卷積神經(jīng)網(wǎng)絡(luò)能夠更好地區(qū)分不同種類調(diào)制信號(hào)。對(duì)信號(hào)分類識(shí)別的實(shí)驗(yàn)中,在-2 dB的信噪比下,也能達(dá)到85%以上的識(shí)別率,具有較好的分類識(shí)別能力。