利 強(qiáng),張 偉,金秋園,姚 欣
(1. 電子科技大學(xué)信息與通信工程學(xué)院,四川成都 611731;2. 鵬城實(shí)驗(yàn)室,廣東深圳 518055;3. 電子信息控制重點(diǎn)實(shí)驗(yàn)室,四川成都 610036)
隨著電磁領(lǐng)域技術(shù)的發(fā)展,電子對(duì)抗技術(shù)已逐步成為現(xiàn)代戰(zhàn)爭(zhēng)的核心技術(shù)之一,其中多功能雷達(dá)(Mul?tifunction Radar,MFR)工作模式的識(shí)別是電子對(duì)抗技術(shù)中的重要組成部分. 通過對(duì)接收機(jī)截獲到的雷達(dá)信號(hào)進(jìn)行處理,挖掘信號(hào)規(guī)律、識(shí)別雷達(dá)工作模式是后續(xù)進(jìn)行雷達(dá)行為意圖推理、威脅評(píng)估、決策干擾的基礎(chǔ).能否對(duì)MFR 工作模式進(jìn)行準(zhǔn)確識(shí)別是雷達(dá)對(duì)抗成功與否的關(guān)鍵[1]. 針對(duì)該問題,主流識(shí)別方法可以分為有監(jiān)督識(shí)別[2~7]和無監(jiān)督識(shí)別[8~11]兩類. 基于監(jiān)督學(xué)習(xí),文獻(xiàn)[2]通過構(gòu)造脈內(nèi)、脈間特征矩陣,再利用證據(jù)理論并結(jié)合雷達(dá)信號(hào)特征庫實(shí)現(xiàn)雷達(dá)工作模式的識(shí)別;文獻(xiàn)[3]使用基于特征提取的模式識(shí)別算法,通過提取雷達(dá)脈沖組的特征,使用神經(jīng)網(wǎng)絡(luò)對(duì)信號(hào)特征進(jìn)行識(shí)別,并對(duì)不同時(shí)刻的識(shí)別結(jié)果進(jìn)行融合決策;文獻(xiàn)[4]將不同的工作模式建模為有限狀態(tài)機(jī)的隱藏序列,以信號(hào)參數(shù)和目標(biāo)信息作為觀測(cè)序列構(gòu)建隱馬爾可夫模型(Hidden Markov Model,HMM),利用HMM 求解算法進(jìn)行訓(xùn)練,實(shí)現(xiàn)工作模式識(shí)別;文獻(xiàn)[5,6]將雷達(dá)在不同工作模式下的信號(hào)建模為具有一定語法規(guī)則的語言,通過借鑒句法模式識(shí)別原理,提出基于多級(jí)匹配和有限狀態(tài)機(jī)的雷達(dá)工作模式推理方法;文獻(xiàn)[7]使用了基于時(shí)頻分析和擴(kuò)張殘差網(wǎng)絡(luò)的識(shí)別算法,將雷達(dá)時(shí)域波形信號(hào)轉(zhuǎn)換成二維時(shí)頻圖像,構(gòu)建擴(kuò)張殘差網(wǎng)絡(luò)以提取雷達(dá)信號(hào)的時(shí)頻特征并完成分類識(shí)別. 基于無監(jiān)督學(xué)習(xí)的雷達(dá)工作模式識(shí)別,文獻(xiàn)[8]使用基于序列比對(duì)的模式識(shí)別算法完成搜索工作模式的規(guī)律重建;文獻(xiàn)[9]使用基于包絡(luò)分析的模式識(shí)別算法,根據(jù)機(jī)載火控雷達(dá)不同工作狀態(tài)的信號(hào)特點(diǎn),提出一種具有工程意義的包絡(luò)分析法,實(shí)現(xiàn)對(duì)雷達(dá)工作模式的識(shí)別和對(duì)編隊(duì)飛機(jī)的識(shí)別;文獻(xiàn)[10]將HMM 模型替換為預(yù)測(cè)狀態(tài)表示模型,利用預(yù)測(cè)狀態(tài)表示模型的相關(guān)算法完成對(duì)模型的訓(xùn)練,實(shí)現(xiàn)對(duì)雷達(dá)工作模式的識(shí)別;文獻(xiàn)[11]使用了基于數(shù)據(jù)增強(qiáng)和加權(quán)輔助分類生成對(duì)抗網(wǎng)絡(luò)的識(shí)別算法,利用時(shí)間鏡像數(shù)據(jù)增強(qiáng)方法擴(kuò)充樣本數(shù)據(jù)集,結(jié)合加權(quán)輔助分類生成對(duì)抗網(wǎng)絡(luò)來優(yōu)化判別器,提高判別器的識(shí)別效果和識(shí)別穩(wěn)定程度. 總體而言,基于無監(jiān)督學(xué)習(xí)的雷達(dá)工作模式識(shí)別研究較有監(jiān)督學(xué)習(xí)模式少,且算法局限性較大. 但是,后者要取得較好識(shí)別性能通常需要大量帶標(biāo)注的數(shù)據(jù)樣本來訓(xùn)練識(shí)別模型. 但在實(shí)際中,由于MFR 工作模式的多樣性、隱藏性,實(shí)際能夠獲取到的不同工作模式的樣本數(shù)可能是極其有限的,現(xiàn)有基于大樣本的算法難以直接應(yīng)用于小樣本場(chǎng)景下的工作模式識(shí)別[12].
另外,由于雷達(dá)工作模式設(shè)計(jì)與其功能應(yīng)用息息相關(guān),遵循一定設(shè)計(jì)準(zhǔn)則,且同一系列雷達(dá)的前后代不同型號(hào)間在工作模式上往往存在相似性和繼承性,因此根據(jù)對(duì)雷達(dá)的長(zhǎng)期監(jiān)測(cè)和資料情報(bào)積累,對(duì)不同平臺(tái)搭載的雷達(dá)的工作模式往往具有一定程度的先驗(yàn)知識(shí). 將前期積累的相關(guān)先驗(yàn)知識(shí)與偵收的數(shù)據(jù)相結(jié)合,將有助于提升MFR 工作模式的識(shí)別準(zhǔn)確率,尤其是在數(shù)據(jù)樣本不足的場(chǎng)景. 基于以上想法,本文提出數(shù)據(jù)和知識(shí)聯(lián)合驅(qū)動(dòng)的模式識(shí)別算法. 通過將先驗(yàn)知識(shí)嵌入網(wǎng)絡(luò)模型訓(xùn)練之中,減輕模型對(duì)訓(xùn)練數(shù)據(jù)“量”的依賴,實(shí)現(xiàn)小樣本條件下雷達(dá)工作模式的準(zhǔn)確識(shí)別. 實(shí)驗(yàn)結(jié)果表明,融入了先驗(yàn)知識(shí)的原型網(wǎng)絡(luò)較不使用先驗(yàn)知識(shí)的原型網(wǎng)絡(luò)識(shí)別性能有較大提升. 本文的主要?jiǎng)?chuàng)新點(diǎn)和貢獻(xiàn)包含以下3點(diǎn).
(1)提出了一種向量化編碼映射方法,實(shí)現(xiàn)對(duì)MFR工作模式先驗(yàn)知識(shí)的映射表征. 通過對(duì)雷達(dá)脈沖描述字中各參數(shù)的變化范圍和規(guī)律進(jìn)行編碼訓(xùn)練獲得工作模式先驗(yàn)知識(shí)信息的高效表征.
(2)提出了一種融合先驗(yàn)知識(shí)和原型網(wǎng)絡(luò)的小樣本MFR 工作模式識(shí)別方法. 結(jié)合雷達(dá)工作模式先驗(yàn)知識(shí)的高維表征,改進(jìn)原型網(wǎng)絡(luò)的度量函數(shù),實(shí)現(xiàn)先驗(yàn)知識(shí)與樣本數(shù)據(jù)在高維特征空間中的融合,使得不同工作模式的特征具有更好的類內(nèi)聚合性和類間區(qū)分性.
(3)對(duì)8 款雷達(dá)55 種工作模式進(jìn)行仿真測(cè)試,結(jié)果表明融入了先驗(yàn)知識(shí)的原型網(wǎng)絡(luò)與不使用先驗(yàn)知識(shí)的原型網(wǎng)絡(luò)、SVM 分類器相比,識(shí)別準(zhǔn)確率分別提升了2.9%和10.5%,初步驗(yàn)證了方法的可行性和有效性.
早在2017 年,Snell 等人就提出原型網(wǎng)絡(luò)結(jié)構(gòu)來解決小樣本場(chǎng)景下的學(xué)習(xí)問題[13]. 其核心是通過度量學(xué)習(xí)將數(shù)據(jù)映射到高維特征空間,使得類內(nèi)樣本在高維空間中盡可能聚集,同時(shí)類間樣本盡可能遠(yuǎn)離. 在識(shí)別過程中,以待測(cè)樣本在高維特征空間中的特征向量與各原型中心之間的距離差值為依據(jù)實(shí)現(xiàn)分類. 針對(duì)多功能雷達(dá)工作模式識(shí)別,其原型網(wǎng)絡(luò)架構(gòu)如圖1所示.
圖1 基于原型網(wǎng)絡(luò)的雷達(dá)工作模式識(shí)別架構(gòu)
本文考慮將MFR 不同工作模式下的脈沖重復(fù)間隔(PRI)、載波頻率(RF)和脈沖寬度(PW)這3 個(gè)維度的數(shù)據(jù)作為輸入. 首先,對(duì)脈沖到達(dá)時(shí)間(TOA)進(jìn)行逐差轉(zhuǎn)換為脈沖重復(fù)間隔(PRI),并參考小樣本圖片分類方法[14,15],將脈沖數(shù)據(jù)的3 個(gè)維度看作圖片樣本的3 個(gè)通道,通道上的數(shù)值對(duì)應(yīng)脈沖數(shù)據(jù)各維度上的參數(shù)值. 然后,對(duì)一幀脈沖數(shù)據(jù)進(jìn)行預(yù)處理,轉(zhuǎn)化為三通道的圖片樣本,并按照通道進(jìn)行歸一化后作為原型網(wǎng)絡(luò)的輸入.在實(shí)現(xiàn)過程中,使用多層卷積神經(jīng)網(wǎng)絡(luò)提取脈沖數(shù)據(jù)特征. 在原型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,記fθ為原型網(wǎng)絡(luò)的映射函數(shù),那么圖像樣本x輸入到原型網(wǎng)絡(luò)后映射為高維空間中的特征向量z的過程則可表示為
其中,H,W表示原型網(wǎng)絡(luò)輸入圖片樣本的高度和寬度;C表示圖片樣本的通道數(shù);D表示原型網(wǎng)絡(luò)輸出特征向量的維度;θ表示原型網(wǎng)絡(luò)參數(shù). 關(guān)于實(shí)驗(yàn)中原型神經(jīng)網(wǎng)絡(luò)的具體結(jié)構(gòu)將在第3節(jié)中詳細(xì)說明.
在小樣本MFR 工作模式識(shí)別過程中,使用多層卷積層作為原型網(wǎng)絡(luò)的特征提取器,將支撐集中的雷達(dá)脈沖數(shù)據(jù)樣本映射為高維特征向量,并按類別計(jì)算高維特征向量的均值獲得原型中心向量,具體的計(jì)算過程為
其中,Xk表示類別k的支撐集;Nk表示支撐集中第k類工作模式的訓(xùn)練樣本量.
其中,T表示訓(xùn)練樣本總量. 迭代訓(xùn)練過程中使用Adam隨機(jī)梯度下降和反向傳播更新原型網(wǎng)絡(luò)參數(shù)θ,以最小化原型網(wǎng)絡(luò)的損失,即最大化網(wǎng)絡(luò)分類識(shí)別的準(zhǔn)確率.當(dāng)網(wǎng)絡(luò)收斂時(shí),同類樣本經(jīng)過原型網(wǎng)絡(luò)的映射函數(shù)fθ輸出的特征向量在高維空間中聚成一簇,不同類別對(duì)應(yīng)的簇間距離較遠(yuǎn). 完成訓(xùn)練后,輸入待分類雷達(dá)脈沖數(shù)據(jù)x?,經(jīng)過網(wǎng)絡(luò)映射為fθ(x?),按照式(3)計(jì)算分類概率,選擇最大概率對(duì)應(yīng)的類別作為分類結(jié)果.
本節(jié)給出一種在原型網(wǎng)絡(luò)中融合先驗(yàn)知識(shí)的MFR模式識(shí)別方法,其主要原理如圖2所示.
圖2 知識(shí)原型網(wǎng)絡(luò)原理
第一階段,采用前一節(jié)所述方法,預(yù)訓(xùn)練原型網(wǎng)絡(luò),記錄網(wǎng)絡(luò)輸出的不同工作模式所對(duì)應(yīng)的原型中心向量. 第二階段,按照3.1 節(jié)定義編碼方法對(duì)先驗(yàn)知識(shí)進(jìn)行編碼,并連同第一階段獲得的原型網(wǎng)絡(luò)中心向量作為標(biāo)簽,一同送入中心網(wǎng)絡(luò)進(jìn)行訓(xùn)練,當(dāng)中心網(wǎng)絡(luò)收斂時(shí)將輸出的向量定義為預(yù)中心向量. 第三階段,以罰函數(shù)形式將第二階段得到的預(yù)中心向量與網(wǎng)絡(luò)Loss 函數(shù)相結(jié)合,重新訓(xùn)練原型網(wǎng)絡(luò),完成先驗(yàn)知識(shí)與數(shù)據(jù)的深層融合.
測(cè)試階段,將待分類PDW 數(shù)據(jù)送入已訓(xùn)練的知識(shí)原型網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)小樣本雷達(dá)工作模式的識(shí)別. 本文所提出的知識(shí)原型網(wǎng)絡(luò)模型框架如圖3所示,下面從先驗(yàn)知識(shí)編碼、先驗(yàn)知識(shí)映射和先驗(yàn)知識(shí)融合這3個(gè)方面對(duì)知識(shí)原型網(wǎng)絡(luò)的原理進(jìn)行詳細(xì)闡述.
圖3 知識(shí)原型網(wǎng)絡(luò)框架
對(duì)于已知雷達(dá),根據(jù)對(duì)抗經(jīng)驗(yàn)以及掌握的情報(bào)知識(shí),能夠(大致)獲知不同工作模式下PDW 的各維度特征的變化規(guī)律,因此可以將PDW 各參數(shù)變化范圍和規(guī)律這一知識(shí)信息融入原型網(wǎng)絡(luò)訓(xùn)練,以提升網(wǎng)絡(luò)識(shí)別性能. 由于本文主要考慮PRI,RF 和PW 這3 個(gè)特征維度,其相應(yīng)的知識(shí)定義為:在不同工作模式下,以上3個(gè)維度參數(shù)的變化范圍及規(guī)律描述.
確定好訓(xùn)練過程中的先驗(yàn)知識(shí)后,需要將其進(jìn)一步轉(zhuǎn)化為便于計(jì)算和使用的形式. 本文提出一種知識(shí)編碼方式,可以將工作模式的PRI,RF 和PW 這3 個(gè)維度上的參數(shù)變化范圍及規(guī)律表征為一定長(zhǎng)度的數(shù)值(知識(shí))向量,具體實(shí)現(xiàn)如下:整個(gè)向量包含a,b,c這3 個(gè)子段,每個(gè)子段刻畫先驗(yàn)知識(shí)中的一個(gè)特征維度,分別對(duì)應(yīng)PRI,RF 和PW 的變化規(guī)律,向量總維度為(a+b+c),如圖4所示.
圖4 知識(shí)編碼向量
知識(shí)向量的a,b,c取值由先驗(yàn)知識(shí)中各維度參數(shù)變化范圍及規(guī)律確定. 具體而言,子段一的編碼長(zhǎng)度為能夠完整表征每種工作模式下PRI 特征參數(shù)取值和規(guī)律變化所需的最小長(zhǎng)度. 例如:先驗(yàn)知識(shí)記錄了3 類雷達(dá)工作模式的特征信息,如表1 所示. 對(duì)于雷達(dá)工作模式3,其PRI 特征值有3 個(gè)典型值,分別是5 331,4 157和3 528,且取值按照2,3,4 的組變形式進(jìn)行變化,那么其PRI 特征一次完整的變化可表示為[5 331,5 331,4 157,4 157,4 157,3 528,3 528,3 528,3 528],取值序列長(zhǎng)度為9,則a取值為9. 同樣地,對(duì)于雷達(dá)工作模式1,PRI 特征一次完整的變化可表示為[8 431,3 953,3 953,3 953],取值序列長(zhǎng)度為4,則a取值為4. 對(duì)于雷達(dá)工作模式2,其PRI為固定,完整描述一次PRI特征規(guī)律只需要一個(gè)參數(shù),a取值為1. 在確定各模式下a的大小后,選最大的a值為最終PRI 維度的編碼長(zhǎng)度. 在上例中,a取值為9,而對(duì)于模式1 和2,由于其PRI 編碼長(zhǎng)度小于9,可以通過循環(huán)擴(kuò)展為長(zhǎng)度9. 在上述例子中,對(duì)雷達(dá)工作模式1 的知識(shí)信息進(jìn)行編碼得到向量的前9 維是[8 431,3 953,3 953,3 953,8 431,3 953,3 953,3 953,8 431];同樣地,對(duì)雷達(dá)工作模式2的知識(shí)信息進(jìn)行編碼得到向量的前9維是[3 061,3 061,3 061,3 061,3 061,3 061,3 061,3 061,3 061]. 類似地,知識(shí)向量的b和c值的確定取值為先驗(yàn)知識(shí)中各個(gè)工作模式RF 和PW 特征取值及變化規(guī)律能夠完整表征一次的最小長(zhǎng)度. 對(duì)于表1中記錄的3類雷達(dá)工作模式,a,b,c分別取值為9,9,3. 對(duì)于表1 記錄的工作模式3,編碼知識(shí)信息得到向量的前9 維是[5 331,5 331,4 157,4 157,4 157,3 528,3 528,3 528,3 528],中間的9維是[295,295,385,385,385,845,845,845,845],最后的3 維是[70,85,110]. 根據(jù)上述編碼方法,可以獲取各類雷達(dá)工作模式先驗(yàn)知識(shí)信息對(duì)應(yīng)的知識(shí)向量,為后續(xù)處理提供基礎(chǔ).
表1 雷達(dá)工作模式先驗(yàn)知識(shí)表
通過建立知識(shí)向量到原型中心向量的映射關(guān)系,實(shí)現(xiàn)知識(shí)向量空間到原型網(wǎng)絡(luò)特征空間的映射. 具體而言,通過1個(gè)多層全連接網(wǎng)絡(luò)將知識(shí)向量映射為與第一階段預(yù)訓(xùn)練原型網(wǎng)絡(luò)的中心向量分布近似的向量,網(wǎng)絡(luò)輸出為融合了先驗(yàn)知識(shí)信息的原型中心向量,記為“預(yù)中心向量”. 該預(yù)中心向量將應(yīng)用于第三階段原型網(wǎng)絡(luò)的重訓(xùn)練. 在本文中,上述多層全連接網(wǎng)絡(luò)被稱為“中心網(wǎng)絡(luò)”,中心網(wǎng)絡(luò)的處理流程如圖5 所示. 首先,將2.1 節(jié)得到知識(shí)編碼向量進(jìn)行歸一化,然后進(jìn)行高斯隨機(jī)化樣本擴(kuò)充,即,對(duì)每個(gè)知識(shí)向量重復(fù)多次加入均值為0、方差為σ2的獨(dú)立同分布高斯噪聲,得到中心網(wǎng)絡(luò)的訓(xùn)練樣本. 需要指出的是,高斯隨機(jī)化過程在擴(kuò)充訓(xùn)練樣本空間、防止中心網(wǎng)絡(luò)過擬合的同時(shí),可以提高中心網(wǎng)絡(luò)對(duì)知識(shí)編碼向量擾動(dòng)的魯棒性. 中心網(wǎng)絡(luò)以高斯隨機(jī)化知識(shí)向量樣本為輸入,以預(yù)訓(xùn)練原型網(wǎng)絡(luò)中心為標(biāo)簽,以MSE 為損失函數(shù)進(jìn)行回歸. 網(wǎng)絡(luò)輸出為“預(yù)中心向量”,該向量將應(yīng)用于原型網(wǎng)絡(luò)的重訓(xùn)練. 中心網(wǎng)絡(luò)的具體結(jié)構(gòu)詳見4.2節(jié).
圖5 中心網(wǎng)絡(luò)處理流程
基于校正后的距離度量函數(shù)和分類概率式(6),構(gòu)建損失函數(shù)(4),使先驗(yàn)知識(shí)信息內(nèi)嵌到原型網(wǎng)絡(luò)提取的樣本特征中,從而具有更好的類內(nèi)聚合性及類間區(qū)分性. 完成原型網(wǎng)絡(luò)的重訓(xùn)練后,依據(jù)式(5)和式(6)計(jì)算待測(cè)樣本分類概率,得到模式分類結(jié)果.
本文使用的雷達(dá)脈沖數(shù)據(jù)包含8 款MFR,涵蓋搜索、跟蹤、邊搜索邊跟蹤等55 種工作模式. 每個(gè)雷達(dá)脈沖包含TOA,RF 和PW 這3 維參數(shù),脈沖按照TOA 大小順次排列,將連續(xù)的84 個(gè)PDW 處理轉(zhuǎn)化為84×84×3 的圖片數(shù)據(jù),對(duì)應(yīng)一種工作模式下的一個(gè)樣本. 為擬合小樣本場(chǎng)景,每個(gè)雷達(dá)工作模式包含20個(gè)圖片樣本(由于在小樣本雷達(dá)模式識(shí)別領(lǐng)域,對(duì)“小樣本”的樣本量的劃定暫時(shí)還沒有一個(gè)公認(rèn)的數(shù)量級(jí)范圍,本文將樣本量≤20、單個(gè)樣本脈沖數(shù)≤100 視為小樣本場(chǎng)景),其中支撐集和查詢集各占一半.
在實(shí)驗(yàn)中,本文采用的原型網(wǎng)絡(luò)中卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖6 所示,整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)為5 層,卷積層的卷積核大小固定為3×3,池化層的池化模板固定為2×2,池化時(shí)的步長(zhǎng)設(shè)定為2,3 層卷積層將通道數(shù)從3 經(jīng)由32和64 增至128. 最后一層池化層后連接兩層全連接層,輸出維度分別設(shè)定為128和55.
圖6 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
中心網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)如圖7 所示,整個(gè)網(wǎng)絡(luò)包含4層全連接層,第1~3層激活函數(shù)為ReLU,第4層為tanh.實(shí)驗(yàn)中經(jīng)過編碼后得到47維知識(shí)向量,經(jīng)4層全連接層從47 維經(jīng)由128,256,128 再降為55 維. 在中心網(wǎng)絡(luò)的訓(xùn)練過程中,每個(gè)batch大小設(shè)置為128,迭代2 000輪.
圖7 中心網(wǎng)絡(luò)結(jié)構(gòu)
首先,考察中心網(wǎng)絡(luò)的映射性能. 圖8 給出了在完成中心網(wǎng)絡(luò)的回歸訓(xùn)練后,用高斯隨機(jī)化樣本測(cè)試中心網(wǎng)絡(luò)映射的準(zhǔn)確率. 該準(zhǔn)確率由測(cè)試樣本經(jīng)中心網(wǎng)絡(luò)映射后,按與預(yù)中心向量的歐氏最小距離作為分類依據(jù)統(tǒng)計(jì)得到. 圖8 中藍(lán)色曲線和橙色曲線分別表示訓(xùn)練和驗(yàn)證過程中的準(zhǔn)確率. 由圖8 可以看出,中心網(wǎng)絡(luò)映射準(zhǔn)確率約為78%.
圖8 中心網(wǎng)絡(luò)映射準(zhǔn)確率曲線
接下來考察先驗(yàn)知識(shí)的使用對(duì)原型網(wǎng)絡(luò)識(shí)別準(zhǔn)確率的影響. 知識(shí)原型網(wǎng)絡(luò)每個(gè)batch 大小設(shè)置為16,迭代3 000輪. 知識(shí)原型網(wǎng)絡(luò)與經(jīng)典原型網(wǎng)絡(luò)在訓(xùn)練過程中識(shí)別準(zhǔn)確率的對(duì)比結(jié)果如圖9所示.
圖9 知識(shí)原型網(wǎng)絡(luò)與經(jīng)典原型網(wǎng)絡(luò)訓(xùn)練準(zhǔn)確率對(duì)比曲線
從圖9 可以看出,在訓(xùn)練輪次較少的情況下,融入先驗(yàn)知識(shí)有助于快速提升原型網(wǎng)絡(luò)識(shí)別準(zhǔn)確率,并最終達(dá)到96.7%. 值得注意的是,圖9 中的訓(xùn)練曲線隨著訓(xùn)練輪次的增加呈現(xiàn)較大的起伏,這一現(xiàn)象產(chǎn)生的原因可能是樣本本身數(shù)據(jù)量小,在使用隨機(jī)梯度下降法進(jìn)行網(wǎng)絡(luò)訓(xùn)練時(shí),單次輸入網(wǎng)絡(luò)的隨機(jī)樣本量較小,致使反向傳播算法在對(duì)網(wǎng)絡(luò)參數(shù)更新過程中出現(xiàn)較大起伏.
考慮到實(shí)際中先驗(yàn)知識(shí)可能存在誤差,導(dǎo)致先驗(yàn)知識(shí)信息中各個(gè)參數(shù)值不準(zhǔn)確,為此,分別在知識(shí)編碼向量上加入不同程度的高斯噪聲來模擬不同程度的先驗(yàn)知識(shí)誤差. 表2 給出了在不同先驗(yàn)知識(shí)誤差下,知識(shí)原型網(wǎng)絡(luò)與支持向量機(jī)、經(jīng)典原型網(wǎng)絡(luò)的對(duì)比結(jié)果. 其中,知識(shí)誤差較小和較大場(chǎng)景對(duì)應(yīng)的高斯噪聲分別為Gauss(5,0.12)和Gauss(50,0.12). 從表2 可以看出,當(dāng)先驗(yàn)知識(shí)誤差較小時(shí),知識(shí)偏差對(duì)網(wǎng)絡(luò)性能影響較小,融合先驗(yàn)知識(shí)的原型網(wǎng)絡(luò)在訓(xùn)練和測(cè)試過程中的識(shí)別準(zhǔn)確率分別為95%和94.7%;當(dāng)先驗(yàn)知識(shí)誤差較大時(shí),知識(shí)偏差對(duì)網(wǎng)絡(luò)性能影響較大,融合先驗(yàn)知識(shí)的原型網(wǎng)絡(luò)在訓(xùn)練和測(cè)試過程中的識(shí)別準(zhǔn)確率分別為93.4%和91.6%,均低于不使用任何先驗(yàn)知識(shí)的原型網(wǎng)絡(luò)的準(zhǔn)確率. 該結(jié)果表明,較大誤差的先驗(yàn)知識(shí)已不能很好地反映不同工作模式下參數(shù)變化的真實(shí)情況,將帶有較大偏差的知識(shí)向量融入原型網(wǎng)絡(luò)不但無法提升識(shí)別性能,甚至適得其反.
表2 不同識(shí)別方案識(shí)別準(zhǔn)確率對(duì)比統(tǒng)計(jì)
最后,考慮到實(shí)際中先驗(yàn)知識(shí)可能存在部分缺失的情況,針對(duì)該情況,知識(shí)向量缺失部分,可以采用填充全0 或者隨機(jī)數(shù)的方式來補(bǔ)全. 補(bǔ)全后的知識(shí)向量仍然可以采用3.2 節(jié)及3.3 節(jié)的方式融入原型網(wǎng)絡(luò)中,實(shí)現(xiàn)對(duì)小樣本雷達(dá)工作模式的識(shí)別. 表3 給出了不同補(bǔ)全方式下的識(shí)別準(zhǔn)確率統(tǒng)計(jì)結(jié)果. 仿真結(jié)果表明,以隨機(jī)的方式補(bǔ)全知識(shí)向量比全0補(bǔ)充方式稍好,其原因可能是,全0填充缺失的先驗(yàn)知識(shí)等價(jià)于將缺失的先驗(yàn)信息視為相同,從而導(dǎo)致不同模式的先驗(yàn)知識(shí)區(qū)分度變小.
表3 基于部分先驗(yàn)知識(shí)的識(shí)別準(zhǔn)確率統(tǒng)計(jì)
本文針對(duì)小樣本MFR 工作模式識(shí)別問題,提出了一種融合先驗(yàn)知識(shí)的原型網(wǎng)絡(luò). 通過對(duì)雷達(dá)工作模式先驗(yàn)知識(shí)編碼、映射,將先驗(yàn)知識(shí)融入原型網(wǎng)絡(luò)有效提升了識(shí)別準(zhǔn)確率. 在涵蓋8款MFR、55種工作模式的小樣本雷達(dá)數(shù)據(jù)上的仿真結(jié)果表明,相比于不使用先驗(yàn)知識(shí)的原型網(wǎng)絡(luò)和SVM 分類器,本文網(wǎng)絡(luò)識(shí)別準(zhǔn)確率分別提升了2.9%和10.5%. 值得注意的是,在先驗(yàn)知識(shí)有較大誤差的情況下,融合知識(shí)的網(wǎng)絡(luò)識(shí)別性能會(huì)有較大下降,如何設(shè)計(jì)具有對(duì)知識(shí)誤差魯棒性的融合網(wǎng)絡(luò)是下一步值得研究的方向.