高玉龍 王國(guó)強(qiáng) 王 鋼
(哈爾濱工業(yè)大學(xué)電子與信息工程學(xué)院 哈爾濱 150001)
電子信息戰(zhàn)中敵我雙方間干擾和抗干擾的博弈過(guò)程無(wú)處不在,并且各種新型的惡意干擾樣式層出不窮。對(duì)于敵方干擾樣式的識(shí)別作為抗干擾過(guò)程當(dāng)中不可或缺的一環(huán),其重要性毋庸置疑。尤其在如今復(fù)雜的電磁頻譜環(huán)境下,不僅希望干擾識(shí)別方法能夠?qū)τ谝阎透蓴_精確識(shí)別,同時(shí)能夠?qū)τ谖粗透蓴_進(jìn)行判決來(lái)提高通信系統(tǒng)的安全性。
目前干擾模式識(shí)別方法根據(jù)特征參數(shù)提取方式的不同,整體上可以分為基于專家知識(shí)和基于神經(jīng)網(wǎng)絡(luò)的特征提取兩大類。其中基于專家知識(shí)手動(dòng)特征提取的干擾模式識(shí)別方法,對(duì)于任意干擾識(shí)別任務(wù)都需要進(jìn)行特定的多維度特征參數(shù)和分類器的設(shè)計(jì)。要求所設(shè)計(jì)的特征參數(shù)具有盡量小的計(jì)算復(fù)雜度,其中常用于干擾識(shí)別任務(wù)的特征參數(shù)有單頻能量聚集度、平均頻譜平坦系數(shù)、分?jǐn)?shù)階傅里葉域能量聚集度、信息熵[1]和高階累積量等。對(duì)于多分類器的優(yōu)化也極其重要,文獻(xiàn)[2]采用改進(jìn)的遺傳算法優(yōu)化支持向量機(jī)( Support Vector Machines, SVM)分類器存在的過(guò)早收斂和種群多樣性不足的問(wèn)題。
其中基于神經(jīng)網(wǎng)絡(luò)自動(dòng)提取特征的干擾模式識(shí)別方法,為提高其神經(jīng)網(wǎng)絡(luò)對(duì)于干擾信號(hào)的識(shí)別能力,主要改進(jìn)方向在于干擾信號(hào)預(yù)處理方式、神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)以及網(wǎng)絡(luò)損失函數(shù)3個(gè)方面。文獻(xiàn)[3]首次將圖形深度學(xué)習(xí)與無(wú)線電信號(hào)識(shí)別技術(shù)相結(jié)合,將信號(hào)類型識(shí)別問(wèn)題轉(zhuǎn)換為神經(jīng)網(wǎng)絡(luò)對(duì)于信號(hào)瀑布圖的識(shí)別問(wèn)題。文獻(xiàn)[4]在獲取到干擾信號(hào)的時(shí)頻圖像后,使用特定的圖像處理方法來(lái)對(duì)時(shí)頻圖像進(jìn)行處理,使得其中的信號(hào)分量得以增強(qiáng),噪點(diǎn)信號(hào)得以抑制。文獻(xiàn)[5]將注意力機(jī)制引入到卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)中,提高了CNN網(wǎng)絡(luò)識(shí)別已知型干擾時(shí)對(duì)于信號(hào)全局性特征的關(guān)注程度,并由此進(jìn)一步提高了網(wǎng)絡(luò)的識(shí)別能力。
然而目前大多數(shù)的干擾模式識(shí)別方法雖然在已知型干擾識(shí)別任務(wù)上大都取得了不錯(cuò)的分類識(shí)別效果,但是并沒(méi)有考慮未知型干擾的存在,僅有少數(shù)研究員針對(duì)這一更貼近于真實(shí)的場(chǎng)景展開(kāi)研究并將其轉(zhuǎn)換為干擾模式開(kāi)集識(shí)別問(wèn)題。文獻(xiàn)[6]將零樣本學(xué)習(xí)作為解決未知型干擾存在性判決的思路提出了信號(hào)識(shí)別與重構(gòu)卷積神經(jīng)網(wǎng)絡(luò) (Signal Recognition and Reconstruction Convolutional Neural Networks , SR2CNN),可以在沒(méi)有相應(yīng)訓(xùn)練樣本的情況下完成對(duì)于未知型干擾的判決。文獻(xiàn)[7]提出了基于孿生神經(jīng)網(wǎng)絡(luò)的開(kāi)放世界識(shí)別方法,通過(guò)迫使已知型干擾的潛在分布趨近于自身特有的高斯分布,為后續(xù)的未知型干擾的判決提供條件。文獻(xiàn)[8]提出了一種新型的空洞卷積原型學(xué)習(xí)方法,利用基于內(nèi)點(diǎn)的交叉熵?fù)p失和中心損失將原型更新到編碼空間的外圍,為未知型干擾樣本保留了內(nèi)部空間以進(jìn)行判決。
本文在總結(jié)上述干擾模式識(shí)別方法的基礎(chǔ)之上,同樣將未知型干擾存在時(shí)的干擾模式識(shí)別問(wèn)題轉(zhuǎn)換為開(kāi)集識(shí)別問(wèn)題,并且從現(xiàn)行主流開(kāi)集識(shí)別算法中尋求解決該問(wèn)題的可行性。近年來(lái)開(kāi)集識(shí)別問(wèn)題由于其相較于傳統(tǒng)的閉集識(shí)別問(wèn)題更為貼近現(xiàn)實(shí),作為一種全新的挑戰(zhàn)開(kāi)始受到廣泛的關(guān)注與研究。文獻(xiàn)[9]當(dāng)中將現(xiàn)行主流的開(kāi)集識(shí)別方法分為判別式開(kāi)集識(shí)別方法和生成式開(kāi)集識(shí)別方法,其中判別式開(kāi)集識(shí)別方法又可分為基于傳統(tǒng)機(jī)器學(xué)習(xí)的開(kāi)集識(shí)別方法和基于深度學(xué)習(xí)的開(kāi)集識(shí)別方法。在基于機(jī)器學(xué)習(xí)的開(kāi)集識(shí)別方法當(dāng)中主要以文獻(xiàn)[10,11]提出的單類支持向量機(jī)(One-Class SVM, OCSVM)、支持向量數(shù)據(jù)描述 (Support Vector Data Description,SVDD)以及 Weibull-校正支持向量機(jī)(Weibull-calibrated SVM, W-SVM)等各種基于SVM的單分類器開(kāi)集識(shí)別方法為代表。而基于深度學(xué)習(xí)的開(kāi)集識(shí)別方法更是多種多樣,文獻(xiàn)[12]提出了一種全新的基于極值理論的openmax開(kāi)集識(shí)別方法,通過(guò)openmax輸出層取代原有的softmax層,使神經(jīng)網(wǎng)絡(luò)獲得估計(jì)輸入為未知類概率的能力。文獻(xiàn)[13]將開(kāi)集識(shí)別問(wèn)題的關(guān)鍵挑戰(zhàn)視為如何同時(shí)降低已知型數(shù)據(jù)上的經(jīng)驗(yàn)分類風(fēng)險(xiǎn)和潛在未知型數(shù)據(jù)上的開(kāi)放空間風(fēng)險(xiǎn),提出了一種名為對(duì)抗互反點(diǎn)學(xué)習(xí)的新學(xué)習(xí)框架,來(lái)最小化已知型數(shù)據(jù)分布和未知型數(shù)據(jù)分布的重疊,同時(shí)不損失已知型樣本數(shù)據(jù)的分類精度。在生成式開(kāi)集識(shí)別方法中,其基本思想是通過(guò)變分自編碼器(Variational Auto-Encoder, VAE)或者生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Network, GAN)等生成方法直接產(chǎn)生未知型樣本,從而將未知型干擾的判決問(wèn)題轉(zhuǎn)換為一個(gè)二分類問(wèn)題。依據(jù)這種思路,文獻(xiàn)[14]為改進(jìn)傳統(tǒng)GAN訓(xùn)練不穩(wěn)定的問(wèn)題提出OpenGAN方法,利用生成器生成的“假”數(shù)據(jù)來(lái)擴(kuò)充訓(xùn)練樣本集,以訓(xùn)練OpenGAN判別器具有判決未知型樣本數(shù)據(jù)的能力。
考慮到現(xiàn)行開(kāi)集識(shí)別方法以及干擾信號(hào)識(shí)別問(wèn)題的特殊性,本文在前人研究的基礎(chǔ)上提出了一種基于超球面3元組編碼的干擾模式開(kāi)集識(shí)別方法,本方法包含基于3元組損失的干擾信號(hào)時(shí)頻圖像超球面編碼和基于編碼結(jié)果的分類器設(shè)計(jì)兩個(gè)部分,其中超球面編碼是指基于3元組損失有監(jiān)督訓(xùn)練所得編碼器的編碼空間是滿足特定約束條件的超球面,這有利于提高后續(xù)的干擾模式識(shí)別任務(wù)的分類精度。而后續(xù)的分類器是基于元識(shí)別思想所設(shè)計(jì),利用訓(xùn)練集中各已知型干擾樣本擬合所得的Weibull模型,來(lái)估計(jì)輸入干擾屬于各已知型干擾類別的概率值,從而完成對(duì)于干擾模式開(kāi)集識(shí)別結(jié)果的判斷。
本文分為以下4個(gè)部分,第1部分為未知型干擾存在時(shí)干擾模式識(shí)別問(wèn)題的建模;第2部分對(duì)本文提出的基于超球面3元組編碼的干擾模式開(kāi)集識(shí)別方法進(jìn)行介紹;第3部分為仿真試驗(yàn),通過(guò)對(duì)比不同方法對(duì)于測(cè)試集干擾信號(hào)識(shí)別效果來(lái)證明算法的有效性以及其中分類器設(shè)計(jì)方法的合理性;最后一部分為結(jié)論。
干擾模式識(shí)別問(wèn)題是指在戰(zhàn)場(chǎng)復(fù)雜的電磁環(huán)境下,完成對(duì)于敵方的干擾樣式的識(shí)別。在這種真實(shí)開(kāi)放空間當(dāng)中既存在典型的干擾類型,也存在著從未見(jiàn)識(shí)過(guò)的新型惡意干擾類型。這些新型干擾樣式也就是所謂的未知型干擾,在進(jìn)行干擾模式識(shí)別時(shí)難以甚至不可能獲得其先驗(yàn)信息。在開(kāi)放空間當(dāng)中已知型干擾種類數(shù)K是確定的,由此可得已知型干擾類型集合Xknown={J1,J2,...,JK} ,其中J表示干擾類型。然而對(duì)于未知型干擾類型來(lái)說(shuō)其數(shù)目則無(wú)法確定,可將未知型干擾類型集合建模為Xunknown={JK+1,JK+2,JK+3,...}。在實(shí)際干擾模式識(shí)別任務(wù)當(dāng)中,首先需要完成對(duì)于接收干擾類型J屬于Xknown還是Xunknown的判斷,這可以抽象為一個(gè)2元分類問(wèn)題,即
如果分類輸出為“1”,則需要繼續(xù)進(jìn)行Xknown中K種已知型干擾類型的識(shí)別判決。
在己方接收機(jī)連續(xù)采樣識(shí)別干擾信號(hào)的過(guò)程當(dāng)中,同時(shí)也可能存在敵方干擾機(jī)兩種干擾切換時(shí)相互間隔的情形或是不同干擾相互混疊的狀態(tài)。對(duì)于前者兩種干擾切換時(shí)相互間隔的情況,由于其持續(xù)時(shí)間極短,識(shí)別結(jié)果難以用于抗干擾決策且不影響后續(xù)時(shí)段的干擾模式識(shí)別,該文中不予考慮。而對(duì)于后者不同干擾混疊的情形,該文主要考慮已知型干擾和未知型干擾混疊的情況,并將其判決為未知型干擾Xunknown以進(jìn)行后續(xù)針對(duì)性抗干擾處理。
所以為了更加地貼近真實(shí)的戰(zhàn)場(chǎng)場(chǎng)景,本文與文獻(xiàn)[15]一致將干擾模式識(shí)別問(wèn)題建模成為開(kāi)集識(shí)別問(wèn)題。要求該干擾模式開(kāi)集識(shí)別算法能夠保證對(duì)于Xknown中已知型干擾信號(hào)類型的準(zhǔn)確識(shí)別的同時(shí)完成接收干擾類型J是否屬于Xunknown這一二分類問(wèn)題的精確判決。
本文將未知型干擾存在時(shí)的干擾模式識(shí)別問(wèn)題建模為干擾模式開(kāi)集識(shí)別問(wèn)題。在不增加神經(jīng)網(wǎng)絡(luò)模型復(fù)雜度的前提下,以提高干擾模式開(kāi)集識(shí)別效果為目標(biāo),本文提出基于超球面3元組編碼的干擾模式開(kāi)集識(shí)別方法,本方法包含干擾數(shù)據(jù)預(yù)處理、超球面3元組編碼和元識(shí)別分類3個(gè)部分,下面進(jìn)行詳細(xì)介紹。
本文選擇采取干擾信號(hào)的時(shí)頻圖像作為神經(jīng)網(wǎng)絡(luò)的輸入,這是因?yàn)闀r(shí)頻圖像保留了區(qū)分各種干擾信號(hào)類型的關(guān)鍵信息,同時(shí)此舉能夠?qū)⒕矸e神經(jīng)網(wǎng)絡(luò)對(duì)于圖像信息極強(qiáng)的提取能力應(yīng)用到干擾信號(hào)識(shí)別問(wèn)題中來(lái)。并且通過(guò)干擾數(shù)據(jù)預(yù)處理工作去除干擾信號(hào)時(shí)頻圖像上部分冗余信息,提高神經(jīng)網(wǎng)絡(luò)的泛化能力。其中進(jìn)行基于3元組損失[16]的超球面編碼工作,其主要目的在于改善數(shù)據(jù)樣本的緊致性,在編碼空間中增大不同樣本的類間距離的同時(shí)減小同類樣本類內(nèi)距離,這對(duì)于干擾模式開(kāi)集識(shí)別問(wèn)題有很大的提升。3元組損失中引入了空白(margin)的概念,使得編碼空間中除了各已知型干擾的編碼子空間外,還存在著大量的空白空間,這為編碼在空白空間上的未知型干擾的判決提供了可能性。最后是基于元識(shí)別思想的分類器設(shè)計(jì),此部分工作在傳統(tǒng)開(kāi)集識(shí)別方法openmax中引入了超球面3元組編碼并直接利用擬合模型所得到的信心分?jǐn)?shù)進(jìn)行干擾模式開(kāi)集識(shí)別。充分地利用了極值理論對(duì)于未知型輸入判決的有效性,大大提高了算法對(duì)于未知型干擾判決這一二分類問(wèn)題的真陰率和假陰率識(shí)別效果。
采樣得到的干擾信號(hào)時(shí)域波形序列數(shù)據(jù)量巨大,包含大量的冗余信息,直接在神經(jīng)網(wǎng)絡(luò)中訓(xùn)練的代價(jià)較大,不容易得到理想效果。并且由于頻譜圖缺乏時(shí)間信息,導(dǎo)致僅從頻域上無(wú)法完成干擾信號(hào)的識(shí)別。所以本文采取干擾信號(hào)的時(shí)頻圖像作為干擾模式開(kāi)集識(shí)別算法的輸入特征,其中時(shí)頻圖像由短時(shí)傅里葉變換[17]得到,對(duì)于樣本信號(hào)r(τ)的短時(shí)傅里葉變換公式為
由于干擾模式識(shí)別與干擾信號(hào)2維短時(shí)傅里葉時(shí)頻圖像中功率譜密度的絕對(duì)值無(wú)關(guān),所以為了提高本文方法對(duì)于干擾模式開(kāi)集識(shí)別問(wèn)題的泛化能力,對(duì)由短時(shí)傅里葉變換得到的2維時(shí)頻圖像進(jìn)行功率譜密度歸一化操作,具體數(shù)學(xué)公式為
其中,P表示短時(shí)傅里葉變換得到的干擾信號(hào)2維時(shí)頻圖像數(shù)據(jù),Pmin表示時(shí)頻圖像數(shù)據(jù)最小值,Pmax表示時(shí)頻圖像數(shù)據(jù)最大值,通過(guò)歸一化操作將結(jié)果值Pnormal映射到 [0~1]上。
3元組損失(Triplet Loss)由于其強(qiáng)大的異類數(shù)據(jù)區(qū)分能力,經(jīng)常在個(gè)體級(jí)別的細(xì)粒度識(shí)別上使用,尤其適合于不同類別間相似度較高的模式識(shí)別任務(wù)。同時(shí)在本文基于3元組損失有監(jiān)督訓(xùn)練所得編碼器中,其輸出端維度為 1×M并且進(jìn)行L2歸一化操作,這使得編碼空間表現(xiàn)為一個(gè)半徑為1的M維超球面。假設(shè)訓(xùn)練集中已知型干擾類別數(shù)為K,通過(guò)3元組損失當(dāng)中超參數(shù) m arg in的合理設(shè)置,可以使得隨著訓(xùn)練批次的不斷增加以及損失函數(shù)值的不斷下降,K個(gè)已知型干擾樣本的樣本中心在M維超球面上趨于均勻分布。此時(shí)不同樣本中心間距離最大,并且近似于 m arg in值。這能夠最大提高輸出單位超球面編碼空間上特征分布的對(duì)齊性和均勻性[18],對(duì)后續(xù)的干擾模式開(kāi)集識(shí)別效果有很大提升。
同時(shí)3元組損失也存在著缺點(diǎn),主要是組合爆炸問(wèn)題[19]。假設(shè)存在N個(gè)樣本數(shù)據(jù),softmax loss遍歷所有樣本的復(fù)雜度為O(N),而3元組損失的復(fù)雜度卻為O(N3),在多數(shù)任務(wù)場(chǎng)景難以進(jìn)行遍歷以選取好的訓(xùn)練樣本,尤其當(dāng)訓(xùn)練類別數(shù)目很大時(shí)訓(xùn)練過(guò)程極其復(fù)雜。但是在干擾模式開(kāi)集識(shí)別場(chǎng)景當(dāng)中,這些問(wèn)題迎刃而解。這是由于與傳統(tǒng)的類別數(shù)達(dá)到成千上萬(wàn)種的識(shí)別問(wèn)題相比,典型壓制式干擾信號(hào)類別較少并且各種干擾類型樣本數(shù)充足,在現(xiàn)行計(jì)算資源下完全能夠無(wú)視3元組損失本身存在的問(wèn)題而發(fā)揮其優(yōu)勢(shì)。
3元組損失的定義表達(dá)式為
其中,a表示基準(zhǔn)樣本,p表 示與a同一類別的正例樣本(positive),n表示與a不同類別的反例樣本(negative),d則代表兩個(gè)樣本之間的編碼距離。3元組損失的計(jì)算每次選擇一個(gè)形如 (a,n,p)的3元組,3元組 (a,n,p) 根據(jù)其中d(a,p)-d(a,n)=D數(shù)值的分類公式為
其 中 easy_triplets , semi-hard_triplets 和hard_triplets分布表示簡(jiǎn)單、一般和復(fù)雜3元組,如果輸入的 (a,n,p) 屬于 easy_triplets ,則此時(shí)L=0,當(dāng)然這是所希望的優(yōu)化目標(biāo)但是也意味著該3元組對(duì)網(wǎng)絡(luò)參數(shù)的優(yōu)化不再發(fā)揮作用。所以在網(wǎng)絡(luò)訓(xùn)練階段時(shí)需要挑選出所有的 h ard_triplets 和semi-hard_triplets并使用其進(jìn)行網(wǎng)絡(luò)的訓(xùn)練。通過(guò)最小化損失L達(dá)到如圖1所示的效果,具有相同標(biāo)簽的樣本的編碼在編碼空間中盡可能相近,而具有不同標(biāo)簽的semi-hard_triplets樣本則編碼距離盡可能變遠(yuǎn)。
圖1 3元組損失原理圖
元識(shí)別的核心思想是以某個(gè)分布模型來(lái)判斷分類模型失效的概率[20],在本文中使用極值理論中3大極值分布之一的Weibull分布來(lái)判斷分類模型失敗的概率。尤其在經(jīng)典開(kāi)集識(shí)別算法openmax中使用到了這一理論[12],openmax將傳統(tǒng)的softmax與元識(shí)別思想相結(jié)合,以各已知類樣本在神經(jīng)網(wǎng)絡(luò)中倒數(shù)第2層的輸出作為激活向量(activation vector),去擬合得到各已知類的Weibull模型來(lái)判斷閉集分類模型分類失敗的概率,數(shù)學(xué)表達(dá)式為[21]
其中,K為已知類類別數(shù),x表示輸入數(shù)據(jù),y?表示激活向量,wi為p(Ci|x,x ∈M) ,且M={C1,C2,C3,...,CK} ,第K+1類便是未知型種類。
本文在openmax基礎(chǔ)上做出了改進(jìn),首先將激活向量改為各類樣本通過(guò)基于3元組損失訓(xùn)練的神經(jīng)網(wǎng)絡(luò)后輸出的64 dim歸一化編碼,這有利于將超球面3元組的各種優(yōu)勢(shì)引入到干擾模式開(kāi)集識(shí)別問(wèn)題當(dāng)中。其次與openmax根據(jù)元識(shí)別的思想矯正softmax分類得分不同,本文直接使用Weibull模型對(duì)于輸入為其對(duì)應(yīng)類別的信心分?jǐn)?shù)wi進(jìn)行干擾模式開(kāi)集識(shí)別,其中信心分?jǐn)?shù)=1-模型估計(jì)的分類失敗概率。如果輸入樣本通過(guò)各已知型干擾的Weibull模型后都不能得到一個(gè)較高的信心分?jǐn)?shù),則可將該樣本判決為未知型干擾。反之如果輸入樣本對(duì)于其中某一已知型干擾Weibull模型的信心分?jǐn)?shù)較高超出所設(shè)置的閾值,則判斷為該已知型干擾。
最終該文基于超球面3元組編碼和元識(shí)別思想的干擾模式開(kāi)集識(shí)別算法如算法1所示。
其中Weibull模型的擬合通過(guò)libMR庫(kù)[12]進(jìn)行。算法中最主要的超參數(shù)為p%,其決定著訓(xùn)練集中樣本數(shù)據(jù)能夠通過(guò)設(shè)定閾值的比例數(shù),即閾值為最后一個(gè)通過(guò)判決的樣本的信心分?jǐn)?shù)。這種閾值設(shè)置方法能充分利用各已知型干擾信心分?jǐn)?shù)的先驗(yàn)分布,并且令p%?=1能夠減小訓(xùn)練集中離群點(diǎn)的影響,避免由于離群點(diǎn)存在導(dǎo)致閾值過(guò)低的可能發(fā)生。
由于采取時(shí)頻圖作為干擾模式開(kāi)集識(shí)別算法的輸入時(shí),干擾和信號(hào)頻段不會(huì)對(duì)算法識(shí)別性能產(chǎn)生影響,所以該文提出的算法同樣能夠適應(yīng)其他頻段的干擾模式開(kāi)集識(shí)別任務(wù)。該文仿真部分以短波電臺(tái)所在頻段10~20 MHz為例進(jìn)行,假設(shè)己方通信信號(hào)為信息速率為10 Mbit/s、中心頻率為15 MHz、信噪比為0 dB的 正交相移鍵控(Quadrature Phase Shift Keying, QPSK)信號(hào),并且由于與干擾信號(hào)的時(shí)頻混合造成無(wú)法正常通信??紤]到實(shí)際場(chǎng)景中干擾信號(hào)能量過(guò)低無(wú)法起到干擾效果,在仿真試驗(yàn)當(dāng)中設(shè)置干信比(Jammer-to-Signal Ratio, JSR)范圍為-2~10 dB,且取值步長(zhǎng)為2 dB。同時(shí)設(shè)置采樣頻率為50 MHz,采樣時(shí)間為1 ms,并且試驗(yàn)中所涉及的干擾信號(hào)類型及具體參數(shù)設(shè)置如表1所示,共單音干擾(Continuous Wave, CW)、多音干擾(Multi-Tone Jamming, MTJ)、寬帶干擾(Partial Band Noise Jamming, PBNJ)、線性掃頻干擾(Linear Frequency Modulation, LFM)、正弦調(diào)頻干擾(Sinusoid Frequency Modulation, SFM)、周期脈沖噪聲干擾(Periodic Pulse Noise Jamming,PPNJ)、跳頻干擾(Frequency-Hopping Jamming,FHJ)、噪聲調(diào)頻干擾(Noise Frequency Modulation, NFM)和QPSK數(shù)字調(diào)頻干擾9種干擾。
表1 干擾信號(hào)參數(shù)設(shè)置
算法1 基于超球面3元組編碼的干擾模式開(kāi)集識(shí)別算法
為驗(yàn)證算法對(duì)于干擾模式的開(kāi)集識(shí)別效果將上述9種干擾信號(hào)分為已知型干擾和未知型干擾兩組,其中未知型干擾不出現(xiàn)在干擾模式開(kāi)集識(shí)別訓(xùn)練集當(dāng)中,僅出現(xiàn)在測(cè)試集當(dāng)中以測(cè)試算法開(kāi)集識(shí)別能力??紤]到干擾模式開(kāi)集識(shí)別問(wèn)題的特殊性,由于上述9種干擾信號(hào)中單音干擾、多音干擾、寬帶干擾、線性掃頻干擾和周期脈沖干擾5種干擾信號(hào)極其常見(jiàn),在實(shí)際場(chǎng)景中容易獲得相應(yīng)的數(shù)據(jù)樣本,在試驗(yàn)中設(shè)置為已知型干擾。而剩余的跳頻干擾、正弦調(diào)頻干擾、噪聲調(diào)頻干擾和QPSK數(shù)字調(diào)頻干擾4種干擾信號(hào)相對(duì)較為少見(jiàn),并且為了充分驗(yàn)證算法的有效性、降低試驗(yàn)結(jié)果的隨機(jī)性,在試驗(yàn)中隨機(jī)選取這4種干擾信號(hào)中的兩種與上述5種常見(jiàn)干擾信號(hào)組成全部的已知型干擾,剩余的兩種則組成未知型干擾。由于在4種干擾信號(hào)中隨機(jī)挑選兩種,構(gòu)成如表2所示的共=6種干擾模式開(kāi)集識(shí)別試驗(yàn)數(shù)據(jù)組合。并在后續(xù)試驗(yàn)中除特別說(shuō)明外,所有試驗(yàn)結(jié)果均為6個(gè)試驗(yàn)數(shù)據(jù)組合下的平均數(shù)值。
表2 干擾模式開(kāi)集識(shí)別試驗(yàn)數(shù)據(jù)組合
超球面3元組編碼器的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,各層網(wǎng)絡(luò)輸出端均采用relu函數(shù)作為激活函數(shù)。該CNN網(wǎng)絡(luò)使用pytorch搭建,采用大小為1 × 256 ×256的干擾信號(hào)2維時(shí)頻圖像作為輸入,采取3元組損失( m arg in設(shè)置為1.25)作為損失函數(shù),并設(shè)置學(xué)習(xí)率為1e-5,batch_size為16以及epoch_num為150。
圖2 超球面3元組編碼器結(jié)構(gòu)圖
使用表2中干擾模式開(kāi)集識(shí)別試驗(yàn)數(shù)據(jù)組合1的訓(xùn)練集數(shù)據(jù)完成網(wǎng)絡(luò)模型的訓(xùn)練之后,將該訓(xùn)練集數(shù)據(jù)通過(guò)網(wǎng)絡(luò)模型得到相應(yīng)的64 dim編碼數(shù)據(jù)。再使用谷歌高維數(shù)據(jù)分析的工具Embedding Projector[22]對(duì)訓(xùn)練集編碼數(shù)據(jù)集進(jìn)行CUSTOM降維,得到的3元組損失聚類效果圖如圖3(b)所示,其中2維平面中的每一個(gè)點(diǎn)都代表著一個(gè)64維的訓(xùn)練集編碼數(shù)據(jù)樣本。其中7種不同的標(biāo)簽點(diǎn)分布代表著訓(xùn)練集中7種不同干擾類型,并與基于交叉熵?fù)p失訓(xùn)練的聚類效果圖3(a)相比,容易看出通過(guò)基于3元組損失訓(xùn)練后樣本數(shù)據(jù)的緊致性大大提高,各類樣本數(shù)據(jù)聚類效果良好。
圖3 試驗(yàn)數(shù)據(jù)組合1訓(xùn)練集編碼數(shù)據(jù)CUSTOM降維效果圖
完成對(duì)干擾模式開(kāi)集識(shí)別試驗(yàn)數(shù)據(jù)組合1的測(cè)試集數(shù)據(jù)的超球面3元組編碼后,基于元識(shí)別思想的干擾模式開(kāi)集識(shí)別混淆矩陣如圖4所示。圖4中每種干擾信號(hào)的測(cè)試樣本總數(shù)為700個(gè),可以看到對(duì)于已知型干擾除極其少量的測(cè)試樣本被誤判為未知型干擾外,其他樣本都得到正確判決,且不會(huì)誤判為其他6種已知型干擾。當(dāng)p%=99.0%時(shí),由圖4(b)可知兩種未知型干擾共1 400個(gè)測(cè)試樣本中僅14個(gè)樣本被誤判,充分說(shuō)明了算法的有效性。
圖4 試驗(yàn)數(shù)據(jù)組合1基于元識(shí)別分類器干擾模式開(kāi)集識(shí)別混淆矩陣
為了正確評(píng)價(jià)不同分類方法的干擾模式開(kāi)集識(shí)別性能,令已知型干擾樣本的真實(shí)標(biāo)簽為陽(yáng)性,未知型干擾樣本則為陰性,并引入真陰率(True Negative Rate, TNR)、真陽(yáng)率(True Positive Rate, TPR)、精準(zhǔn)度(Precision)以及F1分?jǐn)?shù)(F1-score),其中F1分?jǐn)?shù)計(jì)算公式為
最終得到在所有試驗(yàn)數(shù)據(jù)組合下的平均識(shí)別結(jié)果如表3所示。
表3 不同分類方法的干擾模式開(kāi)集識(shí)別整體性能對(duì)比(%)
表3中SVDD和OCSVM是兩種經(jīng)典的單分類器方法,在仿真試驗(yàn)中均使用文獻(xiàn)[23]開(kāi)發(fā)的LIBSVM進(jìn)行搭建。而基于余弦距離的分類方法是指在超球面編碼空間當(dāng)中,直接通過(guò)輸入樣本與各已知型干擾樣本中心的余弦距離來(lái)進(jìn)行分類判決。并且由于超球面編碼空間的特殊性,在元識(shí)別分類方法當(dāng)中所選取的距離類型同樣為余弦距離。
首先由表3可以直觀地看出4種分類方法都能起到較好的開(kāi)集識(shí)別效果,其中F1-score值均能達(dá)到97%以上,這是由于超球面3元組編碼所帶來(lái)的識(shí)別增益。對(duì)比4種方法,元識(shí)別方法在TNR、Precision和F1-score 3個(gè)指標(biāo)上均取得最高數(shù)值,在TPR上取值99.612 3%,較余弦距離方法低0.258 5%。由于超球面3元組編碼聚類效果良好,測(cè)試過(guò)程中已知型干擾之間不會(huì)發(fā)生誤判,所以僅有0.387 7%的已知型干擾被誤判為未知型干擾。而且由于元識(shí)別方法中超參數(shù)p%的存在,使得其能夠根據(jù)任務(wù)需求靈活調(diào)整閾值,得到任務(wù)所需求的開(kāi)集識(shí)別真陽(yáng)率和真陰率。如圖4所示當(dāng)從99.9%下降到99.0%時(shí),由圖4(b)可以顯著發(fā)現(xiàn)兩種未知型干擾信號(hào)的誤判數(shù)均出現(xiàn)下降,總體上減少26個(gè),與此同時(shí)也犧牲了0.877 6%的真陽(yáng)率。
這種靈活性是SVDD這一系列單分類器分類方法所不具備的,其不能直接通過(guò)設(shè)置訓(xùn)練集通過(guò)率來(lái)改變閾值,只能通過(guò)遍歷超參數(shù)的取值范圍去尋找與所需通過(guò)率相對(duì)應(yīng)的超參數(shù)取值來(lái)進(jìn)行設(shè)置。但是會(huì)無(wú)端增加巨大的計(jì)算量,甚至是徒勞之舉根本無(wú)法找到。所以在該文中選取性能優(yōu)異并且根據(jù)靈活穩(wěn)定的元識(shí)別方法進(jìn)行編碼后的分類識(shí)別任務(wù)。
為驗(yàn)證本文提出的基于超球面3元組編碼的干擾模式開(kāi)集識(shí)別方法的有效性,將其與文獻(xiàn)[15]中所提出的基于零樣本學(xué)習(xí)的干擾模式識(shí)別方法和openmax開(kāi)集識(shí)別方法進(jìn)行比較。仿真試驗(yàn)中文獻(xiàn)[15]算法中超參數(shù)設(shè)置如下,損失函數(shù)中交叉熵?fù)p失、中心損失和重構(gòu)損失的權(quán)重值分別為10,10,1,并設(shè)置判決閾值的乘法因子γk值為1。為了驗(yàn)證超球面3元組編碼的有效性,排除網(wǎng)絡(luò)結(jié)構(gòu)方面對(duì)于試驗(yàn)結(jié)果的影響,在仿真試驗(yàn)中所有方法編碼器部分神經(jīng)網(wǎng)絡(luò)均相同且如圖2所示。最終3種算法在所有試驗(yàn)數(shù)據(jù)組合下的平均干擾模式開(kāi)集識(shí)別效果F1-score值如表3所示。
通過(guò)表4可以看到本文方法的F1-score值較文獻(xiàn)[15]方法和openmax開(kāi)集識(shí)別方法更加穩(wěn)定,在通過(guò)率p%=99.9%和p%=99.0%兩種情況下均有F1-score值大于98.5%,并在p%=99.9%時(shí)取得4種方法中的最大F1-score值。尤其在TNR指標(biāo)上,本文方法遠(yuǎn)遠(yuǎn)高出其他兩種干擾模式開(kāi)集識(shí)別方法,說(shuō)明在本文方法下92%以上的未知型干擾樣本都能夠得到正確判決。
表4 不同干擾模式開(kāi)集識(shí)別算法整體性能對(duì)比(%)
表4中3種干擾模式開(kāi)集識(shí)別方法在相同的編碼器神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)下的干擾識(shí)別效果可以看出,本文基于超球面3元組損失訓(xùn)練的編碼器和元識(shí)別分類方法更利于干擾模式開(kāi)集識(shí)別任務(wù),下面從損失函數(shù)、分類方法和編碼空間3個(gè)部分具體分析原因。(1)文獻(xiàn)[15]中損失函數(shù)以中心損失為主,而中心損失雖然能夠?qū)⑼瑢僖活惖臉颖局g的距離拉近均往樣本中心靠攏,使其相似性變大,但其沒(méi)有把不同類別樣本之間的樣本距離拉大的能力。openmax方法中的交叉熵?fù)p失與之同樣僅能做到區(qū)分不同干擾信號(hào)。3元組損失則兼具減小類內(nèi)距離、增大類間距離兩個(gè)作用,同時(shí)3元組損失通過(guò)加大不同類樣本編碼距離能夠很好地抑制通信信號(hào)對(duì)于干擾模式開(kāi)集識(shí)別的影響,并通過(guò) m arg in的設(shè)置使得在超球面上的編碼效果獲得更好的均勻性與對(duì)齊性。(2)文獻(xiàn)[15]方法采用訓(xùn)練集中樣本信號(hào)與樣本類中心的最大距離,作為干擾模式識(shí)別任務(wù)閾值設(shè)置的基礎(chǔ),這容易造成干擾樣本離群點(diǎn)對(duì)于分類效果的嚴(yán)重影響。而本文中元識(shí)別分類方法基于極值理論實(shí)現(xiàn),能夠很好地避免離群點(diǎn)的影響,并且進(jìn)一步通過(guò)參數(shù)p%的使用將離群點(diǎn)在閾值設(shè)置時(shí)排除在外。(3)采取超球面編碼對(duì)于干擾模式開(kāi)集識(shí)別任務(wù)具有一定好處,超球面中當(dāng)類被很好地聚集在一起時(shí)(形成球狀帽),它們是線性可分離的。這一點(diǎn)對(duì)于歐幾里得空間來(lái)說(shuō)并不成立[18]。
給出不同干擾模式開(kāi)集識(shí)別方法在試驗(yàn)數(shù)據(jù)組合2測(cè)試集數(shù)據(jù)下的接收者操作特征曲線(Receiver Operating characteristic Curve, ROC)如圖5所示。由圖5可以看出本算法的ROC曲線下面積(Area Under Curve, AUC)高達(dá)0.94,說(shuō)明本算法對(duì)于干擾模式開(kāi)集識(shí)別任務(wù)的識(shí)別性能非常優(yōu)秀。同時(shí)在圖5中,本文方法曲線上大部分(假陽(yáng)率,真陽(yáng)率)坐標(biāo)點(diǎn)靠近最優(yōu)點(diǎn)(0,1)處,說(shuō)明超球面3元組編碼大大降低了未知型干擾帶來(lái)的開(kāi)放空間風(fēng)險(xiǎn)。圖中信心分?jǐn)?shù)閾值為0和1分別對(duì)應(yīng)(1,1)和(0,0)兩個(gè)坐標(biāo)點(diǎn),隨著閾值的等值逐步上升,曲線存在一段坐標(biāo)點(diǎn)從(1,1)往(0,1)逐步左移的過(guò)程,此過(guò)程中真陽(yáng)率始終保持在較高水平而假陽(yáng)率變化較大,所以為了避免離群點(diǎn)影響造成所設(shè)信心分?jǐn)?shù)閾值過(guò)小采取p%∈(99.0%,99.9%),并且識(shí)別任務(wù)中訓(xùn)練集數(shù)據(jù)樣本離群點(diǎn)越多,超參數(shù)p%的取值應(yīng)當(dāng)相對(duì)越小。同時(shí)由于超球面3元組編碼基于歐式距離進(jìn)行,容易形成越靠近類中心點(diǎn) MAVi聚類密度越高的編碼效果,此時(shí)聚類邊界處密度相對(duì)稀疏,所以p%在 (99.0%,99.9%)范圍內(nèi)變化所帶來(lái)的信心分?jǐn)?shù)閾值變化程度遠(yuǎn)遠(yuǎn)大于( 90%,99%)范 圍內(nèi),即p%在 (90%,99%)范圍內(nèi)設(shè)置對(duì)于干擾模式開(kāi)集識(shí)別效果影響較小。同時(shí)為了防止坐標(biāo)點(diǎn)掉入曲線從右往左的劇烈下降階段,采取的超參數(shù)p% 需滿足p%>90%,避免信心分?jǐn)?shù)閾值設(shè)置過(guò)高。
圖5 試驗(yàn)數(shù)據(jù)組合2下不同干擾模式開(kāi)集識(shí)別算法ROC曲線圖
圖6為本文基于超球面3元組編碼的干擾模式開(kāi)集識(shí)別算法在所有試驗(yàn)數(shù)據(jù)組合下的平均準(zhǔn)確率曲線圖。由圖6(a)可知設(shè)置通過(guò)率p%為99.9%時(shí),本文方法在干信比-2~10 dB范圍內(nèi)對(duì)于已知型干擾的識(shí)別準(zhǔn)確率均超過(guò)97.5%,而對(duì)于未知型干擾的判別準(zhǔn)確率稍顯遜色。但隨著通過(guò)率p%的下降,對(duì)應(yīng)的信心分?jǐn)?shù)閾值上升,如圖6(b)所示該算法對(duì)于未知型干擾判別準(zhǔn)確率整體上升。雖然對(duì)于已知型干擾的識(shí)別準(zhǔn)確率整體稍下降,但是總體上在干信比大于-2 dB時(shí)算法對(duì)于所有干擾樣式均有一個(gè)較高水平的識(shí)別準(zhǔn)確率,基本均處于94%以上。
圖6 基于超球面3元組編碼的干擾模式開(kāi)集識(shí)別算法準(zhǔn)確率曲線圖
接下來(lái)對(duì)于已知型干擾和未知型干擾相互混疊的特殊情形進(jìn)行討論,在本文中將已知型干擾和未知型干擾混合形成的加性復(fù)合干擾信號(hào)判決為未知型干擾視為判決正確。在此部分仿真試驗(yàn)中,增加復(fù)合干擾中的子干擾個(gè)數(shù)和加大子干擾間功率差值均會(huì)降低將判決難度,所以試驗(yàn)設(shè)置混合的已知型干擾和未知型干擾均為一種且平均功率相等。以試驗(yàn)數(shù)據(jù)組合1為例,已知型干擾種類為7種,未知型干擾種類為2種,所得加性復(fù)合干擾種類數(shù)為7×2=14種。設(shè)置每種加性復(fù)合干擾干信比范圍為-2~10 dB,且在不同干信比下均生成測(cè)試樣本數(shù)為20個(gè),最終得到組合1的加性復(fù)合測(cè)試樣本總數(shù)為14×7×20=1 960個(gè)。并最終得到此種情形下該文方法在不同試驗(yàn)數(shù)據(jù)組合下的判決準(zhǔn)確率如表5所示,可以看出未知型干擾與已知型干擾混合明顯提升判決難度,但本文方法在p%=99.0%時(shí)依然能夠保持77%以上的平均判決準(zhǔn)確率。在試驗(yàn)結(jié)果中由于多音干擾各音頻分立的特殊性,造成大部分的誤判均識(shí)別為多音干擾,在加性復(fù)合占主導(dǎo)的特殊場(chǎng)景下可對(duì)識(shí)別結(jié)果為多音干擾的干擾信號(hào)進(jìn)一步處理以提高判決準(zhǔn)確率。
表5 已知型干擾與未知型干擾混合情況下該文方法的判決準(zhǔn)確率(%)
針對(duì)目前干擾識(shí)別問(wèn)題,本文提出一種基于超球面3元組編碼的干擾模式開(kāi)集識(shí)別方法,其通過(guò)超球面3元組編碼成功地提取到有效區(qū)分各類干擾信號(hào)的特征值,并使用元識(shí)別分類方法準(zhǔn)確地完成了干擾模式開(kāi)集識(shí)別任務(wù)。試驗(yàn)論證了元識(shí)別分類方法的有效性和靈活性,以及本文方法較基于零樣本學(xué)習(xí)的干擾模式開(kāi)集識(shí)別方法和openmax干擾模式開(kāi)集識(shí)別方法更高的識(shí)別準(zhǔn)確性和穩(wěn)定性。并且仿真結(jié)果表明,當(dāng)p%為99.9%時(shí),本文方法能夠保持一個(gè)不錯(cuò)的未知型干擾判決準(zhǔn)確率的同時(shí),對(duì)于所有已知型干擾均有97.5%以上的識(shí)別準(zhǔn)確率;當(dāng)p%為99.0%時(shí)則在-2~10 dB范圍內(nèi)對(duì)于各類已知型干擾和未知型干擾基本上均能達(dá)到94%以上的識(shí)別準(zhǔn)確率,并且對(duì)于已知型干擾和未知型干擾相互混疊的特殊情形大部分能判決準(zhǔn)確。