王奇?zhèn)?,孫閩紅,簡志華,仇兆煬
(杭州電子科技大學通信工程學院,浙江 杭州 310018)
雷達欺騙干擾識別是雷達抗干擾核心技術之一,人工智能應用于雷達欺騙干擾識別的研究取得了一些進展。阮懷林等[1]采用棧式稀疏自編碼器對雷達接收信號的時頻特征進行降維處理,用SoftMax分類器完成了欺騙干擾的分類識別。文獻[2]用卷積神經網絡實現了常見的3類拖引干擾的識別。這些研究需要大量帶標簽的信號樣本,但在真正的電子戰(zhàn)環(huán)境中,很難提前獲取大量敵方發(fā)射的欺騙干擾信號樣本,只能根據接收機的異常來獲取少量的欺騙干擾樣本。因此,研究小樣本條件下的雷達欺騙干擾智能識別具有現實意義和應用價值。近年來,小樣本學習在機器視覺領域取得了不少成果,主要包括模型微調[3]、數據增強[4]和遷移學習[5-6]?;谀P臀⒄{的小樣本學習方法先通過訓練大量樣本的數據集從而得到性能優(yōu)異的分類模型,再在測試集上對模型進行微調;基于數據增強的小樣本學習方法主要是對目標數據集的樣本進行擴充,目前廣泛使用的模型是生成對抗網絡(Generative Adversarial Network,GAN)[7-8];遷移學習方法需要源域數據集和目標域數據集存在一定關聯,在源域中訓練得到的知識和特征能夠提高模型在目標域的分類性能,從而實現知識在不同數據域之間的遷移。在機器視覺領域,文獻[9]提出多模態(tài)單樣本學習算法,將多類單個語音信號與對應的圖像信號進行模態(tài)匹配訓練,實現了單樣本條件下的語音信號分類。目前將小樣本學習理論應用于欺騙干擾識別的研究不多,文獻[10]結合半監(jiān)督學習思想,使用少量帶有類別標簽的雷達接收信號集訓練分類器,實現了欺騙干擾的識別;文獻[11]在少量的帶標注樣本的條件下,用半監(jiān)督生成對抗網絡(Semi-Supervised GAN,SSGAN)和基于生成控制的半監(jiān)督生成對抗網絡(Generative Control SSGAN,GC-SSGAN)實現了欺騙干擾的半監(jiān)督學習,提高了識別性能。目前,基于小樣本學習的欺騙干擾識別方法主要是對目標數據樣本進行擴充。但是,由于欺騙干擾信號與真實目標回波(True Target Echo, TTE)信號之間有較高的相似度,使得擴充后的樣本間差異性不夠明顯。針對這一不足,本文受文獻[12]方法的啟發(fā),提出一種多模態(tài)小樣本學習欺騙干擾識別算法,對雷達接收信號進行“語音”和“視覺”模態(tài)的人為定義并假設具有相應的關聯,用偽孿生網絡進行模態(tài)信息匹配訓練,實現了小樣本條件下對欺騙干擾的識別。
轉發(fā)式欺騙干擾是指干擾機通過數字射頻存儲器(Digital Radio Frequency Memory, DRFM)對截獲到的雷達信號進行幅度、時延、多普勒頻率等調制后轉發(fā)的欺騙干擾信號。本文選取典型的4種雷達欺騙干擾樣式作為研究對象,分別為距離欺騙干擾、速度欺騙干擾、距離速度同步欺騙干擾以及密集假目標欺騙干擾。雷達發(fā)射信號以線性調頻信號為例,表示為:
(1)
式中,A為發(fā)射信號的幅度,φ(t)=jπ(2f0t+kt2),f0為中頻頻率,k為調頻斜率,φ0為發(fā)射信號的初始相位,j為虛數單位。假如與雷達相距R0的位置處有1個目標,則此時雷達接收機接收到的真實信號為:
(2)
(1)距離假目標欺騙干擾(Range False Target Deception Jamming, RFTD)設備對干擾脈沖的轉發(fā)時延進行調制,使得干擾脈沖和目標回波分別位于不同的距離門,以達到對雷達的距離欺騙干擾效果。當DRFM干擾機轉發(fā)RFTD時,雷達接收機接收到的信號為:
(3)
式中,AR為距離欺騙干擾的幅度,tr為距離欺騙干擾的時延調制值,tf為距離欺騙干擾的時延調制值,φJ為干擾信號的初始相位。
(2)速度假目標欺騙干擾(Velocity False Target Deception Jamming, VFTD)設備根據截獲到的雷達信號,對干擾脈沖的多普勒頻率進行調制,使得干擾脈沖和目標回波分別位于不同的速度跟蹤波門,導致雷達跟蹤或檢測時發(fā)生錯誤。當DRFM干擾機轉發(fā)VFTD時,雷達接收機接收到的信號為:
(4)
式中,AV為速度假目標欺騙干擾的幅值,fJ為速度假目標欺騙干擾的多普勒頻移調制值。
(3)在距離和速度這2個維度上產生距離-速度同步假目標欺騙干擾(Range -Velocity False Target Deception Jamming, R-VFTD),假目標的距離和速度具有同步性,相對于真目標而言,假目標有一定的速度差且固定不變,真假目標速度差的存在使得假目標與真目標的相對距離發(fā)生變化,雷達不能根據實際測得的距離值和速度值對抗該干擾。當DRFM干擾機轉發(fā)R-VFTD時,雷達接收機接收到的信號為:
(5)
(6)
然后將J1(t)重復n次,得到整個頻譜彌散干擾的時域模型為:
(7)
式中,?為卷積算子,δ(t)為沖激函數。
本文提出一種基于多模態(tài)小樣本學習的雷達欺騙干擾識別算法。將少量雷達接收的時域信號定義為“語義”模態(tài)輸入,將樣本數量足夠且識別性能較好的MINIST手寫體數據集定義為其對應的“視覺”模態(tài)輸入,并用神經網絡在兩者之間進行匹配關聯訓練,將待識別的雷達接收信號與不同類別的手寫體數字分別輸入至已經訓練好的模型,匹配得到的差異最小的手寫體數字對應的欺騙干擾類型即為識別結果,算法流程如圖1所示。
圖1 基于多模態(tài)小樣本學習的雷達欺騙干擾識別算法示意圖
考慮到訓練樣本數量的不足以及欺騙干擾與真實目標回波信號之間的高度相似性,選擇有足夠樣本并且類別之間差異足夠大的MINIST手寫數字集作為雷達接收信號的“視覺”模態(tài)。在深度學習領域,MINIST手寫體數據集是一個非常經典的數據集,最早被當作測試深度學習可行性的數據集。大量的實驗研究表明,神經網絡可以進行圖像分類,卷積神經網絡對手寫體數據集有較高的識別率。
如圖1(b)所示,定義雷達接收信號的“視覺”種模態(tài),手寫體數字“0”為真目標信號的“視覺”模態(tài),數字“1”為距離假目標信號的“視覺”模態(tài),數字“2”為速度假目標信號的“視覺”模態(tài),數字“3”為距離-速度聯合欺騙干擾信號的“視覺”模態(tài),數字“4”為密集假目標干擾信號的“視覺”模態(tài)。
一般情況下,神經網絡模型僅將輸入信息的一種模態(tài)信息標簽化后進行訓練,而本文算法將雷達接收信號的2種不同模態(tài)信息同時輸入至神經網絡進行匹配訓練,并且這2種模態(tài)的輸入格式不一致,“語義”模態(tài)為一維時序數據,“視覺”模態(tài)為二維圖像數據。孿生網絡具有將輸入數據映射到目標空間的優(yōu)點,其應用背景與本文類似,已在基于度量學習的單樣本學習中得到應用[12-13],因此,本文選用偽孿生網絡模型來完成輸入樣本的匹配訓練,其網絡結構如圖2所示。假設網絡的2個輸入是X1和X2,映射函數分別為GW1(X)和GW2(X),經過映射后輸入分別表示為GW1(X1)和GW2(X2),最后通過損失函數優(yōu)化兩者在特征空間的距離EW。
圖2 孿生網絡結構
偽孿生網絡將訓練集中成對的樣本作為輸入進行訓練,考慮到輸入2種模態(tài)數據格式的不同,本文使用的2個網絡是不同的網絡結構,分別為長短期記憶模型循環(huán)網絡(Long-Short Term Memory,LSTM)和卷積神經網絡(Convolutional Neural Network,CNN)它們不共享相同的權值。輸入樣本狀態(tài)表示為(X1,X2,Y),其中Y=0表示X1和X2模態(tài)匹配,相似性度量EW(X1,X2)是1個較大的值;Y=1則表示X1和X2模態(tài)不匹配,相似性度量EW(X1,X2)是1個較小的值,其中EW(X1,X2)=GW1(X1)-GW2(X2)2,表示2個輸入樣本之間的歐氏距離。損失函數的形式為:
(8)
式中,EW(X1,X2)same表示X1和X2模態(tài)匹配時的相似性度量,EW(X1,X2)different表示X1和X2模態(tài)不匹配時的相似性度量。為證明本文算法提出將雷達信號與手寫體數字進行匹配訓練的可行性,將文獻[9]中語音信號與圖像的匹配結果和文本數據的多模態(tài)匹配結果進行對比,用歸一化的歐式距離進行模態(tài)之間的相似度度量,即距離差值越小相似度越高,差值越大相似度越低,結果如表1所示。
表1 不同數據集的模態(tài)匹配相似度
從表1可以看出,當輸入樣本模態(tài)匹配時,文獻[9]中語音模態(tài)描述與視覺圖像模態(tài)的歸一化相似度略高于本文雷達接收時域信號與手寫體數字的模態(tài)匹配結果;當輸入樣本模態(tài)不匹配時,本文數據集的相似度更低。只需模態(tài)匹配時的相似度相對高于模態(tài)不匹配時的相似度就可以用度量模塊完成干擾識別,所以,將雷達信號與手寫體數字進行模態(tài)匹配從而實現小樣本條件下欺騙干擾識別的方法可行。
為了實現少量帶標簽樣本下欺騙干擾的識別,驗證基于接收信號多模態(tài)小樣本學習的欺騙干擾識別效果,對雷達接收信號中是否存在距離假目標欺騙干擾、速度假目標欺騙干擾、距離-速度同步假目標欺騙干擾和頻譜彌散干擾進行仿真實驗,雷達發(fā)射信號和欺騙干擾參數設置如表2所示。
表2 信號參數設置
將距離欺騙干擾、速度欺騙干擾、距離-速度聯合欺騙干擾、頻譜彌散干擾和真目標回波信號各產生800個,每種類型信號隨機抽取600個信號作為訓練集,剩下的樣本作為測試集。實驗在CPU為Intel(R) Core(TM) i7-8750H 2.20GHz,GPU為NVIDIA GeForce GTX 1060MaxQ的電腦上運行,內存為16 GB,硬盤容量為512 GB的固態(tài)硬盤,所有數據仿真均通過MTALAB 2018a編程實現。
偽孿生網絡模型分別采用LSTM網絡和CNN網絡,將接收信號的不同模態(tài)進行匹配,其中LSTM網絡的參數設置為:輸入信號的長度為800,隱藏層的神經節(jié)點為1 200,輸出神經元個數為24;CNN網絡的參數設置為:3層卷積層,第1層的卷積核個數為32,第2層的卷積核個數為64,第3層的卷積層的個數為120,下采樣層為2×2的最大池化層,最后1個隱藏層的神經元個數也為24。使用歐式距離定義2個網絡輸出特征向量的相似度,初始學習率設置為0.001,batch size為128,使用自定義的交叉熵作為損失函數,優(yōu)化器為Adam。
從樣本集中分別隨機抽取250,500,750,1 500和3 000個帶標簽接收信號樣本,訓練集與測試集的比例為4∶1,不同接收信號匹配的“視覺”模態(tài)樣本為5 000個。仿真得到不同帶標簽樣本數量場景下,本文算法欺騙干擾的平均識別效果隨著干噪比的變化曲線如圖3所示。從圖3可以看出,隨著帶標簽訓練樣本數量增加,本文算法的識別性能不斷提高。3 000個測試樣本全部用于訓練,在干噪比大于0 dB時,欺騙干擾平均識別率達到92.26%以上,說明本文算法在樣本充足時的欺騙干擾識別性能較好。當訓練樣本數量降低到7.50%,干噪比為9 dB時,平均識別率能達到90.05%以上;在樣本數量降低到12.50%的情況下,在干噪比為7 dB時能達到94.07%以上的識別率;在樣本數量降低到25%的情況下,在干噪比為3 dB時能達到90%以上的識別率;樣本數量降低到50%的情況下,欺騙干擾的識別性能始終高于90%。綜上分析可知,本文算法不僅能在樣本不足的條件下對欺騙干擾信號進行識別,而且在識別性能上有較大的改善。
圖3 不同樣本數的識別效果
匹配集樣本數量分別為1 000,3 000和5 000,從干噪比為10 dB的樣本集隨機抽取750個帶標簽樣本,訓練集與測試集的比例為4∶1,神經網絡模型與3.1節(jié)實驗設置一致,樣本數量減小到25%時,本文算法的識別性能與匹配集數量的關系如表3所示。
表3 樣本數量減小到25%時,本文算法的識別性能
從表3可以看出,本文算法的識別性能受匹配集數量的影響較大。匹配集數量為1 000時,算法的平均識別率為79.46%;匹配集數量為3 000時,平均識別率為94.92%;匹配集數量為5 000時,平均識別率為98.26%。綜上分析可知,本文算法的整體識別性能較好,根據對欺騙干擾識別技術指標的實際需求設置合適的匹配集數量,可以有效降低訓練時間。
將本文算法與文獻[10]采用的基于S4VM的識別算法、文獻[11]采用的基于改進模型GC-SSGAN的識別算法的欺騙干擾識別性能進行比較。設置仿真場景為:信噪比為10 dB,匹配集數量為5 000,訓練集不同類型的雷達接收信號數量為500個(樣本數量降低到25%),訓練集與測試集的比例為4∶1,3種識別算法使用相同數據集,得到的欺騙干擾識別率如表4所示。
表4 不同算法的欺騙識別率
從表4可以看出,在相同實驗環(huán)境下,文獻[10]算法的欺騙干擾平均識別率為89.6%,文獻[11]算法的欺騙干擾平均識別率為91.6%,本文識別算法的欺騙干擾平均識別率為95.4%,比文獻[10]算法的識別率提高了5.8%,比文獻[11]算法的識別率高3.8%。
本文首先將手寫體數字圖像定義為雷達信號的“視覺”模態(tài),然后通過模態(tài)匹配訓練,使得映射后的2種模態(tài)向量具有高度相似性,最后用度量模塊完成了多模態(tài)小樣本學習的欺騙干擾識別。仿真實驗表明,即使人為看來是相互獨立的2個數據集,通過神經網絡模型訓練后,仍可以讓其映射到具有高度相關性的目標空間。但是,本文只實現了基于仿真數據的小樣本雷達欺騙干擾識別,由于實戰(zhàn)環(huán)境中電磁信號具有復雜性,下一步將對實測數據下的雷達欺騙干擾識別展開進一步研究。