梁 晶, 楊晶晶?, 黃 銘
(1.云南大學 信息學院, 云南 昆明 650091;2.云南大學無線創(chuàng)新實驗室, 云南 昆明 650091)
隨著無線通信的發(fā)展,電磁空間中海量的不同通信體制無線電設備潛在的相互干擾一直是無線電監(jiān)測工作關注的熱點。 在無線電監(jiān)測問題中,除需要判斷某個頻段是否有信號出現之外,還需要對信號進行識別分類。 然而傳統(tǒng)上,基于無線通信信號檢測與識別的方法都是單獨進行的,例如,Digham等[1]提出了有關能量檢測(Energy Detection,ED)的方法。 Yang 等[2]提出了有關循環(huán)平穩(wěn)特征檢測的方法。 Zhang 等[3]提出了基于匹配濾波器的檢測方法。 Liu 等[4]提出了有關最大特征值的檢測方法。Zheng 等[5]研究了基于深度學習(Deep Learning,DL)分類的認知無線電檢測方法,考慮到了噪聲不確定性的影響。 Awe 等[6]和Bao 等[7]提出了基于支持向量機(Support Vector Machine,SVM)的檢測方法,SVM 將采樣到的能量信號作為訓練集與測試集,能夠對信號與噪聲進行分類識別。 但是該方法需求解特征參數并且存在感知時間長的缺點。 Gao等[8]提出了一種基于卷積長短期深度神經網絡(Convolutional Long Short-Term Deep Neural Network,CLDNN)的DL 檢測器,適用于任意類型的初級信號。 Liu 等[9]探索了基于卷積神經網絡(Convolutional Neural Network,CNN)協方差矩陣的檢測方法,可以方便地設置期望的虛警概率。 Xie 等[10]提出了使用雙CNN 結構來從當前和歷史感測數據構建的一系列協方差矩陣中同時學習能量相關特征和用戶活動模式,以進一步提升檢測性能。 而在文獻[10]的基礎上,Xie 等[11]繼續(xù)提出了一種基于DL 的CNN-LSTM 感知檢測器。 Ni 等[12]提出了一種基于時間卷積網絡(Temporal Convolutional Network,TCN)的檢測方法,該方法通過離線訓練和在線檢測階段提取離散時間信號中的隱藏關系,消除噪聲不確定性的影響,以提高檢測概率和降低計算復雜度。而Liu 等[13]為自動調制分類(Automatic Modulation Classification,AMC)提出了一種簡單的CNN 的識別方法,并探索了所提出結構的最佳深度。 侯濤等[14]研究了一種基于深度神經網絡通信信號調制識別模型。 任進等[15]研究了基于循環(huán)神經網絡(Recurrent Neural Network,RNN)的衛(wèi)星調制信號識別算法。O’Shea 等[16]研究了基于時域同相和正交(IQ)數據訓練的CNN。 Wang 等[17]研究了一種數據驅動的融合方法,使用2 個CNN 的組合在不同數據集上訓練來獲得更好的分類精度。 Ramjee 等[18]研究了3 種基于不同神經網絡的AMC 高精度模型,包括CLDNN、長短期記憶(Long Short-Term Memory,LSTM)神經網絡和深度殘差網絡(ResNet)。 Zhang等[19]研究了一種基于CNN 的AMC 數據預處理方法,一定程度上解決了直接使用采集到的信號樣本作為CNN 模型的輸入帶來的弊端。 Liao 等[20]研究了一種用于快速AMC 的序列卷積遞歸神經網絡,結合了CNN 的并行計算能力和RNN 的時間敏感性,顯著提高了收斂速度。
從以上文獻可以看出,研究者們對無線頻譜監(jiān)測系統(tǒng)中信號檢測和信號識別方面的問題都是分開研究的,并沒有考慮到將信號檢測和識別相結合起來用于獲取無線電監(jiān)管知識[21]。 基于此,本文分別將卷積注意力模塊(Convolution Block Attention Module,CBAM)[22-23]與LSTM 網絡和TCN 結合起來通過二分類實現信號檢測,以及基于多分類實現信號識別的集成方法。 仿真實驗的結果充分驗證了算法模型的可行性和有效性。
在無線頻譜監(jiān)測系統(tǒng)中,信號模型如下:
式中,xi(n)為用戶發(fā)射的信號;y(n)為接收到的信號;hi(n)為信道的狀態(tài)信息;M為信號中存在的未知信號個數;v(n)為信道干擾,通常建模為零均值的加性高斯白噪聲。 從分類的角度可將H0和H1假設表示為二分類問題:H0只有噪聲,H1有未知信號和噪聲。
圖1 信號模型結構Fig.1 Signal model structure
信號檢測與識別的算法如表1 所示。 本文分別將CBAM[22-23]與LSTM 和TCN 結合起來通過二分類實現信號檢測(簡稱CBAMLSTM 和CBAMTCN),基于多分類實現信號識別的集成方法。
表1 信號檢測與識別的算法Tab.1 Algorithms for signal detection and recognition
該方法的2 階段如下:在信號檢測階段中,CBAMLSTM 和CBAMTCN 檢測器被用于通過用2 類訓練來決定信號是否存在,第一類包括未知信號和噪聲,第二類僅包括噪聲。 為了簡化表示,將y (n)的離散時間采樣中生成的信號樣本表示為:
式中,N為采樣總數;yn為Y 的第n個采樣點。 由于采用的信號樣本是I/Q 樣本,所以每個采樣點可以表示為:
式中,T 表示轉置;In及Qn分別為采樣點yn的實值和虛值。 將In和Qn設置為一個像素點上的2 個通道中的值,組成大小為N×2 的Y0,并將Y0作為正樣本,噪聲作為負樣本,組成Y1用作檢測器的輸入,并進一步通過DL 的感知框架,做出關于信號是否存在于頻段中的決定。 而相比于ED 方法,這種基于DL 的信號檢測方法,是利用調制信號的底層結構信息,不需要關于信道狀態(tài)信息或背景噪聲的先驗知識,減少了許多復雜的計算度[8]。
一般來說,分類算法Ddl可以表示為[9]:
式中,Yd為分類器的輸入,通過由L層組成的自定義神經網絡進行處理;fi,i=1,2,…,L-1,表示第i層權值和激活函數的計算,fL是Softmax 函數給出2 個假設H1和H0的概率;argmax 是返回列表中最大數字的索引的操作符。
在信號檢測階段中,針對DL 檢測器,設計了一種定制化的兩段訓練策略。 在第一段,當驗證集損失在連續(xù)6 次訓練周期中都沒有得到降低時,停止模型訓練,以防止模型過擬合。 第二段用觀察到的指標來權衡特性,即驗證損失和精度均保持穩(wěn)定,而不同信噪比下的虛警概率(Pf)和檢測概率(Pd)則隨訓練次數的變化而變化。 因此,設計了一個Pf停止時間間隔,首先從第一段的最佳模型繼續(xù),當Pf落入最佳模型時停止訓練。 DL 方法的一個缺點是缺乏精確的性能控制,采用兩段訓練策略,通過調整預設的停止時間間隔可以在一定程度上控制檢測性能。 利用區(qū)間大小參數實現控制精度與訓練時間的平衡。
本文認為,把人工智能的技術水平分為四個等級,比三個等級能更清楚地反映其可能導致的社會效應,因為中級和高級的差別是很大的。
而在調制識別階段中,利用CBAMLSTM 和CBAMTCN 識別分類器激活該階段。 在文獻[19]的啟發(fā)下,為進一步提取信號特征,首先將式(3)中In和Qn設置為一個像素點上的2 個通道中的值,然后換算出該采樣點的幅度值和相位值Pn= arctan(In/Qn),同樣設置為另一個像素點上2 個通道的值與In及Qn合并,使每個采樣點變換為一個矩陣,組成大小為N×4 的Y2,用作識別分類器的輸入,并進一步通過所采用的網絡模型來識別信號。
CBAMLSTM 算法模型的網絡結構如圖2 所示。該CBAMLSTM 的網絡基線模型是由4 個卷積層、2 個全連接層、2 個128 單元的LSTM 層和CBAM 層組成的網絡。 其中CBAM 是由通道(Channel)注意力機制和空間(Spatial)注意力機制組成,是為了提高模型的表征能力,有效減少無效目標的干擾,提升對關注目標的檢測識別效果,進而提高模型的整體性能。
圖2 CBAMLSTM 的網絡結構Fig.2 Network structure of CBAMLSTM
CBAMLSTM 算法模型的總體流程如下。 首先Y1作為檢測器的輸入,通過該基線模型網絡的卷積層、LSTM 層、CBAM 層和全連接層等來判斷信號存在(H1)和信號不存在(H0),當返回H1時Y2作為識別器的輸入進一步通過該基線模型網絡識別該信號的類型。 此外,識別信號的類型時,直接通過輸出層返回結果,不需要進入判斷層。 第一個全連接層表示一個64 類神經元,另一個全連接層表示在檢測方案時Y1作為檢測器的輸入判斷信號有無的2 類神經元和在調制識別方案時Y2作為識別器的輸入的11類神經元。 2 個LSTM 層都返回完整的序列,激活函數ReLU 應用于卷積層。 最后的全連接層利用Softmax 函數來實現信號檢測和調制識別分類。 每個隱藏層利用30%的下降來減少過擬合。 損失函數采用分類交叉熵,可表示為:
式中,yi以一次性編碼的形式表示基本事實;表示預測;N為訓練批次大小。 根據其計算效率,使用了學習率為0.001 的Adam 優(yōu)化。
CBAMTCN 算法模型的網絡結構如圖3 所示。CBAMTCN 網絡基線模型是由4 個卷積層、2 個全連接層、TCN 層和CBAM 層組成的網絡。 該模型中使用的CBAM 網絡結構與CBAMLSTM 算法模型中使用的CBAM 網絡結構是一樣的。
圖3 CBAMTCN 的網絡結構Fig.3 Network structure of CBAMTCN
CBAMTCN 算法模型的總體流程如下。 首先,Y1作為檢測器的輸入,通過該基線模型網絡的卷積層、TCN 層、CBAM 層和全連接層等來判斷信號存在(H1)和信號不存在(H0),當返回H1時Y2作為識別器的輸入進一步通過該基線模型網絡識別該信號的類型。 此外,識別信號的類型時,直接通過輸出層返回結果,不需要進入判斷層。 第一個全連接層表示一個64 類神經元,另一個全連接層表示在檢測方案時Y1作為檢測器的輸入判斷信號有無的2 類神經元和在調制識別方案時Y2作為識別分類器的輸入的11 類神經元。 激活函數ReLU 應用于卷積層和TCN層。 最后的全連接層利用Softmax 函數來實現信號檢測和調制識別分類。 每個隱藏層利用30%的下降來減少過擬合。 損失函數也采用分類交叉熵,與式(8)表示一樣,同樣使用了學習率為0.001 的Adam 優(yōu)化器。
使用GNU Radio 生成的典型調制數據集RadioML2016.10a[24]用作基準數據集,用于訓練和評估所提結構在信號檢測和識別分類方面的性能。 該數據集中包含11 類調制信號,每類包含20 000 個信號樣本,每個樣本包括128 個I/Q 樣本點,SNR=-20 ∶2 ∶18 dB 共20 個,總共220 000 個樣本。 文中的數據集和源碼地址為https:∥github. com/Win-LabYunnanUniversity/CBAMLSTM-and-CBAMTCN。
在信號檢測階段,判斷信號的有無時,由于傳統(tǒng)的ED 方法在低信噪比下的檢測性能極其差,如信噪比為-20 dB 時,ED 發(fā)現不了信號,而基于DL 的檢測方法擁有良好的檢測性能。 因此將數據集在SNR=-18 ∶2 ∶18 dB 共209 000 個樣本作為正樣本,提取數據集中SNR=-20 dB 的樣本作為噪聲負樣本,共418 000 個樣本作為輸入,使用3 ∶1 ∶1 的分割比例,分別是250 800 個樣本用于訓練、83 600 個樣本驗證和83 600 個樣本測試。 參數如表2 所示。
表2 信號檢測部分的數據集參數Tab.2 Dataset parameters of signal detection part
在調制信號識別分類階段,將整個數據集RadioML2016.10a 中總共220 000 個樣本劃分成2 部分,70%共154 000 個樣本用于訓練,30%共66 000 個樣本用于識別分類模型的測試。
信噪比和檢測概率如圖4 所示。 可以看出,在低信噪比下CBAMLSTM 模型和CBAMTCN 模型的檢測性能相比于DNN[8],CNN[9],LSTM[11]和TCN[12]有所改善,提高了1%~10%,其中CBAMLSTM 模型的虛警概率(0. 16%)比DNN(1. 95%)低1.79%、比CNN(1.19%)低1.03%、比LSTM(1.46%) 低1.3%、比TCN(1.28%)低1.12%;CBAMTCN 模型的虛警概率(0.22%)比DNN(1.95%)低1.73%、比CNN(1.19%)低0.97%、比LSTM(1.46%)低1.24%、比TCN(1.28%)低1.06%。 此外,還可以看出,CBAMLSTM 和CBAMTCN 與ED[1]通過理論公式虛警概率Pf=Q((λ-Nσn2)/)計算出檢測閾值λ,然后根據λ計算檢測概率的檢測性能趨勢是一樣的,都是隨著信噪比的增大,檢測概率相應地增大,進而驗證了該方法的合理性。在樣本數量N都為128 時,其方法在低信噪比的檢測性能都比傳統(tǒng)的ED 方法更好,而在高信噪比下的檢測性能沒能達到1,是由于數據集的限制,其噪聲樣本是通過提取數據集中信噪比為-20 dB 的信號作為噪聲負樣本,不是以高斯白噪聲作為噪聲負樣本造成的。
圖4 信噪比和檢測概率Fig.4 Signal-to-noise ratio and detection probability
不同模型的識別精度如圖5 所示。 圖5(a)所示,是多分類實現信號識別的結果,可以看出在高信噪比下所采用的CBAMLSTM 模型和CBAMTCN 模型相比于不加CBAM 的TCN[12],CNN[13]和LSTM[20]基線模型的識別準確度提高5% ~ 9%,分別有著92.1%和92.7%的顯著識別準確度。 圖5(b)顯示了CBAMLSTM 模型和CBAMTCN 模型與其他3 種模型在所有信噪比下的平均識別準確率。 可以看出CBAMLSTM 和CBAMTCN 分別比CNN 平均識別準確率高出0. 068 和0. 076,比TCN 平均識別準確率高出0.034 和0.042,比LSTM 的平均識別準確率分高出0.041 和0.048。
圖5 不同模型的識別精度Fig.5 Recognition accuracy of different models
由圖4 和圖5 可以看出, 在低信噪比下CBAMLSTM 和CBAMTCN 的檢測性能相差不大,但CBAMLSTM 的虛警概率(0.16%)比CBAMTCN 的虛警概率(0.22%) 低 0.06%; 在高信噪比下CBAMLSTM 的識別準確率(92.1%)比CBAMTCN的識別準確率(92.7%)低0.06%,CBAMLSTM 的平均識別準確率(0.619 22)比CBAMTCN 的平均識別準確率(0.626 47)低0.007 25。
為了進一步分析CBAMLSTM 模型CBAMTCN模型識別分類的性能,圖6 呈現了CBAMLSTM 模型和CBAMTCN 模型與其他3 種網絡模型的混淆矩陣圖。 關于圖中描繪的混淆圖,行對應于真實的調制,而列對應于預測的調制。 對角線單元格對應于正確分類的觀察值,非對角線單元對應于錯誤分類的觀察值。 因此, 由圖的對角線單元格可以看出,CBAMLSTM 模型和CBAMTCN 模型對每類信號的識別精度都比其他3 種網絡模型的高。
由圖6 也可以看出,除了矩陣中清晰的對角線之外,還有2 個主要差異:一是WBFM 被誤分類為AM-DSB;二是QAM16 被誤分類為QAM64。 這種差異可能是因為它們信號特征的相似性使得這種區(qū)分容易受到信號中小噪聲的影響。 因此可以預想,調制識別的未來發(fā)展應該集中減少這2 方面的差異。
圖6 不同模型的混淆矩陣Fig.6 Confusion matrix of different models
考慮到無線頻譜監(jiān)測系統(tǒng)中可以將信號檢測和識別結合起來用于獲取無線電監(jiān)管知識,提出了分別將CBAM 與LSTM 網絡和TCN 結合起來通過二分類實現信號檢測,以及基于多分類實現信號識別的級聯方法。 結果表明,二分類模型在低信噪比下的檢測性能有所改善;多分類模型相比于不加CBAM 的LSTM,TCN 和CNN 基線模型,實現了在高信噪比下的高效識別,同時這一DL 算法是利用調制信號的底層結構信息,無需人工提取特征,可以快速適應未知信號。 下一步將研究不同網絡模型在真實場景中的實踐。