張婷婷,方宇強,韓 蕾
(1. 北京特種工程設計研究院,北京 100028;2. 電子信息系統(tǒng)復雜電磁環(huán)境效應國家重點實驗室,河南 洛陽 471003;3. 航天工程大學,北京 101416)
通信信號調制識別就是通過對接收信號進行一系列信號處理后獲取信號的調制方式的過程,其基本目的是為選擇合適的信號解調器提供依據(jù);自動調制識別在軍事和民用領域上均具有一定的意義和價值,一直是研究的關注熱點。目前常見的方法多采用“人工特征”結合統(tǒng)計模式分類器的方式實現(xiàn)識別過程,這種方式對信號特征的提取依賴于專家的人工設計,如常用的正交變換、高階累積量、延時相關和瞬時自相關特性等[1],然后對特征進行分類。近年來,這種“人工特征”的方法在語音、圖像識別領域已經(jīng)逐漸被以深度學習為代表的自動特征學習或表示學習方法所取代,基于數(shù)據(jù)本身,利用深度神經(jīng)網(wǎng)絡得到特征表示和分類的端到端模型已經(jīng)成為發(fā)展的趨勢[2]。而今年來利用深層神經(jīng)網(wǎng)絡對自動調制識別的研究也逐漸興起,如文獻[3-6]采用經(jīng)典的卷積神經(jīng)網(wǎng)絡實現(xiàn)了調制方式的識別并得到了較好的識別效果。但是從遞歸、卷積等結構多角度的考慮電磁信號序列表示問題的研究相對較少。為此,本文針對信號調制識別的深層神經(jīng)網(wǎng)絡方法開展研究,對序列信號表示的遞歸神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡等不同網(wǎng)絡結構的表示能力進行研究,并提出基于雙向GRU網(wǎng)絡和深度殘差網(wǎng)絡的自動調制識別方法。在建立的包含9種不同調制模式的仿真信號數(shù)據(jù)集上,對不同算法進行了對比分析,實驗結果表明了提出方法的有效性,為電磁信號調制識別問題提供了新的數(shù)據(jù)驅動解決思路。
該部分首先描述通信類信號調制識別的數(shù)據(jù)仿真建模方法,然后分別對提出的基于雙向GRU和深度殘差卷積網(wǎng)絡的自動調制識別方法進行描述。
實現(xiàn)端到端的識別方案,首先就要求從數(shù)據(jù)出發(fā),積累一定的數(shù)據(jù)以滿足模型學習的要求,從足夠的數(shù)據(jù)中挖掘數(shù)據(jù)特征的表示方式。為此本文首先利用仿真建模方式建立相應的數(shù)據(jù)集。
考慮加性高斯白噪聲AWGN信道下的單信號調制識別問題是調制識別研究的基礎,因此,針對AWGN信道下的單信號調制識別應用場景,建立信噪比環(huán)境不理想情況下的不同調制方式數(shù)據(jù)集。
AWGN信道下接收信號的數(shù)學模型為
y(t)=s(t)+n(t)
(1)
表1 仿真參數(shù)設置
其中生成的信號如圖1所示。
圖1 AWGN信道不同調制樣式信號仿真結果
2.2.1 基于雙向GRU神經(jīng)網(wǎng)絡的調制識別
在語音和序列信號處理領域中,遞歸神經(jīng)網(wǎng)絡RNN是一種常用的序列建模網(wǎng)絡,該網(wǎng)絡采用遞歸和權值共享的方式實現(xiàn)序列數(shù)據(jù)的建模。借鑒RNN的基本思想,本文建立一種多層雙向GRU網(wǎng)絡模型來實現(xiàn)信號調制樣式識別任務。門限遞歸網(wǎng)絡(Gated Recurrent Network)是一種改進的RNN模型[7],引入了門限機制來克服訓練過程中長記憶模型的梯度消失,同時門限單元的引入對序列數(shù)據(jù)的噪聲項有一定的抑制作用,因此在本文算法中采用GRU作為基礎模型。本文提出的多層GRU具體的網(wǎng)絡結構如圖2所示,模型由兩部分組成,其中編碼器模塊由一個輸入層、兩個GRU隱藏層和一個全連接層組成。為了使訓練模型更精確,在GRU隱藏層中采用雙向結構。此外,編碼器后采用兩個全連接層對GRU神經(jīng)網(wǎng)絡進行訓練,以提取良好的特征和識別結果。
圖2 多層雙向GRU網(wǎng)絡模型示意圖
2.2.2 基于深度殘差卷積網(wǎng)絡的調制識別
利用1D卷積同樣可以建立局部相關性,并可以通過增加網(wǎng)絡層數(shù)來擴大感受野的范圍。為此,論文分別采用了多層感知器(MLP)、卷積神經(jīng)網(wǎng)絡(CNN)進行自動調制識別并進一步提出了針對調制識別的深度殘差卷積網(wǎng)絡。
采用的多層感知器結構中每一層均采用全連接方式進行傳輸,ReLU作為隱層的非線性單元,輸入為截取的4096長度信號,輸出為9類調制方式。
進一步,設計了一種卷積神經(jīng)網(wǎng)絡結構進行測試,結構如下圖3所示。該網(wǎng)絡結構包含7層,分別采用1*8、1*5和1*3的卷積核進行特征提取,并在最后一層利用平均池化和全連接最為最終輸出。訓練時采用多分類交叉熵和Adam優(yōu)化器進行模型優(yōu)化。
圖3 基于卷積神經(jīng)網(wǎng)絡調制識別網(wǎng)絡結構
最后,借鑒殘差網(wǎng)絡在圖像識別中的成功應用[8],本文針對調制方式識別設計了一種殘差網(wǎng)絡結構模型,該模型如圖4所示。模型包含三個BLOCK,每一BLOCK由1*8、1*5和1*3的卷積核構成,同時由于層數(shù)的增加,為了避免訓練中的梯度消失問題,BLOCK中包含了Skip Connect模塊來實現(xiàn)訓練過程中殘差的傳遞,最后一層利用平均池化和全連接最為最終輸出進行分類。訓練時采用多分類交叉熵和Adam優(yōu)化器進行模型優(yōu)化。該網(wǎng)絡結構模型相比MLP和CNN而言層數(shù)更加深,針對電磁序列信號具備更好的序列特征表達能力。但由于每一個BLOCK的卷積核相對較少,參數(shù)量沒有MLP和CNN多,因此具備較高的計算效率。
圖4 提出的深度殘差網(wǎng)絡調制識別網(wǎng)絡結構
依據(jù)2.1節(jié)的電磁調制信號生成方式,本文建立生成了9類典型的數(shù)字通信信號作為實驗對象。實驗驗證中輸入為截取的4096長度信號,輸出為9類調制方式進行識別。在訓練中隨機生成5000個噪聲強度為5dB的數(shù)據(jù)集,并選取其中的20%作為測試數(shù)據(jù)集,剩下的80%作為訓練數(shù)據(jù)集進行神經(jīng)網(wǎng)絡訓練。以平均絕對誤差來評價訓練結果。
提出的雙向GRU調制識別網(wǎng)絡經(jīng)過訓練后,訓練過程如圖5所示,模型對這9類調制方式識別性能在90.45%,同時將網(wǎng)絡最后一層特征進行2維空間的可視化,可以發(fā)現(xiàn)特征具備一定區(qū)分度和判別性,實現(xiàn)了較好的數(shù)據(jù)低維特征提取效果。但是GRU雖然能夠達到一定的識別率,但還存在以下不足:面對4096長度的序列建摸中,GRU的在處理較長序列信號時訓練顯存開銷巨大,訓練耗時且很難達到最優(yōu)解;另一方面,GRU層數(shù)增加時,模型的訓練難度就會增加,因此該模型欠缺對更大規(guī)模數(shù)據(jù)和更多樣式數(shù)據(jù)的表示能力。
圖5 基于雙向GRU網(wǎng)絡的調制識別訓練
為了對比提出的殘差卷積網(wǎng)絡模型的效果,首先對MLP模型進行訓練和分類效果測試,9類的平均識別準確率僅為76%??梢哉f全連接網(wǎng)絡一方面參數(shù)量大,同時識別效果精度一般。其次,選取針對調制方式識別的CNN網(wǎng)絡結構(結構圖3所示)。從圖6上圖中可以看出,訓練的損失函數(shù)不斷下降,相比MLP該結構識別效果更好,識別準確率可以達到81%,同時具備更少的參數(shù)量。
圖6 提出的卷積網(wǎng)絡和殘差網(wǎng)絡調制識別結果對比圖
基于提出的殘差網(wǎng)絡模型,進行調制樣式識別的實驗,同樣的實驗設置下,該網(wǎng)絡識別結果如圖6所示??梢钥闯觯捎诓捎昧藲埐钅K使得訓練曲線快速收斂,驗證集合精度也不斷下降,9類的平均識別率達到96%,明顯高于MLP和基本的CNN模型。通過對三種1D卷積深層網(wǎng)絡模型的建立和對比,發(fā)現(xiàn)提出的殘差網(wǎng)絡調制識別模型可以較好的完成識別任務。
本文利用遞歸神經(jīng)網(wǎng)絡結構對電磁信號序列進行表示,提出了基于多層雙向GRU網(wǎng)絡結構。同時,從一維空間卷積表示序列的角度思考,提出了基于深度殘差卷積網(wǎng)絡的調制識別方法。利用建立的調制方式仿真數(shù)據(jù)集,對提出的方法與典型神經(jīng)網(wǎng)絡模型進行了對比實驗。實驗結果表明了本文提出方法具備更高的識別準確率和更好的特征表示能力。未來可以進一步考慮模型壓縮和剪枝的方法,再保證準確率的同時提高計算效率。