白 迪,崔勇強*,王曉磊,李永輝
(1.中南民族大學電子信息工程學院,武漢 430074;2.武漢大學電子信息學院,武漢 430072)
近幾年來,無人機“黑飛”事件[1-2]呈高發(fā)態(tài)勢,而無線(局域)網(wǎng)/無線保真(wireless fidelity,Wi-Fi)是目前使用最為廣泛的互聯(lián)無線通信協(xié)議標準,眾多無人機采用Wi-Fi作為其通信數(shù)據(jù)鏈,故研究Wi-Fi的鏈路層特征盲識別對于實現(xiàn)基于Wi-Fi的智能通信或無人機的反制都具有重要意義。
Wi-Fi的鏈路層的調制方式采用的是BPSK/QPSK/QAM/CCK等,目前調制類型識別算法的研究中,各國研究者基于傳統(tǒng)的數(shù)理統(tǒng)計和新的深度學習的方法[3-9]進行了深入的研究,完成了各種調制方式在各種信噪比下的盲識別算法,取得了前所未有的研究成果。Wi-Fi采用的是低密度奇偶校驗碼(low density parity check code,LDPC)編碼,針對LDPC編碼方式的盲識別問題也吸引了各國專家進行了深入的研究[10-17],Refaey等[10]設計了一種智能接收機,能夠從截獲的數(shù)據(jù)流中盲探測LDPC編碼。文獻[8]提出了一種新的LDPC信道編碼識別算法,從譯碼的角度來識別LDPC編碼類型。文獻[9]針對一個有限編碼數(shù)據(jù)集,提出了一種Cosine Conformity(CC)算法,能夠從3種編碼方式中識別LDPC編碼,相比同類算法,性能提升1.5 dB。文獻[13-17]從人工特征提取以及數(shù)理統(tǒng)計的方法著手就識別率、校驗矩陣、誤碼條件等方面的問題展開研究,LDPC編碼類型的盲識別的識別率取得了較大的提升。而LDPC編碼參數(shù)的盲識別卻是Wi-Fi鏈路層特征盲識別的疑難問題,存在識別率不高、計算復雜度高等問題,故現(xiàn)提出基于深度學習的LDPC編碼參數(shù)盲識別算法,以求在低復雜度、低延時的前提下,提高在各種誤碼條件下的識別準確率。
根據(jù)802.11標準,Wi-Fi采用的是LDPC編碼,編碼參數(shù)有信息位碼長和編碼碼率兩種。其中信息位碼長分為648、1 296和1 944 bit三種,碼率有1/2、2/3、3/4和5/6四種。Wi-Fi編碼參數(shù)識別即從截獲接收的波形信號中識別其具體使用的編碼碼長及碼率,目前各國研究者對信道編碼盲識別進行了深入的研究。文獻[18]針對低信噪比條件下現(xiàn)有LDPC編碼碼率參數(shù)識別度不高的問題提出了一種新的編碼碼率識別算法,該算法首先利用信道輸出的軟信息,將編碼校驗關系映射到對數(shù)似然比域。其仿真結果表明,在給定先驗編碼集合的閉集應用模式下,識別率可提高2~5 dB。文獻[19]針對LDPC編碼提出了一種新的編碼碼長和碼率的識別算法,該算法充分利用了數(shù)據(jù)的均值和均方差的統(tǒng)計特征,在高信噪比的條件下識別率較高。文獻[20]研究了在誤碼信道條件(高斯白噪聲)下IEEE 802.11標準的Wi-Fi的編碼方式-LDPC編碼碼長和碼率識別算法,其實驗結果表明調制階數(shù)越低,編碼參數(shù)的識別率越高。
上述學者針對LDPC編碼參數(shù)的盲識別研究都取得了較好的研究成果,進一步更新了鏈路層特征盲識別的研究成果。然而上述無論是編碼方式的研究還是LDPC編碼參數(shù)的識別都基于的傳統(tǒng)的人工特征提取+數(shù)理統(tǒng)計分析的方法,該方法面臨人工特征提取的特征差異性較大,并且統(tǒng)計特征難以發(fā)掘,其次數(shù)理統(tǒng)計的計算過程復雜,導致工程實踐難度較大,并且計算耗時較高,不利于工程實踐的低復雜度、低延時的要求。除此外,傳統(tǒng)數(shù)理統(tǒng)計算法在較高誤碼率的條件下的識別率不高,受誤碼率影響較大。目前,深度學習(deep learning,DL)算法由于良好的自適應性和優(yōu)異的感知精度,備受研究者們青睞,故以深度學習算法為技術手段,通過搭建并且訓練合適的神經網(wǎng)絡模型,力求從解調的有誤碼的數(shù)據(jù)集中盲提取數(shù)據(jù)的深層次特征,挖掘數(shù)據(jù)的內在聯(lián)系,實現(xiàn)可工程化的編碼參數(shù)盲識別算法。
系統(tǒng)整體方案圖如圖1所示,圖像處理單元服務器(graphics processing unit server,GPU-Server)負責信息序列的生成及其LDPC編碼,編碼后的序列一方面經過千兆以太網(wǎng)線進入發(fā)射機之后經過調制、成型濾波處理后輸入到一體化收發(fā)器ADRV9009內,經過其上變頻、濾波處理后經發(fā)射天線輻射到空氣中;另一方面編碼后的序列經過另外一路千兆以太網(wǎng)線進入到接收機進行存儲,便于統(tǒng)計信道誤碼率。接收機經過接收天線從有損信道接收到調制波形后經過濾波、解調后,將時域比特數(shù)據(jù)傳輸?shù)紾PU-Server進行后續(xù)的神經網(wǎng)絡模型的訓練和預測,以便進一步從接收的IQ數(shù)據(jù)集中挖掘數(shù)據(jù)深層次的互聯(lián)關系,盲識別發(fā)送端所用LDPC編碼參數(shù)。接下來從LDPC編碼參數(shù)盲識別深度神經網(wǎng)絡的設計、數(shù)據(jù)集的構建、平臺的選擇三個方面進行詳細論述。
IEEE 802.11標準規(guī)定的Wi-Fi的LDPC編碼信息位碼長有648、1 296和1 944 bit三種,碼率有1/2、2/3、3/4和5/6四種,故Wi-Fi的LDPC編碼參數(shù)一共有12種可能的組合。將該LDPC編碼參數(shù)的盲識別問題轉換為一個多分類問題。圖2給出了設計的深度網(wǎng)絡模型,模型采用深度神經網(wǎng)絡(deep neural network,DNN)模型,R表示網(wǎng)絡節(jié)點個數(shù)。
圖2 深度神經網(wǎng)絡模型圖 Fig.2 Deep neural network model diagram
模型一共11層,每層的神經元的數(shù)量分別為1 024、512、256、128、64、32、64、128、256、512、1 024,最后輸出層Softmax的神經元數(shù)量為13,與總分類數(shù)量匹配。解調后的比特序列通過預處理,保存為定長的一維張量,輸入到模型的輸入層。該深度網(wǎng)絡模型通過不斷的迭代、學習,自動提取數(shù)據(jù)內在特征,優(yōu)化自己的網(wǎng)絡參數(shù),最終預判數(shù)據(jù)所使用的編碼參數(shù)。表1給出了每層神經網(wǎng)絡參數(shù)、激活函數(shù)以及優(yōu)化策略和各層的輸出數(shù)據(jù)維度列表。
表1 深度神經網(wǎng)絡各層參數(shù)詳情列表Table 1 Detail list of neural network parameters
設計的深度網(wǎng)絡模型層數(shù)較多,為了防止過擬合,在每層的全連接層的優(yōu)化配置中都加入了l2的正則化項,優(yōu)化參數(shù)為2。除此外,在層與層之間加入了BatchNormalization優(yōu)化項,進一步避免網(wǎng)絡模型的過擬合。該深度神經網(wǎng)絡模型采用遷移學習的模式,不斷調整模型的訓練參數(shù),例如學習率、batch-size、epoch等,逐步提高驗證集的預測準確率,直至得到滿意的結果。
數(shù)據(jù)是深度學習的核心驅動力,使用的數(shù)據(jù)采用MATLAB仿真+軟件無線電半實物的模式生成。表2給出了LDPC編碼的碼長和碼率以及原始信息位長度之間的關系。從表2中可以看出,各種不同的信息位長度數(shù)據(jù)跟不同的碼率搭配,最終生成Wi-Fi所需要的3種編碼碼長。信息位碼長數(shù)據(jù)采用MATLAB隨機生成的方式,然后根據(jù)對應的碼率,調用MATLAB的comm.LDPCEncoder()函數(shù)隨機生成多組編碼數(shù)據(jù)。如圖1所示,將這些生成的數(shù)據(jù)通過千兆以太網(wǎng)線灌入到軟件無線電平臺中,經過處理后通過發(fā)射通道(transmit,TX)通道發(fā)射出去。在接收端,經過相應的濾波、解調后得到接收數(shù)據(jù)。為了滿足輸入層5 000 bit的張量要求,這里將接收到的多組編碼數(shù)據(jù)前后拼接,截取前面5 000 bit,作為一維的輸入數(shù)據(jù),并且打上相應的標簽。另外,為了準確研究誤碼率對編碼參數(shù)識別的影響,實驗時通過在收發(fā)機之間接入信道模擬器(型號:Spirent TAS4500,made in Dongguan Mastery Electronics Co.,Ltd.,Dongguan,China)取代收發(fā)天線,以便可以定量生成制定誤碼率的數(shù)據(jù)集。信道模擬器可以模擬射頻信道的主要特征,如多徑數(shù)量、延時、多普勒頻率偏移、信道噪聲等。通過設置信道模擬器的參數(shù),控制信道質量,進一步控制接收數(shù)據(jù)的誤碼率。通過如此的方式,不斷循環(huán)往復,最終生成在不同誤碼率條件下的50 000條有效數(shù)據(jù)。實驗時,按照8/2的比例分配給訓練數(shù)據(jù)集和驗證數(shù)據(jù)集。
表2 深度神經網(wǎng)絡數(shù)據(jù)集列表Table 2 Data list of deep neural network
數(shù)據(jù)的構造采用MATLAB,數(shù)據(jù)的收發(fā)硬件系統(tǒng)采用GNU Radio軟件無線電平臺,硬件平臺由ZCU102+ADRV9009硬件平臺構成,GPU的信號為NVIDIA GeForce GTX1080TI,所有數(shù)據(jù)的訓練和測試都在GPU上進行,深度學習架構軟件平臺為Keras 2.3.1,其以Tensorflow 2.0作為后端處理軟件。
基于圖1的總體研究方案,利用上述構建的數(shù)據(jù)集對所提出的深度神經網(wǎng)絡模型進行訓練,直至模型loss收斂,得到訓練好的網(wǎng)絡權重參數(shù)集。論文設計了兩個實驗,分別從LDPC編碼參數(shù)識別的總體效果以及單項參數(shù)的識別率兩方面對所提深度神經網(wǎng)絡模型的預測效果做進一步討論。
為了驗證所訓練的深度神經網(wǎng)絡模型對所有Wi-Fi制式下的LDPC的編碼參數(shù)的預測性能。實驗1基于圖1的研究方案,通過不斷調整信道模擬器中噪聲參數(shù)的值以便進一步控制接收機接收序列的誤碼率?;谶@種方法,生成了10 000條包含了12種編碼參數(shù)在不同誤碼率條件下的測試數(shù)據(jù)集,各編碼參數(shù)的數(shù)據(jù)總量大致相等。將該數(shù)據(jù)集灌入到所訓練的神經網(wǎng)絡模型中,通過比對數(shù)據(jù)的標簽label與網(wǎng)絡預測的pre_label是否一致來判定預測是否準確,并且基于平均統(tǒng)計的方法來評估網(wǎng)絡的總體性能。
圖3給出了所訓練的深度神經網(wǎng)絡模型總體的預測準確率的曲線圖。從圖3可以看出,隨著接收序列誤碼率的逐漸增加,網(wǎng)絡模型的編碼參數(shù)識別率逐漸降低。在誤碼率低于0.07時,網(wǎng)絡模型能夠保證95%的綜合預測準確率。當接收序列的誤碼率達到0.1時,模型仍然能夠達到91.5%的準確率。故圖3說明所訓練的深度神經網(wǎng)絡模型的普適性較好,魯棒性較高,能夠勝任各種不同條件下的預測任務,取得較高的預測準確率。
圖3 不同信噪比條件下LDPC編碼參數(shù)綜合識別率曲線圖Fig.3 Comprehensive recognition rate of LDPC coding parameters under different SNR
為了進一步分析所訓練的深度神經網(wǎng)絡模型對各種不同編碼參數(shù)的預測性能的差異,基于上述測試數(shù)據(jù)的生成方法,實驗2針對12種編碼參數(shù)在不同信噪比條件下各生成了5 000條測試數(shù)據(jù),通過實驗1的測試方法來具體分析各種編碼參數(shù)的預測性能。
圖4給出了在不同信噪比條件下LDPC的12種編碼參數(shù)在所訓練的深度神經網(wǎng)絡模型上的性能表現(xiàn)。從圖4可以看出,在誤碼率小于0.08時,各項編碼參數(shù)的準確率都優(yōu)于90%。碼長為1 296、碼率為1/2的編碼參數(shù)在誤碼率為0.1的條件下仍然能夠達到92%的預測準確率,性能表現(xiàn)最為優(yōu)異。并且,當碼長相同時,低碼率的數(shù)據(jù)的識別率較高。原因可能是對于截取的相同的5 000 bit的數(shù)據(jù)里,低碼率的約束比特較多,約束關系特征更容易提取。
圖4 不同信噪比條件下LDPC編碼各項參數(shù)識別率曲線圖Fig.4 Recognition rate of LDPC coding parameters under different SNR
通信鏈路層特征盲提取是智能通信和通信對抗領域的重點研究內容,其中的編碼參數(shù)識別一直是重難點問題,存在著在高誤碼條件下識別率不高、數(shù)理統(tǒng)計算法在工程實現(xiàn)時無法滿足低復雜度以及低延時的要求的問題。以最常見的無線互聯(lián)標準IEEE 802.11規(guī)定的Wi-Fi為切入點,通過將Wi-Fi的LDPC編碼參數(shù)盲識別問題轉換為一個分類問題,并且引入了深度學習算法。通過搭建深度學習網(wǎng)絡,構建滿足要求的訓練、驗證、測試數(shù)據(jù)集對模型進行訓練和驗證。實驗結果得出如下結論。
(1)在無誤碼的條件下,編碼參數(shù)預測準確度高達95.32%。
(2)在高達10%的誤碼條件下,所訓練的深度神經網(wǎng)絡模型仍能夠確保LDPC編碼參數(shù)盲識別的綜合預測準確率優(yōu)于91.5%。相比同類算法,取得了較大的進步,并且現(xiàn)有的嵌入式深度學習平臺可輕松移植該網(wǎng)絡模型進行實際的應用,保證了工程的可實踐性。