桂冠,王禹,黃浩
(南京郵電大學(xué)通信與信息工程學(xué)院,江蘇 南京 210003)
爆炸性增長的數(shù)據(jù)量、高速和低延遲的通信需求給通信系統(tǒng)帶來了巨大挑戰(zhàn),現(xiàn)有的通信系統(tǒng)難以滿足這些需求。此外,現(xiàn)有的通信理論在系統(tǒng)結(jié)構(gòu)信息的利用以及海量數(shù)據(jù)的處理方面存在根本的局限性,這意味著需要建立新的通信理論來滿足未來無線通信系統(tǒng)的需求。
自阿爾法狗擊敗李世石起,深度學(xué)習(xí)就引起了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。由于深度學(xué)習(xí)在面對結(jié)構(gòu)化信息與海量數(shù)據(jù)時的巨大優(yōu)勢,諸多通信領(lǐng)域的研究者也將目光投向深度學(xué)習(xí)?;谏疃葘W(xué)習(xí)的通信技術(shù)在信號分類、信道估計、性能優(yōu)化[1-2]等方面可能具有很大的潛力,其原因主要有如下 3個方面。
1)大多數(shù)現(xiàn)有的通信系統(tǒng)都是逐塊設(shè)計的,這意味著這些通信系統(tǒng)由多個模塊組成(例如發(fā)射機、調(diào)制器、編碼器等)。對于這種基于模塊設(shè)計的通信體系結(jié)構(gòu),通信領(lǐng)域的學(xué)者已經(jīng)開發(fā)了許多技術(shù)來優(yōu)化每個模塊的性能,但是每個模塊的性能達到最佳,并不意味著整個通信系統(tǒng)的性能達到最佳。一些新的研究[3-9]表明,端到端優(yōu)化(即優(yōu)化整個通信系統(tǒng))優(yōu)于優(yōu)化單個模型。深度學(xué)習(xí)為實現(xiàn)端到端性能最大化提供了一種先進且強力的工具。
2)在無線通信系統(tǒng)中,在復(fù)雜、大規(guī)模的通信場景下,信道狀況變化迅速。許多傳統(tǒng)的通信模型,如基于聯(lián)合空間分復(fù)用(JSDM, joint space division multiplexing)的大規(guī)模多輸入多輸出(MIMO,multiple input multiple output)模型[10]嚴重依賴信道狀態(tài)信息(CSI,channel state information),它們的性能在非線性時變信道下會發(fā)生惡化[3],準確獲取時變信道的 CSI對系統(tǒng)性能至關(guān)重要。通過利用深度學(xué)習(xí)技術(shù),有可能使通信系統(tǒng)可以學(xué)習(xí)突變的信道模型,并及時反饋信道狀態(tài)。
3)目前,具有內(nèi)存共享的大規(guī)模并行架構(gòu)的計算體系具有良好的能耗比,例如圖形處理單元(GPU,graphics processing unit)。并行計算可以吞吐大量數(shù)據(jù)[3],十分符合現(xiàn)有的通信場景。此外,基于深度學(xué)習(xí)的通信技術(shù)可以在 GPU上正常運行,并且可以充分利用這種并行架構(gòu)。
基于上述考慮,為了適應(yīng)未來無線通信場景中的新需求,本文主要研究無線通信中的深度學(xué)習(xí)技術(shù),包括基于深度學(xué)習(xí)的調(diào)制信號識別技術(shù)以及基于深度學(xué)習(xí)的波束賦形技術(shù),它們將促進未來無線通信的進一步發(fā)展。
自動調(diào)制模式識別(AMR, automatic modulation recognition)是一種識別信號調(diào)制方式的技術(shù),該技術(shù)在軍用領(lǐng)域和民用領(lǐng)域都發(fā)揮著巨大的作用。在軍用領(lǐng)域,調(diào)制模式識別主要用于電子戰(zhàn)(EW,electronic warfare),用來恢復(fù)截獲的敵方信號,獲取敵方情報。在民用領(lǐng)域,自動調(diào)制模式識別主要用于頻譜監(jiān)測和干擾識別。在現(xiàn)代無線通信中頻譜資源是最寶貴的資源,而頻譜資源的短缺也造成了某些機構(gòu)或者個人非法占用已分配好的頻段,這會嚴重干擾合法用戶的正常通信,甚至產(chǎn)生安全問題。自動調(diào)制模式識別可以協(xié)助頻譜監(jiān)測系統(tǒng)分析各個頻段信號的調(diào)制方式,進而解調(diào)出被監(jiān)測信號,分析被監(jiān)測信號的具體屬性,實現(xiàn)對頻譜資源的監(jiān)控。
鑒于深度學(xué)習(xí)在圖像及文本分類任務(wù)方面的強大性能,本文將深度學(xué)習(xí)引入自動調(diào)制模式識別。具體而言,基于深度學(xué)習(xí)的調(diào)制模式識別是在接收到未知信號進行參數(shù)處理后,將得到的基帶信號利用深度神經(jīng)網(wǎng)絡(luò)來識別信號的調(diào)制方式,如圖1所示。本文采用3種不同的神經(jīng)網(wǎng)絡(luò),分別為卷積神經(jīng)網(wǎng)絡(luò)(CNN,convolution neural network)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN,recurrent neural network)以及深度神經(jīng)網(wǎng)絡(luò)(DNN, deep neural network)。主要識別的信號調(diào)制方式包括二進制相移鍵控(BPSK,binary phase-shift keying)、正交相移鍵控(QPSK,quadrature phase-shift keying)、八進制相移鍵控(8PSK, 8 phase-shift keying)、連續(xù)相位頻移鍵控(CPFSK, continuous-phase frequency-shift keying)、高斯頻移移位鍵控(GFSK, Gaussian frequency-shift keying)、四級脈沖幅度調(diào)制(PAM4, 4 pulse-amplitude modulation)以及十六相正交幅度調(diào)制(16QAM, 16 quadrature amplitude modulation)這7種信號調(diào)制方式。采用的數(shù)據(jù)集是由信號的同向分量(I,in-phase component)和正交分量(Q,quadrature component)組成的IQ樣本。
圖1 基于深度學(xué)習(xí)的調(diào)制模式識別
基于CNN、RNN、DNN這3種神經(jīng)網(wǎng)絡(luò)的調(diào)制模式識別算法在各個信噪比下的準確度如圖2所示。從圖2可以看到,基于CNN的調(diào)制模式算法的性能優(yōu)越。因此,在圖3中給出了基于CNN的調(diào)制模式識別在信噪比分別為-6 dB、0 dB、6 dB和12 dB時的混淆矩陣。由圖3可以看出,在信噪比為0 dB時,除了部分QPSK信號和8PSK信號難以區(qū)分外,基于CNN 的調(diào)制模式識別可以正確區(qū)分其他信號,并且在信噪比大于6 dB時,可以準確識別實驗中所涉及的7種調(diào)制信號。實驗結(jié)果驗證了深度學(xué)習(xí),尤其是CNN,不僅適用于各類計算視覺任務(wù),而且可以運用在調(diào)制模式識別中,并且能取得良好的性能。
圖2 基于不同調(diào)制模式識別算法的識別準確度
圖3 基于CNN的調(diào)制模式識別在不同信噪比下的混淆矩陣
波束賦形(beamforming)又叫波束成形、空域濾波,是一種使用傳感器陣列定向發(fā)送和接收信號的信號處理技術(shù)[11]。波束賦形也是5G的核心技術(shù)之一。本文考慮的場景是下行鏈路傳輸場景,如圖4所示。
圖4 下行鏈路傳輸場景的波束賦形
在此場景下,最常使用的傳統(tǒng)算法是加權(quán)最小均方誤差(WMMSE,weighted minimum meansquare error)算法,該算法可以獲得該問題的次優(yōu)解,但是計算復(fù)雜度高。為了降低計算復(fù)雜度,本文提出了一種基于無監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò),以實現(xiàn)快速波束賦形,其具體結(jié)構(gòu)如圖5所示。
本文在不同信噪比下測試了傳統(tǒng)的WMMSE與基于無監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)的性能,如圖6所示。從圖6中可以看出,相較于WMMSE,基于無監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)的性能損失極低,但是2種算法的計算復(fù)雜度差別較大,可以體現(xiàn)在算法的計算時間上。圖7為在不同發(fā)射天線數(shù)下,2種算法的計算復(fù)雜度,其中WMMSE僅能運行于中央處理器(CPU,central processing unit),其計算時間為圖 7中的WMMSE(python)-CPU comp。但基于無監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)既可采用CPU運行,也可以利用GPU的并行計算能力加速運行,計算時間分別為圖 7中的DNN-CPU comp.和DNN-GPU parallel comp.。從圖7可以看出,基于無監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)計算時間遠少于WMMSE。結(jié)合圖6和圖7可知,在用戶數(shù)與天線數(shù)有限的場景下,本文方案在不同的信噪比下性能損失極低,并且計算復(fù)雜度得到了極大程度的降低。此外,基于無監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)可以采用GPU并行加速計算,可以進一步減少算法的運行時間。
圖5 基于無監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)
圖6 不同信噪比下,WMMSE與基于無監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)的性能對比
圖7 不同發(fā)射天線數(shù)下,WMMSE與基于無監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)的計算復(fù)雜度
數(shù)據(jù)集的質(zhì)量與數(shù)量對基于深度學(xué)習(xí)的通信系統(tǒng)的性能影響巨大。在計算機科學(xué)中,基于深度學(xué)習(xí)的自然語言處理(NLP, nature language processing)、計算機視覺(CV, computer vision)和自動駕駛技術(shù)的飛速發(fā)展,很大程度上得益于計算機科學(xué)領(lǐng)域存在著許多著名的、有效的數(shù)據(jù)集,如ImageNet和 MNIST。然而,在無線通信領(lǐng)域,現(xiàn)有的、公用的數(shù)據(jù)集卻很少,因此,需要為各類通信問題創(chuàng)建一個通用且可靠的數(shù)據(jù)集,或者開發(fā)新的仿真軟件,便于模擬各種通信場景,產(chǎn)生相應(yīng)的數(shù)據(jù)集,最終目標是建立一個類似于 ImageNet的龐大數(shù)據(jù)集。
在基于深度學(xué)習(xí)的通信框架下,如何設(shè)計深度神經(jīng)網(wǎng)絡(luò)是研究者首先要面對的問題。目前,許多應(yīng)用于通信領(lǐng)域的深度學(xué)習(xí)模型都是基于通用模型設(shè)計的,例如 CNN通常用于圖像分類問題,而RNN通常用于NLP領(lǐng)域,因此,需要建立適用于無線通信的深度學(xué)習(xí)模型。雖然目前計算機科學(xué)領(lǐng)域通用的模型可以應(yīng)用于通信領(lǐng)域,但是在實際的通信工程項目中,建立適用于通信場景的通用模型不僅有利于優(yōu)化通信系統(tǒng),而且可以降低模型選擇的成本和時間。
雖然深度學(xué)習(xí)在計算機視覺、自然語言處理等領(lǐng)域均取得了遠超傳統(tǒng)算法的效果,但是目前的深度神經(jīng)網(wǎng)絡(luò)的參數(shù)過多(參數(shù)量一般為幾千萬到上億),且計算量極大。以 VGG-16為例,其參數(shù)量超過 1.38億,實際利用 ImageNet訓(xùn)練得到的VGG-16的模型大小超過500 MB,并且其計算量極大,需要進行309億次浮點運算。當(dāng)前的深度學(xué)習(xí)只能依靠云端的 GPU加速運算,云計算的帶寬、時延、安全等將面臨嚴峻的挑戰(zhàn)。這些都極大地限制了深度學(xué)習(xí)在嵌入式設(shè)備上的應(yīng)用。
同樣,基于深度學(xué)習(xí)的通信系統(tǒng)也很難部署在移動電話等小型終端設(shè)備上。由于深度學(xué)習(xí)模型的參數(shù)存在著巨大的冗余,可以對深度學(xué)習(xí)模型進行壓縮和加速,進而構(gòu)建輕量級網(wǎng)絡(luò),這也是未來相關(guān)技術(shù)發(fā)展的必然趨勢。具體而言,一方面,可以考慮剪枝與結(jié)構(gòu)化稀疏約束,剔除部分冗余結(jié)構(gòu),加快計算速度。另一方面,也可以考慮對網(wǎng)絡(luò)模型的參數(shù)進行量化和哈夫曼編碼,進一步壓縮網(wǎng)絡(luò)模型。
由于無線信道的開放性,無線通信系統(tǒng)極易受到攻擊、仿冒與竊聽,其物理層安全問題備受關(guān)注。此外,無線通信系統(tǒng)日趨復(fù)雜,系統(tǒng)各個模塊之間存在著緊密的關(guān)聯(lián),一旦某個模塊受到攻擊將會“牽一發(fā)而動全身”,影響整個無線通信系統(tǒng)的運行。雖然傳統(tǒng)安全防護機制可以在一定程度上保障通信安全,但是它們并不適用于處理超大規(guī)模網(wǎng)絡(luò)以及超大規(guī)模網(wǎng)絡(luò)所帶來的海量數(shù)據(jù),傳統(tǒng)安全防護機制難以滿足未來無線通信系統(tǒng)的安全需求。
鑒于深度學(xué)習(xí)在處理海量數(shù)據(jù)時的巨大優(yōu)勢,可以考慮將深度學(xué)習(xí)引入到解決物理層安全問題中,尤其是物理層異常數(shù)據(jù)檢測。其主要思想是把異常數(shù)據(jù)檢測問題歸結(jié)為基于深度學(xué)習(xí)的模式識別分類問題,利用深度神經(jīng)網(wǎng)絡(luò)對通信系統(tǒng)中產(chǎn)生的數(shù)據(jù)進行訓(xùn)練,構(gòu)建分類模型對異常數(shù)據(jù)和正常數(shù)據(jù)進行分類。得益于深度神經(jīng)網(wǎng)絡(luò)對高維數(shù)據(jù)的強大的表示能力和分析能力,該方法有望大幅提高異常數(shù)據(jù)的檢測效率。
鑒于深度學(xué)習(xí)在圖像、語音、文本等領(lǐng)域表現(xiàn)出的強大性能,本文研究了基于深度學(xué)習(xí)的物理層無線通信技術(shù),具體研究了2種基于深度學(xué)習(xí)的物理層無線通信技術(shù)——基于深度學(xué)習(xí)的調(diào)制模式識別及基于無監(jiān)督學(xué)習(xí)的快速波束賦形技術(shù),并且展示了它們杰出的性能。但是必須承認的是,目前許多技術(shù)實施尚未處于初期探索階段,使用深度學(xué)習(xí)解決物理層無線通信問題是一條漫長的道路,而且這條道路上還有許多障礙,比如如何建立通信數(shù)據(jù)集,如何選取或設(shè)計適用于通信場景的神經(jīng)網(wǎng)絡(luò)以及如何將基于深度學(xué)習(xí)的通信技術(shù)運用于小型通信設(shè)備等。但是值得堅信的是,基于深度學(xué)習(xí)的物理層無線通信技術(shù)將會引領(lǐng)通信技術(shù)的進一步發(fā)展。