程芳芳,王旭東,吳 楠
(大連海事大學 信息科學技術(shù)學院,遼寧 大連 116026)
傳統(tǒng)無線通信系統(tǒng)可以簡單描述為傳輸信號經(jīng)過發(fā)射機調(diào)制編碼后傳送到信道,接收機在有信道干擾的情況下完美地完成解調(diào)和解碼,從而恢復(fù)出原始傳輸信號的過程。這種方法可以單獨優(yōu)化每個模塊,使每個模塊達到最優(yōu),在信道估計[1-4]、信號檢測[5]、信道編解碼[6-7]及調(diào)制識別[8-9]等方面有著廣泛應(yīng)用;缺點是需要大量的專家知識,并且優(yōu)化每個子模塊不能保證實現(xiàn)全局最優(yōu)的性能[10]。隨著近幾年神經(jīng)網(wǎng)絡(luò)技術(shù)以及專用硬件的發(fā)展,無線通信領(lǐng)域的研究學者提出了基于深度學習(Deep Learning,DL)的端到端通信方案,這一方法能夠聯(lián)合優(yōu)化發(fā)射機和接收機,大幅度提升通信系統(tǒng)的可靠性和有效性。文獻[11]提出了一種發(fā)射機和接收機均由深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)構(gòu)成的端到端通信系統(tǒng)實現(xiàn)方案。文獻[12]在此基礎(chǔ)上進行了改進,用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)構(gòu)建收、發(fā)信機,獲得了泛化性較高的一種設(shè)計方案。文獻[13]提出了一種基于CNN的正交頻分復(fù)用(Orthogonal Frequency Division Multiplexing,OFDM)自編碼正交頻分多址技術(shù),用于復(fù)雜信道環(huán)境下的船聯(lián)網(wǎng)信息傳輸,且性能優(yōu)于傳統(tǒng)的OFDM系統(tǒng)。
端到端通信系統(tǒng)設(shè)計的一個關(guān)鍵問題是信道傳輸特性描述,在以往的研究中通常采用一個假設(shè)的數(shù)學模型來表示信道,但實際場景受到多種噪聲的干擾,信道會隨著時間、地點的變化而變化。簡單模型可能無法正確反映實際傳輸場景中信號的傳輸受到的影響,使得性能分析評估不夠準確,因此越來越多的人開始尋求新的信道建模方法,以保證通信系統(tǒng)建模分析的準確性和可靠性。
深度學習的迅速發(fā)展使人們意識到可以將神經(jīng)網(wǎng)絡(luò)應(yīng)用于通信領(lǐng)域以解決現(xiàn)有問題。文獻[14]提出了一種用生成對抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)來逼近隨機信道模型的方法,結(jié)果表明,該方案能夠準確地學習到隨機信道特征。文獻[15]在GAN的基礎(chǔ)上引入條件信息,提出了用條件生成對抗網(wǎng)絡(luò)(Conditional Generative Adversarial Network,CGAN)進行信道建模的方法,將學習到的信道應(yīng)用于端到端通信系統(tǒng)中,提供發(fā)射機和接收機之間進行梯度反向傳播的橋梁,更新權(quán)重和偏置,最終得到與傳統(tǒng)信道估計方法相似的性能。
針對原始的CGAN采用全連接層(Fully Connected Layer,FC)學習長傳輸序列模型時準確度不夠以及計算量大的問題,本文將CNN引入CGAN,提出了一種基于CNN的條件對抗生成網(wǎng)絡(luò)的改進方案。方案采用CNN構(gòu)建GAN網(wǎng)絡(luò)的生成器和判別器,同時加入全連接層,對輸入的每個元素進行處理。通過對參數(shù)設(shè)計及網(wǎng)絡(luò)結(jié)構(gòu)調(diào)整,獲得了適應(yīng)不同調(diào)制方式和信道類型的學習網(wǎng)絡(luò),可以實現(xiàn)傳輸長序列的信道建模,并且較好地解決了GAN收斂慢、計算量大的問題。采用不同的調(diào)制方式在加性高斯白噪聲(Additive White Gaussian Noise,AWGN)信道和瑞利衰落信道下進行仿真實驗,驗證了DCGAN對于傳輸長序列信道建模的有效性。該方法可以在固定信噪比(Signal-to-Noise Ratio,SNR)下進行訓練,推廣到整個SNR范圍內(nèi)工作。此外,利用不同的評價標準進行性能評估對比,證明了方法的準確性。
2014年,Goodfellow等[16]在國際會議上發(fā)表了有關(guān)生成對抗網(wǎng)絡(luò)的論文,主要靈感來源于博弈論中零和博弈的思想。應(yīng)用到深度學習神經(jīng)網(wǎng)絡(luò)上來說,GAN網(wǎng)絡(luò)是通過對抗訓練的方式來使得生成網(wǎng)絡(luò)產(chǎn)生的樣本服從真實樣本分布。相比傳統(tǒng)的模型,生成對抗網(wǎng)絡(luò)的特點是有兩個網(wǎng)絡(luò)進行對抗訓練:一個是生成網(wǎng)絡(luò)(Generator Network),用G表示;另一個是判別網(wǎng)絡(luò)(Discriminator Network),用D表示。和單目標的優(yōu)化任務(wù)相比,生成對抗網(wǎng)絡(luò)的兩個網(wǎng)絡(luò)的優(yōu)化目標剛好相反,GAN中生成器G的梯度更新信息來自判別器D,而不是來自數(shù)據(jù)樣本,因此生成對抗網(wǎng)絡(luò)的訓練比較難,往往不太穩(wěn)定。一般情況下,需要平衡兩個網(wǎng)絡(luò)的能力。對于判別網(wǎng)絡(luò)來說,一開始的判別能力不能太強,否則難以提升網(wǎng)絡(luò)的能力。但是,判別器的判別能力也不能太弱,否則針對它訓練的生成網(wǎng)絡(luò)也不夠完美,最終需要的結(jié)果是兩者達到納什均衡。
生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)的主要功能是:生成網(wǎng)絡(luò)GG(n)是一個生成式的網(wǎng)絡(luò),它接收一個隨機的噪聲n,通過這個噪聲生成樣本。判別網(wǎng)絡(luò)DD(i)實際上是一個二分類的分類器,目標是區(qū)分樣本i是來自于真實分布pr(i)還是來自于生成模型pg(i),其中標簽y=1表示來自于真實分布,y=0表示來自生成模型。判別網(wǎng)絡(luò)y=0的輸出為屬于真實數(shù)據(jù)分布的概率為
P(y=1|i)=DD(i),
(1)
則樣本來自生成模型的概率為
P(y=0|i)=1-DD(i)。
(2)
給定一個樣本(i,y),y={1,0}表示其來自于pr(i)還是pg(i),判別網(wǎng)絡(luò)的目標函數(shù)為最小化交叉熵,即
(3)
(4)
公式(4)可以進一步由公式(5)表示:
(5)
生成網(wǎng)絡(luò)的目標剛好和判別網(wǎng)絡(luò)相反,即讓判別網(wǎng)絡(luò)將生成的樣本錯判為真實樣本,即
(6)
公式(6)進一步轉(zhuǎn)化為
(7)
式(6)和式(7)兩個目標函數(shù)是等價的,但公式(6)的梯度性質(zhì)更好。對于函數(shù)lb(x)來說,假設(shè)x∈(0,1),x接近1時的梯度比接近0時小很多。因此當判別網(wǎng)絡(luò)D以很高的概率認為生成網(wǎng)絡(luò)G產(chǎn)生的樣本是假樣本時,即(1-DD(GG(n)))趨向于1,不利于優(yōu)化。生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)之間是相互競爭的關(guān)系,它們的性能在對抗中一次次提高。若用目標函數(shù)表示該過程,則可表示為
En~pn(n)[lb(1-DD(GG(n)))]。
(8)
式中:E[·]表示計算統(tǒng)計平均。
2014年,Mirza等[17]在《Computer Science》上發(fā)表了CGAN的論文[17]。如果生成網(wǎng)絡(luò)G和判別網(wǎng)絡(luò)D都以接收到的導頻信息c作為條件信息,則GAN可以擴展為條件模型,只需要將條件信息c饋入生成網(wǎng)絡(luò)G和判別網(wǎng)絡(luò)D中作為附加輸入。因此,一般生成網(wǎng)絡(luò)G的輸出為GG(n|c),鑒別器D的輸出為DD(i|c)。CGAN的優(yōu)化目標相比GAN則變?yōu)?/p>
En~pn(n)[lb(1-DD(GG(n|c)))]。
(9)
本文在CGAN網(wǎng)絡(luò)的基礎(chǔ)上引入CNN,構(gòu)成DCGAN網(wǎng)絡(luò)。但優(yōu)化目標與CGAN網(wǎng)絡(luò)相同,其中生成器和判別器都由CNN和全連接層構(gòu)成。引入了條件信息c和CNN的DCGAN網(wǎng)絡(luò)模型如圖1所示,生成器的輸入由n和c兩部分組成,其中n為輸入噪聲,生成器生成的虛假數(shù)據(jù)和真實數(shù)據(jù)以及條件信息c一同作為判別器的輸入,判別器判別輸入樣本的真假,如果樣本是真實數(shù)據(jù)判為Real,是生成的虛假數(shù)據(jù)則判為Fake。
圖1 CGAN網(wǎng)絡(luò)系統(tǒng)組成結(jié)構(gòu)
將信道建模和端到端通信結(jié)合起來,完成通信系統(tǒng)的完整構(gòu)建。端到端通信的結(jié)構(gòu)如圖2所示,由發(fā)射機、信道和接收機三部分組成,其中發(fā)射機包含調(diào)制器,信道包含AWGN信道和瑞利信道,接收端包括解調(diào)器。
圖2 端到端通信系統(tǒng)結(jié)構(gòu)
系統(tǒng)的發(fā)射機由4個一維卷積層和1個功率歸一化層組成,輸入的二進制消息序列s經(jīng)過由卷積層構(gòu)成的調(diào)制器進入調(diào)制階段,功率歸一化層對調(diào)制后的信號進行能量約束,經(jīng)過能量約束后的信號x∈n進入信道。針對信道部分,本文提出將CNN和全連接層引入CGAN對信道進行建模,生成器包含3個一維卷積層和1個全連接層,利用卷積層的局部連接和權(quán)重共享特性,能夠在所有輸入符號上采用同一組參數(shù),執(zhí)行相同的卷積運算,因此可以同時處理整個符號序列x。對傳輸k×l比特信息的信道進行建模,其中l(wèi)是符號的長度,k是每符號攜帶的比特數(shù)。全連接層能夠完成特征空間的維度轉(zhuǎn)換,將輸入維度為l×k的信號轉(zhuǎn)換為l×2,保證信號的輸出由實部和虛部兩個維度構(gòu)成。生成器生成的虛假數(shù)據(jù)和真實數(shù)據(jù)一同輸入到判別器,判別器采用3個一維卷積層和1個全連接層,對輸入數(shù)據(jù)進行判別,全連接層將維度為l×2的輸入轉(zhuǎn)換為l×1,采用sigmoid激活函數(shù)將輸入的概率值壓縮到(0,1)之間,當概率值大于0.5時判別為Real,反之判為Fake。利用DCGAN網(wǎng)絡(luò)可以成功地對AWGN信道或瑞利信道進行建模。接收機由5個一維卷積層組成,能夠接收經(jīng)過信道后具有失真和噪聲污染的信號y=x+n或y=hx+n,其中h是信道特性,n是方差為σ2的加性高斯白噪聲。接收機對信號y進行解調(diào),以恢復(fù)原始的比特流s。信道建模與端到端通信結(jié)合的系統(tǒng)模型如圖3所示。
圖3 基于DCGAN網(wǎng)絡(luò)的端到端通信系統(tǒng)組成結(jié)構(gòu)
盡管采用更多的神經(jīng)網(wǎng)絡(luò)層可以使得整個結(jié)構(gòu)的學習能力更強,但層數(shù)的增加也意味著訓練難度加大。經(jīng)過試驗,本文對收發(fā)機均采用5層神經(jīng)網(wǎng)絡(luò)設(shè)計結(jié)構(gòu),對DCGAN結(jié)構(gòu)采用4層,既能獲得準確的建模結(jié)果,又能保證網(wǎng)絡(luò)結(jié)構(gòu)的學習能力以及訓練難度適中。圖3對應(yīng)的參數(shù)由表1給出。
表1 生成器結(jié)構(gòu)參數(shù)
本節(jié)將通過大量的仿真實驗證明提出的基于DCGAN網(wǎng)絡(luò)的信道建模方法能夠?qū)鬏旈L序列的情況進行建模,并具有良好的泛化能力。與端到端通信結(jié)合,在固定信噪比20 dB下進行訓練,選取比特能量信噪比Eb/N0在0~30 dB范圍內(nèi)進行誤比特率分析,在不同調(diào)制方式下,將本方案獲得的誤比特率(Bit Error Rate,BER)性能與傳統(tǒng)數(shù)字調(diào)制系統(tǒng)進行對比。
利用卷積神經(jīng)網(wǎng)絡(luò)的權(quán)重共享和局部連接特性,在l×k的傳輸長度下對信道進行建模。在本次試驗中,符號長度l設(shè)置為128,每個符號包含k比特信息。生成對抗網(wǎng)絡(luò)中生成器和判別器的損失函數(shù)如式(9)所示,收發(fā)機的損失函數(shù)采用輸入和輸出之間的二進制交叉熵損失函數(shù):
(10)
分別采用不同指標對加性高斯白噪聲信道和瑞利衰落信道建模效果進行分析,調(diào)制方式選取16QAM,優(yōu)化器為Adam,其他參數(shù)保持相同,部分系統(tǒng)仿真參數(shù)如表2所示。
表2 系統(tǒng)仿真參數(shù)
為了準確地對建模效果進行評價,采用概率密度函數(shù)(Probability Density Function,PDF)對信道建模效果進行分析。在兩種不同的信道下分別對真實數(shù)據(jù)和生成數(shù)據(jù)進行對比。通過圖4可以觀察到,在加性高斯白噪聲和瑞利衰落信道下,真實信道數(shù)據(jù)和DCGAN生成的信道數(shù)據(jù)兩條曲線之間差距都比較小,在一定程度上可以反映出建模效果,但這種方法的不足是無法計算兩者之間的差距。
(a)AWGN信道的概率密度函數(shù)
(b)瑞利信道的概率密度函數(shù)圖4 不同信道下的概率密度函數(shù)
歸一化均方誤差(Normalized Mean Squared Error,NMSE)是一種較為簡單的方法,可以用來衡量生成數(shù)據(jù)與真實數(shù)據(jù)之間的偏差,評價數(shù)據(jù)的變化程度。其計算表達式如下:
(11)
在本次試驗中采用NMSE方法可以有效地對建模效果進行分析。以16QAM調(diào)制下的瑞利信道為例,通過圖5可以觀察到,NMSE可以直觀地反映出真實數(shù)據(jù)和生成數(shù)據(jù)之間的差距,并能比較不同方法針對長短序列的建模效果。與文獻[10]中原始的GAN方法和文獻[15]中改進的CGAN方法相比,在處理相同長度為8的短序列時,從圖5(a)中可以觀察到GAN和CGAN模型在迭代次數(shù)較少時生成效果較差,但隨著迭代次數(shù)的增加,效果越來越好,最終與DCGAN的信道建模效果差距較小,證明GAN、CGAN和DCGAN均可以成功對短序列進行建模,不存在維度詛咒問題。但當針對長序列輸入進行建模時,由于維度詛咒,現(xiàn)有的GAN和CGAN方法學出來的結(jié)果誤差較大,即不能正確地進行信道建模。為了解決這一問題,本文采用DCGAN方法。DCGAN相比GAN和CGAN的優(yōu)勢是能夠?qū)⑤斎霃膸妆忍氐亩梯斎胄蛄袛U展到幾十甚至上百比特的長序列。從圖5(b)中可以觀察到,在長度為128的長序列下,GAN迭代20次時逐漸平穩(wěn),CGAN迭代180次時逐漸趨于平穩(wěn),最終的NMSE值較大,GAN和CGAN針對長序列建模失敗。但DCGAN在迭代60次時NMSE已經(jīng)達到-35 dB,結(jié)果較好,證明DCGAN可以準確地實現(xiàn)輸入為長序列的建模,打破了維度的限制。為了進一步比較GAN、CGAN和DCGAN三種方法,對其loss函數(shù)進行分析。
(a)基于短序列的NMSE
(b)基于長序列的NMSE圖5 基于不同輸入長度CGAN和DCGAN信道建模的NMSE
loss函數(shù)是決定網(wǎng)絡(luò)學習質(zhì)量的關(guān)鍵。在網(wǎng)絡(luò)結(jié)構(gòu)不變的前提下,loss函數(shù)選擇不當會導致模型精度差等后果。本文的損失函數(shù)參考公式(9)。GAN模型訓練困難,判別器太差時無法提供有效梯度,太好則會導致梯度消失,為了避免這一問題,訓練時首先固定生成器,判別器每訓練10次生成器訓練一次。觀察圖6中GAN、CGAN和DCGAN模型針對16QAM調(diào)制下瑞利信道的loss函數(shù)可知,GAN模型在迭代290次時產(chǎn)生交叉點(即達到納什均衡),CGAN模型迭代150次達到納什均衡,而DCGAN模型迭代20次時就可以達到納什均衡。從該結(jié)果中可以得出結(jié)論:GAN收斂速度最慢,CGAN次之,DCGAN相比GAN和CGAN隨著訓練次數(shù)的增加可以更快地收斂,效果更好。
(a)基于CGAN的loss函數(shù)
(b)基于DCGAN的loss函數(shù)
(c)基于GAN的loss函數(shù)圖6 基于GAN、CGAN和DCGAN的loss函數(shù)對比
通過采用不同的指標進行對比可以得出結(jié)論:NMSE方法最適合用來對信道建模效果進行分析,能夠直觀準確地判斷出不同方法的建模效果。loss函數(shù)收斂效果對比表明,基于DCGAN的建模方法優(yōu)于基于CGAN的方法。
針對AWGN信道和瑞利衰落信道進行準確建模后,將其與自編碼器(Auto Encoder,AE)系統(tǒng)結(jié)合起來組成端到端通信系統(tǒng)。在不同的調(diào)制方式下將基于神經(jīng)網(wǎng)絡(luò)的端到端通信和傳統(tǒng)的通信系統(tǒng)進行對比,觀察整體結(jié)果。
圖7給出了不同信道中采用不同調(diào)制方式時的BER。設(shè)置k為2、4、6,分別對應(yīng)傳統(tǒng)的QPSK、16QAM和64QAM。如圖7所示,與傳統(tǒng)的調(diào)制方式相比,基于DCGAN信道建模的端到端通信系統(tǒng)的BER性能與傳統(tǒng)調(diào)制方式的理論值相吻合,由于學習到的信道并不是完全準確,所以BER會存在一定的偏差。
(a)AWGN信道下不同調(diào)制方式的誤比特率
(b)瑞利信道下不同調(diào)制方式的誤比特率圖7 不同信道下不同調(diào)制方式的誤比特率
本文提出了一種基于DCGAN的端到端通信系統(tǒng),將改進的DCGAN和自編碼器運用到通信領(lǐng)域中。系統(tǒng)采用神經(jīng)網(wǎng)絡(luò)來完成整個通信過程。利用卷積層和全連接層的局部連接和權(quán)重共享特性對傳輸長的二進制比特序列信道進行建模,并從AWGN信道擴展到更復(fù)雜的瑞利衰落信道中。將信道建模結(jié)果與端到端通信結(jié)合起來,發(fā)射機實現(xiàn)調(diào)制過程,接收機將接收到的信號進行恢復(fù)。仿真實驗證明,基于DCGAN的信道建模方法能夠?qū)鬏數(shù)拈L序列成功建模,并且可以得到與傳統(tǒng)調(diào)制方式相吻合的性能。
本文提出的模型系統(tǒng)能夠推廣到各種信道,與端到端通信結(jié)合時可得到與現(xiàn)有人工設(shè)計的最佳調(diào)制方案相似的性能。未來希望在DCGAN網(wǎng)絡(luò)上繼續(xù)進行改進,進一步實現(xiàn)在無監(jiān)督學習的方式下準確的信道建模過程。