梁家熙,牛澤坤,胡衛(wèi)生,義理林
(上海交通大學 區(qū)域光纖通信網(wǎng)與新型光通信系統(tǒng)國家重點實驗室,上海 200240)
在加性高斯白噪聲(Additive White Gaussian Noise,AWGN)信道中,使用高階的正交振幅調(diào)制(Quadrature Amplitude Modulation,QAM)在高信噪比(Signal Noise Ratio,SNR)的情況下,互信息量(Mutual Information,MI)與香農(nóng)極限相差1.53 dB[1],QAM的方形星座圖是造成容量差距的原因。星座整形是一種在QAM基礎上提高MI的方式,分為幾何整形和概率整形,其中幾何整形指調(diào)整星座點的幾何分布,概率整形指調(diào)整星座點在發(fā)送信號中出現(xiàn)的概率。幾何整形和概率整形通過一些傳統(tǒng)的方式實現(xiàn),例如幾何整形可以通過一定的規(guī)則調(diào)整星座圖點與點的位置,充分利用空間,但是無法證明這種方法可以得到使系統(tǒng)的信道容量最大的編碼方式[2];概率整形可以通過麥克斯韋-玻爾茲曼(Maxwell- Boltzmann,MB)分布調(diào)整星座點的概率分布,在AWGN信道下,證明MB分布可以達到性能最佳,但是對于其他信道而言,MB分布無法取得最佳性能[3]。
近年來,深度學習被引入物理層通信中,通信系統(tǒng)可以被視為一個自動編碼器,此時發(fā)端與收端都可以由神經(jīng)網(wǎng)絡的全連接層擔任,這就是端到端的深度學習(End-to-End Deep Learning,E2EDL)通信系統(tǒng)[4]。E2EDL相較于傳統(tǒng)的通信算法優(yōu)勢在于從一個全局的角度出發(fā)考慮優(yōu)化,而不是將局部最優(yōu)組合到一起,得到一種非全局最優(yōu)的方案[5]。通過E2EDL,可以實現(xiàn)星座整形,訓練得到幾何整形[4]和概率整形[6]的編碼器,性能接近或超過傳統(tǒng)算法的最佳性能。通過E2EDL在幾何整形星座圖的基礎上做概率整形,可以取得比單獨幾何整形和概率整形更高的增益[6]。但是,目前的方法都是在固定的幾何整形上做概率整形,沒有進行聯(lián)合優(yōu)化,且這些方法無法證明當前整形結(jié)果的信息量是最優(yōu)的。
本文提出了一種基于互信息量估計(Mutual Information Neural Estimation,MINE)的幾何與概率聯(lián)合整形方法。MINE可以估計兩種不同分布的MI[7],本文提出的系統(tǒng)利用MINE估計當前通信系統(tǒng)的MI,并且訓練發(fā)端編碼器以滿足最大化MI?;贛INE的系統(tǒng)無需訓練解碼器,可以避免解碼器誤差對編碼器訓練帶來的損失。本文提出了幾何整形與概率整形的聯(lián)合優(yōu)化方式,通過訓練迭代優(yōu)化幾何整形與概率整形的編碼器,使系統(tǒng)接近到幾何整形與概率整形所能達到的MI的極限。本文將系統(tǒng)在不同SNR的AWGN信道中進行仿真,比較了幾何與概率聯(lián)合整形的系統(tǒng)與其他方案之間的MI。仿真結(jié)果表明,幾何與概率聯(lián)合整形系統(tǒng)的MI高于單獨進行幾何或概率整形的系統(tǒng),在SNR為10 dB的AWGN信道中,幾何與概率聯(lián)合整形的系統(tǒng)MI與單獨做概率整形的系統(tǒng)相比,有0.027 9 bit/symbol的增益;與單獨做幾何整形的系統(tǒng)相比,有0.041 7 bit/symbol的增益。
根據(jù)香農(nóng)信息論的內(nèi)容,信道輸入和輸出之間的MI的極大值就是信道容量,可以通過最大化MI的方式找到可以逼近信道容量的編碼方式。但從歷史上看,MI往往是難以計算的[8],精確的計算僅僅適用于離散變量(可以直接求出總和),或是用于已知概率分布的有限問題,對于更加廣泛的應用場景,MI的精確計算通常是不可能的。
2018年,來自蒙特利爾大學的Belghazi等人提出了一個基于 Kullback-Leibler(KL)散度的對偶表示的通用參數(shù)神經(jīng)網(wǎng)絡互信息估計器,MINE[7]。MINE是一種數(shù)據(jù)驅(qū)動估計MI下界的方式,可以估計任意兩種不同分布的MI的下界,并且可以將估計值作為損失函數(shù),將梯度沿著神經(jīng)網(wǎng)絡估計器進行反向傳播。
MINE的原理如下:兩個變量X和Z的MI可以通過下式表示:
式中:X和Z為兩種不同的分布;I(X;Z)為兩種分布間的MI;PXZ為X和Z的聯(lián)合分布;PX和PZ分別為X和Z的邊際分布;?為兩種分布間的張量積。另外引入KL散度的概念,KL散度又叫相對熵,是兩個不同分布之間的差異的非對稱性度量,在信息論中,KL散度是兩個不同分布的信息熵的差值,表示如下:
式中:P和Q為兩種不同的分布;DKL(P||Q)為P和Q的KL散度;EP為變量在P分布下的數(shù)學期望值。P和Q都是嚴格連續(xù)的分布。根據(jù)式(1)和(2)可以推導出,MI和KL散度的關系為
接下來,MINE的重點在于KL散度的對偶表示,這份工作由Donsker和Varadhan于1983年完成,因此KL散度的對偶表示又稱Donsker-Varadhan表示[9],具體如下
式中:e為自然對數(shù)底;T為所有函數(shù)集合R中的一個函數(shù),T:Ω→R表示在實數(shù)域函數(shù)中存在函數(shù)T;sup為函數(shù)的上界。式(4)的意義在于,在一個由所有實函數(shù)組成的域中,一定能找到一個函數(shù)對應關系T,按照函數(shù)對應關系將P和Q的分布轉(zhuǎn)化為標量,而這個標量使得等號右側(cè)函數(shù)的值最大,而這個最大值就是P和Q的KL散度。函數(shù)T可以由神經(jīng)網(wǎng)絡函數(shù)來表示,假設Θ為所有神經(jīng)網(wǎng)絡所有參數(shù)的集合,因此TΘ可以看作所有神經(jīng)網(wǎng)絡函數(shù)的集合,而TΘ是R的一個子集,因此神經(jīng)網(wǎng)絡估計的MI與真實的MI間有如下關系:
式中,IΘ(X,Z)為通過神經(jīng)網(wǎng)絡計算的MI的估計值,對于參數(shù)為θ∈Θ的神經(jīng)網(wǎng)絡,根據(jù)式(3)、(4)和(5)可以推導得到:
通過式(6),在兩個隨機分布里隨機選取聯(lián)合樣本和邊界樣本,再通過訓練找到使得樣本的MI估計值最大的神經(jīng)網(wǎng)絡參數(shù),這個MINE值就是兩個分布MI的下界。
因此,計算兩個不同分布的MI,可以轉(zhuǎn)變?yōu)榍笠粋€神經(jīng)網(wǎng)絡在特定損失函數(shù)下的最大值。定義一個神經(jīng)網(wǎng)絡,用于將兩種不同分布的變量轉(zhuǎn)化為一個標量,即Tθ(X,Z),通過將Tθ代入式(6)可以計算得到在當前神經(jīng)網(wǎng)絡參數(shù)θ下的MI估計值,然后將式(6)等號右邊的相反數(shù)設置為損失函數(shù),試圖通過最小化損失函數(shù),即最大化MI的估計值,即可取得MI的下界。
在本文中,系統(tǒng)使用MINE作為估計系統(tǒng)MI的方法,取得信道兩段的符號,通過訓練的方式找到使得估計值最大的參數(shù)θ,再通過式(6)計算得到通信系統(tǒng)MI的估計值。
幾何整形是通過設計星座點的位置,使得星座點之間的歐氏距離增大,從而降低解碼端分辨星座點的難度,降低誤碼率。從信息論角度考慮,幾何整形的目的是尋找一種使得信道容量最大的調(diào)制方法,獲得更高的通信速率。在基于MINE的幾何整形系統(tǒng)中,訓練MINE神經(jīng)網(wǎng)絡計算信道兩端符號的MI,然后通過最大化MI的方式訓練編碼器,從而得到使得信道容量最大的調(diào)制方式。
基于MINE的幾何整形系統(tǒng)如圖1所示,其中編碼器和MINE是兩個全連接神經(jīng)網(wǎng)絡,分別表示調(diào)制使用的神經(jīng)網(wǎng)絡和估計MI使用的神經(jīng)網(wǎng)絡。編碼器輸入原始比特,輸出調(diào)制后的符號;MINE輸入信道兩端的符號,輸出用于估計MI的標量。m為原始比特,輸入編碼器之后進行功率歸一化,得到輸入信道的符號x,x經(jīng)過信道之后得到有損傷的符號y,將x和y輸入MINE神經(jīng)網(wǎng)絡,由式(6)計算MI。本文的神經(jīng)網(wǎng)絡,編碼器擁有3個隱藏層,每個隱藏層有256個神經(jīng)元,使用Leaky ReLU激活函數(shù);MINE擁有3個隱藏層,每個隱藏層有128個神經(jīng)元,使用Leaky ReLU激活函數(shù)。
圖1 基于MINE的幾何整形系統(tǒng)設計
訓練過程如圖2所示,共訓練L個迭代周期,首先構(gòu)建編碼器和MINE神經(jīng)網(wǎng)絡。每個訓練周期中,先生成原始比特,然后根據(jù)圖1進行數(shù)據(jù)正向傳播并且計算MI。訓練編碼器和MINE的目的都是通過式(6)最大化MINE,因此損失函數(shù)設置為MINE的相反數(shù)。每個迭代周期訓練1次MINE神經(jīng)網(wǎng)絡,每10個迭代周期訓練1次編碼器神經(jīng)網(wǎng)絡。
圖2 基于MINE的幾何整形系統(tǒng)訓練流程
概率整形是在星座圖的基礎上,通過改變星座符號的出現(xiàn)概率,使得功率低的星座點出現(xiàn)概率大,功率高的星座點出現(xiàn)概率小,從而降低發(fā)送信號的整體功率,使得噪聲的功率也隨之下降,起到提高信道容量的作用。通常概率整形在標準方形QAM下進行,不同星座點的概率分布符合MB分布。
圖3 基于MINE的概率整形系統(tǒng)設計
基于MINE的概率整形系統(tǒng)如圖3所示,其中概率生成器和MINE為兩個神經(jīng)網(wǎng)絡,MINE與2.1節(jié)相同,概率生成器輸入固定的數(shù),輸出每個星座點的出現(xiàn)權(quán)重,本系統(tǒng)中固定輸入設置為1。將權(quán)重經(jīng)過Gumbel-Softmax激活層[10]得到含有隨機性的不同星座點的輸出概率,Gumbel-Softmax表達式為
式中:α為星座點的權(quán)重向量;G為Gumbel隨機數(shù)向量;h為通過softmax(柔性最大值)計算得到的不同的星座點出現(xiàn)概率的向量;temperature為溫度常數(shù),當溫度常數(shù)接近0時,h接近獨熱編碼分布;當溫度常數(shù)接近正無窮時,h接近均勻分布。
每個星座點的概率與星座點所對應的符號相乘,再將所有星座點的結(jié)果相加,即可得到概率整形編碼器的輸出符號,然后對符號進行功率歸一化,得到輸入信道的符號x,x經(jīng)過信道得到有損傷的符號y,將x和y輸入MINE神經(jīng)網(wǎng)絡,經(jīng)過式(6)計算MI。概率生成器有兩個隱藏層,每個隱藏層有64個神經(jīng)元,使用Leaky ReLU激活函數(shù)。訓練過程如圖4所示,共訓練M個迭代周期,首先構(gòu)建概率生成器和MINE神經(jīng)網(wǎng)絡。每個訓練周期中,首先通過概率生成器生成概率權(quán)重,經(jīng)過Gumbel-Softmax函數(shù)激活后與星座點集相乘得到符號,再根據(jù)圖3進行數(shù)據(jù)正向傳播并計算MI。訓練概率生成器的損失函數(shù)設置為MINE的相反數(shù)。每個迭代周期訓練1次MINE神經(jīng)網(wǎng)絡,每20個迭代周期訓練1次概率生成器神經(jīng)網(wǎng)絡。
圖4 基于MINE的概率整形系統(tǒng)訓練流程
基于MINE的幾何與概率聯(lián)合整形系統(tǒng)的具體訓練流程如圖5所示。首先進行幾何整形和概率整形的預訓練,訓練的方法分別參照2.1與2.2節(jié),其中訓練概率整形所使用的星座圖為編碼器產(chǎn)生的星座圖。訓練結(jié)束后計算該狀態(tài)下的MI,記為maxMI。
接下來進行迭代的幾何整形和概率整形訓練,即分別訓練系統(tǒng)的編碼器和概率生成器。首先進行幾何整形,先將現(xiàn)有的編碼器模型保存,然后根據(jù)不同星座點的概率隨機生成不同數(shù)目的幾何整形星座點符號,將這些符號通過信道進行最大化MI的訓練,一次迭代訓練編碼器若干次,在訓練過程中不斷計算新的幾何整形星座圖的MI,如果新的MI比maxMI高,則停止訓練,將新的MI記為nowMI,然后保存新的編碼器模型。如果訓練超過一定次數(shù)之后MI一直小于maxMI,則回退到保存的編碼器模型,重新進行訓練。
概率整形的訓練部分,先保存概率發(fā)生器模型,訓練概率發(fā)生器并且計算MI,超過maxMI則保存MI和概率發(fā)生器模型并且停止訓練,訓練超過一定次數(shù)則回退概率發(fā)生器模型。就這樣訓練,迭代一定次數(shù),保證每次迭代的幾何整形和概率整形的模型的MI都大于上一次的MI。
將訓練周期的總數(shù)設置為K,每個訓練周期中,編碼器和概率發(fā)生器最多訓練L次迭代,可以保證每次編碼器和概率發(fā)生器訓練后,所得新整形系統(tǒng)的MI高于上一個周期的MI。在訓練過程中,系統(tǒng)的MI逐步增加,逼近幾何與概率整形聯(lián)合優(yōu)化的性能極限。
圖5 基于MINE的幾何與概率整形聯(lián)合系統(tǒng)設計
幾何整形預訓練設置10 000個迭代周期,概率整形預訓練設置100 000個迭代周期。,暫停訓練并回退模型的閾值設置為2 000,即訓練2 000個迭代周期內(nèi),如果編碼器或概率發(fā)生器的性能沒有使得系統(tǒng)的信道容量有所提升,就回退并重新進行訓練。在2 000個迭代周期中,前500迭代周期用于預訓練MINE,剩下的1 500個迭代周期中,每100個周期采集一次MI,如果發(fā)現(xiàn)新的MI超過了過去的maxMI,則將maxMI更新為nowMI,并且立刻停止訓練。
為了驗證基于MINE的幾何與概率聯(lián)合整形系統(tǒng)的性能,在AWGN信道下進行了仿真驗證,在不同SNR下對QAM、幾何整形、概率整形以及幾何與概率聯(lián)合整形的MI進行對比,仿真系統(tǒng)中每個符號對應4位比特。幾何整形系統(tǒng)按照2.1節(jié)設置,L設置為20 000。概率整形按照2.2節(jié)設置,M設置為100 000。幾何與概率聯(lián)合整形按照2.3節(jié)設置,K設置為60。計算MI的方法采用蒙特卡洛估計的方式[11],估計采樣的樣本量足夠多的情況下,這種方式得到的MI是接近精確的。
基于MINE的幾何與概率聯(lián)合整形在不同SNR的AWGN下的整形方案熱力圖如圖6所示。圖中橫坐標和縱坐標分別為信號在I路和Q路的歸一化能量大小,右側(cè)坐標軸表示不同星座點的出現(xiàn)概率權(quán)重,權(quán)重值經(jīng)過softmax函數(shù)計算可以得到星座輸出點的概率。
在熱力圖中,星座點的亮度越高,代表該星座點的權(quán)重越高,該星座點發(fā)送的可能性越大。在SNR較低,噪聲較大的情況下,中心星座點的概率較高,周圍的概率較低;隨著SNR的升高,周圍星座點的權(quán)重逐漸升高,逐漸接近中心星座點的概率。
圖6 基于MINE的幾何與概率聯(lián)合整形在不同SNR下的AWGN信道中整形方案的熱力圖
圖7所示為QAM、幾何整形、概率整形以及幾何與概率聯(lián)合整形在不同SNR下的AWGN信道中的MI變化曲線。由圖可知,在SNR較低的情況下,所有調(diào)制格式和香農(nóng)極限的MI較接近,由于曲線比較接近,因此選取了SNR=10 dB處的曲線進行放大,由圖可知,幾何與概率聯(lián)合整形的系統(tǒng)性能最優(yōu),其次是概率整形,再次是幾何整形,16QAM調(diào)制相較于星座整形而言性能是最差的。由圖可知,幾何與概率聯(lián)合整形的MI相較于概率整形有0.027 9 bit/symbol的增益,相較于幾何整形有0.041 7 bit/symbol的增益,相較于16QAM調(diào)制有0.112 6 bit/symbol的增益。與香農(nóng)極限相比,幾何與概率聯(lián)合整形在SNR=10 dB處仍有0.183 4 bit/symbol的差距,但是與16QAM與香農(nóng)極限間的0.296 0 bit/symbol差距相比,有了較大的性能提升,如果需要繼續(xù)提升性能,需要考慮在更高階的調(diào)制格式上進行幾何與概率整形。
因此,在AWGN信道中,基于MINE的幾何與概率聯(lián)合整形系統(tǒng)可以訓練得到一種性能優(yōu)于幾何整形與概率整形中任意一種整形方案的編碼方案。在幾何整形與概率整形的基礎上,通過這種方法,可以讓信道兩端的MI更加接近香農(nóng)極限。
圖7 4種不同編碼方式在不同SNR下的AWGN信道中MI的變化趨勢
為解決QAM在高SNR的情況下,MI與香農(nóng)極限相差1.53 dB的問題,本文提出了一種基于MI估計的幾何與概率聯(lián)合整形的方法,在QAM的基礎上通過星座整形提升系統(tǒng)的MI。本文分別介紹了基于MI的幾何整形、概率整形以及將兩種整形方法聯(lián)合訓練的步驟,并且將這套方法在不同SNR下的AWGN信道中進行了仿真驗證。仿真結(jié)果表明,幾何與概率聯(lián)合整形方法的性能優(yōu)于單獨進行幾何整形和概率整形中性能。在SNR為10 dB時,系統(tǒng)的MI與單獨做幾何整形相比有0.041 7 bit/symbol的增益,與單獨做概率整形相比有0.027 9 bit/symbol的增益。