李素月,賈 鵬,王安紅
(太原科技大學 電子信息工程學院,太原 030024)
大規(guī)模MIMO(Multiple-Input Multiple-Output)技術是5G通信系統(tǒng)的關鍵技術之一。在大規(guī)模MIMO通信系統(tǒng)中,基站(Base Station,BS)部署大量的天線為更多用戶同時提供服務。大規(guī)模MIMO可以實現(xiàn)較高的分集增益和復用增益,顯著提高鏈路可靠性和系統(tǒng)頻譜效率[1],但是天線數(shù)量增多也給大規(guī)模MIMO信號檢測帶來了巨大的挑戰(zhàn)。已有許多信號檢測方案被提出,其中最大似然(Maximum Likelihood,ML)檢測器是性能最優(yōu)的,其檢測思想是遍歷所有可能的發(fā)送信號,從中尋找出最優(yōu)的檢測結果。但是隨著天線數(shù)量增多,這一檢測方法的算法復雜度呈指數(shù)上升[2]。因此,一些次優(yōu)的檢測方案得到了廣泛的應用,如近似消息傳遞(Approximate Message Passing,AMP)檢測器。然而,AMP檢測器的復雜度會隨用戶數(shù)量和調(diào)制階數(shù)的增加而增加[3]。其他的一些線性檢測器如迫零(Zero Forcing,ZF)檢測器、最小均方誤差(Minimum Mean Squared Error,MMSE)檢測器,雖然算法復雜度相對較低,但其性能表現(xiàn)欠佳?,F(xiàn)有的信號檢測器在算法復雜度與性能表現(xiàn)之間很難折中。近年來深受學術界與工業(yè)界關注的深度學習(Deep Learning,DL)技術為大規(guī)模MIMO檢測提供了新的思路。
深度學習是人工智能領域的重要分支,通過構建一個模擬人腦神經(jīng)元的深度神經(jīng)網(wǎng)絡(Deep Neural Network,DNN)來分析、處理數(shù)據(jù)。由于深度學習在處理結構化信息與海量數(shù)據(jù)顯現(xiàn)出巨大優(yōu)勢,深度學習也受到許多無線通信領域學者的青睞。文獻[4-5]研究了毫米波大規(guī)模MIMO系統(tǒng)基于DNN的混合預編碼技術,結果表明,基于DNN的方法能夠極大地減低誤碼率,提高頻譜效率,在混合預編碼中取得了比傳統(tǒng)方案更好的性能。文獻[6-8]分別研究了卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)在信道估計方面的應用。文獻[9]提出了一種用于相關干擾環(huán)境下信道譯碼的CNN框架,顯著降低了譯碼錯誤概率。文獻[10]提出了應用于MIMO系統(tǒng)信號檢測的一種基于模型驅動的深度學習檢測方案,將深度學習算法思想引入正交近似消息傳遞(Orthogonal Approximate Message Passing,OAMP)檢測算法,在其中加入可供訓練的參數(shù),設計出OAMP-Net;通過數(shù)據(jù)訓練對參數(shù)進行優(yōu)化,提高了檢測性能。文獻[11]利用DNN改進了應用于大規(guī)模MIMO系統(tǒng)信號檢測的消息傳遞檢測器(Message Passing Detector,MPD),取得了更好的誤碼率性能。文獻[12]提出了一種用于大規(guī)模MIMO信號檢測的神經(jīng)網(wǎng)絡DetNet,通過將投影梯度下降算法展開來構建神經(jīng)網(wǎng)絡,仿真結果顯示其誤碼率性能明顯優(yōu)于傳統(tǒng)線性算法。
本文首先深入分析了DetNet[12]應用于大規(guī)模MIMO檢測的原理,在此基礎上嘗試對網(wǎng)絡進行改進——通過去除冗余的輸入項、構造孿生網(wǎng)絡并賦予不同初值向量對DetNet結構進行改進。仿真結果顯示,改進后的網(wǎng)絡誤碼率性能獲得了一定提升。
由于BS端的功耗不受限允許進行復雜的信號處理操作,所以考慮一個大規(guī)模MIMO上行鏈路通信系統(tǒng)模型,移動端配置K個發(fā)射天線,BS端配置N個接收天線。上行接收信號表示為
y=Hx+n。
(1)
式中:y是N×1維的向量;x是K×1維的向量;n是N×1維的向量,表示服從零均值且方差為δ2獨立同分布的加性高斯白噪聲;H表示準靜態(tài)高斯平坦衰落信道,服從均值為零方差為1的正態(tài)分布,矩陣大小為N×K,且在檢測過程中假定信道狀態(tài)信息是完全已知的。
在機器學習領域中,實現(xiàn)了最大后驗準則的貝葉斯解碼器被稱為最優(yōu)解碼器[10]。因此一個最優(yōu)的神經(jīng)網(wǎng)絡檢測器應該實現(xiàn)一個函數(shù)f以逼近最大后驗準則:
f(y)=argmaxP(x|y)。
(2)
(3)
由于ML檢測需要搜索所有可能的信號,其計算復雜度隨著天線數(shù)量和調(diào)制階數(shù)的增加呈指數(shù)增長,導致ML檢測在實際中難以應用到大規(guī)模MIMO系統(tǒng)。
DetNet由多個具有相同結構的檢測單元組成,這些單元通過級聯(lián)組成整個檢測網(wǎng)絡?;谔荻韧队跋陆邓惴嫿ǖ腄etNet檢測單元如下:
(4)
(5)
圖1 DetNet單元結構示意[12]
為了進一步提升DetNet的性能,文獻[12]參考Res-Net[13]的構建思想,在每一個單元的輸出端引入了一個殘差特征,這樣第i個單元的輸入取第i-1個單元輸入與輸出的加權平均值,即
(6)
式中:α表示殘差系數(shù)。因為網(wǎng)絡中每個單元的結構相同,為了使網(wǎng)絡獲得更好的性能,需適當加深網(wǎng)絡的深度。對于L層的DetNet,整個學習過程需要訓練的參數(shù)集為
(7)
梯度消失或梯度爆炸是神經(jīng)網(wǎng)絡訓練過程中常見且較為棘手的問題。為了解決此問題,DetNet將損失函數(shù)定義為
(8)
圖2 RPD單元結構示意
表1 網(wǎng)絡連接數(shù)目對比
(9)
式(9)中的求逆運算運用Neumann級數(shù)展開法[16],可以實現(xiàn)O(K2)的復雜度階數(shù)。
去掉冗余變量后,如果只改變圖2中的初始向量,仿真發(fā)現(xiàn)網(wǎng)絡性能略有下降。因此,考慮借鑒隨機森林[17]的原理對網(wǎng)絡結構進行改進。
圖3 RPD單元結構示意
本節(jié)所有實驗采用的語言環(huán)境為Python3.6及其相關項,網(wǎng)絡使用Tensorflow框架構建。硬件設備主要包括因特爾E5-1620中央處理器和英偉達GeForce-RTX2080Ti圖形處理器。
訓練數(shù)據(jù)的每一個樣本根據(jù)x、H與n的統(tǒng)計從公式(1)中獨立產(chǎn)生。采用衰減學習率訓練網(wǎng)絡,初始學習率設置為0.000 1,每1 000次迭代的衰減率為0.97。整個訓練過程執(zhí)行100 000次迭代,batchsize為2 000。在后續(xù)的仿真實驗中將發(fā)射天線與接收天線的具體配置簡記為K×N。生成的信道H為準靜態(tài)平坦衰落信道,服從均值為零方差為1的正態(tài)分布。在檢測過程中假設完美已知,但是噪聲功率不可知。每一組發(fā)送數(shù)據(jù),信噪比都是從[8,13]dB之間隨機選取。網(wǎng)絡的輸入向量y是原始接信號。
圖4顯示了RPD-Net與DetNet隨網(wǎng)絡層數(shù)變化的BER性能。具體的參數(shù)設置為:信號采用BPSK調(diào)制,天線數(shù)為20×30,SNR=11 dB??梢杂^察到兩個網(wǎng)絡的性能都隨著網(wǎng)絡層數(shù)的增加而提高,不過所提出的RPD-Net性能提升更快。具體來說,DetNet達到最優(yōu)的誤碼率性能需要60層網(wǎng)絡即采用60個檢測單元,而RPD-Net達到與其相同的性能,僅需要20層網(wǎng)絡,雖然RPD-Net每層網(wǎng)絡采用了兩個檢測單元,但達到相同的誤碼率性能時RPD-Net用到40個檢測單元數(shù)量,少于DetNet,這表明RPD-Net具有更快的收斂速度。此外,RPD-Net達到最佳誤碼率性能時需要30層網(wǎng)絡,即采用了60個檢測單元,且明顯優(yōu)于DetNet的最佳性能。由于本文所提出的RPD-Net在賦值輸入向量的過程中引入了ZF算法,其計算復雜度由原來的O(LK2)增至O((L+1)K2),但與DetNet相比RPD-Net的誤碼率性能獲得了一定的提升。
圖4 SNR=11 dB天線數(shù)為20×30時不同層數(shù)下網(wǎng)絡性能對比
圖5包含了天線配置為20×30、30×60兩種情況下三種檢測方法的性能仿真結果。從圖中可以明顯看出,盡管選取了不同的天線配置,但是RPD-Net的性能始終優(yōu)于DetNet與ZF檢測算法。此外,無論是RPD-Net還是DetNet,當配置的天線數(shù)增加時,網(wǎng)絡的性能都相應提高。這表明采用了深度學習的RPD-Net適用于大規(guī)模MIMO場景下的信號檢測。
圖5 不同天線配置情況下三種檢測算法性能比較
為了進一步檢驗網(wǎng)絡的性能,采用不同的調(diào)制方式對網(wǎng)絡進行仿真。從圖6可以看出,當采用QPSK與16QAM兩種高階調(diào)制方法時,DetNet與RPD-Net的性能都有所下降,特別是在16QAM調(diào)制下兩個網(wǎng)絡性能下降明顯。然而,無論采用何種調(diào)制方式,在相同的天線配置條件下RPD-Net性能較DetNet始終有所提升。
圖6 不同調(diào)制方式以及天線配置情況下網(wǎng)絡性能對比
本文首先詳細分析了DetNet模型,然后采用去除網(wǎng)絡冗余輸入項、構建孿生網(wǎng)絡并賦予不同初值向量的方法對其結構進行改進,提出了一種改進的RPD-Net深度學習模型。仿真實驗結果證實在天線配置相同的情況下,本文提出的RPD-Net具有更快的收斂速度,且誤碼性能優(yōu)于DetNet方案。