殷志遠, 陳 瑾, 李國鑫, 王海超
(陸軍工程大學 通信工程學院,江蘇 南京 210007)
隨著現代通信的蓬勃發(fā)展,頻譜資源日益稀缺。為了高效利用有限的頻譜,非正交多址接入(NOMA)技術被廣泛研究[1-3],其核心思想是多個用戶能夠在同一頻段內以不同功率同時通信,從而節(jié)約頻譜資源。
在下行NOMA研究領域,一個重要的方向是協(xié)作NOMA,文獻[4]設計了一個經典的協(xié)作NOMA策略,其中協(xié)作用戶成功依次解碼其他用戶的消息并轉發(fā),從而幫助其他用戶通信。文獻[5]將協(xié)作NOMA用戶的中繼選擇策略分為兩步,實現最大的分集增益。文獻[6]從公平性角度出發(fā),設計了連續(xù)用戶中繼方案,進一步高效利用頻譜。文獻[7]為用戶中繼協(xié)作NOMA網絡設計了兩種不同轉發(fā)方式的傳輸協(xié)議,并推導了系統(tǒng)中斷性能的表達式。文獻[8]在存在用戶中繼譯碼誤差的條件下研究了協(xié)作NOMA網絡在瑞利衰落信道中的中斷性能,并為系統(tǒng)設計提供了一些有用的見解。在上述協(xié)作NOMA研究中,信道狀態(tài)信息(CSI)都是即時反饋的,然而實際通信中,CSI反饋存在延遲,接收到的信道信息是過時的。CSI的反饋延遲會導致系統(tǒng)錯誤解碼,中斷性能嚴重下降。文獻[9,10]研究了正交多址接入網絡中信道信息反饋延時系統(tǒng)的中斷性能,表明過時的CSI會將系統(tǒng)分集增益降到最低,無論CSI精度如何,存在反饋延遲時分集增益始終為1。在協(xié)作NOMA系統(tǒng)中,若CSI反饋延遲,其空間自由度的優(yōu)勢將不復存在。然而,現階段對協(xié)作NOMA網絡中CSI反饋延遲問題的研究不足。文獻[11]研究了過時CSI下協(xié)作NOMA部分中繼選擇系統(tǒng)的性能,但該工作中節(jié)點未考慮解碼轉發(fā)協(xié)議,沒有給出合理的中繼選擇策略,也沒有提出提升系統(tǒng)性能的方法?;谝陨峡紤],有必要對CSI反饋延遲的協(xié)作NOMA網絡進行深入研究。
近年來,深度學習(DL)在通信領域得到了廣泛應用,其中大量研究聚焦于將DL與信道估計技術相結合[12-16],而與過時CSI相關的研究較少。為了降低CSI反饋延遲帶來的影響,現有研究采用DL技術對遲滯的CSI進行處理,利用深度神經網絡的預測能力提升通信性能。文獻[17]對車聯(lián)網系統(tǒng)中CSI延遲反饋條件下的功率分配問題進行了研究,提出了基于循環(huán)神經網絡(RNN)的預測功率分配算法。然而,文獻[17]使用的是標準RNN結構,僅在全連接神經網絡的隱藏層中加入一個循環(huán)層。相比于門控循環(huán)單元(GRU)與長短期記憶(LSTM),標準RNN結構的預測能力較弱,所得CSI的預測誤差較大。文獻[18]設計了一個基于卷積神經網絡(CNN)的信道預測框架用以解決多輸入多輸出(MIMO)系統(tǒng)中CSI反饋延遲問題,提高了頻譜效率。由于CNN能夠提取數據特征,它的預測效果可以媲美標準RNN并減小計算代價,但它對于時間步的順序不夠敏感,會導致預測網絡的性能不穩(wěn)定。上述研究提出的預測網絡都有所欠缺,因此,有必要設計性能更好的預測網絡來解決CSI反饋延遲問題。
基于上述研究啟示,本文將DL技術引入協(xié)作NOMA網絡以解決CSI反饋延遲條件下的用戶中繼選擇問題。
本文研究的下行用戶中繼協(xié)作NOMA如圖1所示,其中共有一個基站、N個近用戶和一個遠用戶。近用戶收到基站發(fā)送的消息后,不僅要解碼自己的信息,還要充當中繼,解碼轉發(fā)遠用戶的信息,協(xié)助遠用戶通信?;静慌c遠用戶直接通信。
圖1 信道信息延遲反饋的下行用戶中繼協(xié)作NOMA
在一個時隙內,用戶的通信被等分為兩部分。在第一部分,基站首先選擇一個近用戶(如第n個近用戶),向其發(fā)送一個疊加信號yn1,該信號帶有所選近用戶信息與遠用戶信息
(1)
在接收到基站發(fā)來的信號后,近用戶需要依次解碼出遠用戶的信息和自己的信息。在檢測信息處接收到的信干噪比(SINR)分別由以下公式給出
(2)
(3)
如果近用戶成功解碼遠用戶的信息,則在該時隙的第二部分將該信息轉發(fā)給遠用戶。假設基站與近用戶的發(fā)射功率相同(均為P),此時遠用戶接收到的信息yn2表示為
(4)
γdn=q|hn2|2
(5)
然而,在實際通信過程中,CSI的反饋是存在延遲的,所得到的信道系數是過時的。過時的信道系數與準確的信道系數可以用如下關系式表示[10]
(6)
根據式(2,3,5),遠用戶與近用戶的可達信息速率分別表示為
(7)
(8)
首先提出一個近用戶選擇策略,然后基于該策略推導無DL情況下的系統(tǒng)中斷概率,最后推導系統(tǒng)分集增益,分析系統(tǒng)中斷性能。
所提策略分為兩部分:(1) 需要確定功率分配因子以保證近用戶成功解碼;(2) 需要確定能夠達到通信要求的近用戶集合,并選擇最佳近用戶。
2.1.1 功率分配優(yōu)化
功率分配因子直接關系到近用戶選擇是否合理。為了確保近用戶能夠成功解碼信息,考慮含有αn的項,根據式(2,7)可得
(10)
根據式(3,8)可得
(11)
式中:ε1=22Rn-1,ε2=22Rd-1。僅在功率分配因子αn滿足式(10)與式(11)時,近用戶才能成功解碼出遠用戶與自己的信息。
2.1.2 最佳用戶選擇
(12)
(13)
因此,該集合可以表示為
(14)
為了最大化遠用戶的可達速率,所選近用戶應包含在集合中。因此,最佳近用戶可表示為
(15)
(16)
由此可得集合En中有m個近用戶的概率為
(19)
將式(18,20)代入式(16),可得系統(tǒng)中斷概率為
由于指數函數e-x的泰勒級數展開式為
(22)
式中o(·)表示高階無窮小。因此式(20)可以改寫為
因此可將式(23)改寫為
可將式(25)簡化為
根據式(22),可得式(18)的漸近表達式為
將式(27)與式(28)代入式(16),可得系統(tǒng)中斷概率的漸近表達式為
(29)
根據漸近中斷概率可以推導系統(tǒng)分集增益。系統(tǒng)分集增益定義為[21]
(30)
在理想狀況下,CSI是準確的,分集增益為N。若CSI是過時的,從式(29)中可以觀察到中斷概率依賴于含有q的項,此時的分集增益為
d=
(31)
根據上述分析可以看出,CSI反饋延遲使得多用戶分集增益消失,嚴重降低系統(tǒng)中斷性能。
為了改善由CSI反饋延遲導致的系統(tǒng)性能下降,采用深度學習方法來預測當前CSI信息。準確的信道信息有利于選擇更合適的近用戶,降低系統(tǒng)中斷概率。如式(19)所示,過時的CSI與準確CSI具有相關性,這使信道信息的預測成為可能。
為了準確預測信道信息,神經網絡需要大量的數據來進行學習,隨著隱藏層的增加,很容易導致梯度消失。GRU層是為了解決梯度消失問題而設計的,類似于LSTM層,可以保存先前學習過的信息以便后面使用。與LSTM相比,GRU的計算代價更低,且更關注近期的數據,更適合用來對遲滯的CSI進行預測。因此,本文設計了帶有GRU的深度神經網絡。同時,為了提高學習收斂速度,降低輸入數據的維度,使用卷積神經網絡進行預訓練。
在通信系統(tǒng)中,數據通常表現為傳輸符號序列SK={s1,s2,…,sK}。如圖2所示,輸入是復數型的信道數據序列,由于現有的很多深度學習庫函數不能對復數域操作進行支持,信道數據序列需要預處理。本文的預處理方式是分離復數的實部和虛部,并組成一個新的數據序列,同時還需提取該數據序列的特征向量。在提取序列的特征向量時,一維CNN表現出了優(yōu)異的性能,它可以提取高級特征,縮短序列長度,從而縮短神經網絡的訓練時間,降低各神經元的傳輸負載。
圖2 深度神經網絡結構
本文構造的預訓練網絡共有3層。第一層是一維卷積層(Conv1D),該層通過滑動窗口計算輸入數據的卷積和,加權處理后得到該卷積層的輸出
(32)
式中:W表示卷積濾波器,b表示偏移,*表示卷積運算,f(·)表示激活函數。在這個卷積層使用的激活函數為雙曲正切激活函數(tanh),其表達式為
(33)
信道信息經過該卷積層后,原有的信息序列被卷積變換,所有的卷積輸出構成一個特征矩陣,并將該矩陣數據輸出到網絡的下一層。第二層是一維最大池化層(Maxpooling1D),該層通過池化窗口搜索到上一卷積層輸出的最大值,并從特征矩陣中提取特征向量來減少特征參數的數量。此時的信道信息已經被轉化成高維的數據表示形式,但其特征被保留了下來。第三層再次堆疊一個一維卷積層,執(zhí)行與第一層相同的操作,進一步完成特征向量的提取,并準備將預訓練后的數據輸入到GRU網絡中進行信息預測。注意,完成預訓練的數據仍然是信道信息,但表達維度更高。
本文構造的預測網絡共有4層。第一層是GRU層,由更新門、重置門和激活函數組成。假設當前GRU層的輸入信道信息數據為xt,該層上一次學習后保留的信息gt-1首先經過重置門,將重置后的數據與本次的輸入疊加,通過激活函數tanh后,得到的輸出g′成功記憶了當前數據,其表達式為
g′=tanh(W·[gt-1*r,xt])
(34)
式中r表示重置門控函數。其表達式為
r=φ(Wr·[gt-1,xt])
(35)
式中:Wr表示重置門濾波器,φ(·)表示Sigmoid函數。然后將該部分輸出g′經過更新門,執(zhí)行信道信息數據的遺忘與記憶過程,表達式為
gt=(1-z)*gt-1+z*g′
(36)
式中z表示更新門控函數。其表達式為
z=φ(Wz·[gt-1,xt])
(37)
式中:Wz表示更新門濾波器。經過該GRU層后,信道信息數據被選擇性記憶與遺忘,將過去的記憶保留一部分后與本輪的新知識相加,得到更新后的數據gt。
第二層仍然是一個GRU層,其功能與第一層GRU類似,增強了學習能力,不同之處在于使用的激活函數為線性整流函數(ReLU),其表達式為
ReLU(x)=max{0,x}
(38)
第三層與第四層是密集層(Dense),對GRU網絡在每個時間步的輸出進行加權處理,降低輸出維度,最終輸出是來自GRU網絡的所有數據的加權和,即為預測的信道信息。
所提神經網絡的目標是預測準確的信道信息,因此使用的損失函數是平均絕對誤差(MAE)函數,該損失函數表示神經網絡的預測值與目標值的絕對差值。本文使用RMSprop優(yōu)化器,降低損失函數值,從而提高預測的準確性。
總的來說,本文設計的深度神經網絡,前三層為卷積神經網絡,用于預訓練信道信息數據;后四層為循環(huán)神經網絡,用于預測準確的信道信息。所提網絡有效地解決了由于CSI反饋延遲導致的通信系統(tǒng)性能下降問題,這一點將在接下來的仿真部分得到驗證。
在本節(jié)中,通過理論仿真與蒙特卡羅仿真的數值結果分析系統(tǒng)中斷性能,并驗證所提神經網絡結構在CSI反饋延遲的NOMA網絡中的性能。數值結果仿真工具為MATLAB,神經網絡編程工具為Python 3.7與Keras。蒙特卡羅仿真為10 000次,為了便于仿真,所有近用戶設置在基站與遠用戶的中點,仿真參數如下:用戶服務質量要求Rn=Rd=0.5 bit/s/Hz,Ω1=Ω2=0.064。這里采用離線訓練和信道估計,以便于評估如下多種深度學習算法。
仿真結果分為兩部分:(1) 將無DL情況下系統(tǒng)中斷概率的理論值與蒙特卡洛仿真值對比,將漸近中斷概率與準確中斷概率進行對比,保證中斷概率表達式與分集增益推導的準確,并分析延時相關系數ρ0對中斷性能的影響;(2) 基于所提信道信息預測方法,分析近用戶數量對中斷性能的影響,驗證深度神經網絡的性能,并將損失函數作為性能指標,比較不同的延時相關系數下各網絡結構的學習性能。
如圖3所示,其中近用戶數量N為3個,ρ0=1表示CSI反饋無延遲。蒙特卡羅仿真曲線與理論曲線完全一致,表明所推導的系統(tǒng)中斷概率閉式表達式是準確的。在高信噪比時,漸近中斷概率曲線與理論曲線相近,且曲線斜率一致,表明分集增益推導準確。對比不同延時相關系數下的理論中斷曲線,CSI反饋無延遲時,系統(tǒng)達到全分集,而存在反饋延遲的情況下,無論ρ0值為多少,系統(tǒng)分集增益都降為1,即CSI反饋延遲時多用戶系統(tǒng)分集增益消失。此外,延時相關系數越接近1,系統(tǒng)中斷概率越小,即反饋延遲越小,系統(tǒng)編碼增益越大。
圖3 不同延時相關系數的系統(tǒng)中斷概率(N=3)
圖4仿真了發(fā)射信噪比q=20 dB下近用戶數量變化時的系統(tǒng)中斷概率。隨著近用戶數量的增多,系統(tǒng)中斷概率不斷下降。當NOMA網絡存在反饋延遲時,系統(tǒng)性能下降嚴重,近用戶數量的增多僅能略微降低系統(tǒng)中斷概率。相比之下,基于DL的信道信息預測方法顯著提升了系統(tǒng)中斷性能,盡管不能完全消除CSI反饋延遲帶來的影響,但系統(tǒng)中斷概率大幅降低,且近用戶越多,性能提升越明顯,體現了該預測方法的優(yōu)越性。
圖4 信噪比20 dB下近用戶數量對系統(tǒng)中斷概率的影響
本文所提預測網絡的結構為雙層GRU與密集層的疊加,如圖5所示。對比其他網絡結構,所提預測網絡具有更小的平均絕對誤差,這表明在本文的CSI反饋延遲問題上,使用GRU網絡更合適。此外,從圖5中可以觀察到,加入Dense層能夠增強預測網絡的學習性能。值得注意的是,雙層GRU網絡的收斂速度要略慢于單個GRU層的神經網絡,但預測能力更強,這是增強網絡學習能力的代價。
圖5 各神經網絡結構預測性能
圖6仿真了延時相關系數變化對神經網絡性能的影響。延時相關系數越大,表示過時CSI與準確CSI的相關性越強,反饋時延較小,神經網絡預測的結果更為準確。當延時相關系數為1時,則表示反饋無延遲,網絡預測的誤差為0。若延時相關系數很小,神經網絡最終將無法預測準確的信道信息,相較于相關系數較大時的網絡性能,預測誤差會擴大至10倍以上,導致無法有效通信。
圖6 延時相關系數對預測性能的影響
綜上所述,過時的CSI會導致系統(tǒng)中斷性能下降,NOMA網絡中近用戶數量越多,CSI反饋延遲的影響越嚴重,而本文所提信道信息預測方法具有良好的效果,有效預測過時的信道信息并提升了系統(tǒng)中斷性能。
本文對CSI反饋延遲條件下的用戶中繼協(xié)作NOMA網絡進行了研究,根據近用戶選擇策略推導系統(tǒng)中斷概率閉式表達式;分析漸近中斷性能,推導系統(tǒng)分集增益。為了更好地選擇近用戶進行通信,提出基于DL的信道信息預測方法,降低CSI反饋延遲帶來的影響,并通過仿真驗證了所提方法能有效提升系統(tǒng)中斷性能。