張 源,沈 皓,趙 昆,夏 斌
(1.上海貝爾股份有限公司,上海201206;2.上海交通大學(xué) 電子工程系,上海200240)
長期演進(jìn)方案(Long-Term Evolution,LTE)是當(dāng)前移動通信的主流技術(shù)標(biāo)準(zhǔn)之一,相比上一代的技術(shù)標(biāo)準(zhǔn)具有高速數(shù)據(jù)傳輸和低延遲等特性,其演進(jìn)標(biāo)準(zhǔn)LTE-Advanced(LTE-A)正在推動著移動通信技術(shù)的進(jìn)一步發(fā)展。多輸入多輸出(Multiple-input Multiple-output,MIMO)技術(shù)是LTE-A 的核心技術(shù)之一,能夠為系統(tǒng)實現(xiàn)空間分集和空間復(fù)用等增益方式,其中空間復(fù)用的意義在于無需增加發(fā)送功率和帶寬即可顯著提高無線系統(tǒng)的容量和頻譜效率。在MIMO 技術(shù)方面,LTE-A 中相對LTE 引入了一些增強。就上行鏈路而言,LTE 尚未支持單用戶MIMO(Single-User MIMO,SU-MIMO),LTE-A 則引入了對最大4 天線發(fā)送8 天線接收的SU-MIMO 的支持[1],在空間復(fù)用的情形下對吞吐量有了大幅提升。在多址技術(shù)方面,正交頻分多址(Orthogonal Frequency Division Multiple Access,OFDMA)和單載波頻分多址(Single-Carrier FDMA,SCFDMA)分別為LTE-A 的下行和上行鏈路所采用。相比OFDMA,SC-FDMA 在保持正交性的同時實現(xiàn)了較低的峰均比(Peak-to-Average Power Ratio,PAPR),從而簡化了用戶終端(User Equipment,UE)的實現(xiàn)。
接收端檢測算法對于MIMO 系統(tǒng)的性能和復(fù)雜度具有重要影響,也是MIMO OFDMA 和MIMO SC-FDMA 技術(shù)的主要難點之一??臻g復(fù)用使得MIMO 系統(tǒng)的發(fā)送端利用多個天線同時發(fā)送多個數(shù)據(jù)流,這些數(shù)據(jù)流的多個線性組合到達(dá)接收端的多個天線,從而引入數(shù)據(jù)流之間的干擾。對于空間復(fù)用MIMO 系統(tǒng)的檢測算法,改進(jìn)其性能和復(fù)雜度的權(quán)衡具有重要的意義,在文獻(xiàn)中已有相當(dāng)數(shù)量的研究。最大似然(Maximum Likelihood,ML)檢測是理論上最優(yōu)的檢測算法,但因為實現(xiàn)的復(fù)雜度隨天線數(shù)目和調(diào)制階數(shù)呈指數(shù)增長而無法應(yīng)用于實際系統(tǒng)。低復(fù)雜度的算法中,迫零(Zero Forcing,ZF)和最小均方誤差(Minimum Mean Square Error,MMSE)都屬于線性檢測算法,雖然其復(fù)雜度相比ML 有很大的降低,但是性能不夠理想,因而以ML 為基礎(chǔ)的降低復(fù)雜度的算法同樣受到關(guān)注。為了接近ML 的性能并顯著地降低復(fù)雜度,文獻(xiàn)[2]提出了球形譯碼(Sphere Decoding,SD)檢測算法。這類算法的基本思想是,在一個以輸出矢量為中心半徑為某預(yù)設(shè)值的多維球內(nèi),搜索格點并找出最大似然點,其中格點集合由所有可能的輸入矢量經(jīng)過系統(tǒng)函數(shù)映射得到。因為搜索僅限于球內(nèi)格點而不是所有格點,所以搜索的格點數(shù)相比ML 可以顯著減少。初始半徑的確定以及球內(nèi)格點的搜索方法都直接影響到搜索的格點數(shù),因而成為SD 算法的關(guān)鍵問題。
將SD 算法應(yīng)用于MIMO 系統(tǒng)的信號檢測最早由文獻(xiàn)[3]提出,隨后很多研究提出了SD 算法的針對特定系統(tǒng)的實現(xiàn)方案以及各種改進(jìn)。文獻(xiàn)[4]對文獻(xiàn)[2]中深度優(yōu)先的格點搜索方法進(jìn)行了改進(jìn),并且在找到更近的有效格點時縮小半徑,從而在保持性能的同時提升了搜索效率,降低了復(fù)雜度。相比基于深度優(yōu)先搜索的SD 算法,一些廣度優(yōu)先的算法,如K- best SD[5]和固定復(fù)雜度SD(Fixed-complexity SD,F(xiàn)SD)[6]分別通過設(shè)定搜索格點數(shù)目的上限和固定值來控制復(fù)雜度,從而更有利于硬件實現(xiàn),但性能損失較為明顯。對于SD 算法在MIMO OFDMA 系統(tǒng)中的應(yīng)用也已經(jīng)有相當(dāng)數(shù)量的研究,如文獻(xiàn)[7]針對SD 算法本身,文獻(xiàn)[8]針對與之配合使用的相關(guān)方法。然而在MIMO SC- FDMA 系統(tǒng)中,發(fā)送端相比MIMO OFDMA 系統(tǒng)增加了離散傅里葉變換(Discret Furier Transform,DFT)擴展的環(huán)節(jié),使得接收端檢測算法的設(shè)計變得更為復(fù)雜。作者在深入調(diào)研的基礎(chǔ)上得知,現(xiàn)有文獻(xiàn)中尚未充分涉及SD 算法在MIMO SC-FDMA 系統(tǒng)中的應(yīng)用。與此相關(guān)的文獻(xiàn)主要有文獻(xiàn)[9-11],分別對SD 算法考慮了不同的實現(xiàn)方案,并通過仿真對誤碼率(Bit Error Rate,BER)或誤塊率(Block Error Rate,BLER)進(jìn)行了評估。然而現(xiàn)有文獻(xiàn)中存在的一個共同問題是,所用的MIMO SC-FDMA 系統(tǒng)模型和仿真設(shè)置相比實際的LTE-A 上行鏈路尚有顯著的差距,對于信道估計均采用理想的假定,因而對于在實際系統(tǒng)中應(yīng)用SD 算法的參考意義有所不足;除此之外還有其他多種問題存在,例如文獻(xiàn)[11]未指明具體采用何種SD 算法作為其實現(xiàn)方案的基礎(chǔ)。為了分析SD 算法在實際的LTE-A 系統(tǒng)中的適用性,本文針對LTE-A 上行SU-MIMO 的應(yīng)用場景,在遵循3GPP 標(biāo)準(zhǔn)的仿真平臺中實現(xiàn)了SD 算法并進(jìn)行了性能評估;所引入的實現(xiàn)方案不僅考慮了性能上與ML 的接近性,也考慮了在實際系統(tǒng)中的可實現(xiàn)性。從所得到的仿真結(jié)果出發(fā),本文闡明了SD相對MMSE 的性能增益的存在,并分析了不同的調(diào)制編碼方案(Modulation and Coding Scheme,MCS)和物理資源塊(Physical Resource Block,PRB)數(shù)目等配置下該增益的相對強弱,從而初步明確了SD 算法的適用條件,為其工程實現(xiàn)提供了參考依據(jù)。
文中符號說明如下:(·)T表示矩陣的轉(zhuǎn)置,(·)H表示矩陣的共軛轉(zhuǎn)置,IN表示N×N 的單位矩陣,‖·‖表示矢量的歐氏范數(shù)。
完整的LTE-A 上行鏈路包含多個模塊,如發(fā)送端有Turbo 編碼、速率匹配、DFT 擴展等,這些模塊在接收端都有對應(yīng)的部分。為簡化描述,以下我們僅給出與接收端檢測算法相關(guān)的數(shù)學(xué)表達(dá)式。令發(fā)送天線數(shù)為Nt,接收天線數(shù)為Nr。在發(fā)送端(UE側(cè)),已編碼的比特序列經(jīng)過QAM(包括QPSK、16QAM、64QAM)調(diào)制生成復(fù)值符號,所生成的QAM符號經(jīng)過N 點DFT 擴展得到頻率域信號,并被映射到M >N 個頻率點。隨后,這些頻率點經(jīng)過M 點IFFT 得到時間域信號,該時間域信號在添加循環(huán)前綴(Cyclic Prefix,CP)之后進(jìn)行發(fā)送。
在接收端,接收信號經(jīng)過移除CP,并經(jīng)過M 點FFT 得到頻率域信號。隨后經(jīng)過解資源映射,分別得到N 個子載波的信號。OFDM 符號中第n 個子載波的頻率域信號可表示為
其中,Yn∈CNr×1是第n 個子載波的接收信號矢量,Hn∈CNr×Nt為第n 個子載波的頻率域信道矩陣,Xn∈CNt×1為相應(yīng)的頻率域發(fā)送信號,νn∈CNr×1為相應(yīng)的噪聲。Xn與DFT 擴展之前的QAM 符號的關(guān)系可表示為
其中,F(xiàn)N∈CN×N為DFT 矩陣,xnt∈CN×1為第nt個發(fā)送天線的時間域信號,由N 個QAM 符號組成,其第k 個分量xnt(k)即為第k 個時刻的QAM 符號。接收端可以通過解調(diào)參考信號(Demodulation Reference Signal,DM- RS)實現(xiàn)頻率域的信道估計,Hn的估計值以及噪聲方差的估計值被作為檢測算法的輸入?yún)⑴c對的求解。
對于第2 節(jié)所述的系統(tǒng)模型,檢測算法所要實現(xiàn)的目標(biāo)是求解所對應(yīng)比特的對數(shù)似然比(Log Likelihood Ratio,LLR)值,其輸入包括Yn、以及。針對這一目標(biāo),SD 算法在系統(tǒng)中的實現(xiàn)需要考慮兩個方面:一是選取何種SD 算法,二是將何種距離量度作為最小化的對象;前者決定了算法實現(xiàn)的內(nèi)部流程,后者決定了算法實現(xiàn)的外部流程。出于對性能上與ML 的接近性以及在實際系統(tǒng)中的可實現(xiàn)性兩方面的考量,本文采用文獻(xiàn)[12]中的單樹搜索SD 算法,并結(jié)合文獻(xiàn)[11]中的迭代干擾消除流程,引入LTE-A 上行鏈路中SD 算法的實現(xiàn)方案。該實現(xiàn)方案由以下步驟描述:
(1)初始化:對n=1,2,…,N,計算Xn的MMSE解并經(jīng)過IDFT 和解調(diào)得出QAM 符號矢量的估計此時視為SD算法的第0 次迭代;
在以上步驟中,距離量度的初始化(即初始半徑的確定)與文獻(xiàn)[12]的不同之處在于,參與距離量度計算的QAM 符號矢量是最近一次得到的而不是基于ZF 所得的結(jié)果。就算法實現(xiàn)而言,本文與文獻(xiàn)[9]的主要區(qū)別在于通過迭代干擾消除將1 次NNt流的SD 求解轉(zhuǎn)化為N 次Nt流的SD 求解,從而避免了高復(fù)雜度;與文獻(xiàn)[10]的主要區(qū)別在于不依賴符號間干擾較弱的假設(shè),并且對MMSE 算法未作修改;與文獻(xiàn)[11]的主要區(qū)別在于結(jié)合了具體化的SD 算法,并選擇了更易于實現(xiàn)的初始半徑確定方法,避免了QR 分解的計算。
本節(jié)給出第3 節(jié)所描述的SD 算法實現(xiàn)方案在LTE- A 上行鏈路中的一些仿真結(jié)果。仿真采用3GPP 標(biāo)準(zhǔn)中規(guī)定的PUSCH 信號發(fā)送和接收流程(未配置控制信息的傳輸),信道模型采用3GPP EPA 模型(反映低速運動的情形)。子幀結(jié)構(gòu)方面采用正常CP,每個子幀內(nèi)的14 個OFDM 符號中有12 個數(shù)據(jù)符號和2 個DM- RS 符號,接收端通過DM-RS 實現(xiàn)信道估計。子載波的映射方式為集中式,總數(shù)目為2048 個。我們考慮三種不同的參數(shù)配置情形:MCS 10,5 個PRB,碼率0.678 8(配置1);MCS 10,10 個PRB,碼率0.666 7(配置2);MCS 20,5 個PRB,碼率0.824 2(配置3)。配置1 和配置2采用QPSK,配置3 采用16QAM,從而便于觀察不同調(diào)制階數(shù)之間的對比。
圖1給出了EPA 信道下2 發(fā)4 收,采用配置1的BER 仿真結(jié)果,圖2給出了這一情形下的BLER仿真結(jié)果。從兩幅圖中都可以看出,當(dāng)SNR 充分高時,采用SD 算法能夠產(chǎn)生顯著的相對MMSE 的增益。與此相反的是,當(dāng)SNR 充分低時,MMSE 的性能則優(yōu)于SD。對于高SNR 的性能增益可以解釋為,SD 算法在本質(zhì)上是降低復(fù)雜度的ML,因而在SNR 充分高時體現(xiàn)出相對MMSE 的優(yōu)勢。另一方面,SNR 充分低時由于MMSE 和ML 的性能差別不大,而SD 相對ML 的復(fù)雜度降低導(dǎo)致了相對此差別更明顯的性能損失;具體地說,由于此時信道估計的效果不夠好,使得初始解(MMSE 檢測的結(jié)果)更加不準(zhǔn)確,并且增強了干擾消除時的誤差傳播,因而導(dǎo)致SD 的性能有明顯的損失,這就解釋了低SNR 下MMSE 的優(yōu)越性。然而實際系統(tǒng)通常需要滿足較小的錯誤率上限的要求(如要求BLER 小于0.01),此時SD 相對MMSE 已經(jīng)有了較為可觀的增益(如圖2所反映的增益至少約1.4 dB),因而使用SD 對于提升性能具有充分的意義。
圖1 EPA 信道下2 發(fā)4 收,采用配置1 的誤碼率Fig.1 Bit error rate under EPA channel,with 2 transmit and 4 receive antennas,using configuration 1
圖2 EPA 信道下2 發(fā)4 收,采用配置1 的誤塊率Fig.2 Block error rate under EPA channel,with 2 transmit and 4 receive antennas,using configuration 1
為了比較不同配置下SD 相對MMSE 的增益大小,我們分別在圖3和圖4中給出了配置2 和配置3的BLER 仿真結(jié)果??紤]到錯誤率充分低時數(shù)值精確度可能不夠好,我們選取BLER 為0.05 時的增益進(jìn)行比較。通過圖上測量得出,配置1、配置2 和配置3 中SD 相對MMSE 的增益分別為0.724 dB、0.71 dB和1.1 dB,可見配置3 的增益顯著高于前兩者。究其原因,首先配置3 有較高階的調(diào)制,這使得ML(以及SD)相對MMSE 的增益較高;其次,較高的MCS 對應(yīng)較高的工作SNR,從而信道估計的結(jié)果更加準(zhǔn)確,亦導(dǎo)致增益的提高。由此可以認(rèn)為,對于較高的MCS,SD 更能夠體現(xiàn)出相對MMSE 的性能優(yōu)勢。
圖3 EPA 信道下2 發(fā)4 收,采用配置2 的誤塊率Fig.3 Block error rate under EPA channel,with 2 transmit and 4 receive antennas,using configuration 2
圖4 EPA 信道下2 發(fā)4 收,采用配置3 的誤塊率Fig.4 Block error rate under EPA channel,with 2 transmit and 4 receive antennas,using configuration 3
從圖1和圖2中還可以看出,將SD 算法進(jìn)行二次迭代幾乎不再有額外的增益,即二次迭代未能夠改進(jìn)BLER,甚至BER 也未見改進(jìn);與此類似,圖3也表明二次迭代產(chǎn)生的額外增益較為微弱。而根據(jù)文獻(xiàn)[11]中的結(jié)果,在無編碼的情形下二次迭代能夠產(chǎn)生顯著的額外增益。兩種情形的對比可以說明,信道編碼的運用使得增加一次迭代能夠產(chǎn)生的增益被顯著地削弱。具體地說,無編碼系統(tǒng)的性能取決于單個QAM 符號的解調(diào)結(jié)果,故只要改進(jìn)部分比特的LLR 即能夠顯著地改進(jìn)符號的解調(diào)結(jié)果;而有編碼系統(tǒng)的性能取決于整個碼塊的譯碼結(jié)果,增加一次迭代可能改進(jìn)了碼塊中部分比特的LLR,但是這些改進(jìn)還不能夠使得整個碼塊的譯碼結(jié)果得到充分的改進(jìn),從而無法像無編碼系統(tǒng)那樣通過增加一次SD 算法的迭代來充分提升性能。因而從經(jīng)驗的角度我們可以認(rèn)為,SD 算法的二次迭代不適用于實際系統(tǒng)。
本文通過對現(xiàn)有文獻(xiàn)中的SD 算法以及相關(guān)方法的分析,引入了一種針對LTE-A 上行鏈路的SD算法實現(xiàn)方案,并通過遵循3GPP 標(biāo)準(zhǔn)的仿真平臺對其錯誤率性能進(jìn)行了仿真。仿真結(jié)果驗證了SD相對MMSE 的性能增益的存在,并揭示出不同的配置情形下該增益的相對強弱。分析發(fā)現(xiàn),當(dāng)SNR 充分高時采用SD 算法能夠產(chǎn)生顯著的相對MMSE 的增益,當(dāng)調(diào)制階數(shù)較高時該增益更大,然而將SD 算法進(jìn)行二次迭代幾乎不再有額外的增益。該方案以及相應(yīng)的結(jié)果不僅適用于SU-MIMO,也適用于通過多用戶配對所組成的虛擬MIMO。通過對仿真結(jié)果的分析,SD 算法的適用情形初步得以明確,可以作為其工程實現(xiàn)的參考依據(jù)。概括地說,本文的創(chuàng)新點不僅包括在遵循3GPP 標(biāo)準(zhǔn)的仿真平臺中實現(xiàn)并評估了SD 算法,也包括采用了實際(非理想)的信道估計,以及分析了不同的配置下性能增益的變化,因而從工程實現(xiàn)的角度彌補了現(xiàn)有文獻(xiàn)的不足。在本文已完成工作的基礎(chǔ)上,對其中所引入的SD算法的實現(xiàn)方案進(jìn)行復(fù)雜度和收斂性等相關(guān)的理論分析,以及考慮如何針對高階調(diào)制等情形進(jìn)一步降低SD 算法的復(fù)雜度,并通過仿真評估其性能和增益的變化趨勢等方面,將會作為后續(xù)的工作內(nèi)容。
[1] Sesia S,Toufik I,Baker M. LTE-The UMTS Long Term Evolution:From Theory to Practice [M]. 2nd ed. New York:Wiley,2011.
[2] Fincke U,Pohst M.Improved methods for calculating vectors of short length in a lattice,including a complexity analysis[J]. Mathematics of Computation,1985,44(4):363-371.
[3] Viterbo E,Boutros J.A universal lattice code decoder for fading channel [J]. IEEE Transactions on Information Theory,1999,45(5):1639-1642.
[4] Agrell E,Eriksson T,Vardy A,et al.Closest point search in lattices[J].IEEE Transactions on Information Theory,2002,48(8):2201-2214.
[5] Guo Z,Nilsson P. Algorithm and implementation of the K-best sphere decoding for MIMO detection[J]. IEEE Journal on Selected Areas in Communications,2006,24(3):491-503.
[6] Barbero L,Thompson J.Fixing the complexity of the sphere decoder for MIMO detection [J]. IEEE Transactions on Wireless Communications,2008,7(6):2131-2142.
[7] Shah M A,Mennenga B,F(xiàn)ettweis G. Iterative Soft- In Soft- Out Sphere Detection for 3GPP LTE [C]//Proceedings of IEEE 71st Vehicular Technology Conference.Taipei:IEEE,2010:1-5.
[8] Wang C,Tsai P.Precoder selection under K-best MIMO detection for 3GPP- LTE/LTE- A systems [C]//Proceedings of 18th Asia-Pacific Conference on Communications.Jeju Island:IEEE,2012:933-938.
[9] Liu X,He X,Ren W,et al.Evaluation of Near MLD Algorithms in MIMO SC- FDMA System[C]//Proceedings of 2010 6th International Conference on Wireless Communications Networking and Mobile Computing. Chengdu:IEEE,2010:1-4.
[10] Jar M,Matus E,Perez-Adeva E,et al.Two-stage detector for SC-FDMA transmission over MIMO ISI channels[C]//Proceedings of 2012 International Symposium on Wireless Communication Systems. Paris:IEEE,2012:391-395.
[11] Moriyama M,Iwanami Y. Complexity reduction using QRD- M or SD in MIMO Interleaved SC- FDMA receiver with iterative detection[C]//Proceedings of 2012 International Symposium on Information Theory and its Applications.Honolulu,HI:IEEE,2012:145-149.
[12] Studer C,Wenk M,Burg A,Bolcskei H. Soft- Output Sphere Decoding:Performance and Implementation Aspects[C]//Proceedings of 40th Asilomar Conference on Signals,Systems and Computers. Pacific Grove,CA:IEEE,2006:2071-2076.