沈 弘 趙春明
(東南大學移動通信國家重點實驗室 南京 210096)
多輸入多輸出(MIMO)技術可以在不增加發(fā)射功率和帶寬的前提下顯著提高無線信道容量,已成為長期演進方案(LTE)等通信標準的物理層關鍵技術之一??辗謴陀檬荕IMO技術的一種重要形式,其基本思想是將多天線信道分解為多個獨立的并行子信道,通過在這些子信道上發(fā)送不同的數(shù)據(jù)流提高傳輸速率。由于空分復用系統(tǒng)會引入數(shù)據(jù)流之間的干擾,因而在接收端需要通過MIMO檢測算法去除空域上的干擾,恢復發(fā)送數(shù)據(jù)流。目前文獻中已經(jīng)提出各種MIMO檢測算法,其中迭代檢測[1-4]是一種能夠有效逼近MIMO信道容量的方案。最大后驗概率(MAP)檢測是最優(yōu)的迭代檢測算法,該方法需要遍歷整個發(fā)送向量空間,因而在采用高階調(diào)制或者數(shù)據(jù)流數(shù)較多的情況下,其復雜度非常高以至于難以實現(xiàn)。針對這個問題,文獻[1]提出一種低復雜度的基于最小均方誤差(MMSE)的軟干擾抵消算法,但是其性能與 MAP檢測相比有一定的差距;文獻[3]對傳統(tǒng)的硬輸出球形譯碼(SD)算法進行改進,提出一種列表球形譯碼(LSD)迭代檢測算法,該算法的性能雖然接近 MAP檢測,但是其復雜度會隨著噪聲強度和信道條件的變化而改變,尤其在低信噪比或者信道條件差的情況下,復雜度仍然很高,因而不利于ASIC實現(xiàn)。文獻[4]則在非迭代硬輸出 M 算法[5]基礎上提出一種迭代樹搜索算法(ITS),其優(yōu)點是計算復雜度恒定,然而當采用高階調(diào)制時,該算法仍需要較多的排序運算,并且某些比特的軟輸出值需要預先設定,導致性能上的損失。最近,文獻[6,7]針對硬輸出SD算法復雜度變化的缺點,提出一種固定復雜度球形譯碼(FSD)算法,該算法能以較低的復雜度獲得近似硬輸出 SD算法的性能,且不需要排序運算,適合ASIC實現(xiàn)。文獻[8]提出實數(shù)域上的FSD算法,有效降低了高階MIMO系統(tǒng)(如8×8)的檢測復雜度。在FSD的基礎上,文獻[9]又提出一種軟輸出FSD(SFSD)算法,該方法通過比特翻轉和路徑添加兩個步驟產(chǎn)生較高精度的軟量。然而,SFSD算法并沒有利用譯碼器反饋的先驗信息更新檢測器的軟輸出,因而其性能與 MAP迭代檢測算法相比仍有很大差距,另外,它的預處理復雜度較大,需要多次求解矩陣的逆。
本文首先將SFSD算法推廣到迭代檢測中,使得其能夠有效利用譯碼器反饋的軟信息,并利用多級比特映射星座圖[4]的特性大大減少分支度量的計算次數(shù),之后又將檢測順序調(diào)整和QR分解這兩個預處理步驟進行結合,在降低計算量的同時保證性能損失很小。最終的仿真結果表明,本文提出的算法能夠達到近似 MAP的性能,并且復雜度遠遠低于MAP。
圖 1給出了采用迭代接收機的 MIMO系統(tǒng)框圖。信息比特序列首先經(jīng)過信道編碼器和交織器,由此產(chǎn)生的比特序列再被映射為符號序列(假設共有Q= 2q個星座符號,q為調(diào)制階數(shù)),然后經(jīng)過串并轉換分為NT個子數(shù)據(jù)流,并從不同的天線上發(fā)射。接收端信號為
圖1 MIMO迭代接收機系統(tǒng)框圖
最優(yōu)的軟輸入軟輸出檢測算法是 MAP算法,其輸出軟量可采用Max-log近似得到[3]。
其中表示符號sn的第k個比特,分別表示滿足和的發(fā)送符號向量集合。由于MAP算法需要計算次,因此當數(shù)據(jù)流數(shù)較多或者調(diào)制階數(shù)較高時,復雜度會變得非常高。對于多輸入多輸出-正交頻分復用(MIMOOFDM)系統(tǒng),由于不同子載波的檢測是獨立進行的,因而本節(jié)介紹的迭代接收方案可以在 MIMOOFDM系統(tǒng)每個子載波上直接使用。
FSD算法本質上是一種基于寬度優(yōu)先原則的樹形檢測算法。對于前P層數(shù)據(jù)流,該算法采用遍歷搜索的方法,而對后NT-P層數(shù)據(jù)流則只保留一條局部最優(yōu)路徑。當P滿足(NR-NT)(P+ 1 ) + (P+ 1 )2≥NR時,F(xiàn)SD算法的性能與SD算法幾乎一致(與非迭代MAP算法的性能也十分接近)。下面將介紹FSD算法的具體步驟。該算法首先通過以下步驟確定檢測順序并置換信道矩陣H的列向量:
(1)令i=1,H1=H,T1={1,2,…,NT}。
(3)交換H第Ti(ki)和NT-i+ 1列;刪除Hi第ki列得Hi+1;刪除Ti第ki個元素得Ti+1。
(4)如果i=NT- 1,則此時Hi+1只包含一列,Ti+1只剩余一個元素,表示已經(jīng)完成檢測順序的調(diào)整;否則i的值增加 1,并跳轉回(2)進入下一輪循環(huán)。
將按照上述步驟得到的信道矩陣記作,則接收信號可以寫為
其中n'和n同分布。根據(jù)式(4)可定義符號i(i=NT,… ,1 )對應分支度量ui和路徑度量wi為
其中Q[·]表示星座圖上的硬判決運算。將最終產(chǎn)生的路徑集合記作LFSD,則硬判決輸出為總路徑度量值最小的路徑:
由于FSD算法只遍歷前P層,使得有些路徑上某些比特位只有0或1,不利于計算輸出軟量。SFSD算法在LFSD的基礎上添加路徑,保證所有比特位軟量都可以計算,過程如下:
(3)如果i=NSFSD,則結束SFSD算法的樹搜索過程,否則跳轉回上一步。
用LSFSD表示 SFSD 算法產(chǎn)生的路徑集合(包括FSD算法產(chǎn)生的QP條路徑),則最終的比特軟量可以采用如下公式計算:
其中表示符號的第k個比特。這里我們采用歐幾里德范數(shù)計算軟量,可以有效地提高軟量精度,該方法最早在文獻[10]中提出。
文獻[6,7]通過理論分析和仿真指出硬輸出 FSD算法能以很低的復雜度獲得近似最優(yōu)硬輸出的性能,其根本原因是FSD能根據(jù)不同數(shù)據(jù)流信噪比自適應的調(diào)整搜索方式。文獻[9]則指出,SFSD 算法在FSD產(chǎn)生的符號向量集合基礎上,通過比特翻轉和添加路徑兩個步驟得到一個新的集合LSFSD,第一可以保證集合LSFSD中不會發(fā)生某個比特位只存在‘0’或者‘1’的情況,第二能確保新增加的符號向量與近似最優(yōu)的^sFSD盡可能地接近,從而使得檢測器輸出的軟量十分精確且接近于最優(yōu)軟輸出。
SFSD算法雖然能產(chǎn)生較高精度軟量,但是并沒有利用譯碼器先驗信息,因而不能獲得迭代增益,此外該算法預處理需要較多的運算量。本文將針對這兩個問題分別進行改進。
當檢測器先驗信息LA1≠0時,分支度量ui和路徑度量wi需考慮LA1的作用,定義如下:
其中Ω是星座符號集合。本文提出的迭代SFSD算法在搜索發(fā)送符號向量集合時使用的方法和非迭代SFSD算法是一致的,包括FSD算法、比特翻轉以及路徑添加3部分。與SFSD算法的區(qū)別在于重新定義了計算軟量時使用的路徑度量和分支度量。根據(jù)之前對SFSD算法的分析可以推斷,迭代SFSD算法同樣能產(chǎn)生十分精確的軟量,并且由于有效地利用譯碼器反饋的信息,其性能接近于 MAP迭代檢測,事實上仿真結果也驗證了這一結論。
將式(12)與式(7)進行對比可以發(fā)現(xiàn),由于引入了先驗信息,此時無法采用簡單的符號硬判決運算,這就導致對于調(diào)制階數(shù)較高的情況(如16QAM),需要計算很多次分支度量值,顯然對于實現(xiàn)是不利的。文獻[4]利用多級比特映射星座圖的特性,有效地簡化了迭代樹搜索算法中的度量計算,下面將采用文獻[4]中的方法降低式(12)的計算復雜度。
圖2中的實心圓表示采用多級比特映射的16 QAM 星座圖,其中每個星座符號都用 4個比特表示。所謂多級比特映射的含義是:前兩個比特代表了該符號所在的象限,例如“00”表示第1象限;而后兩個比特則確定了該符號在象限中的位置,這樣只需要兩步搜索即可確定符號的具體位置(對于64 QAM 星座圖則需要 3步搜索)。下面仍以 16 QAM 為例介紹如何利用多級比特映射減少搜索局部最優(yōu)路徑的運算量。圖2中的空心圓表示每個象限內(nèi)星座符號的中心,記作sC1,sC2,sC3,sC4。首先將這4個符號值分別代入式(10)計算分支度量:
圖2 多級比特映射的16 QAM星座圖
SFSD算法的預處理包括調(diào)整檢測順序和 QR分解這兩個步驟,其中調(diào)整檢測順序需要NT-1次矩陣求逆運算,當數(shù)據(jù)流較多時計算量很大。事實上,SFSD算法對最后NT-P層數(shù)據(jù)流的檢測順序調(diào)整和 V-BLAST檢測[11]一致,即首先檢測信噪比最高的數(shù)據(jù)流。為避免V-BLAST算法的矩陣求逆運算,文獻[12]曾提出一種 SQRD檢測方法,其基本思想是在QR分解同時確定檢測順序。下面我們將該方法推廣到SFSD算法預處理中,具體步驟如下:
(1)令i= 1 ,H1=H,S=T1={1 ,2,… ,NT}。
(3)交換H的第Ti(ki)列和第NT-i+ 1列;交換S的第Ti(ki)個元素和第NT-i+ 1個元素;刪除Hi的第ki列,得到Hi+1;刪除Ti的第ki個元素,得到Ti+1。如果i=P,則進行下一步操作,否則i增加1并跳轉回上一步。
(5)當i≤NT-P時,按照式(14)求解ki:
其中ql表示Q的第l列;分別交換Q和R的第i和ki列,交換S的第i和ki個元素。
(6)采用Gram-Schmidt正交化方法更新矩陣Q和R,包括以下幾步:
(b)qi=qi/ri,i;
(c)ri,l=qiHql,ql=ql-ri,lqi,l=i+ 1,… ,NT。
(7)如果i=NT,則完成預處理,否則i增加1并跳轉回(5)。
該簡化方法保證前P層數(shù)據(jù)流的檢測順序和SFSD算法相同,而后面NT-P層數(shù)據(jù)流的檢測順序則由SQRD算法確定,和原來的預處理方法相比,不但可以省去NT-P- 1次矩陣求逆,而且性能損失很小。這主要是因為SQRD算法能保證QR分解后得到的上三角陣R滿足如下性質:較小的對角元在左上方而較大的對角元在右下方,又由于較大對角元對應的數(shù)據(jù)流具有較高的信噪比[12],因而信噪比較大數(shù)據(jù)流可以先被檢測。雖然這種檢測順序調(diào)整方式不完全等價于下文算法 1中多次求逆的方法,但基本思想是一致的,即減少誤差傳播影響。
本節(jié)將給出LTE下行鏈路環(huán)境中不同算法的性能,表1列出了仿真中采用的系統(tǒng)參數(shù)。
表1 LTE下行鏈路仿真參數(shù)
考慮 LTE下行鏈路中3種天線配置:2×2, 4×4和6×6。通過仿真發(fā)現(xiàn)3種天線配置下較為理想的NSFSD分別為1, 3和6。下文“基于SFSD的迭代算法1”是利用式(12)尋找每層局部最優(yōu)路徑,并采用原始SFSD算法的預處理;“基于SFSD的迭代算法 2”是在算法 1基礎上,利用多級比特映射星座圖特性減少分支度量計算并對簡化預處理。
圖3比較了2×2MIMO, 16QAM調(diào)制情況下兩種基于SFSD的迭代算法誤幀率性能。從圖中可以看到,基于SFSD的迭代算法2和算法1的性能幾乎無區(qū)別,這表明算法2采用的簡化是合理的。此外兩種基于SFSD的迭代算法在第1次迭代時能獲得0.5 dB性能增益(誤幀率0.1),第2次迭代時增益變小,說明迭代趨于收斂。與 MAP算法相比,不進行迭代時基于SFSD的迭代算法2約有0.2 dB的損失(誤幀率0.1),而對于迭代一次和兩次則幾乎無損失。
圖4比較了4×4MIMO, 16QAM調(diào)制情況下兩種基于SFSD的迭代算法性能。從圖中可以看到,基于SFSD的迭代算法2的誤幀率十分接近算法1,這表明算法2的簡化處理對性能影響很小。此外,兩種基于SFSD的迭代算法在第1次迭代時即可獲得0.7 dB的增益(誤幀率0.1),第2次迭代獲得增益變小,說明迭代趨于收斂。與 MAP算法相比,不進行迭代時基于SFSD的迭代算法2約有0.25 dB的性能損失(誤幀率 0.1),迭代 1次時損失為 0.1 dB(誤幀率0.1)。當?shù)螖?shù)為2時損失變得更小。
圖5比較了6×6MIMO, QPSK調(diào)制情況下兩種基于SFSD的迭代算法與MAP算法的性能。從結果中可以看到,基于SFSD的迭代算法2的誤幀率十分接近算法1,這表明即使在高階MIMO情況下,算法2的簡化處理也是有效的。在不進行迭代時基于SFSD的迭代算法2相對于MAP算法約有0.25 dB的性能損失(誤幀率0.1),而迭代1次時,性能損失則減小為0.1 dB(誤幀率0.1),兩次迭代情況下?lián)p失變得很小。
圖3 基于SFSD的迭代算法性能(N T =N R = 2 , 16QAM調(diào)制)
圖4 基于SFSD的迭代算法性能 ( N T =N R = 4 , 16QAM調(diào)制)
圖5 基于SFSD的迭代算法與MAP算法性能比較( N T =N R = 6 , QPSK調(diào)制)
表2列出了MAP檢測和兩種基于SFSD的迭代算法的計算復雜度(單個子載波)。從表中可以發(fā)現(xiàn),在2×2MIMO, 16QAM調(diào)制下,基于SFSD的迭代算法1計算量相對于MAP算法沒有顯著的減少,而算法2的計算量相對于算法1有明顯下降,需要實數(shù)乘法數(shù)和實數(shù)加法數(shù)約為 MAP算法的1/2和1/3。在4×4MIMO, 16 QAM調(diào)制下,基于SFSD的迭代算法 1和算法 2的計算量均遠小于MAP算法,且算法2復雜度最低。對于6×6 MIMO,QPSK調(diào)制,兩種基于SFSD迭代算法計算量遠小于MAP算法,且算法2具有更低復雜度。
表2 算法復雜度比較(單個子載波)
本文提出了一種基于SFSD算法的MIMO迭代檢測方案。該方法首先將譯碼器反饋的先驗信息引入分支度量和路徑度量的定義中,使得檢測器軟輸出的精度在每次迭代過程中不斷增加,獲得明顯的迭代增益。之后,該方案又利用多級比特映射星座圖的特點,大大減少分支度量的計算次數(shù)。另外,本文還將調(diào)整檢測順序和QR分解兩步相結合,減少了SFSD算法預處理中的矩陣求逆次數(shù)。在LTE下行鏈路環(huán)境中的仿真結果表明,本文的算法能夠獲得近似 MAP算法的性能,并且復雜度遠低于MAP。另外本文提出的算法同樣適用于調(diào)制階數(shù)更高(如64QAM)的情況,也可以應用于發(fā)送數(shù)據(jù)流更多的MIMO系統(tǒng)。
[1]Sellathurai M and Haykin S. Turbo-BLAST for wireless communications: theory and experiments [J].IEEE Transactions on Signal Processing, 2002, 50(10): 2538-2546.
[2]Haykin S, Sellathurai M, De Jong Y,et al.. Turbo-MIMO for wireless communications [J].IEEE Communications Magazine, 2004, 42(10): 48-53.
[3]Hochwald B M and Ten Brink S. Achieving near-capacity on a multiple-antenna channel [J].IEEE Transactions on Communications, 2003, 51(3): 389-399.
[4]de Jong Y and Willink T J. Iterative tree search detection for MIMO wireless systems [J].IEEE Transactions on Communications,2005, 53(6): 930-935.
[5]Yue J, Kim K J, Gibson J D,et al.. Channel estimation and data detection for MIMO-OFDM systems [C]. Proceedings of IEEE GLOBECOM, San Francisco, USA, Dec. 2003:581-585.
[6]Barbero L G and Thompson J S. Fixing the complexity of the sphere decoder for MIMO detection [J].IEEE Transactions on Wireless Communications, 2008, 7(6): 2131-2142.
[7]Jaldén J, Barbero L G, Ottersten B,et al.. The error probability of the fixed-complexity sphere decoder [J].IEEE Transactions on Signal Processing, 2009, 57(7): 2711-2720.
[8]Zheng C, Chu X, McAllister J,et al.. Real-valued fixed-complexity sphere decoder for high dimensional QAM-MIMO systems [J].IEEE Transactions on Signal Processing, 2011, 59(9): 4493-4499.
[9]Barbero L G, Ratnarajah T, and Cowan C. A low-complexity soft MIMO detector based on the fixed-complexity sphere decoder [C]. Proceedings of IEEE ICASSP, Las Vegas, USA,March 2008: 2669-2672.
[10]Kawai H, Higuchi K, Maeda N,et al.. Likelihood function for QRM-MLD suitable for soft-decision Turbo decoding and its performance for OFCDM MIMO multiplexing in multipath fading channel [J].IEICE Transactions on Communications,2005, E88-B(1): 47-57.
[11]Foschini G J. Layered space-time architecture for wireless communication in a fading environment when using multiple antennas[J].Bell Labs Technical Journal, 1996, 1(2): 41-59.
[12]Wübben D, B?hnke R, Rinas J,et al.. Efficient algorithm for decoding layered space-time codes[J].Electronics Letters,2001, 37(22): 1348-1350.
[13]3GPP TSG-RAN, TS 36.101 v9.8.0. User Equipment (UE)radio transmission and reception (Release 9) [S]. 2011.
[14]3GPP TSG-RAN, TS 36.212 v9.3.0. Multiplexing and channel coding (Release 9)[S]. 2010.