張德民 孟莎莎 陳貝
(重慶郵電大學(xué)重慶市移動通信技術(shù)重點實驗室,重慶 400065)
LTE系統(tǒng)基于傳輸分集的信號檢測的DSP實現(xiàn)
張德民 孟莎莎 陳貝
(重慶郵電大學(xué)重慶市移動通信技術(shù)重點實驗室,重慶 400065)
信號檢測是長期演進(jìn)(LTE)系統(tǒng)接收端的一項重要技術(shù),對系統(tǒng)的性能有著較大的影響。在LTE系統(tǒng)中,接收端的天線同時接收來自發(fā)送端的多個天線端口的數(shù)據(jù),因此接收端必須采用信號檢測算法還原發(fā)送端的數(shù)據(jù)。分析與研究了基于傳輸分集的信號檢測算法,并著重討論了空頻編碼法,提出了一種簡單的DSP實現(xiàn)方案。該方案已成功應(yīng)用于TD-LTE TTCN擴(kuò)展測試集儀表開發(fā)項目中。
LTE 預(yù)編碼 傳輸分集 信號檢測 DSP實現(xiàn)
長期演進(jìn)(long term evolution,LTE)[1-3]是第三代合作伙伴計劃(the 3rd generation partnership project, 3GPP)近幾年來啟動的最大的科研項目,能夠提高頻譜利用率和數(shù)據(jù)傳輸速率的多輸入多輸出(multiple input multiple output,MIMO)[4]技術(shù)成為LTE技術(shù)的首選。LTE又稱為準(zhǔn)4G技術(shù),MIMO系統(tǒng)信號檢測算法的好壞對MIMO系統(tǒng)有著很大的影響,所以對MIMO系統(tǒng)信號檢測的研究顯得非常重要。MIMO系統(tǒng)接收端的信號檢測是研究TD-LTE系統(tǒng)終端的重點。
傳統(tǒng)的信號檢測算法有很多,大體上可以分為最優(yōu)檢測算法、線性檢測算法、非線性檢測算法三類。
最優(yōu)檢測算法是指最大似然(maximum likelihood, ML)[5]算法和最大后驗概率(maximum a posteriori, MAP)算法。其中,ML算法用于發(fā)送信號等概率的情況,而MAP算法用于發(fā)送信號非等概率的情況。
線性檢測算法包括迫零(zero forcing,ZF)算法和最小均方誤差(minimum mean square error,MMSE)算法。
非線性檢測算法主要指垂直貝爾實驗室分層空間-時間(vertical bell labs layered space time,V-BLAST)[6]算法、QR分解算法[7]、球形檢測(sphere detection,SD)算法和相關(guān)改進(jìn)算法。
線性信號檢測算法忽略了信道對接收數(shù)據(jù)的干擾,將接收的數(shù)據(jù)視為一種線性合并,這樣強(qiáng)制進(jìn)行信號檢測的后果是放大了噪聲。最優(yōu)檢測算法有著最高的性能,但它也有很高的復(fù)雜度,很難在實際系統(tǒng)中進(jìn)行應(yīng)用。而傳輸分集技術(shù)可靠性相對較高,特別是采用空頻編碼(space frequency block code, SFBC)[8]時,兩路信號是相互正交的,信道的相關(guān)性弱,采用線性檢測算法足以實現(xiàn)信號還原。因此,本文主要對TD-LTE系統(tǒng)中基于傳輸分集的信號檢測算法進(jìn)行了分析和研究,在保證性能的前提下極大地降低了算法的復(fù)雜度。
發(fā)射分集的主要原理是利用空間信道的弱相關(guān)性,結(jié)合時間/頻率上的選擇性,為信號的傳遞提供更多的副本,提高信號傳輸?shù)目煽啃?從而改善接收信號的信噪比。假設(shè)一個發(fā)送信號為x,沖激響應(yīng)矩陣為H,同時認(rèn)為接收端完全正確估計出信道沖激響應(yīng)。信號x從發(fā)送端經(jīng)過信道到達(dá)接收端。信號x在無線信道傳輸?shù)倪^程中,由于受多徑衰落、頻率選擇性衰落、噪聲的影響,導(dǎo)致接收信號存在符號間干擾和載波間干擾等。為消除這些干擾、恢復(fù)出原始信號,可以在接收端進(jìn)行信號檢測。傳輸分集的信號檢測有兩種情況,即兩天線口和四天線口。
1.1 兩天線端口的信號檢測
針對兩天線傳輸,采用類似Alamouti編碼方式,編碼矩陣如下:
它表示在天線0的子載波k上的傳輸符號為x1,子載波(k+1)上的傳輸符號為x2,在天線1的子載波k上的傳輸符號為,子載波(k+1)上的傳輸符號為這種編碼方式稱為空頻編碼(SFBC)。在LTE系統(tǒng)中,天線端口0的兩個復(fù)值符號是x(0)(i)、x(1)(i),天線端口1的復(fù)值符號是-x(1)*(i)和x(0)*(i),其實質(zhì)是SFBC。因此,編碼矩陣調(diào)整為如下形式:
在傳輸分集條件下,兩天線的傳輸分集的預(yù)編碼實質(zhì)是SFBC,所以接收端解預(yù)編碼的算法的原理就是解SFBC的原理。采用最大比合并方式進(jìn)行信號檢測、解預(yù)編碼、解層映射。解SFBC的原理如下:SFBC假設(shè)兩個相鄰子載波k和(k+1)保持準(zhǔn)靜態(tài),分別采用第j根發(fā)送天線和第i根接收天線,在子載波k和(k+1)上的信道沖擊響應(yīng)分別為Hij(k)、Hij(k+1),則有Hij(k)= Hij(k+1)。對于1根接收天線,在1個正交頻分復(fù)用(orthogonal frequency-division multiplexing,OFDM)符號周期內(nèi),在第k和第(k+1)個子載波上的接收信號可以寫為:
SFBC通過發(fā)送端構(gòu)造的正交發(fā)射矩陣使得信道矩陣具有正交性。接收端已估計出信道沖激響應(yīng),于是利用信道矩陣的正交性,采用簡單的線性處理即最大比合并。將接收信號向量乘以HH,有HHY=HHHX+HHN,則可以得到:
如果是2根接收天線,其處理的過程與單天線是相同的。在1個OFDM周期內(nèi),2根接收天線在第k和第(k+1)子載波上接收到的信號可以寫成矩陣的形式:Y=HX+N。將其展開可以得到:
若令天線端口0在子載波k和(k+1)處發(fā)送的數(shù)據(jù)為x1(k)=x1,x1(k+1)=x2,則天線端口1在子載波k和(k+1)處發(fā)送的數(shù)據(jù)為可將上式進(jìn)一步簡化為:
為了便于參數(shù)統(tǒng)一,將第二行和第四行取共軛可以得到:
因為相鄰子載波的沖激響應(yīng)數(shù)值相等,因此式(9)可以進(jìn)一步簡化為:
此時的沖激響應(yīng)矩陣為正交矩陣。等式左右兩邊同時乘以HH,濾除掉噪聲后,可以得到x1、x2的估計值:
1.2 四天線端口的信號檢測
四天線發(fā)送的預(yù)編碼和兩天線的原理是一樣的。在某個時刻k和其下一個時刻(k+1),可以通過最大比合并,通過接收的兩根天線在k和(k+1)時刻的值,把發(fā)送天線端口1和天線端口3上的數(shù)據(jù)解出。同理在時刻(k+2)和時刻(k+3)的值,可以把發(fā)送天線端口2和4上的數(shù)據(jù)解出。發(fā)送天線端口1~4在時刻k~(k+4)的數(shù)據(jù)如式(13)所示。
可見對于兩根接收天線,其原理和前面介紹的兩發(fā)兩收是一樣的,所以其推理過程類似。這里不再贅述其計算過程,結(jié)果如下。
四發(fā)四收的處理情況和前面類似,利用四根接收天線在k和(k+1)時刻的值解出發(fā)送天線端口1和端口3上的值x1和x2,再利用四根接收天線在(k+2)和(k+3)時刻的值解出發(fā)送天線端口1和端口3上的值x3和x4。下面直接給出它們的計算公式。
2.1 DSP處理器
TMS320C6455[9-10]芯片屬于C64x系列,是C6000系列中性能最高的定點數(shù)字信號處理器。它主要具有如下的特點:靈活的存儲器配置;專用存取結(jié)構(gòu);高度并行CPU結(jié)構(gòu);片內(nèi)集成多種外設(shè);類似精簡指令集計算機(jī)(reduced instruction set computer,RISC)的指令集。
2.2 變量定義
TD-LTE系統(tǒng)下行最大支持20 MHz帶寬,大約有110個資源塊(resource block,RB)。小區(qū)ID在小區(qū)搜索時獲得,是已知參數(shù)。循環(huán)冗余前綴(cyclic prefix, CP)分為常規(guī)和擴(kuò)展兩種類型,本文DSP實現(xiàn)基于常規(guī)CP、6個RB,且每個RB的子載波個數(shù)選取為12。
DSP實現(xiàn)的公共參數(shù)如表1所示。當(dāng)前支持的發(fā)送端/接收端的天線數(shù)組合為1T1R、1T2R、2T1R及2T2R。
表1 輸入、輸出參數(shù)Tab.1 Input/output parameters
2.3 詳細(xì)設(shè)計流程
根據(jù)接收天線接收的數(shù)據(jù),以及估計出的發(fā)送天線和接收天線之間的脈沖響應(yīng)來檢測發(fā)送天線上的數(shù)據(jù)。首先判斷傳輸天線個數(shù)。如果是一根發(fā)送天線,再判斷接收天線個數(shù),此時有1發(fā)1收(1T1R)和1發(fā)2收(1T2R)兩種處理方式。如果是兩根發(fā)送天線,再判斷接收天線個數(shù),此時有2發(fā)1收(2T1R)和2發(fā)2收(2T2R)兩種情況,每種情況都分開進(jìn)行處理。具體的實現(xiàn)流程如圖1所示。
圖1中,1、2表示發(fā)送或接收天線數(shù)目; Detecsignal11()、Detecsignal12()、Detecsignal21()、Detecsignal22()分別表示1T1R、1T2R、2T1R、2T2R的信號檢測實現(xiàn)函數(shù)。
圖1 信號檢測實現(xiàn)流程圖Fig.1 Implementation flowchart of signal detection
在DSP實現(xiàn)的過程中,實現(xiàn)的主要思想如圖2所示。
圖2 實現(xiàn)的主要思想Fig.2 Main ideal of the implementation
①求分子的實部和虛部、分母(沖激響應(yīng)的模的平方),從分子的實部和虛部、分母中找出最大值,為后面進(jìn)行歸一化做準(zhǔn)備。
②根據(jù)最大值,對分子的實部和虛部、分母分別進(jìn)行歸一化。
③調(diào)用除法,求沖激響應(yīng)的模的倒數(shù)。
④分別將分子的實部和虛部與沖激響應(yīng)的模的倒數(shù)相乘。
在實現(xiàn)過程中有以下幾點需要注意。
第一,由于對接收信號與信道沖激響應(yīng)采用的量化方式不清楚,因此首先分別計算譯出接收天線1的數(shù)據(jù)和譯出接收天線2的數(shù)據(jù)以及信道沖激響應(yīng)的模。然后進(jìn)行歸一化,找出最大值,根據(jù)最大值確定量化方式。
在具體實現(xiàn)時,并沒有取其共軛,而是在進(jìn)行具體操作時,按照復(fù)數(shù)的乘法的加減法進(jìn)行變化。如A=a-bi,B=c+di,則有AB=(a-bi)(c+di)=ac+bd+ (ad-bc)i。
第二,每次處理是求出每根天線的兩個數(shù)據(jù),然后把兩根天線的兩個數(shù)據(jù)進(jìn)行最大比合并即解出兩個數(shù)據(jù)。在譯出每根天線的數(shù)據(jù)時需注意最后要除以各自到接收天線1/2信道沖激響應(yīng)的模。在進(jìn)行除法時,先求出信道沖激響應(yīng)的模的倒數(shù),然后將解出的每根天線的數(shù)據(jù)與其信道沖激響應(yīng)的模的倒數(shù)相乘。在求其倒數(shù)時,如A/B,變?yōu)锳(1/B)。
由于A和B采用相同的量化方式,因而分別對A和B做如下處理。A采用Q13量化,用1左移31位除以B,得到的結(jié)果采用Q18量化,用32位進(jìn)行保存而不做任何處理,直接與A相乘即可。而A是用16位進(jìn)行保存,兩者直接相乘的結(jié)果是48位,前16位是符號擴(kuò)展位,保留低32位,然后將得到的結(jié)果取其高16位即可。
第三,每次譯出的每根天線的第二個數(shù)據(jù)是數(shù)據(jù)的共軛,最后要對其取反。
2.4 DSP實現(xiàn)的優(yōu)化
DSP實現(xiàn)的語言可以是C語言,也可以是匯編語言。匯編語言的可讀性比較差,但執(zhí)行效率較高。因此判斷接收天線和發(fā)送天線個數(shù)用C語言實現(xiàn),而具體每種情況(1T1R,1T2R,2T1R,2T2R)采用匯編語言來實現(xiàn)。
編寫程序的性能除了對算法的優(yōu)化和設(shè)計,還有對程序的優(yōu)化。CCS3.3編譯器自帶優(yōu)化等級,根據(jù)自己欲達(dá)到的優(yōu)化條件,選擇合適的優(yōu)化等級。-o3優(yōu)化級經(jīng)常被青睞,但是-o3優(yōu)化級存在一個致命的缺點,即在程序編排流水不合理時,并不能很好地優(yōu)化程序,甚至在組織流水時會出現(xiàn)錯誤。所以需要手動編排流水,手動優(yōu)化程序。
在程序中,循環(huán)體可以減少大量的指令周期,因此,優(yōu)化循環(huán)體時要注意以下幾點。
①在循環(huán)體中,重復(fù)計算且值相同的多項式或者因子,在循環(huán)體外計算。
②優(yōu)化選擇分支,減少分支選擇跳轉(zhuǎn)費時。
③能用TI提供的內(nèi)聯(lián)函數(shù),盡量使用內(nèi)聯(lián)函數(shù),這樣可以避免壓棧出棧的時間。
④合理安排指令及所使用的功能單元,使一個指令周期內(nèi)可以并行處理多條指令。
在DSP軟件實現(xiàn)中,通過指令并行,盡量優(yōu)化程序循環(huán)體,存儲空間保存在.asm的文件中,包括變量名稱的定義與占用空間大小。所占存儲空間由程序存儲空間和數(shù)據(jù)存儲空間兩部分組成。
在開發(fā)過程中,DSP軟件實現(xiàn)模塊的程序占4.2 kB,變量所占的內(nèi)存為1.2 kB,其和不超過6 kB,而TMS320C6455芯片具有2 MB存儲空間,完全能夠滿足信號檢測功能實現(xiàn)對空間的要求。各種情況執(zhí)行的周期如表2所示。
表2 各種情況執(zhí)行的周期Tab.2 The execution cycles of each condition
本文從理論分析出發(fā),根據(jù)分時長期演進(jìn)(TDLTE)系統(tǒng)特性,闡述了基于傳輸分集的信號檢測技術(shù),分別簡述了兩天線端口和四天線端口的情況。詳細(xì)講述了兩天線端口的實現(xiàn)流程及其在DSP的實現(xiàn)方法,并在TMS320C64x芯片上加以實現(xiàn)。程序運(yùn)行結(jié)果表明,本文提出的方案能夠滿足TD-LTE系統(tǒng)的需求,具有可行性和高效性等特點。
[1] 沈嘉,索士強(qiáng),全海洋,等.3GPP長期演進(jìn)(LTE)技術(shù)原理與系統(tǒng)設(shè)計[M].北京:人民郵電出版社.
[2] 3GPP TS 36.211 v9.0.0 Evolved universal terrestrial radio Access (E-UTRA)physical channels and modulation(Release 9)[S].2009-12.http://www.3gpp.org/ftp/specs/2009-09/Rel-8/36_series/.
[3] 3GPP TS 36.212 v9.0.0 Evolved universal terrestrial radio access(EUTRA)physical channels and modulation(Release 9)[S].2009-12. http://www.3gpp.org/ftp/specs/2009-09/Rel-8/36_series/.
[4] Jalden J,Ottersten B.The diversity order of the semidefinite relaxation detector[J].IEEE Transactions on Information Theory,2008,54(4): 1406-1422.
[5] Rajan G,Rajan B.Multigroup ML decodable collocated and distributed space-time block codes[J].IEEE Transactions on Information Theory, 2010,56(7):3221-3247.
[6] Ohno K,Itami M,Ikegami T.Improvement of coexisting signal detection for MB-OFDMsystem[C]//ICUWB,2012IEEEInternational Conference on,Japan:IEEE Conference Publications,2012:352-356.
[7] Chein-I C.Multiparameter receiver operating characteristic analysis for signal detection and classification[J].IEEE Journals&Magazines, 2010,10(3):423-442.
[8] Safatly L,Andrieux G,Diouris J.LTE multi-antenna techniques based on Alamouti SFBC with correlated channels[C]//SoftCOM. 2010 IEEE International Conference on,Split,Dubrovnik:IEEE Conference Publications,2010:214-218.
[9] 謝瑞雯,陳國興.TMS320C6455的硬件資源分析[J].通信技術(shù), 2010,43(7):230-232.
[10] 田黎育,何佩琨.TMS320C6000系列DSP編程工具與指南[M].北京:清華大學(xué)出版社,2006:32-45.
DSP Implementation of Signal Detection Based on Transmit Diversity in LTE System
Signal detection is one of the significant technologies for receiving terminal in long term evolution(LTE)system,it highly influences the system performance.In LTE system,the receiving antennas at receiving end simultaneously receive the data coming from multiple transmitting antenna ports,so it is necessary to use signal detection algorithm at the receiving end to restore the data from transmitting end.The signal detection algorithm based on transmit diversity is analyzed and studied,and the space frequency block coding(SFBC)method is discussed emphatically,and the simple DSP implementing scheme is proposed.The scheme has been successfully applied in development of the TD-LTE TTCN extended test suite instrumentation.
Long term evolution(LTE) Pre-coding Transmit diversity Signal detection DSP realization
TN929+.5
A
國家科技重大專項基金資助項目(編號:2012ZX03001024);
重慶市科委重點實驗室專項經(jīng)費。
修改稿收到日期:2014-01-06。
張德民(1955-),男,1988年畢業(yè)于北京郵電大學(xué)信號、電路與系統(tǒng)專業(yè),獲碩士學(xué)位,教授;主要從事信號處理及在通信系統(tǒng)中的應(yīng)用。