連帥彬,王 鵬,陳新武,張曉麗
(信陽(yáng)師范學(xué)院 物理電子工程學(xué)院,河南 信陽(yáng) 464000)
數(shù)據(jù)壓縮[1]是指按照特定的編碼機(jī)制,用更少的比特表示原始信息的過(guò)程,以提高其在傳輸、存儲(chǔ)和處理時(shí)效率的一種技術(shù).數(shù)據(jù)壓縮的一般過(guò)程如圖1所示.
圖1數(shù)據(jù)壓縮過(guò)程
Fig.1Theprocessofdatacompression
建模是為了更有效地表達(dá)原始數(shù)據(jù)的規(guī)律性;二次量化是對(duì)模型參數(shù)的精度進(jìn)行截?cái)喾治?;編碼是對(duì)模型參數(shù)或者量化符號(hào)的壓縮表示,盡可能采用接近信息熵的編碼方法.數(shù)據(jù)壓縮[2]可分為無(wú)損數(shù)據(jù)壓縮和有損數(shù)據(jù)壓縮.無(wú)損數(shù)據(jù)壓縮指數(shù)據(jù)經(jīng)過(guò)壓縮后不會(huì)丟失信息,經(jīng)解壓縮后能完全恢復(fù)出原數(shù)據(jù),是一個(gè)可逆的過(guò)程.經(jīng)典的無(wú)損壓縮技術(shù)有:(1)基于統(tǒng)計(jì)模型的壓縮算法;(2)基于字典模型的壓縮算法;(3)基于變換的壓縮算法等.無(wú)損壓縮算法的壓縮比相對(duì)較低,不利于大數(shù)據(jù)的光纖通信系統(tǒng).
有損壓縮算法有較高的壓縮比,因此本文重點(diǎn)研究OFDM時(shí)域信號(hào)的有損數(shù)據(jù)壓縮算法.有損壓縮機(jī)制[3]主要有兩種:(1)有損變換編解碼;(2)預(yù)測(cè)編解碼.有損壓縮一般容易獲得較高的壓縮比,但是壓縮比越大丟失的數(shù)據(jù)越多.衡量有損數(shù)據(jù)壓縮算法通用的性能指標(biāo)[4-5]主要有壓縮比(Compress Ratio,Rc)和信噪比(Signal Noise Ratio,RSN),見(jiàn)式(1)和式(2).
(1)
(2)
本文主要開(kāi)展了基于FTTdp+GDSL[6-7](光纖到戶(hù)+數(shù)字用戶(hù)線路)組網(wǎng)方案的光纖傳輸OFDM時(shí)域信號(hào)有損數(shù)據(jù)壓縮算法的研究.根據(jù)OFDM信號(hào)的統(tǒng)計(jì)特性,首先推導(dǎo)了模數(shù)轉(zhuǎn)換(ADC, Analog to Digital Converter)的量化位數(shù)與量噪比之間的關(guān)系,并提出了兩種降低OFDM信號(hào)峰值平均功率比[8](PAPR,Peak to Average Power Ratio)的方法,即削峰尾插(CTP,Clipping with Tail Plug)技術(shù)和幾何級(jí)數(shù)壓擴(kuò)(GSC, Geometric Series Companding)變換技術(shù),對(duì)這兩個(gè)方法在有損數(shù)據(jù)壓縮模型上進(jìn)行理論分析和仿真驗(yàn)證.
量化誤差的方差[9]為:
(3)
公式(3)中,所有間隔內(nèi)的概率之和等于1,
(4)
用分貝表示式(4)信噪比,
(5)
r=4.77+6.02L-10lgP.
(6)
由式(6)可以看出ADC輸出的量噪比r只與峰均比P、量化位寬L相關(guān).
設(shè)信號(hào)為x[n],削峰門(mén)限Th. CTP的原理:(1)削斷信號(hào)x[n]中所有幅度超過(guò)±Th的信號(hào),在±Th內(nèi)的信號(hào)保持不變;(2)用一個(gè)增量標(biāo)識(shí)Λ來(lái)標(biāo)識(shí)有削斷操作的位置,即有削斷操作的位置設(shè)置為一個(gè)固定值sign(x[n])(Th+Λ),而其他無(wú)削斷操作的采樣點(diǎn)數(shù)據(jù)不會(huì)超過(guò)±Th;(3)超出±Th的部分減掉一個(gè)常數(shù)β,按順序插入符號(hào)序列的末尾.削峰表達(dá)式:
(7)
序列尾部插入的剩余量的表達(dá)式:
x[n]≥Th,
(8)
ICTP的表達(dá)式:
(9)
其中,Λ'也是一個(gè)增量標(biāo)識(shí),且Λ'<Λ.
對(duì)于幅度服從正態(tài)分布的信號(hào),經(jīng)過(guò)CTP處理的數(shù)據(jù),可以把信號(hào)的動(dòng)態(tài)范圍限制在[-Th-Λ,Th+Λ]內(nèi),而且不會(huì)引入截?cái)嗾`差,算法復(fù)雜度低,實(shí)用性強(qiáng).
定義一個(gè)幾何序列an,首項(xiàng)a1>0,公比為q,幾何序列an的前n項(xiàng)和為:
(10)
在OFDM信號(hào)中,時(shí)域信號(hào)x[n]正負(fù)值都存在,幅度壓縮后不能改變?cè)盘?hào)的正負(fù)性.公式(10)中,令a1>0,用x[n]的絕對(duì)值來(lái)代替n,用y[n]來(lái)代替Sn,得出GSC曲線函數(shù)為
(11)
公式(11)中x[n]必須為實(shí)數(shù),如果x[n]為復(fù)數(shù),則只需將x[n]的實(shí)部和虛部分別處理.
當(dāng)a1=1,當(dāng)q取不同的值時(shí),獲得的不同壓縮曲線如圖2所示.
圖2 不同q值下GSC曲線
由圖2可以看出:a1=1時(shí),01時(shí),GSC對(duì)輸入數(shù)據(jù)的動(dòng)態(tài)范圍被放大.容易得出,壓縮擴(kuò)展變換抑制信號(hào)PAPR能力和系統(tǒng)誤碼率(BER)是一對(duì)矛盾,抑制能力越強(qiáng),誤碼率就會(huì)越高.
GSC逆變換(IGSC,Inverse Geometric Series Companding)公式為
(12)
GSC技術(shù)的主要優(yōu)點(diǎn):(1)a1=1時(shí),通過(guò)調(diào)節(jié)q,GSC容易獲得不同性能的壓擴(kuò)曲線,實(shí)現(xiàn)信號(hào)幅度的不同的壓縮,而且還可以在線性壓擴(kuò)(q=1)和非線性壓擴(kuò)(01和a1>1、q<1的組合,GSC也可以獲得相應(yīng)的壓擴(kuò)曲線.
從公式(6)可看出,滿(mǎn)足輸出RSN一定的條件下,通過(guò)降低OFDM信號(hào)的峰均比可以降低量化的位寬,根據(jù)這一原理建立了針對(duì)OFDM時(shí)域信號(hào)的有損壓縮模型,如圖3所示.在發(fā)送端進(jìn)行壓縮處理,先進(jìn)行CTP操作,信號(hào)的動(dòng)態(tài)范圍下降到原來(lái)的二分之一,降低信號(hào)的峰值功率;然后進(jìn)行GSC處理,增大信號(hào)的平均功率;最后進(jìn)行二次量化(低精度定點(diǎn)化),用更少的比特來(lái)表示原信息,即可實(shí)現(xiàn)OFDM時(shí)域信號(hào)的有效壓縮.接收端進(jìn)行相應(yīng)的反變換(ICTP和IGSC),獲得包含量化噪聲的信息,只要量化噪聲不大,就可以利用OFDM的正交性原理完全消除.
圖3 有損數(shù)據(jù)壓縮處理框圖
在Matlab中進(jìn)行仿真驗(yàn)證本文提出的有損壓縮算法的性能,如誤比特率、壓縮比和輸出信噪比等.從公式(6)以及2.1和2.2的分析可以看出,影響壓縮性能的參數(shù)主要有削峰門(mén)限值Th、GSC曲線的選取和二次量化(低精度定點(diǎn)化)的位寬L.公式(6)表明L每減少1比特分比率,則相應(yīng)的輸出信噪比下降約6.02 dB;公式(11)表明不同的公比q產(chǎn)生不同的壓擴(kuò)曲線.表1給出了一些仿真的參數(shù).
表1 仿真參數(shù)設(shè)置
CTP能有效降低信號(hào)的峰值,而GSC能提高信號(hào)的平均功率,為了找到兩者的最佳組合,使得信號(hào)的PAPR最小,令削峰門(mén)限Th=1.8σ、1.9σ、2.0σ、2.1σ、2.2σ,公比q從0.4~1.3之間每間隔0.1取一個(gè)測(cè)試點(diǎn).二次量化位寬L=9,輸出信噪比和壓縮比如圖4所示.從圖4的仿真結(jié)果看出,基于CTP和GSC變換的有損數(shù)據(jù)壓縮模型中,參數(shù)Th和q取不同值時(shí),有如下結(jié)論:(1)壓縮比只與Th有關(guān),幾乎不受q的影響.Th越大,壓縮比越大;Th越小,壓縮比越小.(2)輸出信噪比RSN的大小與Th和q有關(guān).q一定時(shí),Th越小,RSN越大;Th越大,RSN越小.Th一定時(shí),q在0.7~0.8之間取值,能達(dá)到最好的效果.
削峰門(mén)限Th的大小,決定了每個(gè)OFDM符號(hào)末尾新插入采樣點(diǎn)的多少,對(duì)壓縮比造成較大影響.Th越小,被截?cái)嗟男盘?hào)就越多,壓縮比自然下降;反之,亦然.只要數(shù)據(jù)點(diǎn)數(shù)量不變,二次量化的位寬相同,無(wú)論對(duì)數(shù)據(jù)進(jìn)行何種方式的壓擴(kuò)變換,都不會(huì)增加新的數(shù)據(jù)點(diǎn),因此壓縮比不受q的影響.
削峰門(mén)限的大小,同樣決定了處理后信號(hào)動(dòng)態(tài)范圍的大小,當(dāng)二次量化的位寬相同時(shí),Th越小,動(dòng)態(tài)范圍就會(huì)越小,二次量化時(shí)引入的量化誤差相應(yīng)較小,獲得的信噪比較高;反之亦然.而不同的q值,得到不同的壓擴(kuò)曲線,使得對(duì)數(shù)據(jù)進(jìn)行非線性變換后數(shù)據(jù)的概率分布不相同,二次量化時(shí)引入的量化誤差就會(huì)不一樣.為了達(dá)到最好的效果,應(yīng)盡可能地使壓擴(kuò)變換后的信號(hào)服從均勻分布.
圖4 DSL線長(zhǎng)50 m時(shí)削峰門(mén)限Th和公比q的關(guān)系圖
在3.1節(jié)已經(jīng)找到了Th與q的最優(yōu)組合,為了驗(yàn)證這兩種技術(shù)的組合效果的最優(yōu)特性.對(duì)原14比特定點(diǎn)化的信號(hào)直接進(jìn)行9比特二次量化、只進(jìn)行削峰尾插變換(CTP)、只進(jìn)行幾何級(jí)數(shù)壓擴(kuò)變換(GSC)、進(jìn)行削峰尾插和幾何級(jí)數(shù)壓擴(kuò)變換(CTP +GSC)的四種情況進(jìn)行仿真比較分析,以證明該壓縮模型的可行性.其中幾何級(jí)數(shù)的公比q=0.7,削峰門(mén)限Th=2σ,二次量化的位寬L=9.
圖5 DSL線長(zhǎng)50 m和100 m的輸出信噪比RSN
從圖5的仿真結(jié)果可以看出,如果直接采用9比特對(duì)原來(lái)的信息進(jìn)行二次量化,所獲得的平均輸出信噪比RSN比其他方法都低;只進(jìn)行GSC變換比直接9比特二次量化能提升3 dB左右;只進(jìn)行CTP操作,理論上已經(jīng)把動(dòng)態(tài)范圍降低了1倍左右,因此比直接9比特二次量化提升約6 dB. CTP+GSC方法獲得的輸出信噪比單純采用CTP操作略高.表2分別列出四種方法的平均壓縮比、壓縮比和誤比特率情況.
從表2可以看出,CTP+GSC技術(shù)的性能是最優(yōu)的,單純采用CTP技術(shù)比“CTP + GSC”技術(shù)的輸出信噪比相差了約0.3~0.5 dB,但誤比特率與壓縮比幾乎一樣,而直接量化算法和GSC方法在信噪比、壓縮比與誤比特率方面都要比CTP+GSC算法差些.DSL長(zhǎng)度在50~300 m之間變化時(shí),采用“CTP + GSC”技術(shù)的平均壓縮比在1.48以上,平均RSN也能達(dá)到53 dB以上,誤比特率小于10-7,基本上滿(mǎn)足實(shí)際工程的需求.
表2 四種算法的SNR、BER、Ratio對(duì)比
本文針對(duì)有線寬帶接入網(wǎng)中的FTTdp + GDSL部署方案中光纖中數(shù)據(jù)流的有損壓縮問(wèn)題進(jìn)行了研究,在本FTTdp + GDSL部署方案中,為了盡可能地降低DP的成本和計(jì)算復(fù)雜度,對(duì)數(shù)據(jù)壓縮技術(shù)提出了新的要求:一是壓縮比不小于1.45∶1;二是解壓縮輸出的信噪比不低于53 dB.本文的主要研究成果為:(1) 根據(jù)光纖傳輸?shù)母呖煽啃?,提出了一種削峰尾插技術(shù),可以將OFDM時(shí)域信號(hào)的動(dòng)態(tài)范圍降低為原來(lái)的二分之一,而且算法復(fù)雜度極低;(2) 針對(duì)OFDM時(shí)域信號(hào)峰均比過(guò)高的缺點(diǎn),提出了幾何級(jí)數(shù)壓擴(kuò)技術(shù)對(duì)信號(hào)進(jìn)行變換,可以降低OFDM信號(hào)的峰均比.結(jié)合CTP技術(shù)、GSC技術(shù)和二次量化技術(shù),構(gòu)建數(shù)據(jù)壓縮傳輸模型.基于此模型在MATLAB上對(duì)壓縮算法的信噪比、壓縮比和誤比特率等指標(biāo)進(jìn)行仿真驗(yàn)證,結(jié)果表明該壓縮算法具有良好的壓縮性能和實(shí)用性.