【摘 要】文章對(duì)無(wú)線網(wǎng)絡(luò)(Wireless Sensor Network,WSN))中的分布式信源編碼(Distributed Source Coding,DSC)進(jìn)行了研究,基于無(wú)線傳感器網(wǎng)絡(luò)的特性,深入分析分布式信源編碼通過減少數(shù)據(jù)發(fā)送量實(shí)現(xiàn)能量節(jié)省的可行性,并進(jìn)行改進(jìn),設(shè)計(jì)并實(shí)現(xiàn)具有實(shí)用意義的數(shù)據(jù)壓縮系統(tǒng)。
【關(guān)鍵詞】無(wú)線網(wǎng)絡(luò);分布式信源編碼;研究
文章基于WSN的特性,采用DSC技術(shù),將復(fù)雜的計(jì)算轉(zhuǎn)移到能量不受限制的解碼端,而編碼端采用計(jì)算量較小的算法,滿足了WSN節(jié)點(diǎn)的需求。最后通過仿真分析表明,DSC壓縮效果顯著,大幅度減少能量消耗,充分證明了DSC的優(yōu)越性能。
一、分布式信源編碼概述
(一)分布式信源編碼原理
DSC簡(jiǎn)單的說就是利用鄰近傳感器節(jié)點(diǎn)編碼信源的信息相關(guān)性,在確保足夠的可靠性的前提下,盡量減少發(fā)送數(shù)據(jù)的比特率,從而達(dá)到減少傳感器節(jié)點(diǎn)的功耗,延長(zhǎng)節(jié)點(diǎn)的使用壽命的目的。根據(jù)信息論的理論,經(jīng)過Slepian,Wrolf等人論證,可以在信源端不進(jìn)行聯(lián)合編碼的情況下(或者說相關(guān)的信源互相不進(jìn)行通信)達(dá)到與聯(lián)合編碼一樣的性能,也就是所謂的Slcpian-Wolf理論。
從DSC的實(shí)現(xiàn)過程可以看出,傳統(tǒng)信源編碼與DSC的區(qū)別主要是:DSC在編譯碼過程中需要充分利用信源之間的相關(guān)性在編碼端盡可能對(duì)信源進(jìn)行壓縮,但是,每個(gè)編碼器互相之間無(wú)法知道其他編碼器的信息,也就是在編碼端只能對(duì)當(dāng)前節(jié)點(diǎn)的信息進(jìn)行編碼,這樣就降低了編碼器的復(fù)雜度。為了能夠利用這種相關(guān)性,在譯碼器將獲得臨近信源的相對(duì)于當(dāng)前信源的有噪版本,也稱為邊信息,在譯碼端利用邊信息對(duì)接收到的編碼信息進(jìn)行譯碼,以達(dá)到利用信源之間相關(guān)性的目的。這種編碼方式是否能夠有效地利用不同信源之間的相關(guān)性,又能對(duì)信源之間的相關(guān)性的利用達(dá)到什么樣的程度?Slepian-Wolf編碼理論和Wyner-Ziv編碼理論驗(yàn)證了DSC的可行性。
(二)分布式信源編碼理論
1.Slepian—Wolf編碼理論
Slepian-Wolf編碼理論的基本思想是:假設(shè)在譯碼端已經(jīng)給出邊信息,能否利用該邊信息以及從編碼端接收到的編碼信息進(jìn)行正確的譯碼,以及如何譯碼才能達(dá)到無(wú)損譯碼的最優(yōu)情況。設(shè)X和Y是一對(duì)離散的獨(dú)立同分布的相關(guān)隨機(jī)變量,香農(nóng)的信源編碼定理認(rèn)為如果可以對(duì)X和Y進(jìn)行聯(lián)合編解碼,只要總的編碼速率大于X和Y的聯(lián)合熵H(X,Y)就可以進(jìn)行無(wú)損壓縮。例如,可以先把Y壓縮為H(Y)比特每符號(hào),然后基于Y的完整信息,將X壓縮為H(X/Y)比特每符號(hào);解碼端先由H(Y)無(wú)損的恢復(fù)Y,然后結(jié)合Y和H(X/Y)無(wú)損的恢復(fù)X。這就是Slepian-Wolf編碼理論。
有了理論的基礎(chǔ),我們可以對(duì)于DSC原理進(jìn)一步說明一下:假設(shè)X和Y是兩個(gè)3比特的信源,二者是互相關(guān)的且等概率分布,它們的互相關(guān)關(guān)系為dH(X,Y)≤l。如果在編碼端和譯碼端中信源Y都是已知的,那么X可以只用2比特編碼,這是因?yàn)閄和Y按位異或的結(jié)果只有四種可能,這四種可能只需要用2比特就能編碼區(qū)分。而如果Y在編碼端未知,而在譯碼端已知時(shí),X仍然只需要2比特進(jìn)行編碼。因此,只需要2個(gè)比特即可指明X屬于哪個(gè)陪集,在譯碼時(shí)可以根據(jù)Y把X譯碼成陪集中對(duì)Y的漢明距離最近的那個(gè)碼字。這樣即使編碼端無(wú)法確定Y的信息,也可將信源X壓縮成兩比特。
2.Wyner-Ziv編碼理論
在WSN的應(yīng)用中,連續(xù)信源是經(jīng)常需要處理的一種信源,但是在解碼器端利用邊信息就會(huì)產(chǎn)生速率失真。對(duì)于這個(gè)問題,Wyner-Ziv編碼理論為文章說明了這個(gè)問題。Wyner-Ziv編碼理論推導(dǎo)了一種對(duì)具有相關(guān)性的連續(xù)的信源進(jìn)行分布式編碼的方法。在具體的實(shí)現(xiàn)中,首先需要對(duì)連續(xù)信源X進(jìn)行量化,由此雖然引入了量化失真,但是量化后的時(shí)與邊信息Y二者之間仍然具有相關(guān)性,根據(jù)前一節(jié)所闡述的Slepian-Wolf編碼理論,利用這種相關(guān)性來降低*的速 率。由于Slcpian-Wolf編碼是基于信道編碼的編碼,因此Wyner-Ziv編碼問題實(shí) 際上是一個(gè)信源信道編碼問題。Wyner-Ziv理論認(rèn)為,在進(jìn)行有損壓縮的時(shí)候(比如量化之后的壓縮),對(duì) 于只在解碼端獲得參考信息(或邊信息)的情況,以及在編碼和解碼端同時(shí)獲得 參考信息的情況來說,前者的編碼效率并沒有下降。也就是說,在有損壓縮的時(shí) 候,這兩種情況其實(shí)是具有相同的率失真的。Wyner-Ziv編碼問題可以看成是一個(gè)將碼字量化和Slepian-Wolf編碼相結(jié)合的問題,如圖1所示。
如圖1所示的量化模塊中,需要設(shè)計(jì)一個(gè)量化器,該量化器設(shè)計(jì)的目標(biāo)是將信源碼字空間分割成互不重疊的2R個(gè)區(qū)間,則信源的比特率就是R比特/符號(hào)。用U表示信源碼字空間,信源X和邊信息Y是具有相關(guān)性的,則U和Y也具有相關(guān)性,文章可以設(shè)想這樣一個(gè)虛擬信道P,其在U和Y之間,因此用P(Y/U)表示,把U當(dāng)做虛擬信道的輸入,Y當(dāng)做其輸出,假設(shè)信道碼有2足個(gè)碼字(與碼字空間的碼字?jǐn)?shù)量相對(duì)應(yīng)),如果信源碼字屬于這組信道碼,那么在解碼端,參考信息就可以被當(dāng)作信道的輸出,即Y(邊信息)是信源碼字的有噪版本,即Y=X+N,N為信道的噪聲,這樣利用信道碼的糾錯(cuò)性能就可以對(duì)信源碼字進(jìn)行恢復(fù)。
從上面的描述中可以知道,Wyner-Ziv編碼實(shí)際上可以看成是一個(gè)信源信道聯(lián)合編碼的問題,其中信源編碼的內(nèi)容包括量化模塊和估計(jì)模塊,碼字在量化之后就形成了有待分割的碼字空間,在估計(jì)模塊對(duì)解碼輸出做估值。圖1中的 Slcpian-Wolf編碼器是以信道編碼的原理,實(shí)現(xiàn)信源編碼的模塊。隨著信道碼正在一步步地接近信道容量,因此Slepian-Wolf編碼的碼率就會(huì)越來越接近 Slepian-Wolf理論所給出的理論極限。
(三)分布式信源編碼的主要方法
1.利用校驗(yàn)子(Syndrome)的分布式信源編碼方法
Distributed Source Coding Using Syndrome)和實(shí)現(xiàn) Pradhan和Ramchandran提出的DISCUS方案是DSC實(shí)現(xiàn)中具有重要意義的 一種方案,它的出現(xiàn)使得很多DSC都是采用它的思想進(jìn)行實(shí)現(xiàn)。DISCUS采用 的是利用網(wǎng)格編碼調(diào)制的信道碼進(jìn)行實(shí)現(xiàn),對(duì)信源進(jìn)行分割,將需要編碼的信源 映射成所在碼字的校驗(yàn)子來實(shí)現(xiàn)壓縮。DISCUS將信道碼的特點(diǎn)和理論加以利 用,用特有的信道碼對(duì)信源劃分成不同的陪集,使得各個(gè)陪集內(nèi)的信號(hào)之間的距 離盡可能遠(yuǎn)。
2.Turbo編碼方法
DISCUS對(duì)信道編碼的校驗(yàn)位進(jìn)行了特殊的處理,使其轉(zhuǎn)變?yōu)樾r?yàn)子從而減少了直接傳輸校驗(yàn)位的冗余信 息,達(dá)到壓縮信源并且保證了傳輸有效性的目的。如果直接用校驗(yàn)位實(shí)現(xiàn)DSC,就必須考慮一個(gè)問題,即:如何處理實(shí)現(xiàn)對(duì)信源的壓縮。近年來,由于Turbo碼的出現(xiàn),使得這個(gè)問題得到了解答。Turbo碼允許只傳輸部分校驗(yàn)位(鑿孔Turbo碼)也能保證準(zhǔn)確地實(shí)現(xiàn)譯碼,這樣也就在保證譯碼準(zhǔn)確性的前提之下,實(shí)現(xiàn)了信源的壓縮。由于其優(yōu)秀的性能,Turbo碼已經(jīng)被應(yīng)用到DSC中來。
3.LDPC編碼方法
LDPC 碼(Low-Density Parity-Check codes,低密度奇偶校驗(yàn)碼)是 Gallager于 1962 年提出的,是一類可以用非常稀疏的校驗(yàn)矩陣或者二分圖定義的線性糾錯(cuò)碼,目前也被用于DSC。LDPC碼與之前的一些信道碼如Turbo碼等相比,同樣有著逼近理論極限的性能;長(zhǎng)碼字7時(shí)LDPC碼的性能超過Turbo 碼,同時(shí),其譯碼復(fù)雜度大大低于Turbo碼。LDPC碼包括二進(jìn)制LDPC碼和多進(jìn)制LDPC碼,前一種由于實(shí)現(xiàn)簡(jiǎn)單,被廣泛應(yīng)用。
二、無(wú)線網(wǎng)絡(luò)中的分布式信源編碼方法
在WSN中應(yīng)用DSC的基本思想是:將傳感器節(jié)點(diǎn)數(shù)據(jù)之間的冗余看成是被加插的碼元,通過DSC系統(tǒng)對(duì)節(jié)點(diǎn)數(shù)據(jù)進(jìn)行有效的壓縮(編碼),達(dá)到提高數(shù)據(jù)傳輸效 率、節(jié)約節(jié)點(diǎn)能量的目的。文章從Turbo碼的設(shè)計(jì)角度出發(fā),提出Turbo 碼的編譯碼改進(jìn)結(jié)構(gòu),實(shí)現(xiàn)一種DSC—Turbo編譯碼方案,如圖2所示。圖中可以用虛豎線隔成三部分,分別是編碼、網(wǎng)絡(luò)信道和譯碼。Turbo碼編碼器分成三部分:RSC編碼器,交織器和刪余矩陣;譯碼采用最大后驗(yàn)概率譯碼(MAP)。下面討論如何按DSC的要求對(duì)這幾部分進(jìn)行優(yōu)化設(shè)計(jì),構(gòu)造DSC—Turbo編譯碼結(jié)構(gòu)。
(一)編碼器的設(shè)計(jì)
在傳統(tǒng)的Turbo碼編碼器結(jié)構(gòu)中,信息序列“經(jīng)過交織器,形成一個(gè)新的序列材。(長(zhǎng)度與內(nèi)容沒變,但比特位置經(jīng)過重新排列)。序列1和2分別傳送到兩個(gè)分量編碼器。一般情況下,這兩個(gè)分量編碼器結(jié)構(gòu)相同,分別生成新序列。為了提高碼率,新序列需經(jīng)過刪余器,形成校驗(yàn)位序列。校驗(yàn)位序列與未編碼序列經(jīng)過復(fù)用調(diào)制,生成了 Turbo碼序列。
與傳統(tǒng)的Turbo碼編碼器相比,在DSC—Turbo 編碼器設(shè)計(jì)中,我們將信源用傳統(tǒng)的信源編碼方法進(jìn)行編碼,傳輸?shù)浇獯a端,并在解碼端作為參考信息。將信源X送入到兩個(gè)結(jié)構(gòu)相同的分量編碼器中,即每個(gè)編碼周期進(jìn)入RSC的數(shù)據(jù)為k比特,經(jīng)過編碼后產(chǎn)生1比特的校驗(yàn)信息與原始的k比特信息組成編碼輸出。由于邊信息的存在,丟棄原始的k比特信息,只需要1比特的校驗(yàn)信息。經(jīng)過刪余器,兩個(gè)RSC交替保留校驗(yàn)比特,最后得到的碼率為t/I,即將信源速率壓縮到原來的I/k。
(二)譯碼器的設(shè)計(jì)
典型的移動(dòng)通信環(huán)境中,所使用的信道碼編碼方式為l/k,(k=2,3,4,...)的Turbo碼,對(duì)應(yīng)1比特的輸入信息,產(chǎn)生若干比特的校驗(yàn)信息,同時(shí)發(fā)送到接收端 進(jìn)行譯碼,因此采用二進(jìn)制譯碼算法,每個(gè)譯碼周期 的判決輸出為一個(gè)二進(jìn)制比特。而在文章提出的 DSC—Turbo編譯碼中與此剛好相反,其碼率為k/1,若干比特位的輸入信息進(jìn)行編碼后只產(chǎn)生1比特的校 驗(yàn)信息作為編碼輸出發(fā)送到譯碼端,因此需要采用非二進(jìn)制譯碼,每個(gè)譯碼周期的判決輸出為一個(gè)非二進(jìn)制數(shù)據(jù),共2個(gè)備選符號(hào)。由于DSC中接收端可以是性能很強(qiáng)且沒有限制 的基站設(shè)備,因此譯碼可以使用復(fù)雜度比較高但性能很好的軟輸入軟輸出(SISO)MAP,LogMAP,SOVA等 Turbo碼譯碼算法,與以往的DSC—Turbo方案不同,文章提出的設(shè)計(jì)方案中首次采用了MAP譯碼算法。
三、仿真分析
設(shè)信源X和邊信息Y的相關(guān)性可以用二進(jìn)制對(duì)稱信道來建模,且信道的轉(zhuǎn)移概率為p,即
H(X|Y)=H(Y|X)=h(p)
其中,h(g)是二進(jìn)制熵函數(shù)。通過改變參數(shù)p的值來模擬X和Y的相關(guān)性,從而比較不同的條件熵下的性能。假定虛擬信道為理想信道,即校驗(yàn)位能夠正確接收。我們以和之間的相關(guān)性H(X|Y)為橫坐標(biāo),以誤比特率為縱坐標(biāo),通過改變的值來說明誤比特率與信源相關(guān)性之間的關(guān)系,通過MATLAB對(duì)1200幀隨機(jī)信源數(shù)據(jù)進(jìn)行編譯碼仿真得到圖4,其中L=500、 1000表示幀長(zhǎng)度,圖4中data(1—4)四條曲線分別表示未編碼、迭代1次、迭代3次和迭代10次四種情況。
從圖3可以看出,相同條件下,幀長(zhǎng)度越大,誤碼率性能越好;迭代譯碼的迭代次數(shù)越多,性能也越好。幀長(zhǎng)度的增加意味著編碼復(fù)雜度的增加,迭代次數(shù)的增加對(duì)應(yīng)譯碼復(fù)雜度增加,為了取得比較好的編譯碼效果以及盡量減少編譯碼復(fù)雜度,兩者需要適當(dāng)?shù)倪x擇。分量器編碼速率為Rx=1/2時(shí),H(X|Y)≤Rx的范圍內(nèi),誤比特率曲線迅速下降,當(dāng)?shù)螖?shù)達(dá)到10次以上時(shí),可以認(rèn)為達(dá)到了數(shù)據(jù)傳輸所要求的誤差水平。也就是說,在滿足一定可靠性的條件下,信源X的數(shù)據(jù)壓縮率可以達(dá)1/k,網(wǎng)絡(luò)能量效率可以提高k+1/2k。根據(jù)DSC理論推導(dǎo)證明,在H(X|Y)≤Rx時(shí),是可以實(shí)現(xiàn)無(wú)差錯(cuò)傳輸?shù)?,仿真結(jié)果表明文章提出的方案已經(jīng)逼近了這一理論界限。
從仿真結(jié)果可以看出,DSC編譯碼可以顯著減小信源發(fā)送的數(shù)據(jù)量,在DSC譯碼過程中,邊信息和接收到的校驗(yàn)序列所起到的作用不同,邊信息作為輔助信息,是必不可少的,但是允許一定的失真:而校驗(yàn)信息作為譯碼過程的主要處理對(duì)象,具有決定性的作用。因此,目前在WSN中應(yīng)用DSC時(shí),傳送相關(guān)消息的節(jié)點(diǎn)需要進(jìn)行兩個(gè)或者三個(gè)的合作,其中一個(gè)節(jié)點(diǎn)提供邊信息,另一個(gè)節(jié)點(diǎn)根據(jù)Slepian—Wolf界或 Wyner-Ziv界壓縮信息。
參考文獻(xiàn)
[1] 李莉,溫向明.無(wú)線傳感器網(wǎng)絡(luò)中分簇算法能量有效性分析[J].電子與信息學(xué)報(bào),2008,30(04):966-969.
[2] Heinzelman W,Chandrakasan A,and Balakrishnan H.Energy-efficient communication protocol for wireless microsensor networks[C].Proceedings of the 33rd Annual Hawaii International Conference on System Sciences,Hawaii,USA,2000:3005-014.
[3] Younis O and Fahmy S.HEED:a hybrid,energy—efficient,distributed clustering approach for ad hoc sensor networks[J].IEEE Transactions on Mobile Computing,2004,3(04):366—379.
基金項(xiàng)目:文章為許昌學(xué)院校內(nèi)科研基金項(xiàng)目的階段成果,項(xiàng)目編號(hào):2015078。
作者簡(jiǎn)介:武紅玉(1981- ),女,河南鄧州人,碩士研究生,許昌學(xué)院電氣(機(jī)電)工程學(xué)院講師,研究方向:信號(hào)處理,通信。