葉文雄
(廣西中煙工業(yè)有限責(zé)任公司廣西 南寧 530001)
等間隔采樣的信號拆分方法在壓縮感知中的應(yīng)用
葉文雄
(廣西中煙工業(yè)有限責(zé)任公司廣西 南寧 530001)
基于壓縮感知重構(gòu)算法中常用的OMP算法,針對壓縮感知在處理整段大數(shù)據(jù)量信號時存在的重構(gòu)效率低,以及處理過程需為觀測矩陣開辟巨大存儲空間的問題,考慮到將信號進行合適拆分后再運用壓縮感知進行處理,同時針對常規(guī)信號拆分方法,即常規(guī)分段方法存在的局限性,提出一種等間隔采樣的信號拆分方法。通過實驗分析,以上所提問題得以解決,基于此拆分信號方法的信號在壓縮感知處理中,重構(gòu)信號質(zhì)量及效率都得到較大的提高;同時相對于常規(guī)信號分段方法,此信號拆分方案適用于任何類型的信號,適用范圍更廣。
壓縮感知;大數(shù)據(jù)量信號;信號拆分;正交匹配追蹤(OMP)
傳統(tǒng)奈奎斯特采樣定理要求信號的采樣頻率必須大于信號最高頻率的兩倍,受其約束。然而為滿足實時性要求和提高分辨率及精確度,某些系統(tǒng)在信號處理過程與硬件設(shè)備要求上面臨著信號高采樣率,數(shù)據(jù)處理效率慢及存儲空間巨大等問題的嚴峻挑戰(zhàn)。
近年來,D.Donoho、E.Candes及T.Tao等提出了一種全新的信號采樣理論——壓縮感知(Commpressed Sensing,CS)。理論指出,在信號滿足稀疏性的條件下,在信號獲取的同時就對數(shù)據(jù)進行適當(dāng)壓縮,其采樣率可遠低于奈奎斯特采樣率。
由于CS的特殊性質(zhì)以及對傳統(tǒng)奈奎斯特采樣定理的,其一經(jīng)提出,在信息論,圖像處理、模式識別、無線通信、雷達成像、醫(yī)學(xué)成像等領(lǐng)域得到了廣泛的研究與應(yīng)用,同時引起廣大信號處理專家及數(shù)學(xué)家的興趣,迅速成為了信號處理領(lǐng)域的一個研究熱點。
傳統(tǒng)的信號采集、編解碼過程如圖1所示:編碼端先對信號進行采樣,再對所有采樣值進行變換,并將其中重要系數(shù)的幅度和位置進行編碼,最后將編碼值進行存儲或傳輸:信號的解碼過程僅僅是編碼的逆過程,接收的信號經(jīng)解壓縮、反變換后得到恢復(fù)信號。采用這種傳統(tǒng)的編解碼方法,由于信號的采樣速率不得低于信號帶寬的2倍,使得硬件系統(tǒng)面臨著很大的采樣速率的壓力。此外在壓縮編碼過程中,大量變換計算得到的小系數(shù)被丟棄,造成了數(shù)據(jù)計算和內(nèi)存資源的浪費。
圖1 傳統(tǒng)信號編解碼流程圖
壓縮感知理論指出,只要信號時可壓縮的或在某個變換基上的分解表示結(jié)果呈現(xiàn)稀疏性,那么就可以用一個與變換基不相關(guān)的測量矩陣(RIP準則)將稀疏變換后的高維信號投影到一個低維空間上,最后可通過對優(yōu)化問題的求解即可高精度重構(gòu)出原始信號。
壓縮感知理論框架下的信號編解碼流程圖如圖2所示。對于一可壓縮稀疏信號X∈RN×1,在某個正交基ψ上得到其稀疏表示Θ=ψTX,其稀疏度用K表示,滿足關(guān)系K=N。然后設(shè)計一個與正交基不相關(guān)的M×N維觀測矩陣φ,通過觀測矩陣φ觀測得到低維的M個觀測量Y,且滿足關(guān)系M<N。最后通過求解最優(yōu)化問題可精確重構(gòu)或近似逼近原始信號。
圖2 壓縮感知理論框架下的信號編解碼流程圖
有一時域觀測信號如圖3所示,由圖可知該信號為稀疏信號。信號長度為580,稀疏度為20。由于信號本身為一稀疏信號,故稀疏變換步驟可以省略。觀測矩陣φ選取M×N維的高斯白噪聲矩陣。重構(gòu)算法選取壓縮感知在工程上常用的正交匹配追蹤(OMP)算法。從圖4可看出,經(jīng)過壓縮感知處理后,原始信號得到了精確的重構(gòu)。
由上可了解到壓縮感知在一維信號處理中的應(yīng)用,然而當(dāng)所需處理數(shù)據(jù)量較大時,壓縮感知的應(yīng)用遇到了阻礙。如圖4所示信號—高速采樣雷電信號,此信號包含雷電峰值信息以及噪聲信息,經(jīng)濾波器處理,噪聲基本可忽略。由于系統(tǒng)處理過程中對精確度和分辨率要求較高,每段信號數(shù)據(jù)量很大,為5000000,稀疏度在60000左右。
圖3 基于CS理論的OMP算法對一維信號的重構(gòu)
圖4 雷電信號,數(shù)據(jù)量500000,稀疏度60000左右
面對類似稀疏信號,應(yīng)用壓縮感知對信號進行處理遇到了障礙,主要存在兩個問題:
(1)重構(gòu)效率太低,由于所使用重構(gòu)算法復(fù)雜度依賴于信號長度、信號稀疏表示后的稀疏度K以及觀測矩陣φ的大小,故對此類大數(shù)據(jù)量信號運用壓縮感知處理,重構(gòu)效率很低,無法達到某些系統(tǒng)的實時性傳輸要求;
(2)硬件設(shè)備壓力太大,當(dāng)信號數(shù)據(jù)量過大時,壓縮感知處理過程中的變換矩陣和M×N維觀測矩陣φ元素數(shù)量會非常大,使得軟件處理過程中需要為它們開辟巨大空間,則容易出現(xiàn)空間分配不足的問題,例如實驗證明,對圖4的信號,在matlab上采用壓縮感知處理時,在分配變換矩陣和測量矩陣時,產(chǎn)生了溢出,壓縮感知在此將無法使用。
4.1 針對上文中遇到的兩個問題,我們很容易想到一個信號拆分方案,就是將大數(shù)據(jù)量的信號進行適當(dāng)常規(guī)分段,即從頭至尾對信號進行合適數(shù)量的分段,再對每段信號運用壓縮感知處理。以下是一種常用的信號等長分段方法。
假設(shè)有一長度為N一維向量x,記為x(n),n∈[1,2,…,N]。現(xiàn)將其分段,取每段長度為L,則分段數(shù)為R=[N/L]。則一維向量可拆分為R段向量,分別記為X1,X2,…,XR。且Xi=x(j),j∈[1+(i-1)×L,…,L+(i-1)×L],其中i∈[l,…,R]。則有X1={x(1),x(2),…,x(L)},依次類推,即可得到所有分段后的信號,且為方便程序設(shè)計及實現(xiàn),若最后一段信號長度不夠L,則補零即可。分段處理后,再分別對每一小段信號進行壓縮感知處理,再將得到的R段重構(gòu)信號直接進行連接,即可得到重構(gòu)的原始大數(shù)據(jù)量信號。
當(dāng)然,面對某些結(jié)構(gòu)類型的稀疏信號,此類方法是可行的。在壓縮感知處理圖像中用到的圖像分塊處理方法,即用到了類似于上述分段的方法,其原理一樣。其中還有一種自適應(yīng)子信號長度的分段的方法,即可根據(jù)信號實際情況決定每段子信號的長度,而不是等長分段,此類方法適用性更強,但由于子信號長短不一,對于子信號的壓縮重構(gòu)過程也比較繁瑣,在此對這些方法的的說明就不再贅述。
然而上述的分段方法用來處理圖4的大數(shù)據(jù)信號顯然是行不通的。首先分析其原因。由圖4可知,從整體上看,該信號屬于稀疏信號。但此信號有其自身特點,即非零點相對集中。假設(shè)分段長度為1000,則可分為5000段。若簡單從頭至尾進行分段,則會出現(xiàn)某些子信號全為零值,某些子信號全為非零點的數(shù)據(jù)段,則得到的大部分子信號將不再滿足稀疏信號特性,故用壓縮感知進行處理得到的結(jié)果必然是錯誤的。同樣,自適應(yīng)信號長度的分段方法顯然也是行不通的。為此,面對以上信號拆分方法存在的問題,此處考慮到一種新的拆分大數(shù)據(jù)量信號的方法。
4.2 以下提出一種改進的信號拆分方案在壓縮感知中的應(yīng)用
針對于4.1中分段方案存在的問題,此處考慮到一種基于等間隔采樣的信號拆分方案。具體實現(xiàn)步驟如下:
(1)同理,假設(shè)有一長度為N一維向量x,記為x(n),n∈[1,2,…,N]?,F(xiàn)將其分段,根據(jù)實際信號結(jié)構(gòu),取每段長度為L,則分段數(shù)為R=[N/L]。則一維向量可拆分為R段向量,分別記為X1,X2,…,XR。則對整段信號即按采間隔為R進行采樣,有Xi=x(j),j∈[i+(h-1)×R,h∈[1,…,L]],其中i∈[1,…,R]。即可得Xi={x(i),x(i+R),…,x(i+(L-1)×R)},最終可得到拆分后的所有小段稀疏子信號。同理,為方便程序設(shè)計及工程實現(xiàn),若最后一段信號長度不夠,則補零即可。
(2)對每一子信號Xi,取相同的觀測矩陣φ0,其維數(shù)為M0×N0,且在OMP算法中,取M0=L×P,P∈(0,1),即為采樣率,N0=L。對整段信號處理中的M×N維的觀測信號φ,取M=N×P,P∈(0,1),N為原始信號的長度,且滿足N=N0×R。由上分析易知相對于φ,φ0所需要開辟的存儲空間顯然要小的很多,故經(jīng)信號拆分處理后既大大降低了實現(xiàn)過程所消耗存儲空間,也在一定程度上加快了壓縮感知實現(xiàn)的效率。
(3)根據(jù)步驟(2)中的觀測矩陣,對每一個子信號Xi進行稀疏量化,得到對應(yīng)的觀測值Yi,再采用OMP算法從以上所得的低維觀測值中重構(gòu)出每個原始子信號Xi,最后根據(jù)信號拆分的規(guī)則依次插入Xi中各元素,即可得xr={X1(1),…,XR(1),…,X1(j),…,XR(j)},其中j∈[1,…,L],最終可得到重構(gòu)的信號xr。
在此說明,子信號長度L及采樣間隔R的選取與實際信號的長度,信號結(jié)構(gòu)和所用軟件、計算機配置相關(guān),子信號數(shù)太少或太多都可能達不到分段處理的優(yōu)化效果。
(1)首先以圖3中的原始信號為研究對象,根據(jù)其結(jié)構(gòu)特性,為便于研究,此處對信號不進行拆分、分為兩個子信號、四個子信號進行對比分析,當(dāng)然分段數(shù)還可以是其它參數(shù),在此不再贅述。不進行拆分的仿真結(jié)果在圖3已經(jīng)得到。再基于4.2中的步驟,得到子信號數(shù)為2和子信號數(shù)為4的信號處理仿真圖如圖5~8所示,其中各處理過程中采樣率均取P=0.5。即信號長度N,觀測值個數(shù)M,以及對應(yīng)的觀測矩陣φ滿足關(guān)系:M/N=0.5,且相應(yīng)的φ的維數(shù)為各自對應(yīng)的M×N。
由于OMP算法存在一定的隨機性,故對于每一個拆分方案進行10次實驗,并分別求取相應(yīng)的平均運行時間及平均重構(gòu)誤差。其中單個重構(gòu)誤差計算公式為:誤差=(原始信號-重構(gòu)信號)/原始信號。各項參數(shù)對比表如表1所示。
得出結(jié)論:在一定范圍按4.2中方法內(nèi)對信號進行拆分后,基于壓縮感知的信號處理效率及重構(gòu)信號質(zhì)量比未分段之前要高,且在合理范圍內(nèi),處理效率及重構(gòu)信號質(zhì)量與分段數(shù)是成正比的。同時,例如在硬件平臺上實現(xiàn)時,可對每段信號采取并行處理,信號重構(gòu)的效率將有質(zhì)的飛躍。
圖5 拆分為兩段子信號
圖6 重構(gòu)信號與原始信號比較(拆分數(shù)為2)
圖7 拆分為四段子信號
圖8 拆分為四段子信號
表1 不同子信號數(shù)下信號處理時間及重構(gòu)誤差比較
(2)再以圖4信號為研究對象,實驗證明,若不采取信號拆分處理,在處理過程中將出現(xiàn)變換矩陣與觀測矩陣存儲空間分配不足的問題,壓縮感知根本無法實現(xiàn)。其次若采用4.1的分段方法進行分段,簡單分析即可知重構(gòu)信號結(jié)果是錯的,從實驗結(jié)果來看,也得到證實,即重構(gòu)后得不到原始信號,說明對于此類信號,4.1中的分段方法是行不通的,最后采取4.2中所提出的等間隔采樣信號拆分方法,可以精確恢復(fù)原始信號,重構(gòu)誤差僅為6.2364e-016。結(jié)果如圖9所示。
圖9 重構(gòu)雷電信號與原始雷電信號比較
綜上,運用信號拆分方法,相對于不進行信號拆分而言,可以大大提高了壓縮感知在信號處理過程中的效率,并在一定程度上提高重構(gòu)信號的質(zhì)量,同時,對信號處理過程中所需開辟內(nèi)存也會大大減小,節(jié)約了存儲空間。
同時對于4.1中的分段方法而言,由于其使用的局限性,無法實現(xiàn)對圖4中雷電信號的重構(gòu),而文中在4.2提出新的信號拆分方法可以較精確的實現(xiàn)對雷電信號的重構(gòu),說明文中所提出的信號拆分方法適用范圍更廣。
針對基于壓縮感知的大數(shù)據(jù)量信號的處理,本文提出了一種基于等間隔采樣的信號拆分方法,將信號拆分后再運用OMP算法進行重構(gòu)。實驗證明,該方法加快了壓縮感知中信號處理速度,并提高了信號重構(gòu)質(zhì)量,并在一定范圍內(nèi),優(yōu)化效果和拆分子信號數(shù)量是成正比的。同時相對于簡單的將信號常規(guī)分段處理來說,文中提出的方法適用范圍更廣。
在以上研究的基礎(chǔ)上,還存在很多需要研究的內(nèi)容。例如子信號數(shù)的數(shù)量怎么確定,信號的分段數(shù)并不是越多越好,因為子信號也要受到稀疏性這個條件的限制。還有針對OMP算法的穩(wěn)定性也是一個值得研究的問題等等。
[1]李樹濤,魏丹.壓縮感知綜述.自動化學(xué)報,2009,35(11):1~7.
[2]張春梅,尹忠科,肖明霞.基于冗余字典的信號超完備表示和稀疏分解.科學(xué)通報,2006,51(6):628~633.
P427.32
A
1004-7344(2016)16-0324-03
2016-4-12