伍松 吳小龍 魏晟弘
摘? 要:為了解決傳統(tǒng)利用壓縮感知采集語音信號的方法中所用的測量矩陣難以硬件實(shí)現(xiàn),且所用的重構(gòu)方法過于繁瑣導(dǎo)致重構(gòu)時(shí)間過長的問題,采用0-1隨機(jī)矩陣對語音信號進(jìn)行測量,用分段正交匹配追蹤算法對語音信號進(jìn)行重構(gòu).實(shí)驗(yàn)結(jié)果表明,優(yōu)化后的方法可以很好地解決傳統(tǒng)壓縮感知中硬件難以實(shí)現(xiàn)和重構(gòu)算法繁瑣的問題.該方法中所用的0-1隨機(jī)矩陣便于硬件實(shí)現(xiàn),所用的分段正交匹配追蹤(StOMP)算法能夠加速信號的重構(gòu).
關(guān)鍵詞:壓縮感知;語音信號;0-1隨機(jī)矩陣;分段正交匹配追蹤
中圖法分類號:TN912.3; ??DOI:10.16375/j.cnki.cn45-1395/t.2021.02.013
0引言
通信技術(shù)中一個(gè)重要的部分是語音信號的處理.傳統(tǒng)的奈奎斯特采樣定理指出,必須用大于或等于整個(gè)信號最高頻率兩倍的采樣頻率來恢復(fù)原始信息才能使其不失真.近年來提出的壓縮感知理論能夠使信號的采樣和壓縮在同一步驟中進(jìn)行,從而可以采用比奈奎斯特采樣頻率低得多的采樣頻率重構(gòu)信號,并且原始信號幾乎可以恢復(fù)而沒有失真[1-2].這大大降低了信號采樣率,降低了數(shù)據(jù)存儲(chǔ)和傳輸?shù)某杀?
高斯隨機(jī)矩陣、哈達(dá)瑪矩陣和伯努利矩陣等都屬于壓縮感知中常用的測量矩陣,能夠很好地滿足壓縮感知對測量矩陣的要求.但這些矩陣多為稠密矩陣,元素所需的儲(chǔ)存空間大,而且由于其非結(jié)構(gòu)化的本質(zhì)導(dǎo)致其計(jì)算復(fù)雜,不利于硬件實(shí)現(xiàn).
除了測量矩陣,重構(gòu)算法也是壓縮感知中一個(gè)核心的部分.常用的重構(gòu)算法主要分為3種:第一種是凸優(yōu)化算法,主要有基追蹤算法、稀疏重構(gòu)梯度投影算法等[3-4];第二種是貪婪算法,主要有匹配追蹤算法、正交匹配追蹤算法等[5-6];第三種是非凸優(yōu)化算法,主要有迭代重加權(quán)算法.而其中貪婪算法[7-8]是求解稀疏化問題最基礎(chǔ)的方法.貪婪算法基于最小l0范數(shù)[9],其中正交匹配追蹤(orthogonal matching pursuit,OMP)[10]算法是使用較為廣泛的算法.但上述算法的過程較為繁瑣,當(dāng)信號數(shù)量增多時(shí),重構(gòu)精度不高,運(yùn)算時(shí)間過長.
對于上述問題,采用0-1隨機(jī)矩陣對語音信號進(jìn)行測量,采用分段正交匹配追蹤(stagewise orthogonal matching pursuit,StOMP)算法[8]對語音信號進(jìn)行重構(gòu).經(jīng)實(shí)驗(yàn)驗(yàn)證,該方法可行.
StOMP算法當(dāng)中通過殘差r_n控制步長的選取,當(dāng)殘差較大的時(shí)候選擇大步長快速逼近近似值,當(dāng)殘差較小時(shí),通過小步長逐漸挑選影響較大的元素,在保證重構(gòu)精度的同時(shí)也加速了整個(gè)信號重構(gòu)的進(jìn)程,很好地解決了原始算法重構(gòu)時(shí)間過長的問題.并且該算法不需要提前知道信號的稀疏度,通過增量矩陣的長度與觀測矩陣的行數(shù)作比較,來控制迭代的次數(shù),使壓縮感知中的矩陣與重構(gòu)算法的聯(lián)系更為緊密.
3實(shí)驗(yàn)結(jié)果對比與分析
為了驗(yàn)證上述算法和矩陣的有效性,分別采用高斯矩陣和0-1隨機(jī)矩陣,OMP算法和StOMP算法對語音信號進(jìn)行重構(gòu),變換基為傅里葉變換矩陣.該語音信號設(shè)置為4個(gè)頻率,分別為[f1]=50 Hz,[f2]=100 Hz,[f3]=200 Hz,[f4]=400 Hz,采樣頻率為? 800 Hz.所用軟件為Matlab2015b.
圖2為兩種測量矩陣與兩種算法相互組合對語音信號進(jìn)行重構(gòu)的測量矩陣行數(shù)與重構(gòu)概率的關(guān)系圖,測量矩陣的列數(shù)為256,行數(shù)介于1~256之間,圖中重構(gòu)概率介于0~1之間,每隔20個(gè)行數(shù)計(jì)算一次重構(gòu)概率,每個(gè)重構(gòu)概率重復(fù)計(jì)算100次.信號重構(gòu)的誤差是重構(gòu)值與原信號之間差值的絕對值.重構(gòu)誤差小于10-8則重構(gòu)成功,重構(gòu)概率為重構(gòu)成功的次數(shù)與總次數(shù)的比值.信號稀疏度是信號中未知數(shù)的個(gè)數(shù).
由圖2(a)和圖2(b)可知,0-1隨機(jī)矩陣重構(gòu)概率要高于高斯隨機(jī)矩陣.由圖2(a)和圖2(c)可知,StOMP算法重構(gòu)信號的概率要優(yōu)于OMP算法.此外,信號稀疏度K為12時(shí),重構(gòu)概率從12開始計(jì)算;K為20時(shí),重構(gòu)概率從20開始計(jì)算;K為28時(shí),重構(gòu)概率從28開始計(jì)算;K為36時(shí),重構(gòu)概率從36開始計(jì)算.因?yàn)楫?dāng)測量矩陣的行數(shù)小于稀疏度時(shí),就要從P個(gè)方程中解P+1個(gè)未知數(shù),這是一個(gè)欠定性問題,沒有具體解.由圖2(a)和圖2(c)還可以看出各個(gè)稀疏度在測量矩陣行數(shù)較少時(shí)計(jì)算的重構(gòu)概率并不一定為1,因?yàn)樵趬嚎s感知中,理論上求解P個(gè)未知數(shù)需要P個(gè)方程,但在實(shí)際觀測當(dāng)中,并不一定能夠觀測并保存信號中最重要的P個(gè)原子,這與測量矩陣、變換基和重構(gòu)算法的設(shè)計(jì)相關(guān).
表1為不同測量矩陣與不同算法下重構(gòu)信號所用時(shí)間,從表1可知,運(yùn)用StOMP算法比OMP算法節(jié)省很多時(shí)間.這是因?yàn)镾tOMP算法每次不再只計(jì)算一列元素,而是一次計(jì)算多列元素,并且根據(jù)運(yùn)算過程中殘差的改變,對具體需要計(jì)算的列數(shù)作出判斷.
圖3為高斯矩陣和0-1隨機(jī)矩陣分別重構(gòu)語音信號的波形圖,重構(gòu)算法采用OMP算法,兩種矩陣的維數(shù)均設(shè)置為128×256,采用高斯矩陣重構(gòu)信號的誤差為6.72×10-14,采用0-1隨機(jī)矩陣重構(gòu)信號的誤差為6.21×10-14,再次說明采用0-1隨機(jī)矩陣效果更好,且0-1隨機(jī)矩陣相比于高斯矩陣更易于硬件實(shí)現(xiàn).
4理論分析
常用的高斯矩陣、伯努利矩陣等由于其內(nèi)部元素是隨機(jī)產(chǎn)生的數(shù),所以其硬件實(shí)現(xiàn)比較困難.本文采用的0-1隨機(jī)矩陣元素簡單,易于硬件實(shí)現(xiàn),并且可以很好地記錄原始信號當(dāng)中重要的元素.StOMP算法對比之前常用的重構(gòu)算法,解決了此前迭代過程繁瑣的問題,在保證重構(gòu)精度的同時(shí),大大縮短了運(yùn)行時(shí)間.對于一個(gè)語音信號,時(shí)域特性就是信號強(qiáng)度隨時(shí)間的變化規(guī)律,頻域特性就是信號是由很多單個(gè)頻率信號合成.分析時(shí)域和頻域的一種方法是傅里葉分析.傅里葉原理表明,連續(xù)測量的信號可以表示為不同頻率的正弦信號的無限疊加.基于此原理的傅里葉變換算法使用直接測量的原始信號來累計(jì)計(jì)算信號中各種正弦波的頻率、幅度和相位.因此,采用傅里葉變換矩陣當(dāng)作變換基.
5結(jié)論
在用壓縮感知的方法對語音信號進(jìn)行重構(gòu)時(shí),采用0-1隨機(jī)矩陣當(dāng)作測量矩陣,解決了此前測量矩陣難以硬件實(shí)現(xiàn)的問題;對于重構(gòu)算法,采用StOMP算法解決了此前重構(gòu)算法重構(gòu)信號精度不高,算法運(yùn)行時(shí)間過長的問題.
參考文獻(xiàn)
[1] CANDES E J,TAO T. Decoding by linear programming[J]. IEEE Transactions on Information Theory,2005, 51(12):4203-4215.
[2] EFTEKHARI A,HAN L Y,ROZELL C J,et al. The restricted isometry property for random block diagonal matrices[J].Applied and Computational Harmonic Analysis,2015,38(1):1-31.
[3] ZHANG R,SEN M K,SRINIVASAN S. A pre-stack basis pursuit seismic inversion[J].Geophysics,2013, 78(1):1-11.
[4] DENG J,REN G H,JIN Y S,et al. Iterative weighted gradient projection for sparse reconstruction[J]. Information Technology Journal,2011,10(7):1409-1414.
[5] HUANG H L,MAKUR A.Backtracking-based matching pursuit method for sparse signal reconstruction[J]. IEEE Signal Processing Letters,2011,18(7):391-394.
[6] YANG B,LI S T.Pixel-level image fusion with simultaneous orthogonal matching pursuit[J].Information Fusion,2012,13(1):10-19.
[7] NEEDELL D,VERSHYNIN R.Uniform uncertainty principle and signal recovery via regularized orthogonal matching pursuit[J].Foundations of Computational Mathematics,2009,9(3):317-334.
[8] DONOHO D L,TSAIG Y,DRORI I,et al.Sparse solution of underdetermined systems of linear equations by stagewise orthogonal matching pursuit[J].IEEE Transactions on Information Theory,2012,58(2):1094-1121.
[9] 李穎,王澤,王軍華,等.基于l0范數(shù)近似最小化的稀疏信號重構(gòu)方法[J].計(jì)算機(jī)工程與應(yīng)用,2015, 51(10):200-204.
[10]?? 劉記紅,黎湘,徐少坤,等.基于改進(jìn)正交匹配追蹤算法的壓縮感知雷達(dá)成像方法[J].電子與信息學(xué)報(bào),2012,34(6):1344-1350.
[11]?? 勞興松,李思敏,唐智靈.大規(guī)模MIMO系統(tǒng)的貝葉斯匹配追蹤信道估計(jì)算法[J].廣西科技大學(xué)學(xué)報(bào), 2017,28(2):8-16.
[12]?? 李春貴,陶佳偉,周愛霞.基于鄰域能量的壓縮感知醫(yī)學(xué)圖像融合研究[J].廣西科技大學(xué)學(xué)報(bào),2016,27(4):15-20.
[13]?? CAND?S E J.The restricted isometry property and its implications for compressed sensing[J].Comptes Rendus Mathematique,2008,346(9-10):589-592.
[14]? DONOHO D L.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306.
An optimized voice signal processing method
WU Song1, 2, WU Xiaolong1, 2, WEI Shenghong1, 2
(1.School of Mechanical and Traffic Engineering, Guangxi University of Science and Technology, Liuzhou 545006, China;2. Guangxi Key Laboratory of Automobile Components and Vehicle Technology (Guangxi ?University of Science and Technology), Liuzhou 545006, China)
Abstract: To solve the problem that the measurement matrix used in the traditional method of using compressed sensing to collect voice signals is difficult to implement in hardware, and the reconstruction method used is too cumbersome, resulting in a long reconstruction time, a 0-1 random matrix is used to measure the speech signal, and stagewise orthogonal matching pursuit algorithm is used to reconstruct the speech signal. The experimental results show that the optimized method can well solve the problem of difficult hardware implementation and cumbersome reconstruction algorithm in traditional compressed sensing. The 0-1 random matrix used in this method is convenient for ?hardware implementation, and stagewise orthogonal matching pursuit algorithm used can speed up ? signal reconstruction.
Key words: compressed sensing; speech signal; 0-1 random measurement matrix; stagewiseorthogonal matching pursuit
(責(zé)任編輯:黎 ? 婭)
收稿日期:2020-10-11
基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(51665006);廣西汽車零部件與整車技術(shù)重點(diǎn)實(shí)驗(yàn)室自主研究課題(2017GKLACVTZZ01)資助.
作者簡介:伍松,高級實(shí)驗(yàn)師,碩士研究生導(dǎo)師,研究方向:機(jī)械振動(dòng)與噪聲控制、信號處理、壓縮感知,E-mail:swu262160@163.com.