吳亞文 趙家龍 侯金波 辜麗川 何嶼彤 焦俊
摘要:為了快速準確地獲取生豬的音頻信息,消除無線信道的擁塞問題,提出基于普減法的壓縮感知。在信息采集端采用微處理器NanoPCT4控制的麥克風采集音頻信號,通過基于普減法的稀疏基矩陣和測量矩陣,減小聲音傳輸量,接收端運用OMP算法,將壓縮信號進行恢復重構,實現對生豬音頻信號的快速準確傳輸。結果表明,通過運用這套壓縮-重構系統,重構率提高20.75%,重構時間縮短近0.20 s,去噪后的峰值信噪比較未去噪的峰值信噪比增大了近1.50 dB,降低了信息傳輸量,節(jié)省了信號處理、存儲和傳輸的時間,同時也降低信號失真。
關鍵詞:聲音信號;普減法;壓縮感知;傳輸量;生豬
中圖分類號:TN912.34 ??文獻標志碼: A ?文章編號:1002-1302(2020)10-0250-06
收稿日期:2019-04-26
基金項目:安徽省重點研究與開發(fā)計劃(編號:1804a07020130);國家自然科學基金(編號:31671589、31771679);安徽省科技重大攻關項目(編號:16030701092);農業(yè)農村部農業(yè)電子商務重點實驗室開放基金(編號:AEC2018010、AEC2018003)。
作者簡介:吳亞文(1996—),男,安徽樅陽人,碩士研究生,主要從事模式識別研究。E-mail:m18256503647@163.com。
通信作者:焦 俊,博士,教授,主要從事物聯網研究。E-mail:jiaojun2000@sina.com。
我國是世界上最大的豬肉生產國和消費國,從古至今一直把豬肉作為主要肉食品來源[1]。生豬聲音信息可以作為識別健康與否的依據,因此基于多媒體傳感網的生豬音頻信息采集和傳輸是需要解決的主要問題,同時音頻信息也反映生豬健康狀況,是交流和表達情感的重要途徑。但是在多媒體WSN中,聲音傳輸時會出現信息碰撞和擁塞問題。
壓縮感知理論為數據傳輸技術帶來了革命性的突破,得到了研究人員的廣泛關注?;趬嚎s感知的信號采樣速率遠低于傳統奈奎斯特采樣方法。這些優(yōu)點使得其在很多領域有著廣闊的應用前景,如雷達[2-4]、成像[5]、信號處理[6]、信道估計[7-8]等,并被評為2007年度十大科技進展之一[9-10]。針對壓縮感知理論和語音信號的特點,國內外學者對基于壓縮感知的聲音處理進行了多方面的研究。
Giacobell等利用稀疏線性預測技術,將壓縮感知理論用于語音信號壓縮,與多脈沖激勵編碼相比在波形誤差方面具有一定的優(yōu)勢[11]。Peyre將局部余弦字典作為語音信號的稀疏變換字典,并利用樹形搜索方法實現語音壓縮后的重構恢復[12]。葉蕾等在語音信號的稀疏表示和觀測矩陣等方面也做了很多分析研究,提出了基于小波變換和壓縮感知的語音編碼方式,將語音信號分為低頻系數和高頻系數分別進行處理[13];利用主分量分析,構造語音的冗余字典實現稀疏表示[14];采用K-L變換,通過訓練學習構造近似KLT域實現語音壓縮感知[15]。
但是國內外學者尚未涉足對豬聲音傳輸方面的研究,隨著科技進步,急需針對豬的聲音作出研究,利用豬的聲音識別豬的一些行為特征,研究前提是解決豬聲音識別前期處理量和傳輸量大的問題。
本研究為了解決上述問題,基于壓縮感知理論,自主設計一套生豬音頻信號處理系統,壓縮感知的工作過程:稀疏分解或壓縮的原始信號,通過與稀疏基不相干的測量矩陣的線性測量,將原始高維信號投影到低維空間,接收端運用重建算法,高概率地重構原始信號。而重建算法是CS理論的關鍵問題,應該在已知測量矩陣和測量向量的前提下,高效并且精確地實現對原始信號的重建。目前,常用的重構算法有重構準確的BP算法,但是算法復雜;快速重構的MP算法,由于稀疏基準確度不夠,限制了其推廣應用。本研究設計基于普減法[16]的壓縮感知,提高了壓縮率和重構的準確度,減少傳輸時間,實現了聲音信號的快速傳輸和精確重構。
1 聲音采集與傳輸
聲音采集與傳輸是運用cortex架構的嵌入式微處理器NanoPCT4作為主控制器,自主設計實現了用于聲音采集傳輸的硬件系統,外接有iTalk-02麥克風、USB接口及USB device等接口資源。麥克風采用Tyless公司生產的音頻采集模塊作為聲音數據采集設備,audio或者PCM編碼,支持raw和wav等音頻輸出格式。RAM芯片是通過UDP協議進行網絡傳輸采集的語音信號,搭建采集傳輸平臺的實物見圖1,硬件平臺流程見圖2,具體步驟如下:(1)對開發(fā)板進行上電以及USB麥克風設備的初始化;(2)遠程控制器(PC或服務器)創(chuàng)建一個麥克風采集系統的線程和UDP通信協議的IP和端口號;(3)檢測USB麥克風設備的索引號開啟設備;(4)檢測USB麥克風設備是否開啟成功,若沒有成功的話,返回第3步重新檢測,直到檢測成功;(5)通過默認的音頻參數值對特定的環(huán)境進行聲音監(jiān)聽,如果聽這聲音符合采集聲音的標準,就確定錄制聲音;(6)遠程控制器設置音頻的錄制時長以及音頻參數;(7)基于UDP協議上,使用壓縮感知技術對采集的聲音信號進行壓縮網絡傳輸;(8)在接收端進行重構語音信號與原始的聲音信號對比分析,分析是否是音頻質量最高的聲音對應的聲音信號,若是即可輸出結束,若不是返回第6步重設置音頻參數,直到達到最佳的語音信號質量參數。按照這8個步驟,聲音采集到傳輸重構一個完整的硬件平臺流程圖設計完成。
此采集硬件系統關鍵代碼如下:
QAudioFormat defaultAudioFormat;//定義錄制音頻格式
defaultAudioFormat.setSampleRate(m_set->sampleRate);//設置音頻采樣率
defaultAudioFormat.setChannelCount(m_set->ChannelCount);//設置音頻通道數defaultAudioFormat.setSampleSize(m_set->sampleSize);//設置音頻采樣點的字節(jié)大小
defaultAudioFormat.setCodec(“audio/pcm”);//設置音頻編碼格式
audioInput=new QAudioInput(curDevice,defaultAudioFormat,this);//音頻設備初始化
audioInput->start(& file);//開啟音頻采集設備
m_udpSocketMRecord->bind(QHostAddress::Any,9999);//設置IP地址和端口號
connect(m_udpSocketMRecord,SIGNAL(readyRead()),this,SLOT(MRecord()));//關聯音頻采集執(zhí)行函數
2 聲音信號的壓縮感知
壓縮感知理論的主要思想是將離散信號稀疏化后投影到設定的域的觀測值,傳輸,接收端利用少量的觀測值,把稀疏信號最大效率地恢復出原來的信號。針對聲音的壓縮感知,最基本的3個大部分,首先是信號傳輸的稀疏性轉換;再就是測量矩陣(高維轉低維)的構建;最后是接收端信號的重構(低維轉高維)。
本研究中設計了基于普減法的壓縮感知,普減法原理是利用采集的信號幅度譜的絕對值減去噪聲譜的幅度值,大于零的保留,小于零的作為雜音去除,再高維轉低維,傳輸,接收端把經過前期處理的信號再利用OMP算法進行豬的聲音信號的快速精確定量重構,實現原始信號的精確恢復,具體流程見圖3。
2.1 普減法處理信號的稀疏化
普減法原理如下:
語音信號是短時平穩(wěn)的,信號在處理之前先對其進行分幀加窗處理。
y(n)=x(n)+d(n)。
(1)
公式(1)某幀純凈語音信號為x(n);噪聲信號為d(n);帶噪語音為y(n)由純凈語音信號和噪聲信號組成;噪聲信號的FFT為D(n);帶噪語音的FFT為Y(n);可以將Y(ω)以極坐標形式表示:
Y(ω)=|Y(ω)|ejΦy(ω)。
(2)
公式(2)中|Y(ω)|為幅度譜;ejΦy(ω)是帶噪信號的相位譜。噪聲譜D(ω)也可以通過其幅度和相位譜來表示:
D(ω)=|D(ω)|ejΦd(ω)。
(3)
公式(3)中噪聲的幅度譜|D(ω)|是未知的,可以通過無語音活動時的平均幅度譜的估計|D^(ω)|來代替。根據相位不會對音頻可懂度造成影響,只是可能在一定程度上影響語音質量。公式(4)使用帶噪語音相位Фy(ω)來代替噪聲相位Фd(ω)。帶噪語音經過譜減后得到的純凈語音頻譜的估計為
f(ω)=[|Y(ω)|-|D^(ω)|]ejΦy(ω)。
(4)
研究表明,試驗采集的聲音信號在DCT域上表現很強的稀疏性,所以對上述普減閾值處理的信號f進行DCT變換。
F(k)=∑n-1i=01nf(i),k=0;
(5)
F(k)=∑n-1i=02nf(i)cos(2i+1)kπ2n,k=1,2,…,n-1;
(6)
F=α·f。
(7)
公式(5)、公式(6)是對聲音信號f在α域中的DCT變換,進而得到公式(7),公式(7)中,α為N×N標準正交基(α=[α1,α2,…,αN]),f為F在α正交基上展開的系數向量。
2.2 觀測矩陣的構建
構建高斯矩陣θ,測量矩陣構造高斯隨機矩陣是壓縮感知中使用最廣泛的測量矩陣。觀測矩陣滿足約束等距條件公式(8)。
(1-ε)‖F‖22≤‖F‖22≤(1+ε)‖F‖22。
(8)
公式(8)中ε∈(0,1),在M×N的高斯隨機矩陣θ中,所有元素獨立服從均值為0、方差為M-1/2的高斯分布,即:θi,j~N(0,M-1/2),該矩陣的隨機性非常強,當信號的稀疏度為k時,重構端在滿足約束等距條件這個式子成立,重建f信號就能以很大的概率完成信號的恢復,前提是公式(9)成立:
M≥cklg(N/k)<
(9)
A=θ·F=θ·α·f。
(10)
公式(10)中的c是一個很小的常數;公式(10)中的A是這個矩陣向量的觀測向量[17]。
2.3 原始信號的重構
信號的重構問題可以轉化為利用重構算法求解最小L0范數優(yōu)化問題
f=arg min‖f‖0s.t.。
(11)
公式(11)得到稀疏信號f的精確或近似重構f,進而得到原始信號F。然而最小L0范數優(yōu)化問題是N-P hard問題,本研究主要使用OMP算法進行信號的重構,其基本思路是在每一次的迭代過程中,從過完備字典原子庫中選擇與信號最匹配的原子來構建稀疏逼近,遞歸地對已選擇的原子集合進行正交化,保證迭代的最優(yōu)性,并且求出信號的殘差。迭代一定的次數后,信號可以由這些原子線性表示。
u={uj|uj=|
(12)
F=arg min‖A-θ·F‖2。
(13)
r(new)=A-θ·F。
(14)
公式(12)通過求殘差r與測量矩陣θ中各個原子之間內積的絕對值,來計算相關系數u,公式(13)采用最小二乘法進行信號逼近,公式(14)進行殘差更新,這樣不斷迭代最后重構出原信號。
3 結果與分析
本研究基于壓縮感知在聲音信號傳輸中的優(yōu)良性,分2組進行matlab試驗測評,第1組是在DCT域系數有普減閾值和沒有普減閾值情況下,對壓縮重構的壓縮率、重構率以及重構時間等一系列因素做出對比;第2組是在有噪和去噪情況下的信號傳輸壓縮重構的對比,包括有主觀上的聲音分辨率情況以及客觀上的峰值信噪比的對比。