蔣曉永, 楊 濤
(1.西南科技大學(xué) 信息工程學(xué)院,四川 綿陽(yáng) 621000; 2.特殊環(huán)境機(jī)器人技術(shù)四川省重點(diǎn)實(shí)驗(yàn)室,四川 綿陽(yáng) 621000)
電能表異物檢測(cè)的目的是檢測(cè)電能表內(nèi)部是否存在焊渣殘留、松脂殘留、脫落元器件、膠沫等異物或雜物。傳統(tǒng)的人工電能表檢測(cè)是按照一定的速度和旋轉(zhuǎn)方向進(jìn)行搖表聽(tīng)取聲音判斷電能表是否含有異物。檢測(cè)效率低、檢測(cè)結(jié)果不穩(wěn)定。隨著聲學(xué)檢測(cè)技術(shù)的日益成熟,通過(guò)聲音信號(hào)的采集、處理和識(shí)別能實(shí)現(xiàn)對(duì)異物的檢測(cè)。由于電能表內(nèi)部異物的種類存在不確定性且存在較大背景噪聲,增大了電能表異物檢測(cè)算法的復(fù)雜性,需要研究噪聲分離技術(shù)和基于學(xué)習(xí)的聲音識(shí)別技術(shù)以提高檢測(cè)的可靠性和準(zhǔn)確性。
文獻(xiàn)[1]提出心音信號(hào)的3種去噪方法,實(shí)驗(yàn)證明經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)去噪性能更好,但EMD降噪對(duì)于數(shù)據(jù)量較大時(shí)存在速度過(guò)慢以及模態(tài)混疊等問(wèn)題;文獻(xiàn)[2]針對(duì)腦電信號(hào)設(shè)計(jì)了誤差歸一化的最小均方(least mean square,LMS)自適應(yīng)濾波器,效果良好;文獻(xiàn)[3]提出語(yǔ)音增強(qiáng)中的3種去噪算法,得出了無(wú)偏歸一化自適應(yīng)去噪(unbiased normalization adaptive noise reduction,UNANR)性能較好,但收斂速度較慢。文獻(xiàn)[4]將梅爾頻率倒譜(Meier frequency cepstrum coefficient,MFCC)、差分MFCC以及短時(shí)能量3種特征用于高斯混合模型(Gaussian mixture model,GMM)的訓(xùn)練與識(shí)別,在處理不同環(huán)境的聲音信號(hào)時(shí),需根據(jù)實(shí)驗(yàn)結(jié)果確定GMM的參數(shù),所以對(duì)GMM混合階數(shù)的選擇存在局限性;文獻(xiàn)[5]提出了一種提取聲音信號(hào)MFCC系數(shù)的方法和實(shí)驗(yàn)裝置,解決了用HTK提取該系數(shù)的問(wèn)題,采用非線性變換和離散余弦變換,優(yōu)化了提取的MFCC系數(shù),提高了語(yǔ)音識(shí)別的準(zhǔn)確率。文獻(xiàn)[6]提出了一種新的MFCC改進(jìn)方法,通過(guò)對(duì)頻譜噪聲重構(gòu)使改進(jìn)后的MFCC系數(shù)具有良好的抗噪性。文獻(xiàn)[7]提出基于MFCC參數(shù)和支持向量機(jī)(support vector machine,SVM)的心音信號(hào)識(shí)別,平均識(shí)別率達(dá)到了93 %,結(jié)果優(yōu)于神經(jīng)網(wǎng)絡(luò)模型;文獻(xiàn)[8]針對(duì)家庭環(huán)境訓(xùn)練數(shù)據(jù)不易獲得的情況,采用SVM作為分類器,提取自適應(yīng)MFCC參數(shù)作為特征,分類效果優(yōu)于傳統(tǒng)的分類器。
本文針對(duì)電能表內(nèi)異物聲音的特點(diǎn)并結(jié)合具體的應(yīng)用背景,提出一種基于變步長(zhǎng)LMS和SVM的電能表內(nèi)的異物聲音自動(dòng)識(shí)別方法。針對(duì)SVM分類對(duì)噪聲敏感的問(wèn)題,先對(duì)采集到的聲音信號(hào)進(jìn)行數(shù)字降噪。然后提取聲音信號(hào)的短時(shí)能量和改進(jìn)MFCC系數(shù)組成混合特征矩陣并進(jìn)行降維處理,并輸入SVM分類器進(jìn)行識(shí)別。
在車(chē)間采集聲音時(shí)伴隨著氣泵、車(chē)床、風(fēng)扇、電機(jī)等噪音,利用聲卡一次采集2個(gè)通道的聲音信號(hào),一個(gè)通道放置有異物的電表,一個(gè)通道不放置電表作為參照。采用改進(jìn)的變步長(zhǎng)LMS自適應(yīng)濾波降噪,將一個(gè)通道的信號(hào)作為輸入信號(hào),另一個(gè)通道的信號(hào)作為期望信號(hào)。自適應(yīng)濾波器原理如圖1。
圖1 自適應(yīng)濾波器原理
其中x(n)為輸入信號(hào),y(n)為輸出信號(hào);v(n)為與x(n)不相關(guān)的信號(hào),d(n)為期望信號(hào),e(n)=d(n)-y(n),算法通過(guò)誤差e(n)的值自動(dòng)調(diào)整自適應(yīng)濾波器的抽頭權(quán)向量w(n),使得下一輸出信號(hào)y(n+1)與期望信號(hào)更接近,從而使自適應(yīng)濾波器逐漸收斂?;谧钏傧陆捣ǖ腖MS算法迭代公式為
y(n)=wH(n)x(n)
(1)
e(n)=d(n)-y(n)
(2)
W(n+1)=W(n)+2ue(n)x(n)
(3)
式中u為步長(zhǎng)因子,通常為常數(shù)值,收斂范圍為0
本文將步長(zhǎng)同平方誤差結(jié)合,建立新步長(zhǎng)和誤差之間的非線性關(guān)系。在一定程度上解決了收斂速度和穩(wěn)態(tài)之間的矛盾且計(jì)算量小。改進(jìn)后能夠使步長(zhǎng)在收斂穩(wěn)時(shí)保持相對(duì)穩(wěn)定,增大了適應(yīng)性,新的步長(zhǎng)因子為
u(n)=αu(n-1)+β(e(n))2
(4)
由式(4)可得到新的迭代公式為
W(n+1)=W(n)+2(αu(n-1)+β(e(n))2)·
e(n)x(n)
(5)
式中參數(shù)α控制步長(zhǎng)變化函數(shù)的陡峭程度,β控制步長(zhǎng)變化范圍。步長(zhǎng)與誤差的關(guān)系如圖2所示。開(kāi)始收斂時(shí),需要較大的步長(zhǎng)加快收斂速度,而收斂穩(wěn)態(tài)期需要較小的步長(zhǎng)。在滿足算法收斂的條件下,β的取值需要盡可能大。本文中設(shè)定a=0.1,β=9。
圖2 不同參數(shù)下步長(zhǎng)與誤差的關(guān)系
1)聲音的能量隨時(shí)間而變化,預(yù)處理后計(jì)算第i幀聲音信號(hào)xi(n)的短時(shí)能量E(i)為
(6)
2)通過(guò)Mel尺度頻率域提取出MFCC具有較好的魯棒性,能準(zhǔn)確反映聲音信號(hào)的特征。對(duì)每一幀信號(hào)進(jìn)行快速傅里葉變換,將時(shí)域波形數(shù)據(jù)轉(zhuǎn)換為頻域能量信息并得到各幀信號(hào)的頻譜。Mel濾波器的頻域響應(yīng)為Hm(k),通過(guò)濾波器后
(7)
k=0,1,…,N-1
(8)
式中 參數(shù)N為聲音信號(hào)x(n)的長(zhǎng)度,C(k)為正交因子
計(jì)算得到MFCC參數(shù)
cos[πn(2m-1)/2M]
(9)
引入差分系數(shù)來(lái)表現(xiàn)聲音信號(hào)的動(dòng)態(tài)特性。將動(dòng)、靜態(tài)特征結(jié)合起來(lái)才能更全面地反映聲音信號(hào)的整體特征,能有效提高聲音信號(hào)的識(shí)別率。計(jì)算幀間差分參數(shù)
(10)
式中dt為第t個(gè)一階差分;Ct為第t個(gè)倒譜系數(shù);Q為倒譜系數(shù)的階數(shù);K為一階導(dǎo)數(shù)的時(shí)間差,可取1或2。
為了使得到的聲音特征參數(shù)能全面反映聲音信號(hào)的時(shí)、頻特征,故對(duì)聲音特征參數(shù)進(jìn)行排列和處理。短時(shí)能量和改進(jìn)MFCC系數(shù)構(gòu)成混合特征矩陣,其第1維為短時(shí)能量,第2維第15維為MFCC系數(shù)。并對(duì)數(shù)據(jù)進(jìn)行降維處理,求取混合特征矩陣最大特征值所對(duì)應(yīng)的特征向量。將高維數(shù)據(jù)投影到較低維空間,在一定程度上減少聲音特征矩陣的維度,為聲音信號(hào)識(shí)別減少計(jì)算量。
檢測(cè)電能表時(shí)不需要判別異物的具體類別,只需要判別電能表內(nèi)是否含有異物。考慮到SVM可以較好地解決小樣本、非線性、高維數(shù)等實(shí)際問(wèn)題,在對(duì)聲音信號(hào)進(jìn)行降噪后提取特征識(shí)別,不僅可以解決SVM易受噪聲影響的問(wèn)題,還可以解決過(guò)擬合問(wèn)題。
SVM可以將低維數(shù)據(jù)映射到高維空間,由支持向量來(lái)判決最優(yōu)分割線,首先找出對(duì)分類有較好區(qū)分能力的向量,然后構(gòu)造最大化類與類之間間隔的分類器,是一種由分離超平面定義的判別分類器。為了計(jì)算這個(gè)最優(yōu)超平面,超平面定義如下
f(x)=α+βTx
(11)
式中β為權(quán)重向量,α為偏置。通過(guò)對(duì)α和β縮放,可以盡可能多的獲得最優(yōu)化超平面
|α+βTx|=1
(12)
式中x為最接近超平面的訓(xùn)練集,被稱為支持向量。使用式(13)得到點(diǎn)x到超平面(α,β)的距離
d=|α+βTx|/‖β‖
(13)
支持向量到超平面的距離定義為
d(s-v)=|α+βTx|/‖β‖=1/‖β‖
(14)
分類間隔為支持向量到超平面距離的2倍,即
M=2/‖β‖
(15)
對(duì)式(15)分類間隔M的最大化等價(jià)于在某些約束條件下的最小化。約束條件表達(dá)了對(duì)所有訓(xùn)練集正確分類的要求
(16)
式中yi為訓(xùn)練集的標(biāo)簽。
實(shí)驗(yàn)數(shù)據(jù)來(lái)源于工廠實(shí)際采集的電能表內(nèi)異物聲音信號(hào)(異物聲音信號(hào)頻率集中在3 000~4 000 Hz),選取一段較為純凈的異物聲音,設(shè)定初始信噪比為SNR=5,疊加一定的隨機(jī)噪聲,原始信號(hào)與帶噪信號(hào)如圖3,原始信號(hào)與去噪后的信號(hào)如圖4。
圖3 原始信號(hào)與帶噪信號(hào)
圖4 原始信號(hào)與去噪后信號(hào)
2種算法都能一定程度地去除噪聲,其去噪效果如表1。
表1 2種去噪算法的比較
由表1可知,固定步長(zhǎng)LMS算法隨著步長(zhǎng)的減小,去噪后的信噪比先增大后減小,不同步長(zhǎng)時(shí)的去噪效果差于變步長(zhǎng)LMS算法,處理時(shí)間也明顯大于變步長(zhǎng)LMS算法。
采集到聲音信號(hào)經(jīng)過(guò)預(yù)處理和特征特提,得到一組代表聲音信號(hào)特性的聲音特征系數(shù)。但數(shù)據(jù)量大不利于快速計(jì)算,在實(shí)際生產(chǎn)中不能快速判斷電能表有無(wú)異物。對(duì)數(shù)據(jù)進(jìn)行降維處理,降低混合特征矩陣維度,減少聲音信號(hào)識(shí)別的計(jì)算量。將混合特征矩陣和降維處理后的混合特征矩陣分別輸入SVM分類器中進(jìn)行識(shí)別,發(fā)現(xiàn)降維后雖然損失了一部分信息但有效提高了識(shí)別速率。具體表現(xiàn)為:信號(hào)數(shù)目分別為100,500,1000時(shí),混合矩陣SVM識(shí)別時(shí)間分別為0.602 7,1.584 1,3.257 3 s,而降維后的SVM識(shí)別時(shí)間分別為0.203 5,0.792 1,1.293 1 s。
用本文提出的方法對(duì)電能表進(jìn)行識(shí)別,實(shí)驗(yàn)采用留出法將數(shù)據(jù)集分為互斥的2部分分別作為訓(xùn)練集和測(cè)試集,經(jīng)過(guò)重復(fù)實(shí)驗(yàn)1 000次得到的平均識(shí)別率在90 %左右。
本文對(duì)聲音信號(hào)的數(shù)字降噪和識(shí)別進(jìn)行了具體闡述,結(jié)合具體應(yīng)用背景提出了一種新的變步長(zhǎng)LMS算法,將誤差和步長(zhǎng)的關(guān)系建立了等式進(jìn)行了討論,最終得到一個(gè)適合于電能表內(nèi)異物聲音信號(hào)去噪的參數(shù),但如何對(duì)采集的兩個(gè)通道的聲音進(jìn)行對(duì)準(zhǔn)以消除干擾有待進(jìn)一步研究。提取聲音信號(hào)的短時(shí)能量和改進(jìn)MFCC系數(shù)組成混合特征矩陣,并對(duì)其進(jìn)行降維處理,然后輸入SVM分類器識(shí)別。該方法在一定程度上減小了計(jì)算量,提高了異物聲音的識(shí)別率,有很好的應(yīng)用價(jià)值。