冀虹光,楊輝華
(1. 北京郵電大學現(xiàn)代郵政學院(自動化學院),北京 100876;2. 北京郵電大學人工智能學院,北京 100876)
隨著科學技術和互聯(lián)網技術的飛速發(fā)展,不同工作領域產生的噪聲引起了社會各界學者的高度重視,噪聲的存在會對人類的生產生活以及身心健康產生比較嚴重的影響,同時還會對機器設備產生負面影響,導致設備無法正常運行,嚴重危害設備的使用壽命。為了更好地解決上述問題,相關專家針對智能測控設備噪聲功率自適應控制技術進行了大量的研究[1,2],并取得了比較不錯的研究的研究成果。例如劉覺夫等人[3]在滿足主用戶和其他用戶正常通信交流的條件下,將信道狀態(tài)對應的概念全部應用到效用函數(shù)中,增強對系統(tǒng)中理性用戶的自私性懲罰,確保噪聲功率得到有效控制。張啟軍[4]分析發(fā)動機萬有特性曲線,將轉速和負載兩者進行科學合理地匹配,通過匹配結果有效實現(xiàn)降噪控制。上述已有控制方法未能對設備中存在的噪聲進行識別,導致穩(wěn)態(tài)誤差增加,控制結果不理想,同時音質質量降低。提出一種數(shù)字化智能測控設備噪聲功率自適應控制方法,仿真結果表明,所提方法能夠全面提升音質質量,降低穩(wěn)態(tài)誤差,獲取滿意的噪聲功率自適應控制結果。
利用圖1給出數(shù)字化智能測控設備噪聲識別的具體操作流程圖。
圖1 數(shù)字化智能測控設備噪聲識別流程圖
數(shù)字化智能測控設備噪聲識別主要劃分為兩個不同的階段:①異常噪聲特征提取,需要借助傳感器完成數(shù)字化智能測控設備的聲音采集[5,6],但是在實際操作的過程中存在頻譜泄露問題,需要利用Hannning自卷積窗替換Hannning窗和Mel濾波器,得到HSCW-MFCC作為數(shù)字化智能測控設備異常噪聲特征值,同時將其輸入到SVM中進行模式識別[7,8]。②第二階段為模式識別。
當聲頻感知高于1000Hz時,會呈非線性。為了更好地描述語音信號,在對其進行處理的過程中,主要通過Mel標度進行描述。利用式(1)給出感知頻率和實際頻率兩者之間的近似關系
(1)
式中,F(xiàn)Mel代表感知頻率,單位為Mel;f代表實際頻率,單位為Hz。
Mel倒頻譜系數(shù)分析方法主要是通過非線性劃分方法對獲取的頻譜特征進行計算。其中,在語音信號預處理階段,需要通過Hanning窗截取重要的音頻信息。但是在實際操作的過程中,會存在比較嚴重的頻譜泄露問題,同時也無法精準反映數(shù)字化智能測控設備中的音頻信息。當數(shù)據被截取,則說明頻率一定會被泄露,導致各個窗函數(shù)對于頻譜泄露的抑制效果也存在十分明顯的差異,需要針對實際環(huán)境選擇符合條件的窗函數(shù)。
分別對比HSCW窗和Hanning窗頻譜特征,其中數(shù)據長度為M的二階HSCW窗頻域W2(ω)計算式如下
(2)
式中,WR(ω)代表數(shù)字化智能測控設備的窗頻率響應曲線;e代表數(shù)據點的數(shù)量;j代表旁瓣的衰減速率。
通過上述分析能夠獲取兩種不同窗函數(shù)的旁瓣性能。經過對其分析可知,HSCW窗對頻譜泄露的抑制效果明顯優(yōu)于Hanning窗,同時對異常噪聲提取的準確率也明顯更高一些。
利用圖2詳細給出MFCC參數(shù)的具體提取流程。
圖2 MFCC參數(shù)提取流程圖
1)預加重
由于聲音信號高頻信噪比取值較低,借助預加重能夠全面增加信號的高頻分量和信噪比取值。其中,預加重是通過數(shù)字濾波器H(z)實現(xiàn)的,具體的計算式如下
H(z)=1-μz-1
(3)
式中,μ的取值單位在0.93至0.97范圍內;z代表信號的高頻分量。
2)分幀
將取值單位在10~30ms時間長度的數(shù)據點設定為幀長,選取幀長的1/5~3/5作為幀移。
3)加窗
分別對不同的幀數(shù)據進行HSCW加窗處理。
4)對經過預處理的音頻xi(x)進行快速傅里葉變換,獲取音頻頻譜,信號也由時域轉換為頻域,對應的計算式為
X(i,k)=FFT[xi(m)]
(4)
式中,X(i,k)代表信號的頻域信息。
5)計算能量譜,對應的計算式如下
E(i,k)=FFT[xi(m)]
(5)
式中,E(i,k)代表能量譜。
6)Mel濾波器:
各個三角濾波器對應的傳遞函數(shù)Hm(k)能夠表示為
(6)
式中,k代表三角濾波器的總數(shù);f(m)代表數(shù)字化智能測控設備對應的信號譜能量,對應的計算式為
(7)
7)計算采用Mel濾波器處理前后的頻譜分量。數(shù)字化智能測控設備中各幀信號主要利用Mel濾波器獲取對應的頻譜能量,其中頻譜能量是信號頻譜能量E(i,k)和Mel三角濾波器頻域響應Hm(k)兩者的乘積和S(i,m),具體的計算公式為
(8)
8)進行離散余弦變換處理,獲取對應的MFCC系數(shù)。
9)將全部特征參數(shù)進行歸一化處理。
在上述分析的基礎上,采用人工蜂群算法對SVM中的全部參數(shù)進行優(yōu)化處理[9,10],結合人工蜂群算法的優(yōu)勢,解決全局和局部最優(yōu)解兩者之間存在的矛盾,有效克服SVM進行參數(shù)尋優(yōu)時存在的弊端,更好實現(xiàn)噪聲識別。對SVM參數(shù)進行優(yōu)化的目的是:通過ABC算法對SVM的懲罰因子C和核函數(shù)參數(shù)σ進行選擇,確保SVM的識別結果達到最佳。以下給出數(shù)字化智能測控設備噪聲辨識的具體操作步驟:
1)將全部參數(shù)進行初始化處理;
2)形成M個初始坐標解xi;
3)在M個已知坐標附近分別進行搜索,獲取對應的目標函數(shù)值;
4)將初始坐標解和目標函數(shù)值兩者進行對比,同時利用貪婪選擇算法判定是否需要進行坐標更新;
5)獲取已知坐標系在新一輪搜索過程中被選中的幾率;
6)通過貪婪選擇算法選擇局部最優(yōu)解和對應的坐標值;
7)相同坐標被搜索多次如果依據沒有更新,則直接拋棄該坐標,同時采取xij替換坐標,有效實現(xiàn)全局最優(yōu)搜索;
8)通過計算得到目標函數(shù)的最大值和具體坐標值,其中坐標值即為算法的最優(yōu)解;
9)判斷算法是否達到最大收斂次數(shù),如果達到,則輸出最優(yōu)解;反之,則跳轉至步驟2)。
為了更好實現(xiàn)噪聲功率自適應控制,需要借助噪聲功率自適應控制系統(tǒng)完成控制。通過橫向結構FIR濾波器進行濾波處理,其中長度設定為M。實際應用過程中,不需要考慮次級源噪聲對控制系統(tǒng)產生的影響。
設定r(n)代表濾波-x信號,具體的表達形式為
r(n)=[r(n),r(n-1),…,r(n-M+1)]T
(9)
通過一系列推導能夠獲取濾波-x遞歸最小二乘算法的權重矢量更新關系,表示為[11,12]
(10)
式中,W(n-1)代表橫向濾波器的權重系數(shù);R-1代表聯(lián)合估計參數(shù);e(n)、g(n)和μ(n)分別代表不同的權重矢量;rT(n)代表預測誤差向量的取值范圍;λ代表聯(lián)合估計參數(shù)的最優(yōu)解。
基于QR分解的最小二乘格型自適應濾波器算法是通過多個不同的階段完成的,具體如下所示:
1)自適應前向預測;
2)自適應后向預測;
3)自適應聯(lián)合估計。
結合上述分析,能夠獲取濾波算法對應的有源前饋噪聲功率控制系統(tǒng)。進行格型聯(lián)合估計的主要目的就是根據參考濾波構建級源信號,利用式(11)給出格型的具體預測過程
(11)
式中,fm(n)和bm(n)代表不同類型的次級源信號;kf,m和kb,m分別代表fm(n)和bm(n)對應的前向反饋系數(shù)。
其中,控制系統(tǒng)的殘余噪聲e0(n)能夠表示為
e0(n)=d(n)-y(n)·hs(n)
(12)
式中,y(n)代表后向反射系數(shù);hs(n)代表聯(lián)合估計過程對應的權值系數(shù)取值范圍。
針對自適應前后向預測過程,需要將采集到的信號全部轉換為濾波-x信號r(n)。同時應引用自適應聯(lián)合估計器對數(shù)字化智能測控設備噪聲功率自適應控制系統(tǒng)內的全部參數(shù)進行自適應修正,得到各個類型信號對應的聯(lián)合估計回歸參數(shù)更新式
1)全局誤差關系更新式Βm-1(n)為
Βm-1(n)=λΒm-1(n-1)+εb,m-1(n)
(13)
式中,εb,m-1(n)代表各階殘余誤差的更新關系。
2)各階殘余誤差的更新關系εb,m-1(n)表達式為
εb,m-1(n)=bm-1(n-1)+kb,m(n)-d(n)
(14)
通過上述分析,將濾波器結構和自適應算法相結合,對控制器的內部結構進行有效簡化,最終有效控制測控設備噪聲功率,詳細的操作步驟如下所示:
1)優(yōu)先對數(shù)字化智能測控設備噪聲進行辨別,有效識別異常噪聲。
2)經過步驟1)操作后,確保在理想狀態(tài)下,由傳遞函數(shù)、脈沖響應以及系數(shù)更新共同組建的通路是完全相等的。
3)將濾波器算法和自適應算法兩者進行有效結合,同時確保更新環(huán)節(jié)中全部關鍵參數(shù)之間的關聯(lián)。
4)對系統(tǒng)內的輸入信號進行初始化處理,將其輸入到經過簡化處理的控制器中,最終完成數(shù)字化智能測控設備噪聲自適應控制。
為了驗證所提數(shù)字化智能測控設備噪聲功率自適應控制方法的綜合有效性,進行仿真測試。
1)噪聲功率自適應控制效果分析
優(yōu)先采集數(shù)字化智能測控設備的噪聲功率變化情況,將其作為測試對象,分別采用所提方法、文獻[3]方法和文獻[4]方法進行噪聲自適應功率控制,具體的控制結果如圖3所示。
圖3 不同方法的噪聲功率自適應控制效果對比
分析圖3可知,所提方法的噪聲功率自適應控制效果明顯優(yōu)于另外兩種方法。主要是因為所提方法在實際應用的過程中,針對數(shù)字化智能測控設備噪聲進行辨識,及時剔除異常噪聲,有效為后續(xù)的噪聲功率控制奠定了堅實的基礎,確??刂菩Ч_到最佳狀態(tài)。
2)音質質量評估
將三種經過噪聲功率自適應控制后的語言樣本分別輸入到感知語音質量評估軟件中,分別從噪聲殘留以及語言失真等多個方面進行評估,獲取各組測試語音的客觀評分。其中采用百分制評分機制,具體實驗結果如表1所示:
表1 不同方法的音質質量評估結果對比
分析表1中的實驗數(shù)據可知,所提方法能夠獲取比較滿意的音質質量評估結果,評估得分明顯高于文獻[3]方法和文獻[4]方法,充分證明了所提方法的優(yōu)越性。
3)穩(wěn)態(tài)誤差/%
為了更進一步驗證所提方法的優(yōu)越性,以下實驗測試對比三種不同方法的穩(wěn)態(tài)誤差,具體實驗結果如圖4所示。
圖4 不同方法的穩(wěn)態(tài)誤差對比結果
分析圖4中的實驗數(shù)據可知,穩(wěn)態(tài)誤差的取值越小,則說明噪聲功率自適應控制結果越理想。在三種方法中,所提方法的穩(wěn)態(tài)誤差明顯更低一些,充分驗證了所提方法的優(yōu)越性,同時更進一步證明了所提方法能夠獲取更好的控制效果。
針對已有噪聲功率自適應控制方法存在的問題,提出一種數(shù)字化智能測控設備噪聲功率自適應控制方法。測試結果表明,所提方法能夠大幅度降低穩(wěn)態(tài)誤差,增加音質質量,獲取更加理想的噪聲功率自適應控制結果。
對于一個完整的噪聲功率控制方法而言,不僅需要考慮控制系統(tǒng)的控制性能,同時還需要考慮聲源以及聲場等相關信息,所以所提方法仍然存在不足,后續(xù)將繼續(xù)對該方法進行改進。