陽衛(wèi)+陳進(jìn)軍
摘要:語音信號去噪音處理以及濁音、清音的辨別,對智能機(jī)器人人機(jī)語音交互系統(tǒng)有著重要意義。利用MATLAB軟件平臺設(shè)計了巴特沃斯FIR數(shù)字濾波器,進(jìn)行語音信號去噪音濾波處理。由于原始語音信號的時域波形圖與頻譜圖變化小,分析較難,為便于波形分析,對原始語音信號進(jìn)行4千赫茲和8千赫茲重采樣,通過短時平均過零率與短時自相關(guān)函數(shù)法對語音信號進(jìn)行清、濁音的辨別和基音周期提取。仿真結(jié)果表明,基于切比雪夫窗函數(shù)設(shè)計的濾波器對語音信號濾波效果良好。
關(guān)鍵詞:濾波器;MATLAB;語音信號;重采樣
DOIDOI:10.11907/rjdk.172014
中圖分類號:TP319
文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2017)012-0155-03
Abstract:There are about to deal with noise and distinguish between voiced, unvoiced speech signal, has important significance for the intelligent robot human-computer interaction system. This paper is the use of MATLAB software platform designed by Butterworth FIR digital filter for speech signal to noise filtering, because the original speech signal time-domain waveform and frequency spectrum analysis is difficult to change, in order to facilitate the waveform analysis, the original voice signal of 4 thousand Hz and 8 thousand Hz sampling. Finally, a brief overview is given to the recognition of speech signals and the extraction of pitch period by means of short-time average zero crossing rate and short-time autocorrelation function. The simulation results show that the filter designed by Chebyshev window function is good for speech signal filtering.
Key Words:filter;MATLAB;speech signal;resampling
0 引言
語言是人與人工智能進(jìn)行交流的基礎(chǔ)。為獲得清晰的語言信息,用數(shù)字信號處理技術(shù)對語音信號進(jìn)行處理非常重要。處理語音的基本理論以及處理算法研究主要在兩個方面:①從語音的產(chǎn)生和語音感知進(jìn)行研究;②為獲得有效的語音信號對語音進(jìn)行去噪聲處理[1-4]。
語音處理技術(shù)是多學(xué)科、多領(lǐng)域相結(jié)合的高新技術(shù),其中包括數(shù)字信號處理、語言學(xué)、語音學(xué)、模式識別等,現(xiàn)已成為人工智能實現(xiàn)人機(jī)對話的重要基礎(chǔ)[3-5]。
本文利用MATLAB設(shè)計了FIR數(shù)字濾波器進(jìn)行語音信號去噪處理,主要采用切比雪夫窗函數(shù)設(shè)計FIR數(shù)字濾波器。為便于分析,將原始語音信號進(jìn)行4千赫茲和8千赫茲重采樣,然后根據(jù)濾波的性能指標(biāo)對含有噪音的語音信號進(jìn)行濾波處理,最后將濾波前后的時域波形與頻譜波形進(jìn)行了比較。
1 數(shù)字濾波器設(shè)計
數(shù)字濾波器(DF,即Digital Filter)分為兩大類:經(jīng)典濾波器和現(xiàn)代濾波器,其中輸入端的信號中不僅有可用的頻率成分,還有無用的頻率成分,在經(jīng)典濾波器中占有不同的頻率寬帶,通過一個合適的選頻濾波器濾除干擾,就可得到純凈信號,達(dá)到濾波目的[6]。數(shù)字濾波器功能是指把一系列輸入信號通過一定的運算變換成輸出信號。
在設(shè)計數(shù)字濾波器時,采用的運算處理方法不同,決定了運用濾波器的結(jié)構(gòu)也不同。FIR數(shù)字濾波器基本網(wǎng)絡(luò)結(jié)構(gòu)主要有直接型、級聯(lián)型、線性型和頻率采樣型[7]幾種,本文簡要介紹前兩種結(jié)構(gòu)的系統(tǒng)函數(shù)及結(jié)構(gòu)。
3 語音信號處理方案
人在說話時與環(huán)境以及說話人的狀態(tài)有關(guān),人機(jī)交互更是如此,在相對安靜的環(huán)境里錄制一段時間為10秒的語音信號作為本文待處理信號,圖3為處理流程。
(1)利用GoldWave錄音軟件錄制,保存格式為.wav后綴,利用MATLAB軟件中的wavread()函數(shù)讀取錄制好的語音信號,并繪制出該語音信號的時域與頻譜波形圖[4]。
(2)MATLAB給信號加噪聲的方法很多,如可以添加白噪聲、隨機(jī)噪聲等。本文直接通過MATLAB軟件給原始信號疊加指定的噪音,該噪聲為幅值A(chǔ)z=0.02,噪聲頻率為ωz=10的正弦信號噪聲,即Z=0.02*sin(10*n)。模擬原始語音信號被噪聲干擾,然后繪制出疊加噪音后的時域與頻譜波形圖。
(3)濾波性能指標(biāo)為ωp=0.6*pi,ωs=0.75*pi,RP=1,As=30,T=1,MATLAB中濾波器設(shè)計采用切比雪夫窗函數(shù)。采用FIR數(shù)字濾波器,對疊加有噪音的語音信號進(jìn)行濾波處理,然后繪制出含有噪聲的語音信號頻譜。
(4)根據(jù)MATLAB所繪制的波形圖,分析語音信號濾波前后的變化。
4 實驗結(jié)果與分析
(1)圖4為原始語音信號的時域、頻譜圖。由于原始信號的頻譜圖在0~0.2千赫茲和1.8~2千赫茲范圍內(nèi)波動較小,為便于分析,將原始語音信號進(jìn)行4KHz和8KHz的重采樣處理,繪制出如圖5、圖6的時域波形圖與頻譜圖。endprint
(2)圖7為噪音信號時域波形與頻譜圖,該噪音在頻率為8kHz和1.2kHz時的噪音最明顯。根據(jù)濾波性能指標(biāo)ωp=0.6*pi,ωs=0.75*pi,RP=1,As=30,T=1,巴特沃斯濾波器濾除含有加噪音的信號。圖8為加噪音濾波后時域與頻譜圖,從圖中可以看出,該濾波器將頻率為8kHz和1.2kHz時的噪音成功濾除了,這表明該濾波器滿足濾波性能要求。
(3)在進(jìn)行語音辨別時,需要對清音、濁音及噪音進(jìn)行區(qū)別。由于語音屬于非平穩(wěn)的寬帶信號,利用短時平均過零率來辨別清音與濁音,根據(jù)過零次數(shù)的高低來辨別清、濁音,如圖9所示。過零次數(shù)最高的語音信號在幀數(shù)為1 480幀左右時達(dá)到最高,為清音。過零次數(shù)最高時,對應(yīng)語音信號波形中幅度變化最劇烈處。
(4)為便于語音系統(tǒng)診斷與識別說話人,提取語音基音至關(guān)重要。語音基音檢測技術(shù)有時域自相關(guān)函數(shù)法、頻域倒譜法及將兩者相結(jié)合的小波變換分析法。考慮到濾波器的性能指標(biāo),在截取原始語音信號的基音周期時采用短時自相關(guān)函數(shù)法,該方法在檢測時域波形周期性與同步性上效果好且相對容易。
5 結(jié)語
本文設(shè)計的巴特沃斯FIR數(shù)字濾波器具有較好的濾除效果,在時域波形上,濾波后的波形與原始語音信號波形變化較小,從兩者的頻譜圖上可較明顯看出濾波去噪音前后的變化。通過短時過零率能分辨出清音、濁音。短時自相關(guān)函數(shù)可從信號本身檢測到基音周期。
參考文獻(xiàn):
[1] 趙力.語音信號處理[M].北京:機(jī)械工業(yè)出版社,2003.
[2] 梁曉輝,周權(quán).語音信號處理方法的可靠性研究[J].電聲技術(shù),2010,34(4):58-62.
[3] 宋毅郡,朱艷萍,宋耀良.基于分?jǐn)?shù)階濾波器的ADPCM預(yù)測誤差信號處理[J].電聲技術(shù),2010,34(5):52-55.
[4] 付大麗,黨幼云.數(shù)字濾波器在語音信號處理中的應(yīng)用[J].電聲技術(shù),2012,36(8):62-72.
[5] 王淑嬌.數(shù)字濾波器的設(shè)計與參數(shù)的選擇[J].科技資訊,2011,35(12):32-33.
[6] 文德仲.淺析數(shù)字濾波器原理及其設(shè)計過程[J].技術(shù)與應(yīng)用,2016:161-162.
[7] 王兵鋒.FIR數(shù)字濾波器設(shè)計與仿真研究[D].哈爾濱:哈爾濱理工大學(xué),2009.
(責(zé)任編輯:杜能鋼)endprint