羅俞坤
摘 要:在傳輸?shù)倪^程中無線語音信號往往會受到噪聲干擾,所以,在語音通信中降噪一直是大家重點(diǎn)研究的一個課題。本文研究和綜合分析了語音降噪的關(guān)鍵技術(shù)、三大基本工具與兩大基礎(chǔ)理論,意在提升無線語音傳輸?shù)馁|(zhì)量。
關(guān)鍵詞:語音通信;降噪;關(guān)鍵工具;關(guān)鍵技術(shù)
引言
語音是信息傳遞最重要的手段之一。在無線通信中,噪聲不可避免地對有用語音產(chǎn)生影響,對帶噪語音信號進(jìn)行降噪處理是仍是當(dāng)今語音通信中的一個重大課題。頻譜減法、遺傳算法、自適應(yīng)濾波算法等,早在上世紀(jì)六十年代,就在相關(guān)學(xué)者對語音靜噪處理的深入研究中提出來。語音降噪的過程如下圖1所示:
1 無線語音噪聲分類
目前還沒有一種降噪處理技術(shù)能夠完美處理任何噪聲,因此對噪聲進(jìn)行分類并選擇適用的降噪算法顯得尤為重要。噪聲是無法徹底消除的,因?yàn)樵肼暸c純凈語音信號都屬于隨機(jī)信號。故而,我們只能盡可能地在語音降噪處理過程中提取出有用語音信號[1]。在進(jìn)行降噪處理時(shí),選擇適用的技術(shù)很關(guān)鍵,但是必須先根據(jù)分析出的待處理語音中噪聲的種類與特性,再作出選擇。噪聲的分類有很多種。一般而言,加性噪聲與乘性噪聲是無線通信系統(tǒng)中存在的兩大類噪聲。
1.1 乘性噪聲
乘性噪聲:卷積失真是乘性噪聲的另一種稱謂,它是指噪聲在頻域上同純凈語音信號存在相乘的關(guān)系,它是一種由于聲場或信道特性的隨機(jī)變化所引起的噪聲。在實(shí)際中,乘性噪聲可轉(zhuǎn)化為加性噪聲,如利用同態(tài)濾波變換,然后以加性濾波方式加以處理,便可處理乘性噪聲。
1.2 加性噪聲
加性噪聲:在時(shí)域內(nèi),噪聲對純凈通信信號的影響表現(xiàn)為兩種語音信號的疊加。因此,在頻域內(nèi)有用語音信號和噪聲也是疊加的。加性噪聲,從噪聲的來源來看,又可進(jìn)一步分為無線通訊系統(tǒng)中的外部、內(nèi)部噪聲。通信系統(tǒng)各部件和元件是造成內(nèi)部噪聲的主要原因,而外部噪聲則主要來自于信道。單頻噪聲、脈沖噪聲(源于雷電、電火花感染、電力線感應(yīng)等)和起伏噪聲是加性噪聲的三種基本分類。本文研究的是加性噪聲。
2 降噪處理工具
本研究使用了目前應(yīng)用較為廣泛的三種降噪處理工具,分別為:Adobe Audition軟件、VS99語音工作站與DSG—98 計(jì)算機(jī)語音分析系統(tǒng)。
2.1 Adobe Audition 軟件
Adobe Audition軟件具有強(qiáng)大的編輯、特效、混音等功能,支持128 條音軌、多種音頻格式、多種音頻特效,可有效地對音頻文件進(jìn)行修改、合并。該軟件所含的降噪工具和聲相修復(fù)工具可有效對噪聲和語音進(jìn)行調(diào)整。同時(shí),Adobe Audition軟件還設(shè)計(jì)有包括噪聲降低器、爆音修復(fù)器和自動咔噠聲消除器等一系列專門處理噪聲的濾波器。
2.2 VS-99 語音工作站
VS-99是我國自主研發(fā)的一款語音信號處理系統(tǒng)。該系統(tǒng)能實(shí)時(shí)動態(tài)采集分析語音,利用VS-99系統(tǒng)中的降噪器和頻域編輯功能,能夠在語圖觀察的基礎(chǔ)上將語音信號中的噪聲進(jìn)行降噪處理并把有用的語音信號放大,提高語音質(zhì)量。
2.3 DSG—98 計(jì)算機(jī)語音分析系統(tǒng)
DSG—98 計(jì)算機(jī)語音分析系統(tǒng)是一款有通用微機(jī)構(gòu)成的語音分析系統(tǒng)。該系統(tǒng)以FRFT算法為核心,提高了運(yùn)算速度,還綜合了語音處理、圖像處理和計(jì)算機(jī)圖形學(xué)等理論和處理技術(shù),為語音分析探索了一條新路。綜合來看,DSG—98 計(jì)算機(jī)語音分析系統(tǒng)具備低成本、高性能、多功能的優(yōu)點(diǎn)。
3 語音降噪算法
語音降噪,也稱語音增強(qiáng)。語音降噪的目的在于增強(qiáng)語音質(zhì)量,其實(shí)現(xiàn)手段為將有用的語音信號在帶噪語音中盡可能分離出來。
3.1 基于語音譜特征的諧波增強(qiáng)算法
利用帶噪語音濁音段所具有的周期性的特性,可利用自適應(yīng)梳狀濾波器將語音分量提取出來,增加語音可懂度。梳狀濾波器的實(shí)現(xiàn)形式如下:
在式中,s (n)代表輸出信號,M為常數(shù),Ck為濾波器系數(shù), x (n)為輸入信號,L為基音周期。從上式中可知,s (n)是輸入信號的延時(shí)加權(quán)平均。周期性分量在這個平均過程中得以增強(qiáng),但是其他非周期性分量受到抑制或消除[2]。由此可見,使用諧波增強(qiáng)法的關(guān)鍵是準(zhǔn)確估計(jì)基音周期。各種基音估計(jì)算法可有效估計(jì)基音周期,但如果背景噪聲過強(qiáng),則難以準(zhǔn)確估計(jì)基音周期。并且,由于基音發(fā)生變化,所以在過渡語音段中,也是難以準(zhǔn)確估計(jì)基音周期的。
梳狀濾波不僅有增強(qiáng)語音信號的效果,還可對噪聲產(chǎn)生抑制的作用[3]。但如果同時(shí)對兩個語音進(jìn)行處理,準(zhǔn)確估計(jì)基音周期也很困難,這時(shí)使用濾波方法增強(qiáng)語音的效果也差強(qiáng)人意。
3.2譜減法
語音降噪算法多種多樣。譜減法因其原理簡單、容易實(shí)現(xiàn)等優(yōu)點(diǎn)成為語音降噪算法中較為常用的算法。在使用譜減法時(shí),噪聲滿足以下三個假設(shè)條件:
1. 噪聲為加性噪聲,且都是高斯噪聲。
2. 語音信號是短時(shí)平穩(wěn)且獨(dú)立于噪聲的信號。
3. 因人耳對語音信號相位不敏感,故可用帶噪語音信號的相位代替純凈語音信號的相位。
將x (n)表示為有用語音信號,d (n)表示為加性噪聲,y (n)表示為帶噪信號,則有如下(2)式:
帶噪語音經(jīng)加窗處理后如式(3):
其中0 ≤ n ≤ N-1,i為第i幀,n為樣點(diǎn)數(shù),N是幀長。相應(yīng)的頻域表示為:
k 是頻譜的分離值,假設(shè)純凈語音信號與噪聲信號不相關(guān),從功率譜的角度出發(fā)則有:
若從幅度值的角度考慮,則有:
人耳對語音信號的頻譜相位不敏感,其獲取語音信號主要是通過獲得頻譜分量的幅度來實(shí)現(xiàn)的[4]。將原始語音信號的相位加入到降噪后的語音信號中,便可獲得語音信號的估計(jì)值。由此,頻譜減法公式一般化后為:
頻譜減法的原理圖如下:
頻譜減法能夠做到有效降噪并且該方法的算法簡單,故獲得廣泛應(yīng)用,但該方法也有其缺點(diǎn)。它主要包含兩個方面的缺點(diǎn):(1)傳統(tǒng)頻譜減法是依靠噪聲端點(diǎn)檢測的正確性來估計(jì)噪聲的正確性。但是,當(dāng)噪聲水平高時(shí),噪聲端點(diǎn)檢測算的的正確性并不高,于是降低了頻譜減法的語音降噪效果;(2)在對噪聲進(jìn)行估計(jì)時(shí),頻譜減法求噪聲均值。于是,在降噪的過程中,又會引入音樂噪聲。然而,人耳對音樂噪聲易產(chǎn)生疲勞,因此會降低人耳對語音的敏感度。
4.結(jié)束語
綜上所述,Adobe Audition軟件、VS99語音工作站以及DSG—98 計(jì)算機(jī)語音分析系統(tǒng)都可以有效對語音信號進(jìn)行降噪。實(shí)踐證明,傳統(tǒng)頻譜算法和諧波增強(qiáng)算法是兩種比較高效的語音降噪算法。兩種算法各有其優(yōu)勢與不足。在進(jìn)行降噪處理時(shí),要根據(jù)實(shí)際情況選取相應(yīng)的算法。
參考文獻(xiàn):
[1]趙力. 語音信號處理. 北京:機(jī)械工業(yè)出版社 2003:272-273, 282-283.
[2]甄斌 “語音信號的增強(qiáng)相對譜濾波”,聲學(xué)學(xué)報(bào),Vol. 26 No. 3 pp252-258.
[3]樊養(yǎng)余 “加性噪聲抵消的對稱相關(guān)函數(shù)法”,數(shù)據(jù)采集與處理,Vol. 16 No. 3 pp343-347.
[4] 楊行峻,遲惠生等. 語音信號數(shù)字處理. 北京:電子工業(yè)出版社, 1995.