張緩緩,李 盛,王賢波
(西京學(xué)院,陜西 西安 710123)
眾所周知,人類的言語器官[1-2]產(chǎn)生的語音可以通過空氣傳播和感知,并可以通過聲音傳感器進(jìn)行檢測和記錄。然而,空氣并不是唯一可以傳播并用來探測語音的媒介。例如,語音內(nèi)容可以通過骨骼振動傳輸。因此,這種振動可以用特殊位置的骨傳導(dǎo)傳感器拾取[3]。
采用相位振蕩器來產(chǎn)生非常穩(wěn)定的電磁波。放大器的輸出通過定向耦合器、可變衰減器、環(huán)行器,然后到平板天線饋電。平板天線發(fā)射一個微波光束,對準(zhǔn)正對著或直接坐在天線前面的人?;芈曅盘柺怯赏惶炀€接收的,該天線由語音調(diào)制,由相對人類受試者的喉部產(chǎn)生。在雙平衡混頻器中,該信號與參考信號混合。因此,這種混合產(chǎn)生低頻信號,并由信號處理器進(jìn)行放大,然后通過A/D轉(zhuǎn)換器到達(dá)計算機(jī)以獲得進(jìn)一步的處理器。
多頻帶是假設(shè)附加噪聲是平穩(wěn)的,與干凈的語音信號不相關(guān)。如果y(n),含噪語音是由干凈的語音信號s(n)和不相關(guān)的加性噪聲信號d(n)組成的,那么:
腐蝕語音的功率譜可以近似地估計為:
大多數(shù)減法類型算法具有不同的變化,允許在譜減法的變化中具有靈活性。Berouti等提出了廣義譜減法方案如下:
其中α(α>1)是過減法因子,它是節(jié)段信噪比的函數(shù)。β(0≤β≤1)是譜層,γ是決定躍遷銳度的指數(shù)。這里我們設(shè)置γ=2,β=0.002。
這個實現(xiàn)假定噪聲影響語音頻譜的均勻,過減因子α。然而,毫米波雷達(dá)產(chǎn)生的非導(dǎo)通語音中的噪聲可能是有色的,并不影響整個頻譜上的語音信號。估計的分段信噪比的五頻段(60~300 Hz,300~1 000 Hz,1~2 kHz,2~3 kHz,3~5 kHz)雷達(dá)語音雷達(dá)噪聲如圖1所示。從圖1可以看出,低頻帶的信噪比(頻帶1,2)明顯高于高頻帶的信噪比(頻帶3-5)。信噪比最大的差值大于30分貝,相差很大。這種現(xiàn)象表明,噪聲信號不影響整個頻譜上的語音信號,因此,在整個頻譜中減去噪聲譜的常數(shù)因子也可以消除語音。
圖1 對于電磁波雷達(dá)語音五頻段的分段信噪比
為了考慮有色噪聲在不同頻率下對語音頻譜的影響不同,估計一個合適的因子將從每個頻率子帶減去必要量的噪聲譜就變得非常重要。在這項研究中,語音頻譜被劃分為N(N=5)非重疊頻帶,并且譜減法在每個頻帶中獨立執(zhí)行。因此,在第i波段得到了干凈的語音頻譜的估計:
αi是在第i個頻段減因子,和δi是一個調(diào)整因子,可以單獨設(shè)置每個頻段定制噪聲去除性能。bi和ei是第i頻帶的開始和結(jié)束頻率。因此,整個算法如圖2所示。
圖2 提出的語音增強方案
帶特異性過減因子αi是計算第i頻帶的分段噪聲信噪比的函數(shù):
根據(jù)信噪比計算公式(5),α減因子計算為:
使用這種超減因子αi可以對每個頻帶中的噪聲相減級別進(jìn)行一定程度的控制。另一個因素δi,這表現(xiàn)在式(4)可以在每個頻帶提供一個額外的控制程度,因為大部分的語音能量是在較低的頻率,較小的δi值用于低頻帶,為了最大限度地減少語音失真。δi的值由經(jīng)驗確定并設(shè)置為:
這兩個因素,αi和βi可以調(diào)整每個波段的不同語音條件,獲得更好的語音質(zhì)量。
10名健康志愿者參加了雷達(dá)語音實驗,其中男性6人,女性4人。所有受試者都是以普通話為母語的人,年齡20—35歲不等,平均年齡為28.1歲(SD=12.05)。所有的實驗都是在同意書上簽署了由志愿者根據(jù)赫爾辛基宣言的條款(BMJ 1991;302:1194)。
雷達(dá)天線,從2~8 m的人的主體范圍之間的距離,和一句漢語“第四軍醫(yī)大學(xué)”(其他的句子也被使用,但他們并不代表)通過志愿者的揚聲器發(fā)出的用于評價所提出的多頻帶譜減法的方法。
為了分析原產(chǎn)地雷達(dá)語音信號的時頻分布和增強的語音,語音的頻譜圖進(jìn)行了準(zhǔn)確信息的殘留噪聲和語音失真。為便于比較,傳統(tǒng)的功率譜減法的效果通過Berrouti等實現(xiàn)。
非正式的聽力測試還表明,多波段的方法產(chǎn)生了非常好的語音質(zhì)量,很少有音樂噪音的痕跡,而且,有最小的語音失真。
此外,多帶譜相減的方法具有很強的靈活性,以適應(yīng)復(fù)雜的語音環(huán)境中通過調(diào)整兩個參數(shù)αi和δi容易。另外,當(dāng)帶總個數(shù)為1時,多波段譜相減算法降低了傳統(tǒng)的功率譜相減方法。
作為非導(dǎo)通語音,雷達(dá)語音電磁波具有更大的優(yōu)勢,可能更廣泛地應(yīng)用于導(dǎo)通語音。然而,在雷達(dá)語音中加入的復(fù)雜噪聲在很大程度上降低了語音質(zhì)量。因此,本文采用了一種改進(jìn)的譜相減方法、多波段譜相減算法,以考慮有色噪聲對雷達(dá)語音頻譜的非均勻影響。仿真和評價結(jié)果表明,該方法能較好地降低整個頻率噪聲、音樂噪聲,并產(chǎn)生良好的語音效果。
[參考文獻(xiàn)]
[1]朱小紅,藺素珍,張商珉,等.多波段紅外圖像的差異紋理特征選擇[J].光電工程,2016(4):66-72.
[2]李英杰,張俊舉,常本康,等.一種多波段紅外圖像聯(lián)合配準(zhǔn)和融合方法[J].電子與信息學(xué)報,2016(1):8-14.
[3]朱小紅,藺素珍,王棟娟.多波段紅外點目標(biāo)的夜視成像差異分析[J].紅外技術(shù),2015(4):289-295.