楊理華,張翔鵬,劉麗濱,艾夏禹,楊軍
(1.海軍潛艇學(xué)院,山東 青島 266199;2.中國科學(xué)院噪聲與振動實驗室(聲學(xué)研究所),北京 100190;3.中國科學(xué)院大學(xué),北京 100049)
隨著經(jīng)濟不斷發(fā)展,船舶貨運已成為遠洋貨源主要運輸方式,這些大型船舶動力裝置多為汽輪機或者柴油機,其工作噪聲較大[1],嚴重影響船舶艙室通訊系統(tǒng)通信效率,嚴重影響船員生活和工作質(zhì)量[2-3]。為分析艙室噪聲對船員溝通影響,有學(xué)者進行了相關(guān)研究[4-6]。此外,在飛機、艦艇等領(lǐng)域,噪聲對人員語音溝通效果等方面也有嚴重影響[7]。
針對上述強環(huán)境噪聲條件下語音通信問題,諸多學(xué)者開展語音增強研究[8-10]。本文以某船語音通信系統(tǒng)為例,針對其在動力設(shè)備艙室工作條件下,耳罩麥克風(fēng)語音通信或傳送指令受到強環(huán)境噪聲干擾的實際問題,構(gòu)建語音通訊系統(tǒng)物理架構(gòu)和通信耳罩模型,并結(jié)合實際提出一種聯(lián)級型語音增強算法,分析步長因子和濾波階數(shù)等參數(shù)對系統(tǒng)影響,最終搭建試驗平臺并對所提算法進行實驗驗證。
某型船體結(jié)構(gòu)見圖1,主要有指揮艙室、居住艙室、甲板和輪機艙室等區(qū)域。在指揮艙室和輪機艙室分別由船員通過語音通信系統(tǒng),進行溝通交流或指令信息傳遞。當發(fā)動機及變速箱工作條件下,指揮艙室船員向輪機艙室傳遞指令,下達輪機工況轉(zhuǎn)換信息。輪機艙室船員收到指令信息后,在轉(zhuǎn)換工況前后都要向指揮艙室請求和反饋輪機運行情況。此時,輪機工作就會產(chǎn)生強烈的環(huán)境噪聲,嚴重影響輪機艙室船員用麥克風(fēng)傳送回令信息質(zhì)量,甚至導(dǎo)致無法有效溝通。
圖1 某型船體內(nèi)部結(jié)構(gòu)示意
在圖1所示船舶中,其通信系統(tǒng)中耳罩結(jié)構(gòu)見圖2。主要部件包括耳弓、耳罩、揚聲器、音頻線等結(jié)構(gòu)部件,麥克風(fēng)主要采集船員指令語音信息,但同時也會采集到輪機艙室動力裝置噪聲,進而降低有效語音信號信噪比,影響語音通信系統(tǒng)通話質(zhì)量。揚聲器部分左、右聲道,左耳和右耳為并聯(lián)關(guān)系,所有音頻線(或航空插頭)包括GND(地線)、麥克風(fēng)、揚聲器。為應(yīng)用語音增強技術(shù)解決該問題,需要對該耳罩結(jié)構(gòu)進行改進,在左、右耳罩處分別放置傳聲器,并在耳罩外殼上開透聲小孔,采集不同方位環(huán)境噪聲,有利于實現(xiàn)語音增強技術(shù)實驗驗證,改進后通信耳罩音頻線(或航空插頭)包括GND(地線)、麥克風(fēng)、揚聲器、左傳聲器、右傳聲器,其結(jié)構(gòu)見圖3。
圖2 某船語音通信系統(tǒng)耳罩結(jié)構(gòu)
圖3 某船語音通信系統(tǒng)耳罩改進型結(jié)構(gòu)
在復(fù)雜背景條件下,通過信號增強算法提升語音信號信噪比,降低背景噪聲污染,讓船員所接收更為純凈的語音信號。語音增強結(jié)構(gòu)見圖4。通過自適應(yīng)算法濾除環(huán)境噪聲,可獲得純凈語音信號,當系統(tǒng)最優(yōu)時e(n)將無限趨近于s(n)。
圖4 語音信號增強結(jié)構(gòu)
在圖4中,自適應(yīng)算法通過調(diào)整權(quán)值,實現(xiàn)噪聲信號x(n)最小均方誤差要求。其中,x(n)、d(n)和e(n)分別為參考信號、期望信號和誤差信號,均為離散時間序列。若濾波器長度為L,則n時刻輸出可表示為
(1)
定義參考信號矢量和濾波器權(quán)系數(shù)矢量為
W=[w1,w2,…,wL]T
(2)
X(n)=[x(n),x(n-1),…,x(n-L+1)]T
(3)
則式(1)可以表示為
y(n)=XT(n)W=WTX(n)
(4)
第n時刻的誤差信號為
e(n)=d(n)-y(n)=d(n)-WTX(n)
(5)
假設(shè)參考信號和期望信號均為平穩(wěn)各態(tài)遍歷過程,則均方誤差為
J(n)=E(e2(n))=E(d2(n))-2PTW+WTRW
(6)
式中:P和R分別為互相關(guān)矩陣和自相關(guān)矩陣。
P=E(d(n)X(n))
(7)
R=E(X(n)XT(n))
(8)
對均方誤差求導(dǎo)可得到梯度矢量為
(9)
令▽(n)=0可獲得最佳權(quán)矢量,可表示為
W0=R-1P
(10)
該解一般稱為維納解,是基于梯度算法的最優(yōu)解。此時,可得到最小均方誤差為
(11)
上述過程計算最優(yōu)權(quán)值系數(shù)W0時,需要計算自相關(guān)矩陣R和互相關(guān)矩陣P。若濾波器階數(shù)較高時運算量較大,這兩個矩陣很難直接獲取,一般用最陡下降法通過迭代方式獲得。最陡下降法核心是在每個時刻迭代調(diào)整濾波器權(quán)值向量,即每次通過權(quán)值修正項來更新濾波器權(quán)值,從而接近最優(yōu)解維納值。修正方向指向代價函數(shù)最陡下降方向,其值為最優(yōu)的更新值,從而使其以最快速度逼近最優(yōu)解,該方法可以避免復(fù)雜的逆矩陣運算,通過迭代來求維納解,依據(jù)最陡下降法可設(shè)權(quán)值迭代形式為
(12)
式中:迭代步長μ對算法收斂速度及穩(wěn)定性有直接影響;W(n)為n時刻濾波器抽頭系數(shù);wε(n)為第n次迭代梯度矢量,對于給定初始抽頭系數(shù)W(0),選擇適當μ值沿最陡下降方向讓W(xué)(n+1)無限逼近維納解。實際上,最陡下降法需精確知道每個方向上梯度向量,但誤差和輸入期望未知,故最陡下降法不能直接使用。自適應(yīng)算法可在最陡下降法基礎(chǔ)上解決該問題,也可視為最陡下降法特例。其中,wε(n)可表達為
(13)
為減少迭代計算量,可以取瞬時值|e(n)|2作為均方誤差E{|e(n)|2}的瞬態(tài)估計值,若用瞬時值|e(n)|2替換式(13)中期望項E[e2(n)]可得:
w|e(n)|2=-2e(n)X(n)
(14)
W(n+1)=W(n)+μe(n)X(n)
(15)
由以上分析可知,最小均方算法流程為
1)初始濾波器權(quán)值系數(shù):W=[00…0]T。
2)更新時間序列:n=1,2,…迭代計算濾波器權(quán)值系數(shù)。
3)更新濾波器輸出y(n),計算輸出誤差e(n)。
在實際應(yīng)用中,圖1所示為單麥克風(fēng)語音增強,但在這種環(huán)境下若使用者所帶耳罩移動位置和方向,參考信號x(n)將隨之發(fā)生變化,進而影響控制效果。為提升該使用場景語音增強效果,可在使用者左右耳罩外殼處各放置一個傳聲器,用于同步采集環(huán)境噪聲,可在圖4所示基礎(chǔ)上增加一級語音增強,進一步提升語音增強效果,其結(jié)構(gòu)框圖見圖5。其中,s(n)仍為有效語音信號,x1(n)或x2(n)為耳罩左聲道或右聲道處所采環(huán)境噪聲(仍為參考信號),x1(n)與x2(n)之間有較強的相關(guān)性,d(n)為含噪聲語音信號(也稱為期望信號),e1(n)、e2(n)分別為一級和二級殘差信號,通過兩級增強算法可有效獲得純凈語音信號。此外,該算法涉及兩個橫向FIR濾波器和自適應(yīng)最小均方算法,所用算法原理相同,本節(jié)不再詳細推導(dǎo)。
圖5 聯(lián)級型語音增強原理
根據(jù)圖5所示信號增強原理,取純凈語音信號、粉色環(huán)境噪聲信號對所述算法進行驗證,粉色噪聲由白噪聲低通濾波所得,用于模擬船用機械設(shè)備噪聲場景。其中,兩級自適應(yīng)算法采用歸一化LMS算法、兩級濾波器階數(shù)一致,仿真時間為20 s,采樣頻率8 kHz。為分析不同條件下相關(guān)參數(shù)對語音增強的影響,濾波器分別采用40階和128階FIR濾波器,步長因子分別取0.002和0.04。
語音信號、環(huán)境噪聲信號及疊加信號時域信圖和頻域圖,分別見圖6~9。
圖6 純凈語音信號
圖7 純凈語音信號語譜圖
圖8 粉色噪聲疊加語音信號
圖9 粉色噪聲語音信號語譜圖
由圖6、7可知,純凈語音信號在發(fā)音時信噪比較大,在頻譜上呈現(xiàn)寬譜特征,且0.5~1.0 kHz之間能量較為集中。由圖8、9可知,純凈語音信號和粉色噪聲混疊后,其時域信號中有效語音幾乎湮沒在粉色噪聲之中,而在頻譜上粉色噪聲能量主要集中在1 kHz之內(nèi)頻段上,對麥克風(fēng)采集的語音信號形成嚴重干擾。在該條件下,人耳很難分辨出真實語音信息。
在加性粉色噪聲干擾下,取濾波器均為40階,步長因子分別為0.002和0.04,仿真時間為20 s,采樣頻率8 kHz,觀察步長因子對語音增強效果影響,具體見圖10~13。
圖10 語音增強后語音信號(步長因子0.002)
圖11 語音增強后語音信號語譜圖(步長因子0.002)
圖12 語音增強后語音信號(步長因子0.04)
圖13 語音增強后語音信號語譜圖(步長因子0.04)
由圖10、12可知,隨著步長因子增大語音增強收斂時間明顯縮短,在步長因子為0.002時,語音信號約在5 s后才得到有效還原,而步長因子為0.04時,語音信號約在0.5 s即可得到有效還原,語音增強速度得到顯著提升。由圖11、13語譜可知,步長因子0.002時,在1 kHz內(nèi)存在顯著“拖尾”效應(yīng),也在約5 s后才得到抑制和衰減。步長因子0.04時,幾乎不存在這一問題,這說明該參數(shù)條件下語音增強取得了良好效果。因此,在一定條件下,語音增強速度和效果隨著步長因子增大而提升,但是步長因子太大將導(dǎo)致系統(tǒng)發(fā)散。
在粉色加性噪聲干擾下,取步長因子為0.002,濾波器分別為40階和128階,仿真時間為20 s,采樣頻率8 kHz,觀察濾波器階數(shù)對語音增強效果影響,具體見圖14~17。
圖14 語音增強后語音信號(濾波器40階)
圖15 語音增強后語音信號語譜圖(濾波器40階)
圖16 語音增強后語音信號(濾波器128階)
圖17 語音增強后語音信號語譜圖(濾波器128階)
由圖14、16可知,隨著濾波器階數(shù)增大語音增強收斂速度明顯降低,濾波器為128階時,系統(tǒng)約在15 s后才有效還原原始信號。而濾波器為40階時,語音信號約在6 s即可得到還原,語音增強速度得到顯著提升。由圖15、17所示語譜圖來看,無論濾波器為40階或128階,在1 kHz內(nèi)語音信號均存在明顯“拖尾”效應(yīng),但濾波器階數(shù)越大該效應(yīng)越明顯,對系統(tǒng)控制效果不利影響也越大。因此,語音增強速度和效果隨濾波器階數(shù)增大而降低,這主要是濾波器階數(shù)越大計算與迭代時間越長,控制效果也相對越弱,實際應(yīng)用過程中需要依據(jù)硬件控制器算力、采樣率、存儲空間等因素綜合選擇。
綜上可知,取步長因子為0.04,自適應(yīng)濾波器為40階,仿真時間為20 s,并在10 s時開啟語音增強,采樣頻率8 kHz,觀察語音信號增強效果,具體見圖18~19。
圖18 語音增強信號時域變化
圖19 語音增強信噪比變化
由圖18可知,在步長因子為0.04,自適應(yīng)濾波器為40階時,t=10 s時刻之前,語音信號幾乎完全湮沒在粉色環(huán)境噪聲之中,而在開啟語音增強后獲得了較為純凈的語音信號。由圖19可知,系統(tǒng)信噪比得到明顯增強,約提升30 dB,這說明音增強能獲取更為純凈的語音信號,這為船用通訊耳罩改進提供了理論基礎(chǔ)。實際應(yīng)用中,除步長因子、濾波器階數(shù)、控制器算力、存儲空間等因素外,使用者嘴部麥克風(fēng)所采語音信號及兩個參考噪聲信號強度,也將影響語音增強效果。
為驗證所提語音增強算法,搭建噪聲控制驗證平臺,開展強噪聲條件下信號增強驗證工作。設(shè)備包括有源音響、控制器、麥克風(fēng)增強耳罩、測試人工頭、信號調(diào)理及測試系統(tǒng)。
根據(jù)圖5所示語音增強框架,參考語音增強仿真效果,取步長因子為0.02、濾波器階數(shù)為1 024,采樣頻率為10 kHz。以某船艙室噪聲為激勵,由控制電腦播放,并在測試電腦上啟動測試系統(tǒng)采集信息(記t=0時刻),t=10 s由人工頭播放語音信息(麥克風(fēng)采含噪語音),30 s開啟語音增強,50 s采樣結(jié)束,試驗效果見圖20、21。
圖20 語音增強過程時域圖
圖21 語音增強過程頻譜圖
圖20為某船艙室噪聲經(jīng)船用通信耳罩結(jié)構(gòu)傳遞后,人工頭左耳內(nèi)部數(shù)據(jù)采集麥克風(fēng)處噪聲。在t=0 s時開始記錄環(huán)境噪聲信號,在t=10 s時記錄環(huán)境噪聲和語音混合信號,由圖20可知混合后語音信號幾乎完全湮沒在環(huán)境噪聲中。在t=30 s開啟語音信號增強,所選參數(shù)可迅速實現(xiàn)強環(huán)境噪聲下語音信號增強,具體見圖21,t=30 s時刻開啟語音增強后,時域環(huán)境噪聲迅速得到抑制和衰減,環(huán)境噪聲中線譜信號(500~1 500 Hz)幾乎完全被消除,語音信號信噪比得到有效增強。此外,含噪語音信號頻譜特征呈現(xiàn)明顯線譜特征,說明語音信號受環(huán)境噪聲干擾十分嚴重,而在開啟語音增強后,穩(wěn)定語音信號頻譜變化較為平緩,其中線譜成分影響明顯受到抑制。因此,本文所提麥克風(fēng)語音信號增強算法具有良好語音增強效果,可為工程樣機研制提供技術(shù)參考和借鑒。
1)強環(huán)境噪聲對麥克風(fēng)語音通訊效果影響較大,嚴重降低有效語音信號信噪比,影響系統(tǒng)語音通訊質(zhì)量,甚至無法有效通信。
2)通過聯(lián)級型語音信號增強,可以有效降低強環(huán)境噪聲對語音信號干擾,但步長因子和濾波器階數(shù)等參數(shù)選取要結(jié)合實際,才能有效發(fā)揮控制器算力并獲得最優(yōu)控制效果。
3)以某船艙室環(huán)境噪聲為背景,實驗表明語音增強能夠有效抑制環(huán)境噪聲,特別是對中低頻線譜噪聲衰減效果較好,能顯著解決語音信號湮滅在環(huán)境中的困境,提升語音通訊質(zhì)量和效果,可為后期船用通訊系統(tǒng)耳罩改進提供技術(shù)依據(jù)。