余尤好,沈文龍,黃春先,陳 瑋
(莆田學(xué)院電子信息工程系,福建 莆田 351100)
自從人類發(fā)明電話以后,電話成為人類溝通的橋梁,是日常生活中必不可少的通訊工具.電磁污染是直接威脅電子通訊設(shè)備安全經(jīng)濟(jì)運(yùn)行,威脅人類身心健康的三大污染源之一,已引起國(guó)際社會(huì)的高度重視.電流噪聲不但影響了話音質(zhì)量,也給通話雙方帶來了煩惱和不便.電話去噪的主要目的有兩個(gè):一是改進(jìn)聽筒話音質(zhì)量,消除背景噪聲,使聽者沒有疲勞感,樂于接受;二是提高話音的可懂度.神經(jīng)網(wǎng)絡(luò)的自適應(yīng)能力使它成為各類信號(hào)加工處理的重要工具,在自適應(yīng)濾波、信號(hào)檢測(cè)、移動(dòng)通信等方面得到較為廣泛的應(yīng)用.
自適應(yīng)線性神經(jīng)元ADALINE(Adaptive Linear Neuron)是19世紀(jì)60年代美國(guó)斯坦福大學(xué)兩位教授威德羅和霍夫提出的,采用比感知器更復(fù)雜的學(xué)習(xí)算法,該算法稱為 LMS(least mean squares)算法[1].LMS的學(xué)習(xí)規(guī)則能夠使均方誤差最小,從而使判決邊界盡可能遠(yuǎn)離分類模式,增強(qiáng)了網(wǎng)絡(luò)的抗干擾能力,可以實(shí)現(xiàn)高性能自適應(yīng)濾波器的設(shè)計(jì)[2].
通常情況下,語音通信需要面對(duì)復(fù)雜的噪聲環(huán)境,但是在片段區(qū)間內(nèi),引起噪聲的物理環(huán)境在統(tǒng)計(jì)特性上不會(huì)有顯著的變化,由此產(chǎn)生的噪聲環(huán)境也不會(huì)發(fā)生明顯改變,這為線性自適應(yīng)神經(jīng)網(wǎng)絡(luò)應(yīng)用于語音信號(hào)消噪處理創(chuàng)造了有利條件[3].ADALINE神經(jīng)網(wǎng)絡(luò)是一個(gè)可調(diào)的自適應(yīng)網(wǎng)絡(luò),模型如圖1所示,它的傳輸函數(shù)為線性函數(shù).線性神經(jīng)網(wǎng)絡(luò)層的輸出為
式中a代表神經(jīng)元的實(shí)際輸出值,為模擬量;W代表權(quán)值矩陣;b代表閾值向量;p代表輸入向量.在有些應(yīng)用中,系統(tǒng)的輸出不是取自線性神經(jīng)元的輸出,而是把目標(biāo)響應(yīng)t和模擬輸出量a相減,得到誤差向量 e作為輸出[4].
圖1 ADALINE神經(jīng)網(wǎng)絡(luò)模型
線性系統(tǒng)根據(jù)給定的輸入和目標(biāo)向量,可以算出輸出和目標(biāo)向量的最小誤差值.對(duì)于自適應(yīng)線性神經(jīng)網(wǎng)絡(luò)可以直接求解網(wǎng)絡(luò)的W和b而不需要訓(xùn)練,當(dāng)網(wǎng)絡(luò)有多個(gè)零誤差解的時(shí)候,可以取誤差平方和最小的一組W和b.若無法直接求出W和b,ADALINE神經(jīng)網(wǎng)絡(luò)可以采用LMS算法來調(diào)整W和b,這種算法是沿誤差梯度的反方向?qū)ι弦淮蔚募訖?quán)向量進(jìn)行修正[5].
對(duì)于訓(xùn)練樣本{p1,t1},{p2,t2},…,{pQ,tQ},LMS算法的目的是尋找最佳的閾值和權(quán)值,使ADALINE神經(jīng)網(wǎng)絡(luò)的輸出和目標(biāo)值均方誤差最小.
式中:mse為均方誤差;Q為樣本個(gè)數(shù);a為ADALINE的實(shí)際輸出值;t為ADALINE輸出的期望值.
為了得到合適的閾值和權(quán)值,使每個(gè)神經(jīng)元輸出的均方誤差最小,以x代表閾值或權(quán)值,對(duì)(2)式求偏導(dǎo)數(shù)得
令它等于0,可得mse的極點(diǎn).由于均方誤差只能取正值,所以極值點(diǎn)必為極小值.當(dāng)輸入多維向量時(shí),計(jì)算量太大,難以得出正確結(jié)果.通常采用搜索優(yōu)化法,假設(shè)第k次訓(xùn)練獲得相應(yīng)的閾值和權(quán)值,然后找出梯度的反方向,即曲面上該點(diǎn)斜率最大的下降方向,沿此方向?qū)λM(jìn)行修正,得到線性神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值的調(diào)整公式如下
式中α為學(xué)習(xí)速率,決定權(quán)值和閾值的收斂速度以及穩(wěn)定性[6].α值取得越大,學(xué)習(xí)速度就越快,但學(xué)習(xí)速率取太大反而會(huì)出現(xiàn)修正過度,使系統(tǒng)失去穩(wěn)定,最終結(jié)果反而誤差更大[7].仿真過程需要多次對(duì)它進(jìn)行調(diào)整,以期獲得較好結(jié)果.
利用自適應(yīng)線性神經(jīng)網(wǎng)絡(luò)去噪原理如圖2所示.信號(hào)源的輸出表示有用信號(hào),n0為與s不相關(guān)的隨機(jī)噪聲,n1為與噪音信號(hào)n0相關(guān)的參考輸入信號(hào).s+n0為ADALINE神經(jīng)元的期望輸出信號(hào),y為ADALINE神經(jīng)元的實(shí)際輸出,兩者通過減法器后得到誤差信號(hào),作為系統(tǒng)的輸出以ε表示.
由于 s和n0,n1沒有相關(guān)性,所以 E[s·(n0-y)]=0,則 E[ε2]=E[s2]+E[(n0-y)2],通過線性神經(jīng)網(wǎng)絡(luò)調(diào)節(jié),得到
式中,Emin[(n0- y)2]當(dāng)趨于0時(shí),即y趨于n0,其輸出ε等于s,此時(shí)噪音信號(hào)被消除.
圖2 去噪原理
圖3 信號(hào)加噪、去噪效果對(duì)比
圖4 電話語音信號(hào)加噪、去噪后時(shí)域、頻域波形
根據(jù)以上分析,假設(shè)噪聲源為一隨機(jī)噪聲,把一簡(jiǎn)單信號(hào)與隨機(jī)噪聲之和作為ADALINE神經(jīng)元的目標(biāo)向量;輸出信號(hào)為網(wǎng)絡(luò)調(diào)整過程中的誤差信號(hào).從圖3中可以看出,輸出信號(hào)波形與輸入信號(hào)波形基本一致,消除了疊加的隨機(jī)噪聲.
人類說話的語音頻率范圍一般在300Hz~3400kHz之間,電話所使用的頻率范圍在 0~3500Hz之間,更高的頻率在接入交換機(jī)時(shí)被低通濾波器過濾掉.根據(jù)國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT)的長(zhǎng)途通信協(xié)議標(biāo)準(zhǔn),目前各國(guó)一般采用的聲音采樣頻率為8kHz.在仿真過程中,錄制一段語音信號(hào),采樣頻率為8kHz,疊加上一個(gè)隨機(jī)噪聲,其幅度是語音信號(hào)最大幅度的2倍,如圖4所示.
從時(shí)域和頻域觀察,加噪后語音信號(hào)完全淹沒在噪聲中.要在這種惡劣條件下對(duì)語音信號(hào)進(jìn)行濾波,提取出有用的通話語音信號(hào),經(jīng)典濾波器根本無法實(shí)現(xiàn).從圖中可以看到,有用語音信號(hào)和噪聲的頻譜完全混疊在一起.當(dāng)噪聲幅度較小信噪比較大時(shí),可以采用小波變換、譜減法等來去噪,但是隨著噪聲幅度增大,效果很不理想,難以有效濾除噪聲、最大限度地恢復(fù)信號(hào).
圖中帶噪語音信號(hào)聽起來是非常明亮刺耳的“咝”聲,根本無法察覺話音的存在.采用ADALINE神經(jīng)網(wǎng)絡(luò)去噪處理后,信噪比由負(fù)值轉(zhuǎn)為正值,達(dá)到21分貝,經(jīng)過人耳實(shí)際感官測(cè)試,語音質(zhì)量與原始信號(hào)幾乎一致,效果令人滿意[8].從頻譜上觀察,去噪后還存在細(xì)小高頻噪聲,但不影響電話通話信息的有效傳遞,可以用低通濾波器加以消除.
通過仿真驗(yàn)證了神經(jīng)網(wǎng)絡(luò)應(yīng)用于電話去噪的有效性,由于采用LMS學(xué)習(xí)算法,誤差與權(quán)值構(gòu)成的拋物面只有一個(gè)極小值點(diǎn),需要多次訓(xùn)練才能獲得較準(zhǔn)確的結(jié)果.只有在速率較小的情況下,才能保證學(xué)習(xí)收斂.仿真過程中采用恒定學(xué)習(xí)速率,為了改進(jìn)算法,可以采用時(shí)變的學(xué)習(xí)速率.
[1]李作進(jìn).中醫(yī)脈象信號(hào)的統(tǒng)計(jì)分析[D].重慶:重慶大學(xué),2007:5-6.
[2]周開利,康耀紅.神經(jīng)網(wǎng)絡(luò)模型及其MATLAB仿真程序設(shè)計(jì)[M].北京:清華大學(xué)出版社,2005:60-62.
[3]韓玥,張亦軍等.一種基于ADALINE網(wǎng)絡(luò)的自適應(yīng)濾波語音降噪方法[J].鄭州輕工業(yè)學(xué)院學(xué)報(bào),2007,22(2):85-87.
[4]李政洋.基于AD神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)[D].江蘇:蘇州大學(xué),2008:26-27.
[5]郭峰,任興民等.基于神經(jīng)網(wǎng)絡(luò)消噪的獨(dú)立成分分析方法研究[J].機(jī)械科學(xué)與技術(shù),2010,29(12):1678-1682.
[6]楊克己.基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)濾波技術(shù)及其在超聲檢測(cè)中的應(yīng)用[J].儀器儀表學(xué)報(bào),2005,26(8):813 -817.
[7]張帆.Adaline神經(jīng)網(wǎng)絡(luò)隨機(jī)逼近LMS算法的仿真研究[J].電子設(shè)計(jì)工程,2009,17(9):88 -90.
[8]孫靜,陶智等.基于AD神經(jīng)網(wǎng)絡(luò)的耳語音增強(qiáng)的研究[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(29):242 -244.