許方煜(重慶郵電大學(xué),重慶 400065)
多聲源下基于耳蝸基底膜的聲源定位
許方煜
(重慶郵電大學(xué),重慶400065)
摘要:傳統(tǒng)麥克風(fēng)聲源定位在噪聲環(huán)境下無法精確的定位出聲源,而人耳卻能準(zhǔn)確的辨別出來。根據(jù)人耳這一特性,提出一種在多聲源環(huán)境下基于耳蝸基底膜的聲源定位。該方法利用多麥克風(fēng)進(jìn)行聲音信號的采集[1-2],然后采用基底膜濾波器對聲源信號進(jìn)行濾波,這里采用GC-4濾波器進(jìn)行濾波,最后再進(jìn)行聲源定位。實驗結(jié)果證明在多聲源情況下基于耳蝸基底膜的聲源定位能提高定位精度。
關(guān)鍵詞:聲源;耳蝸基底膜;濾波器;精度
人耳聽到聲音的過程是:首先通過聽覺系統(tǒng)的外耳,實現(xiàn)對聲音信號的收集和放大!然后經(jīng)由耳道傳輸至耳膜,經(jīng)過中耳的阻抗匹配后傳導(dǎo)至內(nèi)耳的耳蝸[3]。耳蝸基底膜對聲音信號具有頻率選擇特性,即不同頻率會在基底膜的不同位置產(chǎn)生不同幅度的調(diào)諧峰,基底膜的這種頻率選擇特性相當(dāng)于一個帶通濾波的過程,人耳聽覺系統(tǒng)以此實現(xiàn)對聲音信號的濾波.經(jīng)過基底膜濾波之后的聲波信號傳遞到內(nèi)毛細(xì)胞.內(nèi)毛細(xì)胞接受耳蝸傳來的振動信號,經(jīng)過半波整流之后將其轉(zhuǎn)換成神經(jīng)電信號由聽覺神經(jīng)纖維實現(xiàn)對聲音信號的脈沖編碼。
聲音信號在耳蝸中傳輸時,耳蝸對聲音信號進(jìn)行濾波處理,此時耳蝸相當(dāng)于一組帶通濾波器。而耳蝸基底膜貫穿了耳蝸的底部到頂部,是耳蝸內(nèi)對聲音信號濾波的主要執(zhí)行者。耳蝸基底膜主要有以下幾個特性:(1)頻率選擇;(2)頻譜分析特性;(3)濾波器頻率響應(yīng)的非對稱;(4)濾波器頻率響應(yīng)的強度相關(guān)。
耳蝸基底膜上的每一個點都在一個特定的頻率下響應(yīng)出現(xiàn)峰值。對高頻聲學(xué)信號,耳蝸基底膜的峰值出現(xiàn)在基底膜的底端附近,相反對低頻聲學(xué)信號,耳蝸基底膜的峰值出現(xiàn)在基底膜的頂端附近。耳蝸基底膜縱向位置上,存在頻率部位的轉(zhuǎn)化關(guān)系。在耳蝸基地膜的頂端開始,500Hz以上聲音信號,相對帶寬基本為恒量,其最大方位的包絡(luò)的線性距離與頻率的對數(shù)基本上呈線性關(guān)系,耳蝸基底膜的與頻率的這種聯(lián)系如(1)式所示:
BF的單位是kHz;x表示的是基底膜某處離基底膜頂部的長度和基底膜的全長的比值,一般數(shù)值在0~1范圍內(nèi);表示的是常數(shù)參量(=2.1);k表示的也是常數(shù)參量(k=0.85)。A表示的也是常數(shù)參量(這里取值為A=0.1654)。
耳蝸基底膜的特性明顯可以看出耳蝸基底膜具有濾波的作用,由此可建立濾波模型。
基底膜特性可以建立一個更加符合人耳聽覺特性的濾波器,使其具有更好的頻率選擇性能,本文選用GC濾波器,并對其進(jìn)行改進(jìn)。GC濾波器是一種標(biāo)準(zhǔn)的耳蝸聽覺濾波器,該濾波器組的沖激響應(yīng)的典型模式為(2)式所示:
a表示幅度;n和b用來調(diào)整伽馬函數(shù)的分布;fr表示GC濾波器的中心頻率;ERB(fr)表示當(dāng)頻率為fr時,聽力正常的人平均聽力的等效矩形帶寬;表示初始相位;lnt表示時間的自然對數(shù);u(t)表示單位階躍函數(shù);c表示啁啾因子。當(dāng)c=0時,上式可以簡化為GT濾波器的時域表達(dá)。
通過傅里葉變換,上式可變?yōu)镚C濾波器的幅頻響應(yīng),如式(3)式所示:
由上述可以知道,GC濾波器是由GT濾波器級聯(lián)一個非對稱補償濾波器得到,所以,其改進(jìn)實質(zhì)上是在GT-4上級聯(lián)一個非對稱補償濾波器。而文章的非對稱補償濾波器沒有沖激響應(yīng)函數(shù),需要從補償濾波器的設(shè)計方法實現(xiàn)。
由式(9)分析可以得到,將GT-4濾波器級聯(lián)一個低通濾波器,然后再級聯(lián)高通濾波器后,最終形成GC-4濾波器。
然后利用改進(jìn)后的GC-4濾波器進(jìn)行濾波,最后利用內(nèi)毛細(xì)胞模型,耳蝸核模型以及神經(jīng)纖維模型獲取脈沖發(fā)放率。最后采用映射求和互相關(guān)算法求得雙耳對應(yīng)頻率通道的互相關(guān)函數(shù)。這里的加權(quán)函數(shù)采用相位變化加權(quán)函數(shù)。具體表達(dá)式如公式(10)所示:
相對于空間坐標(biāo)中的新函數(shù),將其定義為映射GCC函數(shù)(mGCC)。通過映射函數(shù),便可以得到左右兩個相同頻率通道求得的空間坐標(biāo)。然后求得各頻率通道中目標(biāo)聲源分量的空間坐標(biāo)。然后將保留下來的空間坐標(biāo)進(jìn)行相加,如式(5.35)所示各信號源的位置。該式定義為求和GCC函數(shù)(sGCC)。
如公式(14)所示。在一個聲源的時候,值存在一個最大的峰值。而且,當(dāng)存在多個聲源的時候,求和GCC的結(jié)果不僅僅是唯一的峰值,還存在第二個或者多個峰值,這是因為空間坐標(biāo)相加得到的峰值位置表示的聲源的位置。在多聲源下基于耳蝸基底膜的聲源定位角度誤差明顯小于其他兩種方法。由此證明:在多聲源環(huán)境下,基于耳蝸基底膜的聲源定位系統(tǒng)比基于麥克風(fēng)陣列的定位系統(tǒng)和基于過零點的聲源定位系統(tǒng)具有更高的定位精度。
參考文獻(xiàn):
[1]趙秀粉.基于麥克風(fēng)陣列的聲源定位技術(shù)研究[D].電子科技大學(xué),2013.
[2]基于小型麥克風(fēng)陣列的聲源定位技術(shù)[J].華中科技大學(xué)學(xué)報,2013,(41):1671-4512.
[3]曲天書,曹松濰.雙耳時間差和強度差與聲源距離線索關(guān)系的研究[J].北京大學(xué)學(xué)報,2010,46(06):0479-8023.
[4]羅元,陳君.基于耳蝸基底膜特性的語音特征提取方法及在智能輪椅上的應(yīng)用[J].計算機應(yīng)用,2012,29(10):1001-3695.
作者簡介:許方煜(1989-),男,福建福鼎人,碩士研究生,研究方向:語音識別。