劉后廣賀志恒饒柱石楊建華趙禹
1中國(guó)礦業(yè)大學(xué)機(jī)電工程學(xué)院(徐州 221116)
2上海交通大學(xué)機(jī)械系統(tǒng)與振動(dòng)國(guó)家重點(diǎn)實(shí)驗(yàn)室(上海 200240)
響度是人耳對(duì)聲音強(qiáng)弱的主觀感知,反映了人耳對(duì)聲的主觀感知與聲音客觀物理量的關(guān)系[1]。響度感知預(yù)測(cè)是聲品質(zhì)客觀評(píng)價(jià)的重要成分[2],隨著人們對(duì)產(chǎn)品聲品質(zhì)要求的提升,建立能夠準(zhǔn)確反映人耳響度感知的預(yù)測(cè)模型具有重要意義。與此同時(shí),響度感知預(yù)測(cè)也是助聽(tīng)裝置驗(yàn)配的基礎(chǔ)[3],如由澳大利亞國(guó)家聲學(xué)實(shí)驗(yàn)室所提出的NAL-NL1驗(yàn)配算法便是基于劍橋大學(xué)Moore-Glasberg響度感知預(yù)測(cè)模型所構(gòu)建[4]。故針對(duì)患者的響度感知預(yù)測(cè),對(duì)助聽(tīng)裝置設(shè)計(jì)及算法開發(fā)也至關(guān)重要。
為了預(yù)估人耳的響度感知,國(guó)內(nèi)外很多學(xué)者提出了各種響度感知計(jì)算模型。針對(duì)正常人耳的響度感知,經(jīng)典的預(yù)測(cè)模型是Zwicker模型和Moore-Glasberg模型,并分別被列為國(guó)際標(biāo)準(zhǔn)ISO 532-1[5]、ISO 532-2[6]。其 中,Moore-Glasberg模型又是對(duì)Zwicker模型的改進(jìn),特別是參考了人耳生理傳遞特性,對(duì)其前端的外耳、中耳濾波器重新設(shè)計(jì),使模型更具有生理意義。但其聽(tīng)覺(jué)外周部分未完全基于人耳生理結(jié)構(gòu)構(gòu)建,中耳的傳聲特性與真實(shí)不同,耳蝸則是由一組通過(guò)掩蔽實(shí)驗(yàn)數(shù)據(jù)得出的聽(tīng)覺(jué)濾波器模擬。Pieper等[7]進(jìn)一步將基于生理結(jié)構(gòu)的耳蝸傳輸線模型引入響度計(jì)算,構(gòu)建了生理響度預(yù)測(cè)模型。然而,該生理響度預(yù)測(cè)模型未考慮中耳的生理結(jié)構(gòu),無(wú)法用于分析中耳炎等聽(tīng)骨鏈病變對(duì)響度感知的影響,亦不能用于分析激振位置位于聽(tīng)小骨的人工中耳響度補(bǔ)償特性。
針對(duì)上述問(wèn)題,本文基于人耳生理結(jié)構(gòu),構(gòu)建了包括聽(tīng)覺(jué)外周及模擬響度感知相關(guān)神經(jīng)發(fā)放的后端模塊的響度感知預(yù)測(cè)模型。通過(guò)與中耳壓強(qiáng)增益、基底膜特性頻率、耳蝸品質(zhì)因子的實(shí)驗(yàn)測(cè)量值對(duì)比,驗(yàn)證了該響度模型能夠較好地模擬人耳生理結(jié)構(gòu)的傳聲特性。最終,通過(guò)響度增長(zhǎng)曲線、等響曲線、響度臨界帶寬的對(duì)比,證明了所構(gòu)建模型在響度感知預(yù)測(cè)上的可信度。該基于人耳生理結(jié)構(gòu)的響度預(yù)測(cè)模型的構(gòu)建,為中耳病變患者響度感知特性的研究,及人工中耳響度補(bǔ)償算法的開發(fā)奠定了基礎(chǔ)。
基于人耳生理結(jié)構(gòu)所構(gòu)建的響度感知預(yù)測(cè)模型如圖1所示,該模型主要由聽(tīng)覺(jué)外周模塊及模擬響度感知相關(guān)神經(jīng)發(fā)放的后端處理模塊兩部分組成。聽(tīng)覺(jué)外周模塊又包括3部分:模擬聲音從人體頭部正前方傳遞至鼓膜傳遞特性的外耳道部分,模擬振動(dòng)從鼓膜至鐙骨足板傳遞特性的中耳部分,及模擬振動(dòng)從鐙骨至基底膜傳遞特性的內(nèi)耳部分。其中,外耳道部分用傳遞函數(shù)簡(jiǎn)化模擬,處理后的聲音刺激鼓膜,帶動(dòng)聽(tīng)骨鏈振動(dòng);中耳部分用等效電路模型模擬,錘骨、砧錘關(guān)節(jié)、砧骨、鐙砧關(guān)節(jié)、鐙骨的等效阻抗分別為Zm、Zimj、Zi、Zisj、Zs,鐙骨輸出壓力驅(qū)動(dòng)內(nèi)耳淋巴液流動(dòng);內(nèi)耳部分采用耳蝸傳輸線模型模擬,計(jì)算出由耳蝸內(nèi)壓差導(dǎo)致的基底膜響應(yīng)速度V。
圖1 基于人耳生理結(jié)構(gòu)的響度感知預(yù)測(cè)模型Fig.1 Loudness perception model based on the physiological structure of the human ear
采用頭部相關(guān)傳遞函數(shù)(Head-related transfer function,HRTF),來(lái)模擬聲從人體頭部正前方傳至鼓膜的外耳傳聲特性。HRTF通過(guò)N=600階的FIR濾波器實(shí)現(xiàn):
式中,PTM為施加在鼓膜上的聲壓;Prefrence為參考點(diǎn)位聲壓,即頭部正前方聲壓;n為輸入聲音信號(hào)中的第n個(gè)點(diǎn)。考慮到響度感知多在自由聲場(chǎng)下測(cè)試獲得,選取Shaw等試驗(yàn)[8]所測(cè)自由場(chǎng)外耳傳遞特性曲線擬合,如圖2所示。
圖2 自由場(chǎng)人體外耳傳遞特性曲線Fig.2 Free-field human external ear transfer function
響度模型(圖1)中的中耳部分由中耳等效電路模型模擬計(jì)算,如圖3所示。其中,鼓膜采用一維無(wú)損傳輸線模型模擬,具體參數(shù)列于表1[9]。其聲激勵(lì)下傳遞方程為:
式中,右側(cè)對(duì)角矩陣為鼓膜變壓器矩陣,將鼓膜聲學(xué)輸入?yún)?shù)轉(zhuǎn)換為機(jī)械參數(shù)。PTM與UTM分別是鼓膜的聲壓與體積速度;FU與VU分別是鼓膜輸出的力與速度;ATM是鼓膜面積;Zchar為特征阻抗,TTM為鼓膜前向傳遞延時(shí)[10]。
將中耳的聽(tīng)骨鏈和關(guān)節(jié)建模為一維振動(dòng)傳遞模型,其與內(nèi)耳耦合的中耳機(jī)械阻抗的模型拓?fù)浣Y(jié)構(gòu)如圖3所示。模型中具體參數(shù)亦列于表1。其聲激勵(lì)下的傳遞方程為:
表1 中耳等效電路模型參數(shù)值Table 1 Parameters of middle-ear circuit model
圖3 中耳等效電路模型Fig.3 Middle-ear circuit model
式中,PSV與USV分別是鐙骨足底板與卵圓窗結(jié)合處的壓力、體積速度。傳遞矩陣中AME、BME、CME和DME由O’Connor等實(shí)驗(yàn)擬合數(shù)據(jù)獲得[10]。計(jì)算傳遞矩陣所需的錘骨與錘骨前韌帶阻抗取決于錘骨質(zhì)量Mm、錘骨前韌帶阻尼Rm與錘骨前韌帶剛度Km;砧錘關(guān)節(jié)阻抗取決于砧錘關(guān)節(jié)阻尼Rimj與剛度Kimj;砧骨阻抗取決于砧骨質(zhì)量Mi;砧鐙關(guān)節(jié)阻抗取決于砧鐙關(guān)節(jié)阻尼Risj與剛度Kisj;鐙骨與鐙骨環(huán)韌帶阻抗取決于鐙骨質(zhì)量MS、鐙骨環(huán)韌帶阻尼RS與剛度KS。此外,表1中NME為錘骨與砧骨之間的聽(tīng)骨鏈杠桿比,Asf為鐙骨足底板面積[11]。
與聽(tīng)骨鏈接觸的內(nèi)耳部分使用聲阻抗模擬,如圖3所示,采用團(tuán)隊(duì)之前報(bào)道的耳蝸輸入阻抗模型與聽(tīng)骨鏈耦合[12]。
內(nèi)耳部分采用Verhulst等[13]報(bào)道的一維傳輸線耳蝸模型來(lái)模擬。建模過(guò)程中,假設(shè)壓力在垂直于基底膜方向均勻分布[14];將基底膜沿耳蝸縱向分為1000段,每段特征頻率根據(jù)Greenwood數(shù)據(jù)確定[15]。最終,所構(gòu)建的傳輸線系統(tǒng)如圖4所示。其中,PSV為鐙骨輸入壓力,Pn為施加在第n段基底膜上的壓力。串聯(lián)阻抗Ysn與Ypn分流通道為復(fù)變量s的函數(shù):
圖4 耳蝸傳輸線系統(tǒng)Fig.4 Cochlear transmission line system
式中,Mso與Mpo是常數(shù)。變量控制著耳蝸的瞬時(shí)非線性。當(dāng)時(shí),耳蝸為主動(dòng)模型。為控制系統(tǒng)穩(wěn)定性的反饋?lái)?xiàng)。假設(shè)基底膜相鄰段之間的傳遞函數(shù)變化局部對(duì)稱,則可用代替s。引入變量,根據(jù)式(6)所示的微分方程,計(jì)算出每段基底膜上的速度v與位移y。
為將聽(tīng)覺(jué)外周模型計(jì)算的基底膜響應(yīng)該物理興奮轉(zhuǎn)變?yōu)榕c神經(jīng)發(fā)放有關(guān)的響度,構(gòu)建響度感知計(jì)算的后端處理模塊。首先,將基底膜各位置在不同時(shí)刻的響應(yīng)速度取絕對(duì)值,構(gòu)成二維聽(tīng)覺(jué)信號(hào)矩陣。再按基底膜的縱向位置將其分成23個(gè)興奮段,從而將該聽(tīng)覺(jué)信號(hào)矩陣分解為23個(gè)微聽(tīng)覺(jué)信號(hào)矩陣。其中特征頻率為80-11180 Hz的所有基底膜段數(shù)按照1/3倍頻程分為21個(gè)興奮段,而特征頻率大于11180 Hz以及小于80 Hz的基底膜段分別作為一個(gè)興奮段。對(duì)每一個(gè)興奮段產(chǎn)生的聽(tīng)覺(jué)信號(hào)矩陣用RC積分電路在時(shí)間軸上積分。采樣頻率(fs)與耳蝸模型的采樣頻率一致,為100000 Hz,時(shí)間常數(shù)τ為25 ms。選取模型輸入信號(hào)的持續(xù)時(shí)間為0.2 s,該積分器對(duì)有限長(zhǎng)時(shí)間信號(hào)與無(wú)限長(zhǎng)時(shí)間信號(hào)積分導(dǎo)致的值相差不超過(guò)5%。通過(guò)該積分器對(duì)基底膜響應(yīng)速度積分后得到初始生理興奮Em,n:
Vm,n為m時(shí)刻時(shí)第n個(gè)基底膜特定位置預(yù)處理后的速度。k為與采樣頻率以及時(shí)間常數(shù)有關(guān)的常數(shù):
所有的初始生理興奮Em,n在每一個(gè)時(shí)間節(jié)點(diǎn)m上取均值得出均值生理興奮一維陣列;再對(duì)這個(gè)陣列取最大值得到第x個(gè)興奮段產(chǎn)生的興奮Ex:
N為第x個(gè)興奮段內(nèi)基底膜的段數(shù)。再采用Moore等[16]將興奮模式轉(zhuǎn)換至特定響度的方法,得到特定響度:
式中,c、ETH、G、A、α對(duì)應(yīng)于不同興奮段上的值不同,具體值采用改進(jìn)粒子群優(yōu)化算法計(jì)算得出。將所有特定響度相加,得出輸入聲音信號(hào)所產(chǎn)生的響度。該值為單耳響度,雙耳響度近似為該單耳響度值的1.22倍[17]。
2.1.1 中耳傳聲特性
為驗(yàn)證所構(gòu)建的響度模型能夠預(yù)測(cè)人耳生理解剖結(jié)構(gòu)傳聲特性,首先對(duì)模型中耳部分的傳聲特性進(jìn)行分析。通過(guò)模型計(jì)算出反映中耳傳聲特性的中耳壓強(qiáng)增益,即鐙骨輸出壓強(qiáng)與鼓膜輸入壓強(qiáng)之比,并將其結(jié)果與Aibara及Nakajima等實(shí)驗(yàn)所測(cè)值進(jìn)行對(duì)比[18,19],如圖5所示。從中可見(jiàn),模型計(jì)算的中耳壓強(qiáng)增益曲線在趨勢(shì)上與Nakajima等人實(shí)驗(yàn)值[19]一致,在數(shù)值上也較接近上述實(shí)驗(yàn)結(jié)果。故所建響度模型可以較準(zhǔn)確地預(yù)測(cè)實(shí)際中耳生理結(jié)構(gòu)的傳聲特性。
圖5 中耳壓強(qiáng)增益幅頻曲線對(duì)比Fig.5 Comparison of amplitude-frequency curves of middleear pressure gain
2.1.2 耳蝸傳聲特性
基底膜選頻是耳蝸傳聲的主要特性,為了驗(yàn)證所構(gòu)建模型能夠準(zhǔn)確模擬耳蝸生理結(jié)構(gòu)的傳聲特性,分別對(duì)基底膜特征頻率、及品質(zhì)因子進(jìn)行對(duì)比驗(yàn)證。首先,對(duì)模型中耳蝸縱向不同位置基底膜的特征頻率進(jìn)行計(jì)算,并將其結(jié)果與文獻(xiàn)報(bào)道[15,20]進(jìn)行對(duì)比,如圖6所示。從中可見(jiàn),模型計(jì)算的耳蝸不同位置基底膜特征頻率與實(shí)驗(yàn)數(shù)據(jù)一致。再計(jì)算反映耳蝸基底膜頻率調(diào)諧特性的品質(zhì)因子QERB,并將模型計(jì)算結(jié)果與Oxenhamo等[21]及Leschke等[22]的實(shí)驗(yàn)測(cè)量結(jié)果進(jìn)行對(duì)比,如圖7所示??梢?jiàn),模型計(jì)算的QERB與實(shí)驗(yàn)報(bào)道值也較吻合。綜上可見(jiàn),所構(gòu)建的響度模型也能夠較準(zhǔn)確地反映耳蝸生理結(jié)構(gòu)的傳聲特性。
圖6 耳蝸基底膜選頻特性驗(yàn)證Fig.6 Verification of frequency selectivity of cochlear basilar membrane
2.2.1 響度增長(zhǎng)曲線計(jì)算
為了驗(yàn)證所構(gòu)建響度模型能夠準(zhǔn)確預(yù)測(cè)人耳響度感知特性,先對(duì)1 kHz純音感知的響度增長(zhǎng)曲線進(jìn)行對(duì)比,如圖8所示。其中,對(duì)比曲線取自ANSI S3.4(2007)中實(shí)驗(yàn)數(shù)據(jù)[23]。從中可見(jiàn),模型計(jì)算出的響度值與ANSI S3.4(2007)實(shí)驗(yàn)值一致。對(duì)于40 dB至70 dB聲壓級(jí)之間的聲壓級(jí),輸入聲壓級(jí)每增加10 dB,響度值大約翻倍;曲線在低分貝時(shí)比在高分貝時(shí)更陡峭。
圖8 1 kHz響度增長(zhǎng)曲線對(duì)比驗(yàn)證Fig.8 Comparison of loudness growth curve at 1 kHz
2.2.2 等響曲線計(jì)算
上述響度增長(zhǎng)曲線對(duì)比證明了所構(gòu)建生理響度模型對(duì)1 kHz單頻聲響度感知預(yù)測(cè)的可靠性。為了驗(yàn)證所構(gòu)建的生理響度模型在其它頻率響度感知預(yù)測(cè)上的可靠性,進(jìn)一步開展等響曲線對(duì)比驗(yàn)證,結(jié)果如圖9所示。其中,對(duì)比實(shí)驗(yàn)曲線取自ISO 226-2003標(biāo)準(zhǔn)[24]。從圖中可見(jiàn),生理響度模型計(jì)算結(jié)果與ISO 226-2003的實(shí)驗(yàn)結(jié)果在低、中頻段吻合較好。高頻段預(yù)測(cè)誤差略大,預(yù)測(cè)值與數(shù)據(jù)之間的最大偏差為6.26 dB,位于10 kHz的100 dB處。
圖9 等響曲線對(duì)比Fig.9 Comparison of equal loudness contour
2.2.3 臨界帶寬計(jì)算
為了驗(yàn)證所構(gòu)建的響度模型能準(zhǔn)確預(yù)測(cè)非純音的響度感知,參考Zwicker等的響度臨界帶寬實(shí)驗(yàn)[25],進(jìn)行模擬計(jì)算,結(jié)果如圖10所示。
圖10 與可變帶寬噪聲匹配所需210 Hz白噪聲聲壓級(jí)Fig.10 Level of a 210Hz wide noise required to match the loudness of a noise of variable bandwidth
計(jì)算時(shí),輸入為經(jīng)過(guò)帶通濾波的白噪聲,中心頻率為 1420 Hz,聲壓級(jí)分別為 30 dB、50 dB、80 dB。對(duì)比聲是以中心頻率為1420 Hz,帶寬為210 Hz的白噪聲。調(diào)整對(duì)比聲的聲壓級(jí),使其響度與可變帶寬的測(cè)試噪聲相匹配。從模型計(jì)算結(jié)果圖10中可見(jiàn),本響度模型計(jì)算出的響度臨界帶寬變化與實(shí)驗(yàn)數(shù)據(jù)較吻合。
自美國(guó)貝爾實(shí)驗(yàn)室Fletecher等[26]提出了響度概念后,為了預(yù)測(cè)人耳的響度感知特性,國(guó)內(nèi)外學(xué)者建立了不同的響度預(yù)測(cè)模型。隨著響度被廣泛應(yīng)用于噪聲評(píng)估[27]、聲品質(zhì)分析[28]、助聽(tīng)裝置設(shè)計(jì)[29]等工業(yè)領(lǐng)域,國(guó)際標(biāo)準(zhǔn)化組織已將兩種經(jīng)典的響度預(yù)測(cè)模型列為標(biāo)準(zhǔn),即Zwicker模型[5]、Moore-Glasberg模型[6]。其中,Moore-Glasberg模型又是在Zwicker模型基礎(chǔ)上的改進(jìn)[16],采用外耳與中耳傳遞函數(shù)替換了Zwicker模型中傳輸因子,使得模型具有生理意義;給出了興奮模式的計(jì)算解析式,避免了Zwicker模型中通過(guò)查圖、表來(lái)計(jì)算的繁瑣過(guò)程。
雖然Moore-Glasberg模型[6]在響度計(jì)算中考慮了人耳的生理組成,但其仍是通過(guò)濾波器組近似模擬外耳、中耳、內(nèi)耳的傳聲特性,忽略了耳內(nèi)真實(shí)的生理結(jié)構(gòu)。此外,為使響度預(yù)測(cè)結(jié)果逼近實(shí)驗(yàn)測(cè)量值,模型的中耳部分傳聲特性還與真實(shí)中耳不一致[16]。上述不足盡管不會(huì)影響模型在正常人耳響度感知上的預(yù)測(cè)效果,但無(wú)法用于研究人耳生理結(jié)構(gòu)對(duì)響度感知的影響。針對(duì)該問(wèn)題,奧登堡大學(xué)Pieper等[7]將基于生理結(jié)構(gòu)的耳蝸傳輸線模型引入到響度計(jì)算,但仍未考慮中耳的生理結(jié)構(gòu)。本文所構(gòu)建的響度預(yù)測(cè)模型首次同時(shí)考慮了中耳、耳蝸的生理結(jié)構(gòu),并通過(guò)中耳壓強(qiáng)增益、基底膜特征頻率、耳蝸品質(zhì)因子的對(duì)比,證明了該響度模型還能較準(zhǔn)確模擬中耳、耳蝸的傳聲特性。該模型的上述優(yōu)點(diǎn),使得研究人耳生理結(jié)構(gòu)、生理響應(yīng)與響度感知間關(guān)系成為可能。
聽(tīng)力損傷患者的響度感知預(yù)估是助聽(tīng)裝置適配算法開發(fā)的基礎(chǔ)[29]。目前,聽(tīng)損人耳響度感知模型主要圍繞感音神經(jīng)性聽(tīng)力損傷開展,如Moore等[30]、陳章立等[31]、Pieper等[32]所構(gòu)建的感音神經(jīng)性聽(tīng)損響度感知預(yù)測(cè)模型。然而,由于上述響度感知預(yù)測(cè)模型都沒(méi)有考慮中耳的生理結(jié)構(gòu),無(wú)法用于傳導(dǎo)性及混合性聽(tīng)損的響度感知計(jì)算。與前述模型不同,本文所構(gòu)建的響度感知模型因?yàn)榭紤]了中耳的生理結(jié)構(gòu),可通過(guò)調(diào)整模型中中耳組織的參數(shù)來(lái)模擬中耳畸形等傳導(dǎo)性病變[33],能用于預(yù)測(cè)傳導(dǎo)性及混合性聽(tīng)損的響度感知特性。此外,通過(guò)機(jī)械激振砧骨長(zhǎng)突、砧骨體、鐙骨等中耳組織,來(lái)補(bǔ)償聽(tīng)力損傷的人工中耳,是近年來(lái)發(fā)展起來(lái)的新型助聽(tīng)裝置[34]。而上述響度感知預(yù)測(cè)模型都沒(méi)有考慮中耳的生理結(jié)構(gòu),故無(wú)法用于分析人工中耳激振下的響度感知特性。本響度預(yù)測(cè)模型的中耳生理結(jié)構(gòu)的考慮,使得其還可用于分析人工中耳響度補(bǔ)償特性。
為使響度模型能夠反映人耳生理結(jié)構(gòu)的傳聲特性,構(gòu)建了基于人耳生理結(jié)構(gòu)的響度感知預(yù)測(cè)模型。該響度模型主要由聽(tīng)覺(jué)外周模塊及后端處理模塊兩部分組成。其中,聽(tīng)覺(jué)外周模塊將輸入聲音轉(zhuǎn)變?yōu)槎亙?nèi)基底膜響應(yīng);后端處理模塊模擬聽(tīng)覺(jué)神經(jīng),將基底膜響應(yīng)該物理響應(yīng)轉(zhuǎn)變?yōu)榕c神經(jīng)發(fā)放相關(guān)的響度感知。最終,通過(guò)中耳壓強(qiáng)增益、基底膜特征頻率、耳蝸品質(zhì)因子的對(duì)比,驗(yàn)證了模型能夠較好地模擬人耳生理解剖結(jié)構(gòu)的傳聲特性;通過(guò)響度增長(zhǎng)曲線、等響曲線、響度臨界帶寬的對(duì)比,驗(yàn)證了模型在響度感知預(yù)測(cè)上的可信度。該響度感知預(yù)測(cè)模型由于基于人耳生理結(jié)構(gòu),一方面有助于研究中耳畸形等生理結(jié)構(gòu)病變對(duì)患者響度感知的影響;另一方面也有利于研究人工中耳等激振位置非鼓膜的人工聽(tīng)覺(jué)裝置的響度補(bǔ)償特性。