莫福源
1 中國(guó)科學(xué)院聲學(xué)研究所(北京 100190)
4.2雙耳效應(yīng)和立體聲 人有雙耳絕對(duì)不僅是為了對(duì)稱(chēng)和美觀,雙耳接收聲音后可以定出聲源的方向和距離。聲源在正前方時(shí)雙耳定向精度高,聲源在側(cè)向時(shí)定向精度低;無(wú)論聲源在那個(gè)方向,雙耳定距離都比較差,要靠眼睛幫助。
表1 臨界帶帶寬劃分表
雙耳定向的解釋是到達(dá)兩耳的強(qiáng)度差、時(shí)間差和相位差,低頻(小于800 Hz)和高頻(大于2 000 Hz)時(shí)強(qiáng)度差起主要作用;中頻時(shí)時(shí)間差(即相位差)起主要作用;因?yàn)樗鼈兊年P(guān)系很復(fù)雜,實(shí)驗(yàn)也不好做,所以不易得出確切的理論[1]。
早期劇場(chǎng)實(shí)現(xiàn)立體聲使用的方法較笨拙,在舞臺(tái)上排列一排傳聲器,在劇場(chǎng)后面安放相反次序的揚(yáng)聲器來(lái)達(dá)到立體聲的效果?,F(xiàn)在用耳機(jī)接收時(shí),只要調(diào)節(jié)達(dá)到雙耳的聲強(qiáng)和相位,就可以得到惟妙惟肖的立體聲效果,因?yàn)槁曇糇罱K是進(jìn)入人耳的兩個(gè)耳道,對(duì)雙耳的有關(guān)實(shí)驗(yàn),都是用一個(gè)假人頭,在耳道位置放置傳聲器。
對(duì)家庭影院的立體聲,國(guó)際電信聯(lián)盟(international telecommunication union,ITU)有一個(gè)推薦標(biāo)準(zhǔn):ITU-R標(biāo)準(zhǔn)BS.775-1,簡(jiǎn)稱(chēng)5.1標(biāo)準(zhǔn)。它由5個(gè)全頻帶(達(dá)到20 kHz)的音箱按圖20方式排放,另有一個(gè)低頻音箱(俗稱(chēng)低音炮)放送低頻,由于低頻方向性不強(qiáng),放置位置關(guān)系不大,通常放于中央方向[3]。
圖20 5.1國(guó)際推薦標(biāo)準(zhǔn)家庭影院立體聲音箱擺放示意圖
4.3雞尾酒會(huì)效應(yīng)(cocktail party effect) 人耳在嘈雜的環(huán)境里可以專(zhuān)注于和自己朋友的談話,而不太受周?chē)渌麩o(wú)關(guān)聲音的干擾;同時(shí),突然聽(tīng)到與自己有關(guān)的聲音時(shí)可以立即反應(yīng),如:有人在呼叫他的名字等,此時(shí)和朋友談話的音量不是很高,呼叫的聲音也不大,但人耳加上大腦的作用,可以排除干擾,直奔自己的聽(tīng)覺(jué)主題,這是任何儀器設(shè)備都達(dá)不到的特殊功能。1953年科學(xué)家將這效應(yīng)命名為雞尾酒會(huì)效應(yīng),因?yàn)殡u尾酒會(huì)的環(huán)境是此效應(yīng)的典型例子,對(duì)雞尾酒會(huì)效應(yīng)心里學(xué)家提出了一些模型來(lái)加以解釋?zhuān)纾哼^(guò)濾器模型、衰減模型、信息分配模型等,這里不詳細(xì)討論了[7]。
4.4虛擬低頻(virtual bass) 在電聲設(shè)備日漸小型化的情況下,例如:平板電視、手機(jī)、小型游戲機(jī)等都希望有豐富低頻的效果,遺憾的是尺度的限制,小的揚(yáng)聲器不可能發(fā)出低頻聲;彌補(bǔ)的方法是利用心理聲學(xué)的現(xiàn)象,使聽(tīng)者感覺(jué)到原來(lái)?yè)P(yáng)聲器發(fā)出的沒(méi)有低頻的聲信號(hào)有低頻的存在,該技術(shù)稱(chēng)為虛擬低頻(virtual bass)。許多音頻工程專(zhuān)家研究了虛擬低頻的實(shí)現(xiàn)方法,其中一種方法稱(chēng)為相位聲碼器(phase-vocoder),其基本原理是將沒(méi)有低頻的信號(hào)從時(shí)間域變換到頻率域,然后增強(qiáng)揚(yáng)聲器可以發(fā)出的中頻,此時(shí)就能感覺(jué)到有低頻存在。圖21是虛擬低頻處理示例,上圖是無(wú)低頻的原始信號(hào)頻譜,下圖是增強(qiáng)中頻的頻譜,將增強(qiáng)中頻的頻譜逆變換為時(shí)間信號(hào),此時(shí)就可以感覺(jué)到缺失低頻的存在,這是心理聲學(xué)又一個(gè)奇妙的現(xiàn)象[9]。
圖21 虛擬低頻處理示例 a.無(wú)低頻的原始信號(hào)頻譜;b.增強(qiáng)中頻的頻譜
人耳對(duì)語(yǔ)音和音樂(lè)的感知機(jī)理有所不同,音樂(lè)感知和語(yǔ)音感知都和大腦理解有關(guān),和人過(guò)去聽(tīng)覺(jué)經(jīng)歷而訓(xùn)練形成的腦部興奮區(qū)位有關(guān)。實(shí)驗(yàn)證明,音樂(lè)和語(yǔ)音在大腦的興奮部位是不同的,但此類(lèi)人體實(shí)驗(yàn)不多,筆者對(duì)這些沒(méi)有研究,不能有所介紹,現(xiàn)僅就人耳對(duì)語(yǔ)音感知的某些問(wèn)題作簡(jiǎn)單敘述。因?yàn)閷?duì)語(yǔ)言有記憶的能力,因此從理解語(yǔ)義來(lái)說(shuō),有些音聽(tīng)不清并不影響對(duì)語(yǔ)義的理解,而對(duì)聽(tīng)外語(yǔ)訓(xùn)練少的人,聽(tīng)不清就理解不好。
基于上述人耳對(duì)聲音分析的機(jī)理,可以看出人耳是一個(gè)進(jìn)行頻率分析的器官。實(shí)驗(yàn)證明,對(duì)較長(zhǎng)時(shí)間的純音信號(hào),只要有1 Hz的頻率變化,人耳就可以辨別出來(lái)。語(yǔ)音分析、合成的研究證明,人耳對(duì)不同參數(shù)語(yǔ)音敏感程度是不同的,其對(duì)語(yǔ)音信號(hào)的強(qiáng)度不敏感,因?yàn)槿硕兄曇舻膭?dòng)態(tài)范圍達(dá)到120分貝,耳部的機(jī)械結(jié)構(gòu)很難使其精細(xì)分辨強(qiáng)度的動(dòng)態(tài)變化。反之,人耳對(duì)語(yǔ)音信號(hào)的共振峰位置極為敏感,共振峰位置的細(xì)微變化都會(huì)影響語(yǔ)音的清晰度和和可懂度。圖22是典型的元音/a/、/i/、/u/的口腔剖面和相應(yīng)頻譜圖。
圖22 元音/a/、/i/、/u/的口腔剖面和相應(yīng)頻譜圖
語(yǔ)音生成的原理告訴我們,喉部發(fā)出的氣流是語(yǔ)音產(chǎn)生的動(dòng)力源,其氣流的頻譜近似平直;人們發(fā)不同元音或輔音時(shí)口腔的形狀不同(圖22)。喉到唇部構(gòu)成一個(gè)多種形狀的共振腔,對(duì)氣流進(jìn)行調(diào)制,產(chǎn)生不同的元音或輔音。共振峰特性是識(shí)別不同語(yǔ)音的主要依據(jù),也是識(shí)別不同話音個(gè)性特征的主要依據(jù),是語(yǔ)音識(shí)別、合成和編碼中最重要的參數(shù);其頻譜包絡(luò)的峰(圖22)近似對(duì)應(yīng)語(yǔ)音信號(hào)的共振峰。語(yǔ)言研究證明共振峰是人耳感知不同語(yǔ)音最重要參數(shù),共振峰位置在語(yǔ)音感知中起主要作用[11]。語(yǔ)音合成研究也證明了共振峰位置的重要性,共振峰位置越精確,合成語(yǔ)音質(zhì)量越高,合成語(yǔ)音就越逼真;而共振峰的寬度、幅度對(duì)語(yǔ)音感知不重要,也不敏感。早期共振峰語(yǔ)音合成算法,只考慮語(yǔ)音信號(hào)共振峰位置,而和共振峰的幅度大小及共振峰的寬度關(guān)系不大,共振峰寬度和幅度僅作為一個(gè)和共振峰頻率有固定關(guān)系的經(jīng)驗(yàn)參數(shù),不必給出具體大小。從語(yǔ)音編碼角度看,線性預(yù)測(cè)聲碼器(linear prediction vocoder)比通道聲碼器(channel vocoder)語(yǔ)音質(zhì)量高,就是因?yàn)榍罢邔?duì)共振峰的描述要精確,現(xiàn)在通道聲碼器已為線性預(yù)測(cè)聲碼器所淘汰和取代。這些例子充分說(shuō)明人耳基底膜分析聲音的“部位理論”,也是處理語(yǔ)音信號(hào)的科學(xué)依據(jù)。
當(dāng)前市場(chǎng)上出售的助聽(tīng)器普遍反映不好用,筆者認(rèn)為,聽(tīng)力障礙者特別是老年人,他們的聽(tīng)力減退因人而異,不同頻率衰退程度不同,必須在他們需要補(bǔ)償?shù)念l率給予較為精確的補(bǔ)償。而普通助聽(tīng)器只是粗略的在某些頻段增強(qiáng),由此,因?yàn)楣舱穹宀粶?zhǔn)確而使佩戴者很難聽(tīng)清正確的語(yǔ)音,當(dāng)然更談不上理解語(yǔ)義了。為此,建議建立一套精確測(cè)試聽(tīng)力障礙者聽(tīng)力損失的規(guī)范標(biāo)準(zhǔn),并利用現(xiàn)有的電聲技術(shù)給予精確聽(tīng)覺(jué)補(bǔ)償,以達(dá)到“精準(zhǔn)助聽(tīng)”的目的。
(完)