謝凌云,劉 靖
(中國(guó)傳媒大學(xué) 媒介音視頻教育部重點(diǎn)實(shí)驗(yàn)室,北京 100024)
樂(lè)器的發(fā)聲是一個(gè)復(fù)雜的問(wèn)題,聲學(xué)家、音頻工程師、音樂(lè)家以及樂(lè)器制造者都非常重視這一難題,他們有的采用數(shù)學(xué)物理方法,有的用信號(hào)處理手段,還有的利用測(cè)振儀或全息干涉成像技術(shù)對(duì)樂(lè)器的發(fā)聲原理進(jìn)行分析,并試圖掌握發(fā)聲的全貌.
樂(lè)器振動(dòng)發(fā)聲的物理原理已經(jīng)在西方樂(lè)器上完成了較系統(tǒng)的研究,大多數(shù)振動(dòng)系統(tǒng)原理的闡述都是在簡(jiǎn)化的線性系統(tǒng)上運(yùn)用數(shù)學(xué)物理方法展開(kāi)的[1].但是,樂(lè)器的振動(dòng)遠(yuǎn)不止這些,振動(dòng)的非線性部分更為復(fù)雜且是樂(lè)器本身所固有的[1].另一方面的研究中,西方樂(lè)器的測(cè)量?jī)?nèi)容主要包括振動(dòng)測(cè)量、音色相關(guān)特征和指向性[2],測(cè)量的西方樂(lè)器涵蓋了常見(jiàn)的銅管樂(lè)器、木管樂(lè)器、弦樂(lè)器和打擊樂(lè)器,但是針對(duì)中國(guó)民族樂(lè)器的測(cè)量[3-4]無(wú)論是測(cè)量?jī)?nèi)容還是樂(lè)器種類(lèi)都不足以與西方樂(lè)器相比.近年來(lái),物理建模技術(shù)的提出,有助于理解音色感知和檢索音樂(lè)信息,其中,一些信號(hào)處理手段被用于處理非線性問(wèn)題,能更精確地模擬樂(lè)器發(fā)聲,在這些處理手段中,數(shù)字波導(dǎo)方法是現(xiàn)在最流行的建模技術(shù)[5].至今使用的信號(hào)處理手段都更傾向于合成或分離聲源,而不是解釋樂(lè)器發(fā)出音樂(lè)聲的方式.
共振模式是描述樂(lè)器振動(dòng)發(fā)聲的本質(zhì)特征,測(cè)量時(shí)能夠得到的面板、背板或空腔振動(dòng)模態(tài),但在樂(lè)器整體的共振或共鳴系統(tǒng)描述上還很匱乏,尤其是中國(guó)民族樂(lè)器.研究中發(fā)現(xiàn)[2],在演奏同一樂(lè)器的不同音符時(shí),能量集中的頻率位置不隨諧波的次數(shù)而改變,這種頻譜能量的集中相對(duì)固定的性質(zhì)反映了一部分樂(lè)器的特點(diǎn),使得同一樂(lè)器在不同的音高下表現(xiàn)出相同或是相似的音色,所以提出用共振峰來(lái)描述樂(lè)器的共鳴或共振情況.然而,由于樂(lè)器的箱體共振模態(tài)與振動(dòng)的激勵(lì)點(diǎn)有關(guān),對(duì)于弦樂(lè)器,不同弦激發(fā)的箱體振動(dòng)模態(tài)是不同的,對(duì)應(yīng)的共振峰也是不同的,所以?xún)H用一個(gè)共振峰難以全面地描述樂(lè)器的共振情況.因此,本文提出使用共振頻段來(lái)描述樂(lè)器的整體共振情況,共振頻段指的是樂(lè)器演奏過(guò)程中共振峰集中出現(xiàn)的頻率區(qū)域.
語(yǔ)音信號(hào)處理中的共振峰估計(jì)方法主要包括帶通濾波器組法、線性預(yù)測(cè)分析方法和倒譜法.實(shí)驗(yàn)顯示,雖然倒譜法的運(yùn)算量很大,但該方法在共振峰估計(jì)中具有頻譜包絡(luò)穩(wěn)定和能夠減少第一次諧波影響的優(yōu)點(diǎn)[6].在針對(duì)音樂(lè)內(nèi)容的研究中,有學(xué)者進(jìn)一步提出能夠有效消除基頻影響的頻譜包絡(luò)估計(jì)算法(True Amplitude Envelope, TAE)[7],該方法是一種迭代的倒譜分析方法,已在音樂(lè)信號(hào)的處理中被證明優(yōu)于其他的方法[8].
因此,本文在TAE算法的基礎(chǔ)上,提出一種倒譜分析算法,分析中國(guó)彈撥樂(lè)器的共振情況.下一部分介紹提出的分析方法框架,框架中包含兩個(gè)主要部分,共振峰估計(jì)和共振峰的后處理.然后,分別闡述共振峰估計(jì)算法和對(duì)不同單音的共振峰進(jìn)行的后處理,后處理時(shí)采用共振譜法和頻帶法,最后整合兩種處理結(jié)果得到單件樂(lè)器的主要共振頻段,用于表征樂(lè)器的整體共振情況.文中的分析素材包括琵琶、箏、柳琴和中阮,它們的共振模式為解釋樂(lè)器演奏時(shí)明亮甚至尖銳的音色起到重要作用.
圖1 共振頻段估計(jì)算法Fig.1 Resonance frequency region estimation algorithm
為了消除信號(hào)基頻的影響,在倒譜分析中運(yùn)用時(shí)間窗進(jìn)行同態(tài)解卷積,因?yàn)榈棺V運(yùn)用對(duì)數(shù)運(yùn)算和2次變換能將第1次諧波和共振系統(tǒng)的頻譜包絡(luò)區(qū)分開(kāi),選擇合適長(zhǎng)度的時(shí)間窗從倒譜中截取出來(lái)的部分,就能夠較精確地反映共振系統(tǒng)的響應(yīng)[6,9].從加窗的倒譜中變換而來(lái)的頻譜就是目標(biāo)頻譜包絡(luò),該頻譜包絡(luò)反映了樂(lè)器的共振情況.然后用峰值估計(jì)算法就能從中得到共振峰.
信號(hào)x(n)的倒譜C(l)是其N(xiāo)點(diǎn)頻譜X(k)的對(duì)數(shù)的傅里葉反變換,所以,信號(hào)的倒譜可以表示為:
(1)
對(duì)信號(hào)倒譜C(l)加時(shí)間窗h(n)后進(jìn)行離散傅里葉變換(Discrete Fourier Transform, DFT)即可得到所需的平滑頻譜包絡(luò),如下:
(2)
圖2 改進(jìn)的倒譜法估計(jì)頻譜包絡(luò)Fig.2 Estimation of spectrum envelope using improved cespstral method
式中: 窗函數(shù)的長(zhǎng)度n0由信號(hào)基頻f0和和采樣頻率fs決定,即n0=fs/f0[10].因?yàn)樵诘棺V中,C(l)(l≥n0)反映的是聲音的激勵(lì)部分(基頻及其以下的頻率),C(l)(l 圖3 中國(guó)彈撥樂(lè)器共振譜Fig.3 Resonance graph of Chinese plucked string musical instruments 共振譜能夠直觀地在頻域上描繪樂(lè)器的共振模式,它是同一樂(lè)器的單音共振譜的均值,圖3是本文分析樂(lè)器的共振譜圖. 采用爬山算法檢測(cè)樂(lè)器共振譜上的峰值,并將其直接視為樂(lè)器的共振峰,檢測(cè)過(guò)程中為得到至少10個(gè)共振峰,檢測(cè)精度不斷增加,從動(dòng)態(tài)范圍的1%變化到0.2%,然后計(jì)算共振峰帶寬等信息,從而得到樂(lè)器的共振峰信息.共振譜的共振峰信息作為共振譜法的輸出,用于后面的整合中. 只要頻帶設(shè)置合理,單音共振峰估計(jì)結(jié)果就可以根據(jù)其共振峰的頻率位置按頻帶劃分,然后與其他單音在頻帶內(nèi)的共振峰進(jìn)行平均,得到各頻帶內(nèi)的平均共振峰,對(duì)相應(yīng)的幅值和帶寬等也進(jìn)行平均,最終取得各頻帶內(nèi)的共振峰信息.由于頻帶的劃分是為了具有普適性,所以對(duì)于每件樂(lè)器,劃分的頻帶可能是過(guò)多的,有必要針對(duì)各樂(lè)器的共振峰頻帶做進(jìn)一步處理.將不同的頻帶視為不同的類(lèi),類(lèi)的屬性為二值類(lèi)型,即用0和1表示是否出現(xiàn)共振峰,以此計(jì)算類(lèi)間的距離,距離歸一化為[0,1]范圍內(nèi),距離大于等于0.9時(shí)表示兩頻帶相斥,說(shuō)明對(duì)于該樂(lè)器任意單音,這兩個(gè)頻帶內(nèi)不會(huì)同時(shí)出現(xiàn)共振峰,若相鄰頻帶互斥,則可以將兩頻帶合并為一個(gè)頻帶.頻帶合并后,計(jì)算各頻帶內(nèi)共振峰的出現(xiàn)概率,在各頻帶中,當(dāng)某頻帶的共振峰出現(xiàn)概率大于所有頻帶的出現(xiàn)概率均值時(shí),表示共振峰在該頻帶是“常見(jiàn)”的,可以認(rèn)為該頻帶在該樂(lè)器的共振模式中較為突出,稱(chēng)該頻帶為顯著頻帶.顯著頻帶的共振峰信息作為頻帶法的輸出,用于最后的整合中. 無(wú)論是共振譜法還是頻帶法,取得的樂(lè)器共振峰都存在各自的缺陷.采用共振譜法雖然能直觀地從共振譜中得到共振峰,但由于樂(lè)器共振譜是由單音共振譜求平均得到,該過(guò)程可能導(dǎo)致單音中相近的共振峰被削弱而未在共振譜中顯示出來(lái);頻帶法為保證反映所有共振峰,劃分的頻帶數(shù)往往遠(yuǎn)大于實(shí)際的樂(lè)器共振峰的數(shù)量,即劃分過(guò)細(xì),使得頻帶過(guò)多,平均的共振頻帶寬度亦受到劃分的頻帶寬度限制.因此,這兩種后處理方法都無(wú)法獨(dú)立且全面地反映樂(lè)器的整體共振情況,需要整合兩者的結(jié)果,才能得到較合理的樂(lè)器的共振頻段. 整合兩種方法的結(jié)果時(shí),首先,必須保證兩方法得到的共振峰在幅值上不低于背景噪聲;其次,只有當(dāng)兩方法得到的共振峰相近時(shí),才認(rèn)為兩方法得到的是同一個(gè)共振頻帶;最后,共振譜法的結(jié)果中允許出現(xiàn)共振峰信息中沒(méi)有的共振頻段,即可參照共振譜.以下為兩種方法的整合原則: 1) 兩種方法的共振峰頻帶中心都不得比最大共振峰低40dB; 2) 共振譜法或頻帶法中相鄰頻帶重疊或相近時(shí),共振譜法參照共振譜圖,若較平坦,則合并這些鄰近頻帶,頻帶法則視共振譜法而定,若相鄰頻帶在共振譜中為同一頻帶或高幅值的平坦區(qū)域,則合并,合并時(shí)用鄰近頻帶中的最低下限作為合并后頻帶的下限,最高上限作為合并后頻帶的上限,合并中心為鄰近頻帶中心的均值; 3) 當(dāng)兩種方法求得的共振峰中心相近時(shí),即任一方法的共振峰中心都處于另一方法的共振峰頻帶內(nèi)時(shí),兩者的共振峰頻帶重疊區(qū)域?yàn)闃?lè)器共振頻段; 4) 當(dāng)頻帶法的共振頻帶未出現(xiàn)在共振譜法的結(jié)果中時(shí),共振譜法的共振峰頻帶可由共振峰帶寬和譜上高幅值的平坦區(qū)域組成,然后參照原則2),3)進(jìn)行整合. 由于在西方樂(lè)器的研究中已廣泛使用振動(dòng)測(cè)量探討樂(lè)器各部分的振動(dòng)模態(tài),因此,借助這部分研究的數(shù)據(jù)可以大致估計(jì)西方樂(lè)器的共振頻率范圍,所以可以采用西方彈撥樂(lè)器素材驗(yàn)證共振頻段估計(jì)算法的有效性.驗(yàn)證算法有效性的過(guò)程中使用古典吉他、豎琴、倍大提琴和大提琴4種樂(lè)器的單音,這些單音均涵蓋了各樂(lè)器的常用音高. 表1為西方彈撥樂(lè)器的主要共振頻段估計(jì)結(jié)果,和文獻(xiàn)中的測(cè)量數(shù)據(jù)摘要.分析素材和測(cè)量中使用的樂(lè)器均為單件樂(lè)器,共振頻率可能由于樂(lè)器材質(zhì)和構(gòu)造的不同出現(xiàn)一定的差異,但從表1中不難看出,估計(jì)的主要共振頻段的大部分區(qū)域均出現(xiàn)在測(cè)量結(jié)果中,即估計(jì)的主要共振頻段基本符合樂(lè)器共振模態(tài)的測(cè)量或耦合分析結(jié)果,說(shuō)明利用樂(lè)器單音素材和信號(hào)處理手段,本文提出的共振頻段估計(jì)算法能有效地估計(jì)出樂(lè)器的主要共振頻段. 表1 西方彈撥樂(lè)器的主要共振頻段和共振測(cè)量數(shù)據(jù)對(duì)照 彈撥樂(lè)器的聲音在不同音高時(shí)會(huì)發(fā)生變化,即使演奏的是相同音高,在不同弦上彈奏時(shí),聲音也會(huì)不一樣[1,3-4].本文中使用的樂(lè)器單音樣本包括了各樂(lè)器所有弦上的常用音區(qū),錄音時(shí)采樣頻率為44.1kHz,使用樂(lè)器包括琵琶、箏、柳琴和中阮.表2為文中用于共振分析的單音樣本,按聲學(xué)中使用的音名演奏單音,調(diào)音標(biāo)準(zhǔn)為國(guó)際標(biāo)準(zhǔn)音高A4=440Hz. 表2 分析中使用的單音樣本 表3 中國(guó)彈撥樂(lè)器的主要共振頻段 將共振頻段分析方法應(yīng)用于各樂(lè)器,得到各樂(lè)器的主要共振頻段如表3所示.主要共振頻段反映了樂(lè)器演奏中會(huì)發(fā)生強(qiáng)烈共振的頻率位置,表3顯示了中國(guó)彈撥樂(lè)器的共振模式具有以下兩個(gè)顯著特點(diǎn): 1) 除中阮外,民族彈撥樂(lè)器在500Hz以下較少出現(xiàn)共振頻段; 2) 不同樂(lè)器的共振頻段在中高頻區(qū)間多出現(xiàn)重疊,尤其在600~1200Hz和3~4kHz這兩個(gè)區(qū)間內(nèi)出現(xiàn)了至少3種樂(lè)器的共振頻段. 綜合來(lái)看,除了中阮,其他樂(lè)器在500Hz以下較少發(fā)生共振,這與樂(lè)器振動(dòng)測(cè)量的結(jié)果[3-4]和頻譜特征分析的結(jié)果[13]相符.多數(shù)樂(lè)器在較高的頻率上出現(xiàn)共振頻段,從客觀參數(shù)上支持了中國(guó)樂(lè)器音色較明亮的觀點(diǎn).另外,一些樂(lè)器的共振頻段間存在重疊相交的情況,而該情況在中高頻區(qū)域較常見(jiàn),這為解釋樂(lè)器合奏時(shí)聲音過(guò)于尖銳的現(xiàn)象提供了一種客觀解釋. 本文提出一種迭代的倒譜分析方法獲取樂(lè)器的共振頻段,該分析方法包括結(jié)合了基頻與改進(jìn)的TAE方法,經(jīng)過(guò)3次迭代得到頻譜包絡(luò),從平滑的頻譜包絡(luò)中檢測(cè)出峰值作為單音共振峰,來(lái)自同一樂(lè)器的單音共振峰經(jīng)過(guò)共振譜法和頻帶法兩種后處理方法,整合得到該樂(lè)器的共振頻段.文中計(jì)算了4種中國(guó)彈撥樂(lè)器的共振頻段,并發(fā)現(xiàn)中國(guó)彈撥樂(lè)器的共振頻率集中在較高的頻率上,不同樂(lè)器間的共振頻段有多處重疊且多出現(xiàn)在中高頻區(qū)域,所以中國(guó)彈撥樂(lè)器合奏時(shí)容易產(chǎn)生尖銳甚至刺耳的聽(tīng)感. 致謝: 本文為中國(guó)傳媒大學(xué)理工科規(guī)劃重點(diǎn)項(xiàng)目(3132016XNG1603)的部分結(jié)果.3 共振峰后處理
3.1 共振譜法
3.2 頻帶法
3.3 整合原則
3.4 算法的有效性
4 結(jié)果及分析
5 結(jié) 語(yǔ)