王輝
【摘要】近年來(lái),隨著信息科學(xué)技術(shù)的迅速發(fā)展,音頻與聲學(xué)信號(hào)的分析逐漸成為當(dāng)前音樂(lè)領(lǐng)域的研究熱點(diǎn)。在機(jī)器聽(tīng)覺(jué)的研究領(lǐng)域中,基于聲學(xué)特征的樂(lè)器識(shí)別是當(dāng)代音樂(lè)分析工作的重要應(yīng)用。本文主要茶樹(shù)了近年來(lái)基于聲學(xué)特征的樂(lè)器研究領(lǐng)域中所取得成果,希望能夠有所幫助
【關(guān)鍵詞】聲學(xué)特征;音樂(lè);模式識(shí)別;樂(lè)器
從廣義上來(lái)說(shuō),樂(lè)器泛指那些可以通過(guò)各種方法演奏出聲音的工具,樂(lè)器又可以分為民族樂(lè)器和西方樂(lè)器兩大類,本文主要涉及的是西方樂(lè)器。傳統(tǒng)意義上,西方樂(lè)器主要分為弦樂(lè)器、銅管樂(lè)器以及木管樂(lè)器二大類,每種樂(lè)器的發(fā)聲方法也都有所不同,還有很多樂(lè)器在聲音上的差別不大,人耳很難將它們順利分辨出來(lái),但是如果借助于計(jì)算機(jī)技術(shù)的幫助,樂(lè)器的識(shí)別工作也變得更加簡(jiǎn)單,樂(lè)器識(shí)別的精度也大大提高。
一、聲學(xué)特征的研究現(xiàn)狀分析
由于樂(lè)器識(shí)別過(guò)程巾有很大的相似性,所以樂(lè)器識(shí)別的方法是建立在語(yǔ)音識(shí)別和聲帶識(shí)別的基礎(chǔ)上逐漸發(fā)展起來(lái)的,樂(lè)器識(shí)別的方法和語(yǔ)音識(shí)別的方法也有所類似。20世紀(jì)90年代之前,在音樂(lè)領(lǐng)域關(guān)于基于聲學(xué)特征的樂(lè)器研究還比較少,但是90年代之后,這項(xiàng)工作就有了很大的進(jìn)展,在學(xué)術(shù)界,基于聲學(xué)特征的樂(lè)器研究論文數(shù)目也進(jìn)一步增加。
特征抽取。特征抽取是近年來(lái)學(xué)術(shù)界關(guān)于聲學(xué)特征在樂(lè)器識(shí)別中的運(yùn)用研究中得出的一項(xiàng)成果。對(duì)于不同樂(lè)器的演奏或者是不同的音樂(lè)片段都會(huì)用不同的聲學(xué)特征加以識(shí)別,由于工作誤差,識(shí)別的精度差別也會(huì)比較大,通常情況下,工作人員并不能找到有效的聲學(xué)特征提高樂(lè)器識(shí)別的精度,所以在樂(lè)器識(shí)別過(guò)程中需要涉及劍多種聲學(xué)特征。抽取的聲學(xué)特征主要有時(shí)域特征、能量特征、波譜特征、和聲特征、感知特征等等。時(shí)域特征是將樂(lè)器演奏的音頻信號(hào)作為一個(gè)整體進(jìn)行計(jì)算;能量特征則是跟樂(lè)器演奏時(shí)包含的能量有關(guān)系;波譜特征是基于信號(hào)在短時(shí)問(wèn)內(nèi)的傅立葉變換得到的特征,比如波譜的斜度等等;和聲特征則是建立在信號(hào)的止弦和聲模型的基礎(chǔ)上計(jì)算出來(lái)的;感知特征的計(jì)算則需要利用工作人員在聽(tīng)覺(jué)機(jī)制巾建立出來(lái)的模型。
在聲學(xué)特征的抽取過(guò)程中,涉及的算法也比較多,比如倒譜系數(shù)、MFCC系數(shù)、線性預(yù)測(cè)倒譜參數(shù)、振幅包絡(luò)特征、波譜質(zhì)心等等。倒譜系數(shù)作為共振峰值的一種表示方法,她也是語(yǔ)音識(shí)別的一項(xiàng)重要信息,同時(shí)也是樂(lè)器聲學(xué)的重要特征之一。相關(guān)工作人員可以通過(guò)同態(tài)處理的方法得到倒譜系數(shù),研究證明使用倒譜系數(shù)確實(shí)可以在一定程度上提高樂(lè)器聲學(xué)特征參數(shù)的穩(wěn)定性。MFCC系數(shù)則是通過(guò)人耳的聽(tīng)覺(jué)機(jī)制提煉出來(lái)的,近年來(lái)MFCC系數(shù)也在語(yǔ)音識(shí)別工作中得以廣泛應(yīng)用。線性預(yù)測(cè)倒譜系數(shù)則是以人的發(fā)生機(jī)理為出發(fā)點(diǎn),進(jìn)一步研究聲道的短管級(jí)聯(lián)模型,在研究過(guò)程中通常認(rèn)為系統(tǒng)傳遞函數(shù)符合全極點(diǎn)數(shù)字濾波器的基本形式。從內(nèi)容上來(lái)看,振幅的包絡(luò)特征包含了聲音的很多相關(guān)信息,比如音量、時(shí)問(wèn)、振幅、頻率等等,在這個(gè)基礎(chǔ)上,聲音的振幅可以通過(guò)信號(hào)的半波整流、低通濾波等形式加以計(jì)算。頻譜質(zhì)心作為一種簡(jiǎn)單而實(shí)用的聲學(xué)特征,他能夠幫助相關(guān)工作人員得到樂(lè)器聲音的音樂(lè)和聲波譜。
除此之外,聲學(xué)特征的研究成果還涉及到其他一些領(lǐng)域,這些研究成果都在很大程度上為相關(guān)工作人員的工作提高了便利,比如波譜平整度、常量系數(shù)等等。
樂(lè)器識(shí)別是樂(lè)器研究工作中的一項(xiàng)重要內(nèi)容,而樂(lè)器的識(shí)別工作又是模式識(shí)別的一種形式,是將一組測(cè)試集模式劃分為兩大類。在樂(lè)器識(shí)別工作中,相關(guān)工作人員首先要建立一個(gè)關(guān)于不同樂(lè)器聲音的主觀描述,然后再在汁算機(jī)軟件巾提取樂(lè)器聲音的基本特征向量,然后在通過(guò)相似度的對(duì)比進(jìn)行樂(lè)器的識(shí)別。通常情況下,樂(lè)器的識(shí)別工作方法主要有兩大類,分別是基于距離和可能性的兩種分類方法,在速項(xiàng)工作中,相關(guān)工作人員還會(huì)用到一些基本模型,比如高斯混合模型、支持向量機(jī)模型、最近鄰模型等。
二、樂(lè)器的聲學(xué)特征原理
樂(lè)器作為音樂(lè)的載體,它隨著人類音樂(lè)素質(zhì)的提高而發(fā)生了本質(zhì)性的變化,現(xiàn)代人類社會(huì)對(duì)樂(lè)器的聲學(xué)特征品質(zhì)也提出更高的要求,所以相關(guān)工作人員更應(yīng)該根據(jù)聲學(xué)的基本特征盡可能地提高樂(lè)器的聲學(xué)品質(zhì)。
從樂(lè)器的構(gòu)造來(lái)看,不同的樂(lè)器也有不同的構(gòu)造形態(tài),即機(jī)械構(gòu)造形態(tài)和聲學(xué)構(gòu)造形態(tài)兩種。其巾樂(lè)器的聲學(xué)構(gòu)造形態(tài)就是建立在聲學(xué)特征基礎(chǔ)上構(gòu)造出來(lái)的。樂(lè)器的聲學(xué)狗仔是由不同的聲學(xué)特征元在沒(méi)有特殊情況下愛(ài)組成的,在這里元的概念主要是指各種聲學(xué)功能。
樂(lè)器根據(jù)聲學(xué)的基本原理也有不同的分類。到現(xiàn)在為止,人們對(duì)樂(lè)器的認(rèn)知還不全面,其根本原因就是很難找到一種適用性比較強(qiáng)的分類方法。本文主要是在聲學(xué)特征的基礎(chǔ)上進(jìn)行樂(lè)器的研究,所以本文提出的分類方法也是建立在聲學(xué)特征基礎(chǔ)上。根據(jù)聲學(xué)特征,樂(lè)器可以分為弦樂(lè)器、管樂(lè)器、簧樂(lè)器、棒樂(lè)器、板樂(lè)器、膜樂(lè)器六大類。
調(diào)查發(fā)現(xiàn),目前基于聲學(xué)特征的樂(lè)器研究主要是集中在樂(lè)器識(shí)別工作領(lǐng)域,然而在樂(lè)器識(shí)別工作中也確實(shí)存在一些困難,如果儀儀從金魚(yú)分割的方法對(duì)聲學(xué)進(jìn)行研究,那么這將會(huì)為工作人員的工作帶來(lái)很多困難,所以筆者認(rèn)為未來(lái),樂(lè)器識(shí)別與音樂(lè)的處理都會(huì)在聲學(xué)特征基礎(chǔ)上利用媒體數(shù)據(jù)進(jìn)行分析,進(jìn)而提高樂(lè)器數(shù)據(jù)分割的工作效率和工作精度。
三、結(jié)語(yǔ)
本文對(duì)基于聲學(xué)特征的樂(lè)器研究進(jìn)行了全面的概括。從目前看來(lái)基于聲學(xué)特征的樂(lè)器識(shí)別工作將會(huì)成為樂(lè)器處理領(lǐng)域巾的研究熱點(diǎn),但是由于樂(lè)器自身的特點(diǎn),樂(lè)器研究工作也將會(huì)更加困難,這種困難程度可以體現(xiàn)在樂(lè)器的研究?jī)?nèi)容及形式等方面,同時(shí)這也為樂(lè)器的研究工作帶來(lái)更大的挑戰(zhàn)。從目前來(lái)看,在未來(lái)幾年,基于聲學(xué)特征的樂(lè)器識(shí)別將會(huì)和計(jì)算機(jī)軟件系統(tǒng)結(jié)合起來(lái),發(fā)揮更大的作用。