基于RBF徑向基網(wǎng)絡(luò)的演唱評(píng)價(jià)模型研究
袁劍
(西安音樂(lè)學(xué)院計(jì)算機(jī)教研室西安710061)
針對(duì)演唱評(píng)分方法易受到主觀(guān)因素的影響,提出采用廣義回歸RBF神經(jīng)網(wǎng)絡(luò)模擬評(píng)委進(jìn)行穩(wěn)定打分并分析網(wǎng)絡(luò)結(jié)構(gòu)在聲樂(lè)評(píng)價(jià)中的優(yōu)勢(shì),對(duì)聲樂(lè)藝術(shù)評(píng)價(jià)建立評(píng)價(jià)指。將定性評(píng)價(jià)轉(zhuǎn)換為定量成績(jī)向量輸入神經(jīng)網(wǎng)絡(luò)生成評(píng)分。用單聲部民族唱法進(jìn)行實(shí)驗(yàn),將輸出結(jié)果與預(yù)期分值進(jìn)行比對(duì)。結(jié)果表明,該模型能有效降低人為因素的干擾,模擬專(zhuān)家進(jìn)行穩(wěn)定打分。
RBF徑向基函數(shù)網(wǎng)絡(luò);廣義回歸神經(jīng)網(wǎng)絡(luò);演唱;評(píng)價(jià)模型
Class NumberTP183
聲樂(lè)表演是一門(mén)藝術(shù),它要求演唱者以技巧、藝術(shù)素養(yǎng)做出個(gè)性化的演繹。通常對(duì)演唱效果的評(píng)價(jià)以去掉最高值與最低值后求平均,此評(píng)價(jià)方法帶有不少主觀(guān)因素。傳統(tǒng)聲樂(lè)評(píng)價(jià)本身是一種評(píng)委的主觀(guān)感受,評(píng)委評(píng)價(jià)標(biāo)準(zhǔn)有所差異,即使是同一評(píng)委也有因人而異的可能[1]。傳統(tǒng)的評(píng)價(jià)方法未說(shuō)明評(píng)價(jià)指標(biāo)與結(jié)果之間的關(guān)系。聲樂(lè)藝術(shù)的評(píng)價(jià)應(yīng)用非線(xiàn)性方法構(gòu)建評(píng)價(jià)指標(biāo)與演唱效果之間的關(guān)系和評(píng)價(jià)體系。人工神經(jīng)網(wǎng)絡(luò)是一種能夠?qū)ψ匀唤绻δ芎瘮?shù)逼近的信息處理系統(tǒng),在聲樂(lè)藝術(shù)評(píng)價(jià)中使用神經(jīng)網(wǎng)絡(luò)更能體現(xiàn)指標(biāo)與效果之間的非線(xiàn)性關(guān)系,評(píng)價(jià)結(jié)果更加客觀(guān)合理。目前,聲樂(lè)評(píng)價(jià)中使用較多的是BP神經(jīng)網(wǎng)絡(luò),BP神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)輸入和輸出間的任意線(xiàn)性或非線(xiàn)性的函數(shù)映射[2]。然而,BP網(wǎng)絡(luò)是一種全局逼近網(wǎng)絡(luò),訓(xùn)練速度很慢且容易陷入局部極小值,需經(jīng)過(guò)反復(fù)試湊和訓(xùn)練,無(wú)法保證每次訓(xùn)練BP算法的收斂性和全局最優(yōu)性,并且BP神經(jīng)網(wǎng)絡(luò)缺乏簡(jiǎn)單有效的參數(shù)確定方法,因此算法不穩(wěn)定,不適合實(shí)時(shí)性要求高的場(chǎng)合。文章擬采用一種收斂速度快,逼近能力和學(xué)習(xí)速度都優(yōu)于BP的廣義回歸向基函數(shù)(Radial Basis Function)神經(jīng)網(wǎng)絡(luò)。它是徑向基網(wǎng)絡(luò)的一種變形形式,具有良好的非線(xiàn)性逼近性能,特別適合解決曲線(xiàn)擬合問(wèn)題。徑向基神經(jīng)網(wǎng)絡(luò)已成功應(yīng)用于非線(xiàn)性函數(shù)逼近、模式識(shí)別等[3]。與BP相比,RBF網(wǎng)絡(luò)能更好地解決局部最小點(diǎn)的問(wèn)題。
廣義回歸網(wǎng)絡(luò)建立在非參數(shù)回歸的基礎(chǔ)上,以樣本數(shù)據(jù)為后驗(yàn)條件,執(zhí)行Pazzen非參數(shù)估計(jì),依據(jù)最大原則計(jì)算網(wǎng)絡(luò)輸出,當(dāng)隱層神經(jīng)元足夠多時(shí),網(wǎng)絡(luò)能夠以任意精度逼近一個(gè)平滑函數(shù)[1]。廣義回歸神經(jīng)網(wǎng)絡(luò)其結(jié)構(gòu)如圖1所示。
圖1 廣義徑向基網(wǎng)絡(luò)結(jié)構(gòu)
輸入層神經(jīng)元個(gè)數(shù)同于輸入向量的維數(shù),傳輸函數(shù)為線(xiàn)性函數(shù)。隱含層為徑向基層,神經(jīng)元個(gè)數(shù)為訓(xùn)練樣本個(gè)數(shù),基函數(shù)為高斯函數(shù),第i個(gè)神經(jīng)元的中心向量為xi。加和層中第一種神經(jīng)元為分母單元,計(jì)算隱含層各神經(jīng)元的代數(shù)和,加和層第二種神經(jīng)元為分子單元,計(jì)算隱含層神經(jīng)元的加權(quán)和,權(quán)值為各訓(xùn)練樣本的期望輸出值。輸出層將加和層的分母單元、分子單元的輸出相除,即得網(wǎng)絡(luò)輸出y。在廣義回歸神經(jīng)網(wǎng)絡(luò)中x,y是兩個(gè)隨機(jī)變量,且x的觀(guān)測(cè)值為x0,樣本數(shù)據(jù)集為,在輸入為x的條件下,y的預(yù)測(cè)輸出為
0y(x0),其估算密度函數(shù)為
則
n為樣本容量,p為隨機(jī)變量x的維數(shù)。σ為高斯函數(shù)的標(biāo)準(zhǔn)差,稱(chēng)為光滑因子,σ過(guò)大則y(x0)近似與樣本變量的平均值,對(duì)數(shù)據(jù)的細(xì)節(jié)便會(huì)部分不能成功逼近。σ過(guò)小,則網(wǎng)絡(luò)失去推廣能力,陷入過(guò)學(xué)習(xí)狀態(tài)。因此在構(gòu)建評(píng)價(jià)模型時(shí)需要根據(jù)評(píng)價(jià)項(xiàng)目的取值范圍選取合適的σ,通常平滑因子應(yīng)和輸入數(shù)據(jù)的平均間距相當(dāng)。
3.1 聲樂(lè)評(píng)價(jià)體系構(gòu)建
聲樂(lè)評(píng)價(jià)的對(duì)象不同,聲樂(lè)評(píng)價(jià)的體系構(gòu)建也應(yīng)不同。本文以獨(dú)唱為評(píng)價(jià)對(duì)象,構(gòu)建評(píng)價(jià)模型。模型中將評(píng)分類(lèi)別分為音準(zhǔn)與完整性、技巧、舞臺(tái)表現(xiàn)、作品理解與情感四個(gè)大類(lèi),每類(lèi)包含多個(gè)小項(xiàng)。每個(gè)評(píng)委只需對(duì)表演給出部分項(xiàng)目的級(jí)別,而不用給出具體的數(shù)值。此方法較以往只打總分的方法更能體現(xiàn)演唱的藝術(shù)內(nèi)涵。獨(dú)唱評(píng)價(jià)標(biāo)準(zhǔn)設(shè)計(jì)如表1所示。
表1 獨(dú)唱表演評(píng)價(jià)標(biāo)準(zhǔn)
評(píng)價(jià)體系有X個(gè)評(píng)價(jià)項(xiàng)目,每個(gè)項(xiàng)目由nl(l= 0,1,…,X-1)個(gè)評(píng)委打分,各項(xiàng)目有Mj(j=0,1,…,X-1)個(gè)級(jí)別,評(píng)價(jià)分值為i(i=0,1,…,Mj-1),第j個(gè)級(jí)別的評(píng)委有ki(i=0,1,…,Mj-1)個(gè),則若各個(gè)評(píng)價(jià)級(jí)別的取值范圍為[] 0,F(xiàn)l,即滿(mǎn)分為Fl(l=0,1,…,X-1),則某項(xiàng)目第i個(gè)級(jí)別的權(quán)值為則該評(píng)價(jià)項(xiàng)目的實(shí)際分值為將權(quán)值代入后得Sl=即評(píng)價(jià)標(biāo)準(zhǔn)中第l項(xiàng)的分值。評(píng)價(jià)體系采用定性的方式描述評(píng)價(jià)項(xiàng)目,項(xiàng)目分類(lèi)級(jí)別各不相同,具體數(shù)量根據(jù)測(cè)評(píng)對(duì)象實(shí)際情況而定。級(jí)別越多區(qū)分度越精確。演唱者實(shí)力相當(dāng)時(shí)需要增加項(xiàng)目的級(jí)別。評(píng)委只需對(duì)所評(píng)價(jià)的項(xiàng)目定級(jí),由評(píng)價(jià)體系公式計(jì)算得到該項(xiàng)目的成績(jī),并作為神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù),最終成績(jī)由神經(jīng)網(wǎng)絡(luò)輸出。對(duì)藝術(shù)的衡量標(biāo)準(zhǔn)本身就是一種定性描述。但應(yīng)當(dāng)注意的是在實(shí)際應(yīng)用中評(píng)價(jià)級(jí)別的劃分應(yīng)足夠的細(xì)致,才能體現(xiàn)表演之間細(xì)微的差異。
3.2 RBF網(wǎng)廣義回歸絡(luò)評(píng)價(jià)模型構(gòu)
網(wǎng)絡(luò)評(píng)價(jià)模型的原理是使用神經(jīng)網(wǎng)絡(luò)來(lái)構(gòu)建一個(gè)穩(wěn)定的打分系統(tǒng)。先請(qǐng)一個(gè)評(píng)委按照評(píng)價(jià)體系為各項(xiàng)評(píng)價(jià)項(xiàng)目定級(jí),按照評(píng)價(jià)體系中的各項(xiàng)公式計(jì)算出各個(gè)項(xiàng)目的分值,此分值是神經(jīng)網(wǎng)絡(luò)的輸入。同時(shí)請(qǐng)?jiān)撛u(píng)委給出一個(gè)合理的總分值,總分值為樣本,用來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。使網(wǎng)絡(luò)模擬評(píng)委進(jìn)行成績(jī)的評(píng)定,即用神經(jīng)網(wǎng)絡(luò)來(lái)模擬一個(gè)專(zhuān)家的評(píng)分思維習(xí)慣。為了選擇合適的網(wǎng)絡(luò),需進(jìn)行試驗(yàn),在相同樣本的情況下進(jìn)行,對(duì)正則徑向基神經(jīng)網(wǎng)絡(luò)、廣義徑向基神經(jīng)網(wǎng)絡(luò)、廣義回歸徑向基神經(jīng)網(wǎng)絡(luò)進(jìn)行測(cè)試。測(cè)試結(jié)果如下:訓(xùn)練樣本為4×16的矩陣,測(cè)試數(shù)據(jù)為4×5的矩陣,網(wǎng)絡(luò)測(cè)試數(shù)據(jù)的期望輸出為:92.75,75,98,72,90。所有實(shí)驗(yàn)網(wǎng)絡(luò)平滑因子SP=1.5。正則RBF輸出值為92.75,75,97.64,89.75,7.47。廣義RBF的輸出值為92.75,7596.88,71.85,83.63。廣義回歸徑向基網(wǎng)絡(luò)的輸出值為92.75,75,98.21,71.45,90.00。當(dāng)測(cè)試數(shù)據(jù)與訓(xùn)練樣本不同時(shí)廣義回歸徑向基網(wǎng)絡(luò)輸出結(jié)果與期望值最為接近,在模擬評(píng)分思維習(xí)慣時(shí),廣義回歸神經(jīng)網(wǎng)絡(luò)最優(yōu),因此在構(gòu)建評(píng)價(jià)模型中使用該網(wǎng)絡(luò)。
在模型驗(yàn)證試驗(yàn)中,采用民族唱法單聲部獨(dú)唱,演唱者年齡為18~26歲的的青年人,其中男聲3人,女生3人,分3次進(jìn)行測(cè)評(píng)。為了有較高的區(qū)分度,每個(gè)評(píng)價(jià)項(xiàng)目的評(píng)價(jià)級(jí)別理論上可分為10~25個(gè)級(jí)別,在試驗(yàn)中使用25個(gè)級(jí)別。在網(wǎng)絡(luò)模型中訓(xùn)練樣本為50組數(shù)據(jù),由一位評(píng)委給出50個(gè)分值作為訓(xùn)練網(wǎng)絡(luò)輸出的目標(biāo)值對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,同時(shí)由該評(píng)委對(duì)實(shí)驗(yàn)中的6位測(cè)試者給出分值作為實(shí)驗(yàn)的參照值。實(shí)驗(yàn)中對(duì)收回的評(píng)分表進(jìn)行分值統(tǒng)計(jì),分別計(jì)算出每個(gè)演唱者的各項(xiàng)分值,將各演唱者的分值向量作為網(wǎng)絡(luò)的輸入進(jìn)行仿真,將仿真結(jié)果與評(píng)委給出的參照值加以對(duì)比。實(shí)驗(yàn)代碼使用Matlab實(shí)現(xiàn),其代碼如下:
P=[];
T=[];
plot(P,T,‘+’);
sp=2.5;
net=newgrnn(P,T,sp);
Y=sim(net,P);
plot(Y,T,‘O’);
Q=[];
A=sim(net,Q);
plot(Q,A,‘*’)
B=[];
plot(B,A,‘O’);
其中P為樣本矩陣;T為樣本的目標(biāo)輸出向量。Q為測(cè)試矩陣,A為網(wǎng)絡(luò)的測(cè)試輸出,即網(wǎng)絡(luò)模擬給出的測(cè)試者分值,B為實(shí)驗(yàn)參考值即給定的目標(biāo)值。網(wǎng)絡(luò)的訓(xùn)練結(jié)果如圖2所示。
圖2 網(wǎng)絡(luò)訓(xùn)練樣本與輸出目標(biāo)圖
對(duì)6位演唱者分值的網(wǎng)絡(luò)仿真結(jié)果如圖3所示。
圖3 網(wǎng)絡(luò)測(cè)試輸出與目標(biāo)值
網(wǎng)絡(luò)的輸出值與給定的參考值如表2所示。
表2 網(wǎng)絡(luò)的測(cè)試輸出結(jié)果與目標(biāo)輸出值
以上結(jié)果說(shuō)明,網(wǎng)絡(luò)給出的結(jié)果能夠模擬一個(gè)評(píng)委的打分。網(wǎng)絡(luò)的模擬精度是由樣本的數(shù)量和樣本的取值決定的。當(dāng)樣本的數(shù)量足夠大,涵蓋取值范圍內(nèi)數(shù)據(jù)時(shí),網(wǎng)絡(luò)的精度則會(huì)大幅度提高。
在對(duì)聲樂(lè)藝術(shù)的評(píng)價(jià)中,評(píng)價(jià)是基于主觀(guān)的,用定量的方法容易出現(xiàn)不穩(wěn)定的偏差,定性描述更符合對(duì)藝術(shù)的評(píng)價(jià)。文章構(gòu)建了一種對(duì)聲樂(lè)藝術(shù)進(jìn)行評(píng)價(jià)的模型,只需按照評(píng)分項(xiàng)目給出定性的描述,模型統(tǒng)計(jì)這種描述并轉(zhuǎn)換為評(píng)價(jià)向量作為廣義回歸RBF神經(jīng)網(wǎng)絡(luò)的輸入由神經(jīng)網(wǎng)絡(luò)給出最終分值。文章提出的模型要應(yīng)用到不同的測(cè)試環(huán)境時(shí)需要大量不同的樣本才有實(shí)際意義,而現(xiàn)實(shí)中大量的樣本不易得到,且徑向基函數(shù)光滑因子SP的選取與數(shù)據(jù)距離有關(guān),需要反復(fù)實(shí)驗(yàn)因此影響到了本模型的實(shí)用性。不同的演唱方法、聲部、環(huán)境都會(huì)對(duì)實(shí)際的評(píng)價(jià)結(jié)果產(chǎn)生影響,要構(gòu)建實(shí)用的網(wǎng)絡(luò)模型則需要在更多的環(huán)境中進(jìn)行實(shí)驗(yàn)。文中的實(shí)驗(yàn)僅是對(duì)民族唱法進(jìn)行研究,對(duì)其他唱法的樣本收集與分析需要進(jìn)一步研究。
[1]袁劍.BP神經(jīng)網(wǎng)絡(luò)在聲樂(lè)評(píng)價(jià)中的應(yīng)用[J].計(jì)算與機(jī)數(shù)字工程,2012,38(12):44-48.
YUAN Jian.Application of BP Neural Network in Vocal Assessment System[J].Computer&Digital Engineering,2012,38(12):44-48.
[2]許東,吳錚.基于MATLAB 6.X的系統(tǒng)分析與設(shè)計(jì)——神經(jīng)網(wǎng)絡(luò)第二版[M].西安:西安電子科技大學(xué)出版社,2002,19-28.
XIU Dong,WU Zheng.System analysis and design Based on MATLAB 6.X--The second edition of neural network[M].Xi'an:Xidian University Press,2002,19-28.
[3]http://www.cnblogs.com/yangxi/archive/2013/05/30/3107921. html
[4]朱良俊,張燕平.幾種徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)的比較[J].福建廣播電視大學(xué)學(xué)報(bào),2007,64(4):68-70.
ZHU Liangjun,ZHANG Yanping.The Comparison of Some radial basis function neural networks(RBF)[J]. Journal of fujian radio and TV university,2007,64(4):68-70.
[5]余成寬.表現(xiàn)性評(píng)價(jià)在聲樂(lè)教學(xué)中的應(yīng)用研究[D].長(zhǎng)春:長(zhǎng)春師范學(xué)院,2010:3-52.
YU Chengkuan.The Case Evaluation of Ordinary College(Teacher Education)Undergraduate Student[D].Changchun:Changchun Normal University,2010:3-52.
[6]李小武,羅蘭娥.BP神經(jīng)網(wǎng)絡(luò)在評(píng)價(jià)歌唱藝術(shù)嗓音中的應(yīng)用[J].現(xiàn)代電子技術(shù),2012,35(14):146-148.
LI Xiaowu,LUO Laner.Application of BP neural network in evaluation of artistic voice[J].Modern Electronics Technique,2012,35(14):146-148.
[7]吳媛,丁亞軍,錢(qián)盛友,等.基于神經(jīng)網(wǎng)絡(luò)的藝術(shù)嗓音客觀(guān)評(píng)價(jià)方法[J].電聲技術(shù),2015,39(12):57-60.
WU Yuan,DING Yajun,Qian Shengyou,et al.An Objective Evaluation Method of Artistic Voice Based on Neural Network[J].Audio Engineering,2015,39(12):57-60.
[8]張軼.高師聲樂(lè)教學(xué)評(píng)價(jià)標(biāo)準(zhǔn)體系的研究[J].人民論壇,2015,11(500):163-164.
ZHANG Yi.The Research on evaluation standard system of vocal music teaching in Higher Normal Colleges[J]. People's Tribune,2015,11(500):163-164.
[9]楊勇.智能化綜合評(píng)價(jià)理論與方法研究[D].杭州:浙江工商大學(xué),2014:49-124.
YANG Yong.A Study on Theory and Method in Intellectualization of Evaluation[D].Hangzhou:Hangzhou Industrial and commercial university,2014:49-124.
[10]苗雨,章莉.歌唱藝術(shù)評(píng)價(jià)相關(guān)問(wèn)題研究[J].大舞臺(tái),2012,43(7):40-50.
MIAO Yu,ZHANG Li.Research on the related issues of the evaluation of singing art[J].Big stage,2012,43(7):40-50.
[11]苗雨.基于人工智能技術(shù)的歌唱發(fā)音質(zhì)量客觀(guān)評(píng)價(jià)研究綜述[J].音樂(lè)探索,2012,23(3):119-127.
MIAO YU.A review of the study on the objective evaluation of vocal quality based on artificial intelligence technology[J].Explorations in Music,2012,23(3):119-127.
[12]羅宇佳.高等學(xué)校音樂(lè)表演專(zhuān)業(yè)學(xué)業(yè)表現(xiàn)性評(píng)價(jià)研究[D].西安:陜西師范大學(xué),2012:63-204.
LUO Jiayu.The study of Academic performance evaluation of music performance in Universities[D].Xi'an:Shanxi Normal University,2012:63-204.
[13]李炳男.RBF神經(jīng)網(wǎng)絡(luò)和HMM用于音樂(lè)識(shí)別的算法研究[D].太原:太原理工大學(xué),2010:25-36.
LI Bingnan.Study of Music Recognition Algorithm Based on RBF Neural Network and HMM[D].Taiyuan:Taiyuan University of Technology,2010:25-36.
[14]蘇美娟.徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法研究[D].蘇州:蘇州大學(xué),2007:1-22.
SU Meijuan.Research on Radial Basis Function Neural Network Learning Algorithms[D].Suzhou:Suzhou University,2007,1-22.
[15]孟新洋,柯琳.加強(qiáng)和完善民族聲樂(lè)的評(píng)價(jià)機(jī)制[J].音樂(lè)創(chuàng)作,2010,246(2):131-133.
MENG Xinyang,KE Lin.To strengthen and improve the evaluation mechanism of national vocal music[J].Musical Works,2010,246(2):131-133.
Singing Performance Evalurion Mode Research Based on RBF Neural Network
YUAN Jian
(Computer Staff Room,Xi'an Conservatory of Music,Xi'an710061)
To giving a correct assessment of a singer's performance is affected by multiple factors.GRNN RBF neural network can simulate a nonlinear system.This article establishes the evaluation model and use neural network to output a reasonable score. At last,this article uses an example to analysis the feasibility of the model.The experimental results show that the model can effectively reduce the interference by human in folk singing evaluation.
radial basis function neural network,general regression neural RBF network,vocal,evaluation mode
TP183
10.3969/j.issn.1672-9722.2017.06.019
2016年12月7日,
2017年1月17日
國(guó)家自然科學(xué)基金項(xiàng)目(編號(hào):61174207);陜西省教育廳科學(xué)研究計(jì)劃項(xiàng)目(編號(hào):16JK1671)資助。
袁劍,女,碩士,講師,研究方向:智能信息處理,數(shù)據(jù)挖掘,教育信息技術(shù)。