趙婕
(陜西工業(yè)職業(yè)技術學院 信息工程學院, 陜西 咸陽 712000)
音樂可以給人們帶來精神上的享受,消除人們身體和精神疲勞,減輕工作上的壓力,由于電子技術不斷地發(fā)展,一些專業(yè)人員通過電子設備進行電子音樂的合成,產(chǎn)生了大量的電子音樂,給人們提供了更多的音樂欣賞素材,但是由于每一個人對電子音樂都有自己的偏好,如老年人喜歡聽一些旋律比較慢的古典音樂,而年輕人喜歡聽一些快節(jié)奏的搖滾音樂,因此幫助人們對電子音樂進行有效辨識,給他們提供最適合的電子音樂具有十分重要的意義[1-3]。
由于國內(nèi)外學者們的重視,當前有許多類型的電子音樂辨識方法,其中人工神經(jīng)網(wǎng)絡的電子音樂辨識方法最多,如回聲狀態(tài)網(wǎng)絡的電子音樂辨識方法,BP神經(jīng)網(wǎng)絡的電子音樂辨識方法,RBF神經(jīng)網(wǎng)絡的電子音樂辨識方法、極限學習機的電子音樂辨識方法等,由于人工神經(jīng)網(wǎng)絡的工作原理與人腦的神經(jīng)網(wǎng)絡工作原理相似,可以模擬人腦對電子音樂進行辨識,電子音樂辨識效果較好,其中BP神經(jīng)網(wǎng)絡的實際應用范圍最為廣泛[4-6]。在實際應用過程中,BP神經(jīng)網(wǎng)絡還有許多難題沒有得到有效的解決,如BP神經(jīng)網(wǎng)絡的結構不穩(wěn)定,使得電子音樂辨識效果極不穩(wěn)定,可信度比較低,導致電子音樂辨識效率低,而且學習速率采用經(jīng)驗方式隨機確定,使得電子音樂辨識誤差比較大[7-9]。
針對神經(jīng)網(wǎng)絡在電子音樂辨識過程中存在的參數(shù)優(yōu)化問題,為了改善電子音樂辨識結果,提高電子音樂辨識精度,提出了改進神經(jīng)網(wǎng)絡的電子音樂辨識方法,采用自適應遺傳算法快速、有效地尋找最優(yōu)的參數(shù),使得神經(jīng)網(wǎng)絡結構達到最優(yōu),測試結果表明,改進神經(jīng)網(wǎng)絡的電子音樂辨識精度高、速度快,具有十分明顯的優(yōu)越性。
由于BP神經(jīng)網(wǎng)絡的學習能力強,與電子音樂辨識過程具有較強的相似性,標準BP神經(jīng)網(wǎng)絡常采用3層結構,如圖1所示[10]。
電子音樂辨識特征為x1,x2,…,xm,其直接作為BP神經(jīng)網(wǎng)絡的輸入,那么其相應的輸出為式(1)。
(1)
隱含層的輸入、輸出分別為式(2)、式(3)。
(2)
(3)
輸出層的輸入、輸出分別為式(4)、式(5)。
(4)
(5)
采用電子音樂辨識誤差作為BP神經(jīng)網(wǎng)絡的訓練目標,BP神經(jīng)網(wǎng)絡的訓練過程實際就是不斷對隱含層和輸出層的連接權值進行調(diào)整,使電子音樂辨識誤差朝最小化方向發(fā)展,如式(6)、式(7)。
(6)
(7)
式中,η為學習速率。
參數(shù)學習速率η直接影響B(tài)P神經(jīng)網(wǎng)絡的隱含層和輸出層的連接權值確定的優(yōu)劣。η越大,隱含層和輸出層的連接權值變化量比較大,使得BP神經(jīng)網(wǎng)絡的學習速度快,但是過大,可能使得BP神經(jīng)網(wǎng)絡出現(xiàn)過擬合現(xiàn)象,即學習精度降低;而η越小,隱含層和輸出層的連接權值變化量比較緩慢,BP神經(jīng)網(wǎng)絡的學習速度慢,影響學習效率。當前主要通過經(jīng)驗方式確定η,難以獲得理想的BP神經(jīng)網(wǎng)絡的學習效果,為此本文采用自適應遺傳算法確定參數(shù)學習速率η的值,在加快BP神經(jīng)網(wǎng)絡學習速度的同時,提高BP神經(jīng)網(wǎng)絡的學習精度。
遺傳算法的性能與交叉概率(Pc)和變異概率(Pm)直接相關,標準遺傳算法的交叉概率和變異概率采用固定方式,在其運行過程中是一個常量,難以產(chǎn)生優(yōu)異的后代個體,使得遺傳算法易限入局部最優(yōu)解,因此本文采用自適應遺傳算法,其交叉概率和變異概率隨著進化代數(shù)的變化而變化,這樣不斷產(chǎn)生優(yōu)秀個體,避免限入局部最優(yōu)解。自適應遺傳算法的Pc和Pm變化曲線如圖2所示。
圖2 交叉變異概率變化曲線
自適應遺傳算法的Pc和Pm的計算式,如式(8)、式(9)。
(8)
(9)
式中,fmax和favg分別為適應度函數(shù)的最大值和平均值;f′為交叉后較優(yōu)個體的適應度函數(shù)值;f為變異后的個體適應度函數(shù)值;ki為0—1范圍的常數(shù)。
本文采用電子音樂信號的短時能量特征、時域方差特征進行電子音樂辨識,它們提取步驟具體如下。
Step1:Em為電子音樂信號{y(n)}的能量,那么其短時能量計算如式(10)。
(10)
式中,c(m)為電子音樂信號的滑動窗,電子音樂信號幀長度是N。
Step2:電子音樂信號可以劃分為N幀,即可以表示為Yt(n)={yt(n,1),yt(n,2),…,yt(n,N)},計算電子音樂時域的均值Ei(n)和方差Di(n),如式(11)、式(12)。
(11)
(12)
Step1:采集電子音樂信號,并對其進行去噪處理,以提高電子音樂信號的信噪比。
Step2:從去噪后的電子音樂信號中提取短時能量特征、時域方差特征,并對它們進行歸一化處理,如式(13)。
(13)
式中,feature(i)表示第i個特征。
Step3:對于每一種電子音樂信號,選擇比較重要的特征進行建模。
Step4:根據(jù)電子音樂信號的重要特征數(shù)量和電子音樂的類型數(shù)量確定BP神經(jīng)網(wǎng)絡的輸入和輸出節(jié)點的數(shù)量。
Step5:根據(jù)一定的規(guī)則,確定電子音樂信號辨識的BP神經(jīng)網(wǎng)絡隱含層節(jié)點的數(shù)量。
Step6:采用自適應遺傳算法確定BP神經(jīng)網(wǎng)絡參數(shù)學習速率η的值。
Step7:BP神經(jīng)網(wǎng)絡對電子音樂信號訓練樣本進行學習,建立最優(yōu)的電子音樂信號辨識模型。
為驗證改進神經(jīng)網(wǎng)絡的電子音樂辨識效果,選擇當前最流行的10類種電子音樂作為實驗對象,而且對于每一類電子音樂,采集不同數(shù)量的電子音樂樣本,如表1所示。
表1 10種電子音樂的樣本數(shù)量
由于電子音樂的類型不同,那么其特征數(shù)量應該不同,因此提取不同的電子音樂特征,并選擇比較重要的特征進行電子音樂辨識,得到的重要特征數(shù)量如表2所示。
表2 10種電子音樂的重要特征數(shù)量
為了驗證本文對神經(jīng)網(wǎng)絡改進的有效性,選擇傳統(tǒng)神經(jīng)網(wǎng)絡進行電子音樂辨識對比實驗,傳統(tǒng)神經(jīng)網(wǎng)絡采用經(jīng)驗方式確定其參數(shù),改進神經(jīng)網(wǎng)絡和傳統(tǒng)神經(jīng)網(wǎng)絡的電子音樂辨識精度和時間,如圖3、圖4所示。
圖3 與傳統(tǒng)神經(jīng)網(wǎng)絡的電子音樂辨識精度對比
圖4 與傳統(tǒng)神經(jīng)網(wǎng)絡的電子音樂辨識速度對比
從圖3和圖4可以看出,無論是電子音樂辨識精度或者是電子音樂辨識速度,改進神經(jīng)網(wǎng)絡均要明顯優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡,這是因為改進神經(jīng)網(wǎng)絡引入自適應遺傳算法解決了參數(shù)優(yōu)化的難題,能夠獲得更優(yōu)的神經(jīng)網(wǎng)絡,建立了高精度的電子音樂辨識模型,而且加快了電子音樂辨識速度,在相同時間可以辨識更多的電子音樂辨識樣本,這樣可以降低電子音樂辨識成本,實際應用價值更高。
為了進一步測試改進神經(jīng)網(wǎng)絡的電子音樂辨識的優(yōu)越性,選擇當前經(jīng)典電子音樂辨識方法進行對比實驗,具體為:隱馬爾可夫模型的電子音樂辨識方法[11]、支持向量機的電子音樂辨識方法[12],所有方法的電子音樂辨識精度如圖5所示。
圖5 與經(jīng)典電子音樂辨識方法的精度對比
從圖5可以看出,相對于支持向量機、隱馬爾可夫模型,改進神經(jīng)網(wǎng)絡的電子音樂辨識精度均有了不同程度的得升,這表明改進神經(jīng)網(wǎng)絡可以有效減少電子音樂辨識錯誤率,能夠準確辯識各種電子音樂,改進神經(jīng)網(wǎng)絡可以解決當前電子音樂辨識方法存在的弊端,獲得了更加理想的電子音樂辨識結果。
支持向量機、隱馬爾可夫模型、改進神經(jīng)網(wǎng)絡的電子音樂辨識時間變化情況,如圖6所示。
圖6 與經(jīng)典電子音樂辨識方法的速度對比
對圖6的電子音樂辨識時間進行對比可以清楚看出,相對于支持向量機、隱馬爾可夫模型,改進神經(jīng)網(wǎng)絡的電子音樂辨識時間明顯減少,改進神經(jīng)網(wǎng)絡的電子音樂辨識時間復雜度明顯降低,提高了電子音樂辨識效率,電子音樂辨識速度得到了明顯的改善。
為了改善電子音樂的辨識精度,針對當前神經(jīng)網(wǎng)絡存在的缺陷,提出了改進神經(jīng)網(wǎng)絡的電子音樂辨識方法,并與其它方法進行了電子音樂辨識仿真實驗,通過對仿真實驗結果分析可以發(fā)現(xiàn),改進神經(jīng)網(wǎng)絡的電子音樂辨識精度高,不僅錯誤率要小于其它電子音樂辨識方法,而且電子音樂辨識速度快,具有十分廣泛的應用前景。