亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于群智優(yōu)化神經(jīng)網(wǎng)絡(luò)的音樂風(fēng)格分類模型研究

        2019-04-12 00:00:00溫贊揚
        現(xiàn)代電子技術(shù) 2019年21期

        摘" 要: 針對用戶音樂檢索問題,傳統(tǒng)采用人工標注的音樂風(fēng)格分類方法已經(jīng)無法滿足實際需求,提出一種基于群智優(yōu)化神經(jīng)網(wǎng)絡(luò)的古典音樂風(fēng)格分類模型。首先,采用Skyline主旋律提取算法對音樂文件進行特征提取;然后,對基于BP神經(jīng)網(wǎng)絡(luò)的分類器訓(xùn)練和分類流程進行分析,并構(gòu)建4層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);最后,采用果蠅群智優(yōu)化算法對BP神經(jīng)網(wǎng)絡(luò)的初始化權(quán)值參數(shù)進行優(yōu)化,以便提高全局搜索能力。仿真實驗結(jié)果顯示,與已有的成果相比,提出的分類模型具有更好的準確率,準確率可達81%,能夠?qū)崿F(xiàn)音樂風(fēng)格自動分類。

        關(guān)鍵詞: 音樂風(fēng)格分類; 自動分類; BP神經(jīng)網(wǎng)絡(luò); Skyline主旋律; 果蠅算法; 群智優(yōu)化

        中圖分類號: TN911.1?34" " " " " " " " " " " " "文獻標識碼: A" " " " " " " " " " " " 文章編號: 1004?373X(2019)21?0082?04

        Abstract: To solve the problem of user music retrieval, a classical music style classification model based on swarm intelligence optimization neural network is proposed because the traditional music style classification method based on manual annotation has been unable to meet the actual needs. Skyline′s main melody extraction algorithm is used to extract the features of music files. The training and classification process of classifier based on BP neural network are analyzed. Thefour?layer BP neural network structure is constructed. The drosophila swarm intelligence optimization algorithm is used to optimize the initial weight parameters of BP neural network, so as to improve the global search ability. The simulation results show that, compared with the existing results, the proposed classification model has higher accuracy which can reach 84%, and can achieve automatic classification of the music styles.

        Keywords:music style classification; automatic classification; BP neural network; Skyline main melody; drosophila algorithm; group intelligence optimization

        0" 引" 言

        隨著互聯(lián)網(wǎng)時代的來臨和多媒體技術(shù)的發(fā)展,傳統(tǒng)的唱片業(yè)已逐漸沒落,數(shù)字音樂行業(yè)得到蓬勃的發(fā)展[1?3]。人們已經(jīng)逐漸習(xí)慣于通過網(wǎng)絡(luò)來獲取高質(zhì)量的音樂文件,例如騰訊音樂、千千音樂、酷狗音樂等網(wǎng)絡(luò)音樂平臺。雖然音樂獲取途徑十分方便,但是廣大用戶想要簡單快速地檢索到自己要的音樂卻有點困難。為了方便人們檢索,各大平臺通常將所有的音樂文件按照風(fēng)格特征進行分類,以便提高用戶搜索的效率。但是,現(xiàn)階段多數(shù)平臺的分類工作仍處于人工操作的階段,也就是說使用人工標注的方法進行分類[4]。雖然分類準確率很高,但是人工手動分類耗時耗力,已經(jīng)無法應(yīng)對規(guī)模巨大的音樂文件數(shù)據(jù)庫。此外,人工分類操作受主觀影響大,要求工作人員的音樂修養(yǎng)較高。因此傳統(tǒng)人工分類已經(jīng)不能應(yīng)對如今對音樂風(fēng)格正確分類的需求。

        近來,一些研究人員提出了基于內(nèi)容的音樂自動分類技術(shù),通過計算機機器學(xué)習(xí)自動對輸入的音樂文件內(nèi)容采用客觀的統(tǒng)一的標準對音樂自動分類,極大地提到了分類的效率[5]。如今,利用人工智能進行音樂風(fēng)格分類已經(jīng)成為音樂信息檢索領(lǐng)域的研究熱點[6?10]。文獻[6]提出一種基于文本挖掘與神經(jīng)網(wǎng)絡(luò)的音樂風(fēng)格分類建模方法,該方法運用機器學(xué)習(xí)中的BP神經(jīng)網(wǎng)絡(luò)使得音樂風(fēng)格分類的準確率達到80%。文獻[7]提出基于馬爾可夫模型的音樂分類方法,并從三個方面對模型的參數(shù)進行了優(yōu)化。文獻[8]提出一種基于BP神經(jīng)網(wǎng)絡(luò)的音樂分類模型,克服了單一特征提供信息簡單的局限性。

        群體智能優(yōu)化方法越來越引起人們的關(guān)注,如粒子群算法、蟻群算法等。文獻[9]提出基于粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的話題趨勢預(yù)測方法,充分利用粒子群算法全局尋優(yōu)的良好性能,解決了BP神經(jīng)網(wǎng)絡(luò)模型易陷入局部最優(yōu)值的問題。因此,本文對基于BP神經(jīng)網(wǎng)絡(luò)的音樂風(fēng)格分類模型問題開展研究,并提出采用群體智能優(yōu)化方法中較為新穎的果蠅算法[10],對BP神經(jīng)網(wǎng)絡(luò)中的初始化權(quán)值參數(shù)進行了優(yōu)化。采用相似度和準確度指標對該模型的準確率進行驗證,并將實驗結(jié)果與現(xiàn)有的方法進行比較。仿真實驗結(jié)果顯示,提出的分類模型的分類能力更強,驗證了其有效性和可行性。

        1" 文件特征提取

        音樂文件自動分類的基礎(chǔ)是文件中音樂信號特征的提取,其中主旋律是音樂的主線,也是進行音樂風(fēng)格判斷的關(guān)鍵因素。通常情況下,大部分樂曲的主旋律的音調(diào)比伴奏的旋律要高,因此,本文主要通過較為簡單的Skyline主旋律提取算法對音樂文件進行特征提取,其步驟如下:

        1) 對音樂文件原始信號進行遍歷。針對具有復(fù)調(diào)關(guān)系的兩個音符,刪除其中音調(diào)最高的音符之外的所有音符。復(fù)調(diào)關(guān)系的音符定義如下:

        式中:[ST1]和[DT1]分別表示音符1的起始時間和持續(xù)時間;[ST2]和[DT2]分別表示音符2的起始時間和持續(xù)時間。

        2) 在執(zhí)行步驟1)后,按起始時間從早到晚進行排序,如果兩個相鄰音符符合如下條件:

        2" 提出的音樂風(fēng)格分類模型

        2.1" 分類器設(shè)計

        分類模型的目標是對樂曲進行分類,因此設(shè)計了基于BP神經(jīng)網(wǎng)絡(luò)的分類器。該分類器包括兩個階段:監(jiān)督訓(xùn)練和分類。在監(jiān)督訓(xùn)練階段,分類器的訓(xùn)練集是音樂文件特征,代表其風(fēng)格標簽,具體訓(xùn)練流程如圖2所示。在分類階段,將待分類樂曲的多個特征輸入到網(wǎng)絡(luò)模型中,得到相應(yīng)的多個風(fēng)格標簽輸出,選擇占比最大的標簽作為實際輸出標簽,具體訓(xùn)練流程如圖3所示。

        2.2" BP神經(jīng)網(wǎng)絡(luò)的建立

        采用4層BP神經(jīng)網(wǎng)絡(luò)構(gòu)建音樂風(fēng)格分類器[8]。該BP神經(jīng)網(wǎng)絡(luò)具體包括:輸入層、變量層、隱含層和輸出層,如圖4所示。

        2.3" 參數(shù)優(yōu)化方法

        如文獻[9]所述,BP神經(jīng)網(wǎng)絡(luò)收斂的主要手段為均方誤差梯度下降,因此BP神經(jīng)網(wǎng)絡(luò)對初始化參數(shù)中的連接權(quán)值十分敏感,常常出現(xiàn)局部最優(yōu)值,導(dǎo)致無法得到全局最優(yōu)值,此外,收斂速度不理想。具有較強全局搜索能力的群體智能優(yōu)化方法越來越引起人們的關(guān)注,如粒子群算法、蟻群算法等。其中,基于果蠅覓食行為自然演化的果蠅優(yōu)化算法是一種較為新穎的群體智能優(yōu)化算法。

        為了得到最優(yōu)的連接權(quán)值,采用果蠅優(yōu)化方法對其進行優(yōu)化,以便提高BP神經(jīng)網(wǎng)絡(luò)的分類準確率,采用的優(yōu)化步驟如下[10]:

        1) 設(shè)置果蠅種群的數(shù)量和迭代次數(shù)均為100,果蠅群體的初始化位置隨機分布在[0,2]范圍內(nèi),飛行范圍為[-10,10]。

        2) 初始化連接權(quán)值[W]、最佳位置([Xbset],[Ybset])和果蠅個體飛行范圍。

        3) 計算味道濃度數(shù)值[S],計算方式如下:

        4) 采用均方根誤差構(gòu)建自適應(yīng)度函數(shù)[Di]以便判定味道濃度數(shù)值[S],即[Di=F(Si)]。

        5) 尋找味道濃度最高的果蠅個體位置,重復(fù)執(zhí)行步驟3)~步驟5),并比較當前和迭代前的最佳味道濃度,若前者大于后者,則執(zhí)行步驟6),否則繼續(xù)迭代。并將具有最佳味道濃度數(shù)值和相應(yīng)的坐標進行保存。

        6) 判斷當前迭代次數(shù)是否達到最大迭代次數(shù),如果是,則該最佳味道濃度數(shù)值就是得到的最優(yōu)連接權(quán)值[W]。

        3" 實驗結(jié)果與分析

        在音樂風(fēng)格分類方法的Matlab實驗中,對本文提出的蠅優(yōu)化BP神經(jīng)網(wǎng)絡(luò)音樂風(fēng)格分類模型進行驗證分析,并與典型BP神經(jīng)網(wǎng)絡(luò)分類模型[8]和PSO?BP神經(jīng)網(wǎng)絡(luò)分類模型[9]進行對比。實驗所用的音樂文件來自千千網(wǎng)絡(luò)音樂平臺的1 200首樂曲,共包含6類風(fēng)格,每類風(fēng)格有200首。800首用于訓(xùn)練集數(shù)據(jù),另外400首用于測試集數(shù)據(jù)。

        實驗參數(shù)為:2.4 GHz雙核CPU、8 GB內(nèi)存、300 GB硬盤、GTX960顯卡,仿真環(huán)境為Matlab R2016a。

        3.1" 評估指標

        為了對提出分類模型的性能和樂曲特征提取效果進行量化分析,選用2種常用的評價準則[11?12]:相似度和準確率。

        相似度[Similarity]的計算公式為:

        式中:[NNn]為音符總數(shù)量;[mo]和[mn]分別為提取出來的主旋律音符數(shù)和標準主旋律音符數(shù);[lev(?)]表示萊文斯坦距離計算。相似度[Similarity]的數(shù)值越大,表示模型的主旋律提取效果越好。

        3.2" 分類結(jié)果分析

        由于BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中網(wǎng)絡(luò)隱含層節(jié)點數(shù)對輸出性能有較大的影響[8],因此首先就隱含層節(jié)點數(shù)對BP神經(jīng)網(wǎng)絡(luò)分類模型的影響進行分析,以便確定最佳節(jié)點數(shù)。設(shè)訓(xùn)練迭代次數(shù)為20,第3層網(wǎng)絡(luò)隱含層節(jié)點數(shù)對整個網(wǎng)絡(luò)訓(xùn)練分類結(jié)果的影響如圖5所示。

        由圖5可以看出,隨著網(wǎng)絡(luò)隱含層節(jié)點數(shù)的增加,訓(xùn)練分類的錯誤率(100%-準確率)不斷降低。但是考慮到時間成本,較大的網(wǎng)絡(luò)隱含層節(jié)點數(shù)也會導(dǎo)致運行效率大大降低,因此綜合考慮本文將第3層網(wǎng)絡(luò)隱含層節(jié)點數(shù)設(shè)為100。

        在隱含層節(jié)點數(shù)設(shè)為100的條件下,本文分類模型、典型BP神經(jīng)網(wǎng)絡(luò)分類模型[8]和PSO?BP神經(jīng)網(wǎng)絡(luò)分類模型[9]在測試集上的準確率對比結(jié)果如表1所示,可以看出本文訓(xùn)練出來的分類模型具有更好的準確率,均值超過81%。這是由于與文獻[8]不同的是,本文采用Skyline方法有效地把樂曲的伴奏和主旋律進行了分離并取出主旋律特征。此外,采用果蠅優(yōu)化方法對BP神經(jīng)網(wǎng)絡(luò)進行優(yōu)化,提高了全局尋優(yōu)能力。結(jié)果說明,相比PSO?BP神經(jīng)網(wǎng)絡(luò)模型,果蠅優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型在樂曲風(fēng)格分類上效果更好。

        4" 結(jié)" 論

        本文提出一種基于果蠅算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的古典音樂風(fēng)格分類模型,并在包含6種風(fēng)格的實際古典音樂數(shù)據(jù)集上進行了分類訓(xùn)練和測試。實驗結(jié)果顯示,提出的分類模型能夠得到理想的效果,而且相比典型BP神經(jīng)網(wǎng)絡(luò)分類模型和PSO?BP神經(jīng)網(wǎng)絡(luò)分類模型,具有較高的分類準確率。但是由于BP神經(jīng)網(wǎng)絡(luò)的迭代限制,該模型的訓(xùn)練和測試時間較長,后續(xù)將考慮使用RBF神經(jīng)網(wǎng)絡(luò)來實現(xiàn)分類。

        參考文獻

        [1] IORDACHE M D, BIOUCAS?DIAS J M, PLAZA A, et al. MUSIC?CSR: hyperspectral unmixing via multiple signal classification and collaborative sparse regression [J]. IEEE transactions on geoscience amp; remote sensing, 2014, 52(7): 4364?4382.

        [2] RAO P, ROSS J C, GANGULI K K, et al. Classification of melodic motifs in raga music with time?series matching [J]. Journal of new music research, 2014, 43(1): 115?131.

        [3] DAIMI S N, SAHA G. Classification of emotions induced by music videos and correlation with participants′ rating [J]. Expert systems with applications, 2014, 41(13): 6057?6065.

        [4] HUANG Y F, LIN S M, WU H Y, et al. Music genre classification based on local feature selection using a self?adaptive harmony search algorithm [J]. Data amp; knowledge engineering, 2014, 92(4): 60?76.

        [5] HU X, CHOI K, DOWNIE J S. A framework for evaluating multimodal music mood classification [J]. Journal of the association for information science amp; technology, 2016, 68(2): 108?117.

        [6] 張鍵鋒,王勁.基于文本挖掘與神經(jīng)網(wǎng)絡(luò)的音樂風(fēng)格分類建模方法[J].電信科學(xué),2015,31(7):80?85.

        ZHANG Jianfeng, WANG Jin. Musical style classification mo?deling method based on text mining and neural network [J]. Telecommunications science, 2015, 31(7): 80?85.

        [7] 肖曉紅,張懿,劉冬生,等.基于隱馬爾可夫模型的音樂分類[J].計算機工程與應(yīng)用,2017,53(16):138?143.

        XIAO Xiaohong, ZHANG Yi, LIU Dongsheng, et al. Music classification based on hidden Markov model [J]. Computer engineering and applications, 2017, 53(16): 138?143.

        [8] 劉明星.基于BP神經(jīng)網(wǎng)絡(luò)的音樂分類模型[J].現(xiàn)代電子技術(shù),2018,41(5):136?139.

        LIU Mingxing. Music classification model based on BP neural network [J]. Modern electronics technique, 2018, 41(5): 136?139.

        [9] 馬曉寧,王惠.基于PSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的話題趨勢預(yù)測[J].計算機工程與設(shè)計,2018,39(9):215?219.

        MA Xiaoning, WANG Hui. Topic trend prediction based on BP neural network optimized by PSO [J]. Computer engineering and design, 2018, 39(9): 215?219.

        [10] DAS K N, SINGH T K. Drosophila food?search optimization [J]. Applied mathematics amp; computation, 2014, 231(11): 566?580.

        [11] REN J M, WU M J, JANG J S R. Automatic music mood classification based on timbre and modulation features [J]. IEEE transactions on affective computing, 2015, 6(3): 236?246.

        [12] SONG Yanyan, LU Ying. Decision tree methods: applications for classification and prediction [J]. Shanghai archives of psychiatry, 2015, 27(2): 130?135.

        亚洲av五月天天堂网| 国产乱色精品成人免费视频| 蜜臀av免费一区二区三区| 欧美破处在线观看| 国产精品不卡无毒在线观看| 成人国产一区二区三区精品不卡| 国产不卡在线观看视频| 一本色道久久88亚洲精品综合| 色妞色综合久久夜夜| 中文字幕大乳少妇| 成人激情视频在线手机观看| 97色偷偷色噜噜狠狠爱网站| 亚洲av区无码字幕中文色| 一区二区三无码| 日韩免费精品在线观看| 大地资源在线观看官网第三页| 久久久国产精品麻豆| 一本色道久久综合亚洲精品蜜臀| 亚洲av毛片在线免费看| 亚洲精品乱码8久久久久久日本| 亚洲欧美国产日韩字幕| 国产亚洲激情av一区二区| 青青草精品视频在线播放| 亚洲av成人无码网站…| 99久久国产亚洲综合精品| 极品少妇高潮在线观看| 国产精品成人免费视频一区| 精品久久久久久久久午夜福利| 亚洲精品国产主播一区二区| 极品尤物精品在线观看| 俄罗斯老熟妇色xxxx| 国产精品高潮av有码久久| 久久精品人妻一区二三区| 美女露内裤扒开腿让男人桶无遮挡| 欧美人与动牲交片免费| 在线观看免费人成视频国产| 国产一区二区三区视频网| 日本丰满少妇裸体自慰| 亚洲爆乳少妇无码激情| 水蜜桃一二二视频在线观看免费| 国产一级二级三级在线观看av |