亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于關聯(lián)規(guī)則數(shù)據(jù)挖掘技術在音樂分類中應用

        2020-03-03 13:20:44張婷婷
        現(xiàn)代電子技術 2020年1期
        關鍵詞:數(shù)據(jù)挖掘

        摘 ?要: 為了提高音樂分類的精準性及個性化,提出基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘技術在音樂分類中的使用,解決單一軌道提取的局限性問題。首先,對音樂文件預處理進行分析,主要包括提取主旋律、分析和聲;之后,對基于FP_Growth關聯(lián)規(guī)則挖掘算法的音樂風格進行分析。因為FP_Growth算法只需要掃描兩遍原始數(shù)據(jù),對原始數(shù)據(jù)進行壓縮具有較高的效率,所以將FP_Growth關聯(lián)規(guī)則挖掘算法應用于音樂媒體的風格分類中,并且創(chuàng)建基于FP_Growth關聯(lián)規(guī)則挖掘的音樂風格分類,減少所需頻繁項集的數(shù)量,從而提高數(shù)據(jù)庫掃描速度,在此過程中不需要候選項集,實現(xiàn)音樂分類過程中的數(shù)據(jù)挖掘;最后,對數(shù)據(jù)挖掘的效率進行Matlab測試,測試結果表示,相比基于LAD和Apriori算法的音樂風格分類,基于FP_Growth的音樂風格分類減少了I/O開銷,提高了運行效率和分類的精準性。

        關鍵詞: 音樂分類; 數(shù)據(jù)挖掘; 關聯(lián)規(guī)則算法; 音樂風格分析; 主旋律提取; FP_Growth

        中圖分類號: TN911.1?34; TP393 ? ? ? ? ? ? ? ? ? 文獻標識碼: A ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)01?0099?03

        Application of data mining technology based on association rules

        in music classification

        ZHANG Tingting

        Abstract: In order to improve the accuracy and individualization of music classification, the application of data mining technology based on association rules in music classification is proposed to solve the limitation problem of single track extraction. The preprocessing of music files is analyzed, including extraction of the main melody and analysis of harmony. Then, the music style based on FP_Growth association rules mining algorithm is analyzed. Because the FP_Growth algorithm only needs to scan the original data twice, it is more efficient to compress the original data, so the FP_Growth association rule mining algorithm is applied to the style classification of music media, and the music style classification based on FP_Growth association rules mining is created to reduces the number of the needed frequent itemsets, so as to improve the scanning speed of the database. There is no need of candidate itemsets in this process for realization of the data mining in the process of music classification. The efficiency of data mining is tested with Matlab. The test results show that, in comparison with the music style classification based on LAD and Apriori algorithms, the music style classification based on FP_Growth algorithm can reduce the overhead of I/O, and improve the running efficiency and the classification accuracy.

        Keywords: music classification; data mining; association rule algorithm; music style analysis; main melody extraction; FP_Growth

        0 ?引 ?言

        數(shù)字化技術的發(fā)展導致音樂產業(yè)發(fā)生了翻天覆地的變化,傳統(tǒng)模式的音樂運營已經(jīng)逐漸銷聲匿跡,依托互聯(lián)網(wǎng)平臺的數(shù)字音樂產業(yè)已經(jīng)成為現(xiàn)今社會的主流。隨著創(chuàng)新型個性化服務產業(yè)的發(fā)展,要求數(shù)字音樂媒體需要根據(jù)用戶的興趣不同,推薦符合其喜好風格的音樂,但是互聯(lián)網(wǎng)平臺中的音樂數(shù)據(jù)文件是海量的,如何在大規(guī)模音樂文件數(shù)據(jù)庫中進行風格分類是現(xiàn)階段研究的熱點問題[1?3]。

        目前,主流的研究方向是采用數(shù)據(jù)挖掘技術實現(xiàn)音樂風格分類,例如文獻[4]提出基于LDA主體挖掘模型的音樂推薦算法,實現(xiàn)了基于音頻信息的音樂推薦以及協(xié)同過濾。文獻[5]提出基于特征旋律挖掘的二階馬爾可夫鏈算法,該算法是在關聯(lián)規(guī)則挖掘Apriori算法的基礎上引入特征旋律挖掘(Interval Sequence Mining,ISM)來實現(xiàn)音樂作曲風格訓練。常見的挖掘頻繁項集算法有兩類[5?9]:一類是Apriori算法;另一類是FP_Growth算法。因此,本文提出將FP_Growth關聯(lián)規(guī)則挖掘算法應用于音樂媒體的風格分類任務中,可有效提高數(shù)據(jù)庫掃描的速度且無需候選項集。此外,采用多維度數(shù)據(jù)庫中數(shù)據(jù)結構Skyline算法[10]提取多軌道的音頻媒體文件的主旋律,并進行和弦構成分析。

        1 ?音樂媒體文件的預處理

        1.1 ?主旋律提取

        主旋律是音樂風格劃分的關鍵因素,直接影響后續(xù)分類算法的性能,是一個重要的預處理環(huán)節(jié)。目前,較為典型的主旋律提取算法是Skyline旋律提取算法,但是Skyline算法只能實現(xiàn)單一軌道的旋律提取,因此對每個軌道執(zhí)行Skyline算法。具體通過如下公式對音軌[ci]的平均音調值[pi]進行計算:

        [pi=j=1npijn] ? (1)

        式中:[pij]表示音軌[ci]中音符[j]的音調值;[n]為音軌[ci]中音符的個數(shù)。

        然后將每個音軌上音符的音調值做12維映射投影[10],每個統(tǒng)計表如下所示:

        [hi=(hi1,hi2,…,hi12)] (2)

        對于一個音樂媒體文件來說,12維映射的整體統(tǒng)計表示為:

        [h=(h1,h2,…,h12)] (3)

        其中:

        [hi=j=1ChiCC] (4)

        式中[C]表示音樂媒體文件中的音軌數(shù)量。

        通過式(5)計算[hi=(hi1,hi2,…,hi12)]和[h=(h1,h2,…,h12)]之間的歐幾里得距離:

        [edistj=i=112hij-hj2] (5)

        在上述距離差計算結果的基礎上對兩個音軌進行簇劃分[11],判斷方式如下:

        [edisti-edistj<δ for ?hi,hj] (6)

        式中[δ]表示設定的閾值。如果任意兩個音軌[hi,hj]之間的歐幾里得距離滿足式(6)的條件,則表示這兩個音軌屬于同一簇。

        1.2 ?和聲分析

        設定[ni],[ni+1]分別表示不同的音符,[ei],[ei+1]分別表示兩個音符的停止時刻,[si],[si+1]分別表示兩個音符的開始時刻,則兩個音符和聲的表示方式為:

        [ni,ni+1si≤si+1,ei>ei+1] (7)

        [ni],[ni+1]的音程計算方式如下:

        [Ii,i+1=pi-pi+1] (8)

        式中[pi]和[pi+1]分別表示兩個音符的音調值。

        此外,利用頻繁與不頻繁的統(tǒng)計來實施音樂的分箱操作[12],方式如下:

        [fi=frequenet, ? ?f(xi)>δinot, ? ?else] (9)

        式中[f(xi)]表示頻度。

        2 ?基于FP_Growth關聯(lián)規(guī)則挖掘算法的音樂風格分類

        關聯(lián)規(guī)則是指形如[X→Y]的表達式。關聯(lián)規(guī)則挖掘Apriori算法需要通過不斷地構造候選集、篩選候選集挖掘出頻繁項集,需要多次掃描原始數(shù)據(jù),當原始數(shù)據(jù)較大時,磁盤I/O次數(shù)太多,效率比較低下。不同于Apriori算法的“試探”策略,作為一種常見的挖掘頻繁項集算法,F(xiàn)P_Growth算法只需掃描原始數(shù)據(jù)兩遍,通過FP?tree數(shù)據(jù)結構對原始數(shù)據(jù)進行壓縮,效率較高[13]。因此,將FP_Growth關聯(lián)規(guī)則挖掘算法應用于音樂媒體的風格分類任務中。

        令[I=i1,i2,…,id]表示音樂數(shù)據(jù)中所有項的集合,而[T=t1,t2,…,tN]表示所有事務的集合。每個事務[ti]包含的項集都是[I]的子集。

        在關聯(lián)分析中,支持度(support)和置信度(confidence)[14?15]的具體表示方式為:

        [s(X→Y)=σ(X?Y)N] (10)

        [c(X→Y)=σ(X?Y)σ(X)] (11)

        式中[N]表示事務的數(shù)量。

        本文提出的音樂分類方式的支持度計算方式如下:

        [s={xx∈D,rulei∈x}] (12)

        式中:[D]表示訓練數(shù)據(jù)集;[rulei]為[D]的規(guī)則。在關聯(lián)分析中集合被視為項集(itemset)。

        基于FP_Growth關聯(lián)規(guī)則挖掘的音樂風格分類的核心步驟是構建FP?tree樹節(jié)點,以便減少所需頻繁項集的數(shù)量。事務型數(shù)據(jù)庫的示例如表1所示,F(xiàn)P_tree樹的節(jié)點結構如圖1所示,其構造FP_tree樹的每個節(jié)點的結構體代碼如下:

        class TreeNode {

        private:

        int32 N_Nodes; ?//節(jié)點名稱

        int Numbers; ?//支持度計數(shù)

        TreeNode *P_Nodes; ?//父節(jié)點

        Vector C_Nodes; //子節(jié)點

        TreeNode *Ner_Nodes; ?//指向同名節(jié)點

        }

        3 ?仿真結果

        實驗數(shù)據(jù)庫為互聯(lián)網(wǎng)音樂平臺中隨機選取的500首音樂文件,共包括6種音樂風格類型(POP,ROCK,JAZZ,METAL,BLUES,F(xiàn)OLK)。所有實驗運行環(huán)境配置信息為:操作系統(tǒng)為Windiws 10,CPU為Intel Pentium4@2.4 GHz,內存為4 GB DDR SDRAM,硬盤為7 200轉的500 GB IDE硬盤。

        將基于FP_Growth關聯(lián)規(guī)則挖掘算法的音樂風格分類方法與基于LAD主題[4]、Apriori算法[5]的音樂風格分類方法進行對比分析。針對相同的音樂數(shù)據(jù)庫,當置信度為56%時,在支持度分別為0.4%,0.5%,0.6%,0.8%,1.0%,1.2%和1.5%的情況下,三種方法的運行時間比較結果如圖2所示。

        從圖2可以看出,隨著支持度逐漸增大,三種方法的運行時間均逐漸減少。但是在支持度較小時,本文提出音樂風格分類方法具有明顯的效率優(yōu)勢,在0.4%最小支持度時,本文方法運行時間約為其他兩種方法的35%。這是因為基于FP_Growth關聯(lián)規(guī)則挖掘算法的音樂風格分類方法在支持度很小的情況下仍只掃描兩次數(shù)據(jù)庫,即I/O開銷較小,而其他兩種方法會隨著選項集的長度變大而增加I/O開銷。

        三種音樂風格分類方法的準確性對比結果如表2所示??梢钥闯?,相比于其他兩種方法,基于FP_Growth關聯(lián)規(guī)則挖掘算法的音樂風格分類方法的準確率更高,分類準確率提高約2%。

        4 ?結 ?語

        本文提出一種高效的適用于音樂媒體分類的FP_Growth關聯(lián)規(guī)則數(shù)據(jù)挖掘方法,在單一軌道旋律提取的基礎上,采用多維度數(shù)據(jù)庫中數(shù)據(jù)結構Skyline算法提取多軌道的音頻媒體文件的主旋律。仿真測試結果顯示,基于FP_Growth關聯(lián)規(guī)則挖掘算法的音樂風格分類方法的性能表現(xiàn)(在運行時間和準確度方面)較為突出,勝過其他所有的方法。但是在某些類型的音樂識別中表現(xiàn)欠佳,例如ROCK風格類型,后續(xù)將針對該方面進行側重分析。

        參考文獻

        [1] DENG J J, LEUNG C H C, MILANI A, et al. Emotional states associated with music: classification, prediction of changes, and consideration in recommendation [J]. ACM tran?sactions on interactive intelligent systems, 2015, 5(1): 1?36.

        [2] KOUR G, MEHAN N, KOUR G, et al. Music genre classification using MFCC, SVM and BPNN [J]. International journal of computer applications, 2015, 112(6): 12?14.

        [3] CHOI K, LEE J H, HU X, et al. Music subject classification based on lyrics and user interpretations [J]. Proceedings of the association for information science & technology, 2016, 53(1): 1?10.

        [4] 李博,陳志剛,黃瑞,等.基于LDA模型的音樂推薦算法[J].計算機工程,2016,42(6):175?179.

        [5] 鄭銀環(huán),王嘉珺,郭威,等.基于特征旋律挖掘的二階馬爾可夫鏈在算法作曲中的研究與應用[J].計算機應用研究,2018,35(3):849?853.

        [6] NAJI M, FIROOZABADI M, AZADFALLAH P. Emotion classification during music listening from forehead biosignals [J]. Signal image & video processing, 2015, 9(6): 1365?1375.

        [7] BANIYA B K, LEE J. Importance of audio feature reduction in automatic music genre classification [J]. Multimedia tools & applications, 2016, 75(6): 1?14.

        [8] KHONGLAH B K, PRASANNA S R M. Speech/music classification using speech?specific features [J]. Digital signal proces?sing, 2016, 48(3): 71?83.

        [9] RODRIGUES F A. A survey on symbolic data?based music genre classification [J]. Expert systems with applications, 2016, 60(3): 190?210.

        [10] FARROKHMANESH M, HAMZEH A. Music classification as a new approach for malware detection [J]. Journal of computer virology & hacking techniques, 2018(2): 1?20.

        [11] ULAGANATHAN A S, RAMANNA S. Granular methods in automatic music genre classification: a case study [J]. Journal of intelligent information systems, 2018(23): 1?21.

        [12] ROSNER A, KOSTEK B. Automatic music genre classification based on musical instrument track separation [J]. Journal of intelligent information systems, 2017(2): 1?22.

        [13] 王建明,袁偉.基于節(jié)點表的FP?Growth算法改進[J].計算機工程與設計,2018,39(1):140?145.

        [14] WANG B, DAN C, SHI B, et al. Comprehensive association rules mining of health examination data with an extended FP?Growth method [J]. Mobile networks & applications, 2017, 22(2): 1?8.

        [15] KHONGLAH B K, PRASANNA S R M. Clean speech/speech with background music classification using HNGD spectrum [J]. International journal of speech technology, 2017, 20(6): 1?14.

        作者簡介:張婷婷(1983—),女,甘肅平?jīng)鋈?,碩士,講師,主要研究方向為音樂教育理論。

        猜你喜歡
        數(shù)據(jù)挖掘
        基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡流量異常識別方法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        數(shù)據(jù)挖掘技術在打擊倒賣OBU逃費中的應用淺析
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術在中醫(yī)診療數(shù)據(jù)分析中的應用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        數(shù)據(jù)挖掘在高校圖書館中的應用
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        利用數(shù)據(jù)挖掘技術實現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實踐
        亚洲国产剧情在线精品视| 日韩放荡少妇无码视频| 日日躁夜夜躁狠狠久久av| 中文字幕永久免费观看| 亚洲一区二区三区最新视频| 亚洲精品在线国产精品| 亚洲色欲久久久综合网| 97人妻视频妓女网| 日本一曲二曲三曲在线| 浓毛老太交欧美老妇热爱乱| 国产麻豆精品久久一二三| 亚洲线精品一区二区三区八戒| 美女人妻中文字幕av| 青春草在线视频观看| 色婷婷综合久久久久中文| 亚洲ⅤA中文字幕无码| 中文字幕人妻一区二区二区| 久久久久88色偷偷| 久久久久亚洲av无码a片软件| 国产精品电影久久久久电影网| 五月激情四射开心久久久| 亚洲av无码专区在线观看成人| 国产精品亚洲一区二区无码| 久久精品国产亚洲av热明星| 国产91色综合久久免费| 99精品国产一区二区| 亚洲春色AV无码专区在线播放| 亚洲天堂av在线一区| 国产成人精品久久亚洲高清不卡| 3344永久在线观看视频| 日本国产在线一区二区| 蜜臀av毛片一区二区三区| 亚洲综合久久精品无码色欲| 天天插视频| 国产福利不卡视频在线| 337p人体粉嫩胞高清视频| 亚洲综合无码| 亚洲国产丝袜美女在线| 亚洲 日韩 激情 无码 中出| 亚洲综合久久成人a片| 人妻丝袜中文字幕久久|