亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向中文歌詞的音樂情感分類方法①

        2019-08-22 02:30:04朱貝貝
        計算機系統(tǒng)應用 2019年8期
        關鍵詞:分類情感音樂

        王 潔, 朱貝貝

        (北京工業(yè)大學 信息學部,北京 100124)

        1 引言

        隨著計算機網(wǎng)絡與多媒體技術的快速發(fā)展,互聯(lián)網(wǎng)上涌現(xiàn)了越來越多的文本、圖像、音頻和視頻等多媒體數(shù)據(jù). 音樂是多媒體數(shù)據(jù)的重要組成部分. 面對音樂作品數(shù)量的爆炸式增長,音樂種類的不斷增多,如何有效的管理音樂成為一個值得關注的問題,對音樂資源進行合理的分類是一個有效的解決辦法. 音樂是情感的載體,情感是音樂最重要的語義信息,音樂的情感分析廣泛應用于音樂檢索、音樂推薦和音樂治療等領域[1]. 音樂情感的自動識別屬于音樂心理學和計算機學科的交叉領域[2],至今已有十幾年的歷史,國內(nèi)外眾多學者都對該領域做了深入的研究,并取得了一定成果.2010年,Kim等曾對當時音樂情感識別研究的進展做了全面綜述[3]. 2012年,Yang等對音頻音樂情感識別研究做了詳盡的總結[4]. 2017年,陳曉鷗等人回顧了最近幾年音頻音樂情感識別的研究進展情況,提出了若干問題及可能的解決方案[5].

        音樂主要由音頻信號與歌詞文本這兩種模態(tài)的數(shù)據(jù)組成. 目前大多數(shù)研究者致力于使用機器學習方法研究音頻信息對音樂情感分類的作用[6-8]. 2003年,Li等提取音色、節(jié)奏和音階等音頻特征,并最早使用SVM (Support Vector Machine)對音樂情感分類[9].2014年,Weninger等提取MFCC (Mel Frequency Cestrum Coefficient)等底層音頻特征后,使用LSTM(Long Short-Term Memory)對音樂情感分類[10].2017年,Jakubik等使用GRU(Gated Recurrent Unit)對音頻進行特征學習,并引入語義嵌入的思想[11]. 同年,鄧永莉等提出基于中高層特征的音樂情感識別模型[12].

        采用現(xiàn)有頻域和時域特征的機器學習方法,很難使音樂情感識別的性能再提高[5]. 一些心理學研究表明歌詞文本中確實蘊含著一些特有的語義信息,包括情感信息[13]. 結合歌詞進行音樂情感分類可以進一步提高分類性能,基于歌詞的情感分類也逐漸成為熱門的研究方向. 歌詞本質(zhì)上屬于文本的范疇,詞語的情感判別是歌詞情感分析的基礎. 構建一部合理的音樂情感詞典,實現(xiàn)詞匯的情感分析是歌詞情感分析的前提和基礎. 國內(nèi)情感詞典構建起步較晚,情感詞典的領域特性也日趨明顯. 已有研究構建的情感詞典主要集中在中文評論領域,如微博評論和商品評論,評論情感分析一般只判別情感極性,即褒貶性,而歌詞具有更加豐富的情感,目前還沒有被廣泛認可的音樂領域的中文情感詞典. 2010年,夏云慶等基于文本向量空間模型提出了情感向量空間模型,并利用實驗驗證了情感向量模型在解決稀疏性、特征表示能力、表示效率和特征歧義消除等方面具有較明顯的優(yōu)勢[14]. 2014年,蔣盛益等利用 HowNet中語義相似度計算的思想,構建音樂領域的中文情感詞典,再進行音樂情感分類[15],2015年,F(xiàn)uruya等通過對非情感詞加權構造情感向量,使用聚類方法進行音樂情感分類[16]. 2017年,黃仁等基于Word2Vec建立情感詞典,用構建的情感詞典對互聯(lián)網(wǎng)商品評論進行情感分類[17],該詞典僅包含詞的情感極性,不包含詞的情感強度,沒有考慮情感詞本身的分類影響程度. 在基于歌詞文本的情感向量的構建過程中,夏云慶等僅統(tǒng)計每個情感類別的情感詞個數(shù),忽略了情感詞的情感強度是不同的. 蔣盛益和Furuya等均未考慮實詞詞頻和詞性的影響作用.

        針對以上問題,本文基于Word2Vec構建音樂領域的中文情感詞典,并基于情感詞加權和詞性進行中文音樂情感分析. 本文首先以VA情感模型為基礎構建情感詞表,采用Word2Vec中詞語相似度計算的思想擴展情感詞表,構建中文音樂情感詞典,詞典中包含每個詞的情感類別和情感權值. 然后,依照該詞典獲取情感詞權值,基于TF-IDF構造特征向量,并進一步考慮詞性對情感分類的影響,最終實現(xiàn)音樂情感分類.

        2 基于歌詞的音樂情感分類

        2.1 構建情感詞表

        音樂是情感的載體,情感是音樂最重要的語義信息,不同的音樂必然與不同的情感相聯(lián)系. 為了更準確的描述音樂情感,與人的情感體驗一致,需要選擇合適的音樂情感模型.

        選擇VA模型作為音樂情感分類的依據(jù). VA模型(也稱為環(huán)形情感模型)是由Russel提出的,是廣泛采用的通用連續(xù)維度模型[18,19]. 該模型認為情感狀態(tài)是分布在一個包含效價度(valence)和激活度(arousal) 的二維環(huán)形空間上的點,如圖1所示. 其中橫軸表示效價度,縱軸表示激活度,圓心代表中性的效價度和中等水平的激活度.

        為了適應中文情感分類,結合VA模型的情感類別以及音樂表達情感的特點構建情感詞表. 情感詞表如表1所示,第1列為情感類別,即本文用于情感分類的標簽. 其它列為對應每一個情感類別的情感詞匯.

        2.2 中文音樂情感詞典

        情感詞表中的詞是經(jīng)過提煉而成的情感詞,而歌詞中包含的情感詞是有限的,因此,需要對情感詞表進行擴展以滿足歌詞情感分類的需求. 借助Word2Vec計算詞語相似度,使用《哈工大同義詞林》和歌詞語料庫對情感詞表的38個情感詞匯進行擴展,從而構建出一部適用于中文歌詞情感分類的詞典,用于歌詞文本分析.

        2.2.1 計算詞語相似度

        情感詞一般是指能表達情感的形容詞,如“喜悅”、“悲傷”、“憤怒”. 歌詞中包含的情感詞較少,而歌詞中的某些非情感詞也能表達情感. 比如,“夜”可以表達“靜”的情感,“告別”可以表達“悲傷”的情感. 因此,可以通過計算有情感傾向的實詞(包括名詞、動詞、形容詞和副詞)與情感詞表中的情感詞匯的詞語相似度,對實詞進行情感分類,從而實現(xiàn)對情感詞表的擴展.

        表1 情感詞表

        采用Gensim的Word2Vec進行相似度計算,并用搜狗實驗室的語料數(shù)據(jù)訓練模型. 因為該語料庫規(guī)模較大,訓練好的模型可以涵蓋盡可能多的詞語. 因此,可以利用訓練好的模型計算任意兩個詞語的相似度,相似度值在0-1之間.

        2.2.2 構建音樂情感詞典

        首先使用《哈工大同義詞林》對情感詞表進行擴展,構建基礎情感詞典. 并結合歌詞語料庫對基礎情感詞典做進一步擴展,構建音樂情感詞典.

        使用《哈工大同義詞林》對情感詞表進行擴展,擴展后的詞典僅包含情感詞,稱為基礎情感詞典. 首先,從《哈工大同義詞林》獲取情感模型中的情感詞對應的同義詞列表. 然后,計算同義詞列表中的實詞與情感詞的詞語相似度,選擇相似度值最大的情感詞與實詞對應. 最后,提取相似度高于0的實詞構成基礎情感詞典. 實現(xiàn)過程如圖2所示. 情感詞典的存儲結構為四元組(實詞,情感詞,情感類別,情感權值),比如(傷感,憂傷,-V-A,0.91). 其中,“傷感”是選自《哈工大同義詞林》的實詞; “憂傷”是選自情感詞表的情感詞; “-V-A”是“憂傷”對應的情感類別; 0.91對應于情感權值,即“憂傷”與“傷感”的詞語相似度. 基礎情感詞典共包含1527個詞匯,其中4類情感的詞匯量分布情況如表2所示.

        圖2 基礎情感詞典構建流程

        表2 基礎情感詞典詞匯量分布

        基礎情感詞典僅包含情感詞,而歌詞中所包含的情感詞較少,但歌詞中的某些非情感詞也有情感傾向.因此可以利用包含一萬首中文歌曲的歌詞語料庫對基礎情感詞典做進一步擴展,以更適用于中文歌詞情感分類,擴展后的詞典稱為音樂情感詞典. 首先,將歌詞語料庫中的歌詞進行處理,并提取實詞構建歌詞詞匯語料庫. 然后,計算歌詞詞匯語料庫中的實詞與情感詞的詞語相似度,選擇相似度值最大的情感詞與實詞對應. 最后,提取相似度高于0的實詞與基礎情感詞典合并,構成音樂情感詞典. 實現(xiàn)過程如圖3所示. 音樂情感詞典的存儲結構與基礎情感詞典相同. 音樂情感詞典共包含45 374個詞匯,其中4類情感的詞匯量分布情況如表3所示.

        圖3 音樂情感詞典構建流程

        表3 音樂情感詞典詞匯量分布

        2.3 構建基于歌詞的特征向量

        本文依照所構建的情感詞典獲取情感詞權值,基于TF-IDF構造特征向量,并進一步考慮詞性對情感分類的影響,將特征向量擴展到16個維度.

        2.3.1 TF-IDF

        基于情感向量模型,采用情感詞表的4類情感類別作為音樂的情感特征向量,共4個維度. 該特征向量的每個維度表示音樂與每類情感的相似關系. 將歌詞中的實詞與情感詞典進行匹配,可以得到每個實詞的情感類別和情感權值,從而計算出每個情感類別的統(tǒng)計值.

        采用TF-IDF規(guī)則計算情感特征. TF-IDF是一種統(tǒng)計方法,TF表示詞頻,可以評估歌詞中某個實詞在特定歌詞文件中的的情感重要程度. IDF表示逆向文件頻率,可以評估某個實詞對于區(qū)分特定歌詞文件和其他歌詞文件的情感重要性.

        對于歌詞文本中的實詞ti,tf(ti)表示ti對情感類別的重要程度,反映出一個實詞在特定歌詞文件中的局部統(tǒng)計特征. si表示ti在情感詞典中對應實詞的情感權值,如果ti匹配失敗,si值為0. ni,j表示ti在該歌詞文本中的出現(xiàn)次數(shù). N表示該篇歌詞經(jīng)過分詞后得到的詞語總數(shù).

        IDF由式(2)計算:

        對于歌詞文本中的實詞ti,idf(ti)表示ti對于區(qū)分特定歌詞文件和其他歌詞文件的情感重要性. |D|表示歌詞文檔總數(shù)表示歌詞中出現(xiàn)ti的歌詞文檔數(shù).

        歌詞文本的特征向量表示為:

        其中,c表示情感類別數(shù),特征向量的每個維度由式(4)計算:

        其中,ek表示特征向量第k維度對應的情感類別,lyric表示歌詞經(jīng)過分詞后得到的詞語.

        2.3.2 詞性

        不同的詞性表達情感的能力是不同的,比如,形容詞比名詞表達的情感更豐富. 因此,本文將結合詞性信息構造特征向量. 我們將每篇歌詞文本經(jīng)過分詞后得到的詞語根據(jù)詞性分為4類,每類詞性對應的特征向量如式(5)所示. 將4類詞性的特征向量結合得到最終的特征向量,如式(6)所示.

        2.4 歌詞情感分類

        音樂情感分類通常采用標準的監(jiān)督學習模型,如K近鄰(KNN)、高斯混合模型(GMM)和支持向量機(SVM). 本文采用KNN分類算法用于歌詞情感分類.

        KNN的核心思想是如果一個樣本在特征空間中的k個最相鄰的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別,其中k通常是不大于20的整數(shù).

        選擇中文歌詞數(shù)據(jù)集中的80%作為訓練集,20%作為測試集. 利用KNN分類的思想,對每個測試樣例,計算它與所有訓練樣例之間的情感特征向量的歐幾里德距離,以確定其最近鄰列表,選擇最近鄰中出現(xiàn)次數(shù)最多一個類別作為測試樣例的類別. 在本文實驗中,當k=5時分類效果最佳.

        3 實驗結果及分析

        3.1 數(shù)據(jù)集

        數(shù)據(jù)集是200篇情感類別鮮明的中文歌詞文檔,每個情感類別約50篇. 每篇歌詞的情感標簽由多個人進行標記,選擇標記人數(shù)最多的類別作為該歌詞的標簽.

        3.2 評價指標

        本文使用準確率、精確率、召回率和F值來評價分類效果. 以情感類別“-V-A”為例,正類(Positive)表示該歌詞的預測結果是“-V-A”,負類(Negative)表示該歌詞的預測結果不是“-V-A”. TP,F(xiàn)P,TN和FN的具體含義如表4所示. 則準確率A、精確率P、召回率R、F值的計算公式如下:

        表4 TP,F(xiàn)P,TN和FN含義表

        3.3 實驗結果與評價

        本文做了兩組對比實驗,所有實驗均使用相同的數(shù)據(jù)集. 第一組對比實驗中,情感詞典的選擇不同,分別使用2.2.2節(jié)構造的基礎情感詞典和音樂情感詞典,構造特征向量均考慮詞性的影響. 實驗結果如表5所列. 可以看出,基于音樂情感詞典的中文歌詞情感分類能夠達到更好的效果,所有情感類別的準確率以及4種情感類別的精確率、召回率和F值均高于基礎情感詞典. 同時,實驗結果表明,基于歌詞的音樂情感分類更適用于“+V+A”和“-V+A”這兩類情感的識別.

        第二組對比實驗中,特征向量的構造方式不同,均使用2.2.2節(jié)構造的音樂情感詞典. 實驗結果如表6所列. 可以看出,在構造特征向量時考慮詞性的影響可以提高所有情感類別的準確率,“-V+A”和“-V-A”的評價指標值都有一定提高.

        表5 情感詞典對比實驗結果(%)

        表6 特征向量對比實驗結果(%)

        4 結論與展望

        本文基于Word2Vec構建音樂領域的中文情感詞典,并基于情感詞加權和詞性進行中文音樂情感分析.首先以VA情感模型為基礎構建情感詞表,采用Word2Vec中詞語相似度計算的思想擴展情感詞表,構建中文音樂情感詞典,詞典中包含每個詞的情感類別和情感權值. 然后,依照該詞典獲取情感詞權值,基于TF-IDF構造特征向量,并進一步考慮詞性對情感分類的影響,最終實現(xiàn)音樂情感分類. 實驗結果表明基于所構建的音樂情感詞典進行中文歌詞情感分類能夠達到更好的效果,同時在構造特征向量時考慮詞性的影響也可以提高準確率. 但基于歌詞的音樂情感分類更適用于“+V+A”和“-V+A”這兩類情感的識別. 今后將研究結合歌詞與音頻的多模態(tài)融合的音樂情感分類,以實現(xiàn)多個信息源互補,從而提高所有情感類別的分類精度.

        猜你喜歡
        分類情感音樂
        分類算一算
        如何在情感中自我成長,保持獨立
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        分類討論求坐標
        如何在情感中自我成長,保持獨立
        數(shù)據(jù)分析中的分類討論
        圣誕音樂路
        兒童繪本(2017年24期)2018-01-07 15:51:37
        教你一招:數(shù)的分類
        音樂
        精品亚洲成a人7777在线观看| 色婷婷久久综合中文久久一本| 国产一区二区在线免费视频观看| 亚洲码欧美码一区二区三区| 亚洲色成人网站www永久四虎| 亚洲在AV极品无码天堂手机版| 爆乳午夜福利视频精品| 久久久黄色大片免费看| 国产精品永久在线观看| 免费观看黄网站在线播放| 99久久超碰中文字幕伊人| 一区二区三区精品亚洲视频| 精品人妖一区二区三区四区| 天堂无码人妻精品av一区| 国产精品无码一区二区在线国| 国产男女猛烈无遮挡免费视频网址| 亚洲岛国一区二区三区| 天天躁夜夜躁狠狠躁2021a2| 亚洲爆乳少妇无码激情| 日本韩国三级aⅴ在线观看 | 久久99亚洲精品久久久久| 毛片24种姿势无遮无拦| 亚洲精品久久久久中文字幕一福利| 无码国产成人午夜电影在线观看| 亚洲精品国产av一区二区| 一区二区三区极品少妇| 亚洲一区二区三区影院| 免费做爰猛烈吃奶摸视频在线观看 | 狠狠综合久久av一区二区三区| 疯狂三人交性欧美| 在线播放亚洲第一字幕| 亚洲国产成人久久综合三区| 中文字幕亚洲视频一区| 私人毛片免费高清影视院| 一级做a爰片久久毛片| 一区二区三区精品亚洲视频| 免费不卡无码av在线观看| 亚洲巨乳自拍在线视频| 国产免费一区二区av| 亚洲一区二区三区四区地址| 99精品国产一区二区三区a片|