王楚凡
(中央財經大學(沙河校區(qū))統(tǒng)計與數學學院,北京 102206)
音樂是一門用來表達情感、反映生活與經歷的藝術,人類的音樂發(fā)展史中產生了各種各樣的音樂流派,相互影響,不斷創(chuàng)造,在藝術家的創(chuàng)造過程中,之前制作的音樂作品、之前的藝術家、社會環(huán)境等因素都影響著他們音樂作品的特征和風格。影響者們對藝術家們的影響主要體現在音樂作品的某些特征具有一定的相似性,除此之外,藝術家們的作品也會出現明顯轉變,也許是產生新的節(jié)奏或是新的流派,這些變化離不開藝術家們的共同貢獻。
首先,通過分析和比較歌曲之間的特征,可以衡量影響者與追隨者的歌曲相似性,以此反映藝術家之間的相互影響,也可以從中觀察出音樂流派隨著時間的轉變,所以,構建一種用于量化音樂影響力的模型是極為重要的,這能夠幫助更好的了解音樂在社會變遷中的進化過程;其次,對數據進行預處理,然后建立音樂相似度的度量模型,判斷流派間與流派內音樂的異同;然后,選取有代表性的歌曲來對流派間與流派內音樂的異同進行可視化;最后,應用聚類分析進行模型檢驗,得出結論。
首先,由于全音數據集中的指標數量較多,必須對數據進行降維處理,從數據集中選取了八位藝術家,其中四位來自同一流派(R&B),另外四位來自其他流派。將他們每個人的所有歌曲的所有特征分別取平均值,得出的這些數據能夠很好的代表他們的歌曲特征。將這些特征分類,分別使用皮爾遜系數、斯皮爾曼系數、以及非參數檢驗來計算出這些特征與音樂流行指數的相關性大小,通過對各指標與流行指數的相關性比較,選取了相關性較為顯著的幾組指標。它們分別是:舞蹈性、能量性、響度、關鍵性、聲學性、工具性、明確性、流行性。
然后,選取了六個相關性較強的指標,在已有的這八個藝術家的數據中,篩選出這六個指標對應的數據進行標準化處理,處理后的數據用于求出相關系數矩陣。不同的音樂流派有著不同于其他流派的一個或數個音樂特征,因此可以提取出這些反映音樂流派特點的音樂特征,來判斷流派之間的相似程度。利用影響數據集中藝術家與其所屬流派的對應關系,在完整的音樂數據集中建立藝術家-所屬流派-音樂特征的對應關系。求出同一流派內所有音樂的七個音樂特征的平均值,作為該流派的音樂特征,再通過皮爾遜相關系數求出流派之間的相似性。根據相關分析選擇出這兩種流派間最具有代表性的三個指標關鍵,舞蹈性,活力,再從R&B和流行樂/搖滾樂中分別選取8首歌,進行下列操作,通過對這16首歌的指標進行分析,可以得到兩種音樂流派的指標分布相差很大,R&B流派的指標的整體分布區(qū)間明顯低于流行樂/搖滾樂流派。并且R&B流派的指標分布范圍更大,波動更廣,由此可知兩個流派的指標具有較為明顯的差異,選擇對舞蹈性做方差分析,利用SPSS軟件對兩種流派的舞蹈性分析結果見表1:
表1 舞蹈方差分析表
表1中的組間方差為0.265。同時Sig<0.05,小于顯著性水平,根據假設檢驗的條件可斷定兩組數據之間具有顯著性差異。由此推算能量指標求出組內方差,發(fā)現流行樂/搖滾樂流派內部的的方差為0.041,而R&B的方差為0.007,可以得到流行樂/搖滾樂流派的能量變化范圍更廣,而R&B流派能量的變化范圍更小,流派之間的指標波動區(qū)別。為了研究流派隨時間的變化,畫出前衛(wèi)流派重要指標隨年代變化的散點圖,如圖1所示:
圖1 前衛(wèi)流派各指標隨年代變化圖
由圖1發(fā)現,前衛(wèi)流派的原子價和活潑指標隨時間變化整體下降。響度和聲學指標隨年代推移波動幅度逐漸變大,而持續(xù)時間u ms則基本未發(fā)生變化。為了對影響者是否真的能夠影響到追隨者,首先利用皮爾遜相似度ρ(a,b)=E(a*b)/(σa*σb),其中E(a*b)是a和b之間的互相關,σ^2(a)=E(a^2)和σ^2(b)=E(b^2)是信號a和b的方差,在本題中,a,b分別代表音樂家A,音樂家B的音樂特征向量(a1,a2,...an)和(b1,b2...bn),其中n為經過經過降維方法后所提取出的更具有影響力的音樂指標。用相關分析的方法,研究各音樂的各個指標與人氣之間的關系大小。由于已經利用這種降維方法提取過更具影響力的指標,因此直接選用已經篩選出的主要指標:“舞蹈性”、“能量”、“響度”、“聲學性”、“樂器性”隨機選取出兩組影響者與追隨者的指標,并將所選出的每位藝術家的所有歌曲取平均值來代表該音樂家的整體音樂特征。最終得到簡化后的兩組數據,其中每組有一個影響者和三個追隨者音樂指標,其中這兩組的影響者為不同的人,最后選取影響者7秒與其追隨者前衛(wèi)的崛起的最具影響力的音樂指標來進行可視化,以更好的對比影響者是否真的對其追隨者產生了影響。為了更好地驗證模型建立的準確性,畫出影響者與其追隨者的雷達圖,根據模型,影響者與其追隨者之間的大部分音樂指標都是較為相似的,但是在某個音樂特征方面,可能做了突破或改進,說明影響者對其追隨者產生了一定的影響,模型建立正確。
圖2 雷達圖
經過對皮爾遜系數的比較,影響者確實影響到了相應的藝術家,也就是說“影響者”實際上會影響追隨者創(chuàng)作的音樂,而經過相關分析各個音樂指標與人氣的關系后,發(fā)現每個指標對于人氣的貢獻度不同,即某些音樂特征比其他音樂特征更具“感染力”。在流派中,變革者的音樂特征往往會出現顯著的變化,使用Z分數表示原始數據偏離均值的程度,同時Z分數將不同指標的數據標準化,很好地消除了指標之間的量綱和取值范圍差異的影響。Z分數計算參考公式:
其中,Xi是歌曲各特征的數值,Ui是各特征數值的均值,分母為標準方差,使用Zi來衡量每首歌曲第i個特征與均值的偏離程度。對第r首歌的n個特征的Zi進行相加,得到:
用Zr來表示每首歌的“特別”程度,找出所有歌曲中的最大值的歌曲,它是變革年份中最特別的一首歌曲,將這首歌所對應的藝術家確定為變革者。前衛(wèi)流派各指標隨時間變化的劇烈程度十分相似,具有一定的趨同性,在20世紀50年代至80年代,前衛(wèi)流派上述五大特征波動都十分明顯,而其余時候均處于較為平穩(wěn)的狀態(tài)??偟膩碚f,流派的音樂特征隨時間推移會有所變化,各指標的變化趨同,但各指標與時間并不構成線性相關的關系,也就是說其變化幅度、趨勢不定。
在經濟繁榮時期,人們對精神文化的需求擴大,互聯網技術的蓬勃發(fā)展同樣對音樂進化具有推動作用,這種推動作用主要體現為互聯網極大促進了音樂的傳播,互聯網加快了音樂的傳播速度,提升了音樂的傳播效果。也就是說,在互聯網技術的推動下,音樂作品的傳播途徑增加,那些流行指數低的歌曲所占據的市場份額也逐步提升,在人們能夠接觸到足夠多的歌曲時,他們的選擇就是多樣化的,在這種需求擴張的情況下,無論是哪種曲風的歌曲,流行指數都能有明顯的提升。