錢文琪,李子晉
(1.中國音樂學(xué)院,北京 100101;2.中央音樂學(xué)院,北京 100091)
近幾年來,計算機技術(shù)介入作曲領(lǐng)域的研究呈現(xiàn)出不斷加速、擴大的趨勢,眾所周知,音樂領(lǐng)域是極富有創(chuàng)造性的領(lǐng)域,音樂創(chuàng)作與計算機的結(jié)合迅速受到社會各領(lǐng)域廣泛關(guān)注?!八惴ā焙汀白髑敝钥梢越Y(jié)合形成一個新興的研究領(lǐng)域,兩者之間一定有邏輯關(guān)系將其聯(lián)結(jié)。追溯到很久之前,作曲本身其實就是一種嚴(yán)格的規(guī)則邏輯,從很早的簡單節(jié)奏及音高對應(yīng)關(guān)系到巴洛克時期復(fù)調(diào)音樂中嚴(yán)格的邏輯對應(yīng),再到后來的十二音序列音樂,音樂中各種要素的隨機對應(yīng)關(guān)系,算法始終貫穿在作曲過程之中。因此,可以將算法作曲認(rèn)為是兩種不同領(lǐng)域的邏輯在當(dāng)代的交叉碰撞。
現(xiàn)階段,在計算機領(lǐng)域,英文文獻中大部分學(xué)者更加偏向于“自動作曲”這個解釋,普遍認(rèn)為算法作曲是使用算法創(chuàng)作音樂的技術(shù),認(rèn)為算法作曲這個術(shù)語通常用來表示無需人工干預(yù)進行的音樂創(chuàng)作過程。中文文獻中大部分學(xué)者更加偏向?qū)⑺惴ㄗ髑忉尀椤坝嬎銠C作曲”,在作曲的過程中,人盡可能少地干預(yù)音樂的生成,以實現(xiàn)計算機算法作曲的主導(dǎo)作用最大化。在音樂領(lǐng)域,中英文獻在算法作曲的釋義理解上則出現(xiàn)較大分歧。英文文獻中部分國外音樂家是希望形成完全自動化的作曲,但中文文獻中音樂家更加注重人在其中的干預(yù)作用,強調(diào)了人干預(yù)是必不可少的,甚至是有利于結(jié)果的最優(yōu)化。
“算法作曲”就是“在算法輔助下的作曲”,算法作曲在計算機算法的支撐下,已經(jīng)成為當(dāng)代創(chuàng)作音樂的新趨勢,隨著各種算法的不斷更新完善,人們越來越依賴計算機的算法來進行音樂的創(chuàng)作,賦予計算機更多的權(quán)限,人們將更多的關(guān)注點逐漸移向算法。在計算機算法作曲系統(tǒng)中,人們擔(dān)任的角色只是規(guī)則制定者與反饋調(diào)試者。這種趨向“自動化創(chuàng)作”的方式雖然新穎,但是當(dāng)作曲家將自己的靈感和情感輸入到計算機中,計算機是否能夠給予他們與之匹配的音樂才是至關(guān)緊要的。這種認(rèn)知的差異性其實主要取決于人們對它的定位。直到現(xiàn)在,對“算法作曲”的理解還沒有一個統(tǒng)一的概念。
各領(lǐng)域?qū)λ惴ㄗ髑J(rèn)知的偏差,在很大程度上影響了算法作曲的研究內(nèi)容和趨勢發(fā)展,但是僅基于個人的主觀判斷是不能夠得出結(jié)論的,而是需要通過客觀準(zhǔn)確的數(shù)據(jù)來說話。文獻計量的方法應(yīng)用領(lǐng)域十分廣泛,在近幾年呈現(xiàn)出與其他領(lǐng)域?qū)W科相結(jié)合的趨勢,通過這種方法可以提取到文章內(nèi)容的核心要素。文獻計量法可以將文獻量、作者數(shù)、詞匯數(shù)作為研究對象對大量文獻進行量化分析,而后實現(xiàn)對相關(guān)研究領(lǐng)域的研究熱點的預(yù)測和評估。本文對國內(nèi)外算法作曲發(fā)展趨勢、研究熱點進行定量考察,借助可視化文獻計量分析工具Citespace,通過發(fā)文量及詞頻分析中關(guān)鍵詞聚類、突現(xiàn)詞分析的方法確定算法作曲研究內(nèi)容在不同發(fā)展階段的核心關(guān)鍵詞變動,以獲取其研究領(lǐng)域演變趨勢及熱點變化。
嚴(yán)格地說,與其它專著、研究報告等文獻相比,期刊論文更直接、客觀、嚴(yán)謹(jǐn)?shù)胤从沉讼嚓P(guān)研究領(lǐng)域的研究課題和研究前沿。本文研究以中文學(xué)術(shù)期刊庫中國知網(wǎng)(CNKI)和美國科學(xué)信息研究所Web of science(WoS)核心合集數(shù)據(jù)庫為主要數(shù)據(jù)來源。其中,以“算法作曲”作為主題詞和關(guān)鍵詞為中國知網(wǎng)(CNKI)數(shù)據(jù)庫檢索式,檢索時間跨度為1955-2020年,時間切片為1,檢索文獻時間為2020年2月29日,統(tǒng)計結(jié)果時間為2020年3月1日,經(jīng)過人工篩選,把顯然不屬于該領(lǐng)域的文獻剔除,并刪除重復(fù)文章。結(jié)果共檢索出相關(guān)文獻共63篇,將檢索出的論文題目、關(guān)鍵詞、作者、摘要等數(shù)據(jù)以Refworks的純文本格式導(dǎo)出,以備數(shù)據(jù)分析所用。
本文又以Web of science(WoS)為檢索平臺,選擇“Web of Science Core Collection”數(shù)據(jù)庫為樣本框,檢索策略設(shè)定為 TS=(Antibiotic*AND Soil),文獻類型設(shè)定為“Article”,檢索主題為“Algorithm composition”和“music”;OR 主題為“Computer Composition”和”music”;檢索時間跨度是1985-2019年,檢索時間為2020年2月29日,統(tǒng)計時間為2020年3月1日,經(jīng)過人工篩選,對檢索結(jié)果逐條篩選,剔除不相關(guān)的非學(xué)術(shù)文章,并且刪除重復(fù)文獻,最終共得到相關(guān)有效文獻共295篇,將篩選過后的文獻保存為純文本格式導(dǎo)出,以備數(shù)據(jù)分析所用。
本文采用文獻計量法中的關(guān)鍵詞共現(xiàn)分析方法,關(guān)鍵詞共現(xiàn)可以分為幾個分析維度,分別為關(guān)鍵詞頻次(關(guān)鍵詞提取檢索所得論文中的高頻關(guān)鍵詞,以揭示算法作曲在不同發(fā)展階段的研究主題)、關(guān)鍵詞中心性(Betweenness Centrality)、關(guān)鍵詞聚類圖譜(可以反映聚類結(jié)構(gòu)特征,表征識別聚類的性質(zhì),從特定聚類的標(biāo)題、關(guān)鍵詞、摘要中抽取名詞短語,作為聚類標(biāo)簽,更能清晰得出該研究領(lǐng)域的核心)、Time line圖譜(揭示聚類時間跨度、發(fā)展脈絡(luò)及研究進程)、Time zone圖譜(在時間層面展示關(guān)鍵詞關(guān)聯(lián)及研究領(lǐng)域知識演進)。
通過對中英文算法作曲相關(guān)文獻的發(fā)文量進行對比分析(如圖1)。首先看到的是明顯的發(fā)文量數(shù)量的差距,英文相關(guān)文獻發(fā)文總量大致為國內(nèi)發(fā)文總量的2倍。中文相關(guān)文獻發(fā)表時間明顯晚于國外,之間相差近20年。首先,通過觀察發(fā)表論文的數(shù)量趨勢,兩者趨勢基本一致。英文相關(guān)文獻的數(shù)量分別在1995年、2005年、2015年出現(xiàn)高峰值,在1993年、2009年出現(xiàn)低峰值;而對比中文文獻,在2006年、2010年及2013年出現(xiàn)高峰值,在2008年、2012出現(xiàn)低峰值。可以得知,英文文獻幾乎每隔10年就會出現(xiàn)一個高峰值,而中文文獻幾乎每四年出現(xiàn)一個高峰值。由此可見,這種數(shù)量的發(fā)展趨勢是相同的。
圖1 國內(nèi)外中英文算法作曲發(fā)文量散點對比圖
在科學(xué)研究中,關(guān)鍵詞通??梢员磉_一篇論文的研究核心內(nèi)容,繼而可以表征出該領(lǐng)域的研究主題和發(fā)展動向[1]。因此,如果某一主題詞或關(guān)鍵詞在其領(lǐng)域文獻中出現(xiàn)次數(shù)較多,則可認(rèn)為該關(guān)鍵詞或主題詞所表征的研究主題即為該領(lǐng)域的研究熱點。
聚類分析是機器學(xué)習(xí)的一個很重要的分支。聚類(Clustering),就是將相似度較高的團或簇聚成一組。聚類也是一種可視化樣式,它可以展示網(wǎng)絡(luò)的聚類分布概況。Citespace自動聚類的實現(xiàn)是依據(jù)譜聚類算法(Spectral Clustering,SC),聚類樣式中的聚類以不同顏色的節(jié)點來表示。譜聚類是從圖論中演化出來的算法,目前在聚類研究中得到了廣泛的應(yīng)用,是一種新型聚類算法。其原理是基于聚類矩陣的相似性,然后利用圖分割形成聚類。
本文將所得中國知網(wǎng)(CNKI)文獻數(shù)據(jù)導(dǎo)入Citespace軟件進行關(guān)鍵詞共現(xiàn)分析,軟件時區(qū)選擇為1990年-2019年,時間切片(Slice length)為1,節(jié)點類型選擇“keyword”,TopN為50。經(jīng)過參數(shù)篩選,關(guān)鍵詞共現(xiàn)圖譜中共出現(xiàn)關(guān)鍵詞141個,形成200條連線,密度為0.0203。此次研究中,CNKI數(shù)據(jù)的輪廓值S為0.5696,模塊值Q為0.8262,一般而言,Q的值在區(qū)間[0,1)內(nèi),Q≥0.3說明劃分出來的關(guān)鍵詞聚類是明確的[2];當(dāng)S值在0.7時,聚類是高效率令人信服的,若在0.5以上,一般認(rèn)為聚類是合理的,表明形成聚類的結(jié)構(gòu)層次比較清晰,該方法的置信度較高且具有意義[3]。另外,筆者采用潛在語義索引算法(LSI)從施引文獻的關(guān)鍵詞(Keyword list)中提取名詞性術(shù)語對聚類進行命名。
同樣,本文將Web of science(WoS)核心合集數(shù)據(jù)庫中文獻數(shù)據(jù)導(dǎo)入Citespace軟件進行關(guān)鍵詞共詞分析,軟件時區(qū)選擇為1970年-2019年,時間跨度(Slice length)為1,節(jié)點類型選擇“keyword”,TopN為50。經(jīng)過參數(shù)篩選,圖譜中共出現(xiàn)關(guān)鍵詞386個,形成836條連線,密度為0.0113。WOS數(shù)據(jù)的輪廓值S為0.7022,模塊值Q為0.6268,表明形成聚類的結(jié)構(gòu)層次比較清晰。另外,筆者同樣采用相同語義索引算法(LSI)從施引文獻的關(guān)鍵詞(Keyword list)中提取名詞性術(shù)語對聚類進行命名。
圖2 中文文獻中“算法作曲”關(guān)鍵詞聚類知識圖譜
圖3 英文文獻中“算法作曲”關(guān)鍵詞聚類知識圖譜
從關(guān)鍵詞聚類視圖可以發(fā)現(xiàn),中文文獻中該領(lǐng)域聚類分布較分散,每個聚類相關(guān)性較?。欢馕奈墨I中該領(lǐng)域聚類分布密集,相關(guān)性較大。
本文將中英文算法作曲相關(guān)論文關(guān)鍵詞聚類進行對比得出表1(如下表)。中文文獻關(guān)鍵詞主要聚類分析結(jié)果有4個,分別是“人工智能”(聚類0)、“計算機音樂”(聚類1)、“適應(yīng)度函數(shù)”(聚類2)、“計算機作曲”(聚類3);英文文獻關(guān)鍵詞主要聚類分析結(jié)果有5個。分別是“深度學(xué)習(xí)”(聚類0)、“教育”(聚類1)、“機器學(xué)習(xí)”(聚類2)、“算法作曲”聚類3)、“算法”(聚類4)??梢?,中文文獻中算法作曲研究主要以算法為主要研究內(nèi)容;而英文文獻中算法作曲研究內(nèi)容涉及很多方面。
表1 中英文獻算法作曲關(guān)鍵詞聚類視圖對比表
此外,本文將文獻中算法作曲高頻中介中心性關(guān)鍵詞進行整理對照(如表2),可以看出,中文文獻中關(guān)于算法作曲的主要研究重點在于算法的研究,如“遺傳算法”、“神經(jīng)網(wǎng)絡(luò)”、“機器學(xué)習(xí)”、“交互式遺傳算法”、“循環(huán)神經(jīng)網(wǎng)絡(luò)”、“馬爾科夫鏈”等;而英文文獻以“evolutionary algorithm”(進化算法)為算法研究方向的主要內(nèi)容,與此同時,還進行作曲本身要素的研究,如“結(jié)構(gòu)”、“模型”、“作曲技法”等,另外還加入了主觀情感的影響因素研究。
表2 中英文獻算法作曲中介中心性關(guān)鍵詞匯總
關(guān)鍵詞時區(qū)視圖可以清晰地呈現(xiàn)算法作曲研究主要研究內(nèi)容的變化以及研究前沿。在中文文獻中,前期的研究中幾乎都是算法相關(guān)的研究,如“隱馬爾科夫模型”、“遺傳算法”、“適應(yīng)度函數(shù)”這些關(guān)鍵詞。在中期的研究階段,關(guān)鍵詞為“節(jié)奏”、“音樂創(chuàng)作”、“神經(jīng)網(wǎng)絡(luò)”等,這表明研究重點雖沒有離開算法,但是加入了一些音樂創(chuàng)作相關(guān)的內(nèi)容。目前,中文文獻中算法作曲的研究以“局部自動化”為研究前沿。
英文文獻中算法作曲關(guān)鍵詞時區(qū)視圖中可知前期出現(xiàn)“algorithm”、“music”、“composition”、“computer music”這些關(guān)鍵詞,這表明前期大部分的研究雖然是以算法為研究出發(fā)點,但主要研究內(nèi)容是在音樂創(chuàng)作本體上。在研究中期,出現(xiàn)“machine learning”、“genetic algorithm”等關(guān)鍵詞,表明這個階段是以算法的研究為主。目前,英文文獻中算法作曲的研究以“emotion”、“education”、“evolutionary algorithm”為研究前沿。
通過對比中英文文獻中算法作曲關(guān)鍵詞突現(xiàn)視圖可以得出下表(表3),表中可以看出中文文獻中算法作曲在2005年之前的研究成果幾乎為空白,而英文文獻中在該領(lǐng)域已經(jīng)開始有針對算法的研究,主要體現(xiàn)在交互遺傳算法和人工智能相關(guān)的算法研究;2005年-2010年這個階段中文文獻中算法作曲的研究內(nèi)容開始集中在算法,而在此階段,英文文獻中相關(guān)研究已經(jīng)開始強調(diào)計算機的輔助作用,甚至出現(xiàn)了計算機算法作曲應(yīng)用于教育的研究;在2010年-2015年,這個階段,中文文獻中該領(lǐng)域從單一算法研究變?yōu)榻换ナ骄幊陶Z言的應(yīng)用研究,與此同時,英文文獻中該領(lǐng)域已經(jīng)開始了細胞自動機(CA)、生物反饋的相關(guān)算法研究來進行作曲;2015年-2019年這個階段,中文文獻中的研究沒有明顯的進展,研究內(nèi)容上也沒有明顯的變化。這個階段的英文文獻中已經(jīng)在算法作曲研究中加入了情感、主觀感知等影響因素的探索研究。
表3 中英文獻中算法作曲突現(xiàn)詞階段對比
本文通過運用文獻計量法,對比中英文算法作曲相關(guān)文獻,根據(jù)國內(nèi)外算法作曲發(fā)展趨勢和研究熱點,演測其研究前沿并總結(jié)出以下結(jié)論:
(1)國內(nèi)外研究進度趨勢大體相同。從發(fā)文量看,國內(nèi)和國外發(fā)文量都是經(jīng)過短暫的緩慢增長后出現(xiàn)三個明顯的峰值,且各峰值之間的年份間隔分布均勻,發(fā)展趨勢線條走勢大體相同,其原因可能在于國內(nèi)外研究時代背景相同,兩者的發(fā)展始終存在密切的聯(lián)系。
(2)國內(nèi)外研究熱點存差異。在算法的研究方面還處于尋找“最優(yōu)解”的過程中,國內(nèi)大多數(shù)研究偏重早期遺傳算法和神經(jīng)網(wǎng)絡(luò)。且以遺傳算法為主流方向。目前,國外的多數(shù)研究側(cè)重深入研究進化算法輔助作曲,并且在找到“最優(yōu)解”的情況下,加入了主觀情感因素的干擾性,這也是由于領(lǐng)域?qū)W科之間的教育方式的差異性,導(dǎo)致國內(nèi)外在學(xué)科領(lǐng)域的融合度不同。在研究過程中,也會由于語言翻譯的問題,對于算法作曲的本身具有的邏輯性認(rèn)知存在差異。
(3)國內(nèi)外研究前沿趨于一致。通過時區(qū)圖譜的對比,也可以發(fā)現(xiàn)國內(nèi)的研究前沿是局部自動化,而國外是自動作曲。局部自動化是需要人工干預(yù)的,而自動化的概念已經(jīng)擴展為計算機技術(shù)代替人體力或者腦力的過程。目前,國內(nèi)對于算法的探索研究不僅局限于遺傳算法,還進行了神經(jīng)網(wǎng)絡(luò)等復(fù)雜算法的突破性實踐以及音樂風(fēng)格情感方面的研究探索。
目前,算法作曲的相關(guān)算法經(jīng)過多年的蛻變、演算、進化,已基本滿足該領(lǐng)域研究要求。與此同時,研究視角開始切換到作曲理論,即關(guān)注于作曲理論規(guī)則制定的科學(xué)性,如何讓一個音樂作品更具有可聽性。但是可以說,自動化是算法作曲發(fā)展的必然趨勢。