王健健
(寶雞文理學(xué)院 音樂(lè)系,陜西 寶雞721013)
基于內(nèi)容的民族音樂(lè)檢索模型構(gòu)建與實(shí)現(xiàn)
王健健
(寶雞文理學(xué)院 音樂(lè)系,陜西 寶雞721013)
針對(duì)當(dāng)前非結(jié)構(gòu)化P2P網(wǎng)絡(luò)中民族音樂(lè)資源搜索的問(wèn)題,提出一種基于內(nèi)容的民族音樂(lè)檢索模型。通過(guò)建立局部索引和全局索引結(jié)合模型,其中局部索引通過(guò)構(gòu)建特征矩陣的方法,提取民族音樂(lè)的ID與特征所屬區(qū)間,去掉在檢索中存在的重復(fù)問(wèn)題;通過(guò)構(gòu)建關(guān)聯(lián)索引表作為全局節(jié)點(diǎn)的索引,提高搜索的精準(zhǔn)性。最后通過(guò)仿真軟件對(duì)上述的模型進(jìn)行驗(yàn)證,對(duì)500首不同的民族音樂(lè)文件進(jìn)行模擬,得到良好效果。
內(nèi)容;民族音樂(lè);全局索引;局部索引;音樂(lè)ID
P2P網(wǎng)絡(luò)作為當(dāng)前分布式應(yīng)用當(dāng)中的重點(diǎn),是在因特網(wǎng)基礎(chǔ)上所構(gòu)建的一層覆蓋網(wǎng)絡(luò)。該網(wǎng)絡(luò)中是以節(jié)點(diǎn)作為分布,并且不同的節(jié)點(diǎn)承擔(dān)著相同的角色,在充當(dāng)服務(wù)器的同時(shí),也為客戶(hù)機(jī)。同時(shí)該網(wǎng)絡(luò)還可為廣大的用戶(hù)提供一個(gè)具有高容錯(cuò)性、均衡能力強(qiáng)的系統(tǒng)和強(qiáng)大的數(shù)據(jù)庫(kù)。根據(jù)該網(wǎng)絡(luò)存在的優(yōu)勢(shì),使得對(duì)音樂(lè)的共享程度越來(lái)越大,根據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),在P2P節(jié)點(diǎn)中的音樂(lè)資源甚至占到整個(gè)P2P資源的70%。而人們隨著音樂(lè)的擴(kuò)大,傳統(tǒng)的通過(guò)關(guān)鍵字、主題、出版社等方式進(jìn)行搜索已經(jīng)不能滿(mǎn)足。另外當(dāng)前針對(duì)音樂(lè)資源的搜索的研究中,存在重復(fù)搜索,導(dǎo)致搜索時(shí)間過(guò)長(zhǎng),另外在特征提取方面比較單一。同時(shí)當(dāng)前在P2P網(wǎng)絡(luò)應(yīng)用中大部分都為非結(jié)構(gòu)化的網(wǎng)絡(luò)。對(duì)此,本文提到一種基于非結(jié)構(gòu)化的P2P網(wǎng)絡(luò)民族音樂(lè)檢索模型,從全局索引和局部索引的角度,解決在檢索重復(fù)性和精準(zhǔn)性方面存在的問(wèn)題。
當(dāng)前針對(duì)基于內(nèi)容的音樂(lè)的檢索研究中,基本是通過(guò)以下步驟進(jìn)行搜索:
1)對(duì)音樂(lè)音頻信號(hào)進(jìn)行處理處理;
2)通過(guò)對(duì)特征進(jìn)行提取,以此構(gòu)建資源的查詢(xún)索引;
3)構(gòu)建數(shù)據(jù)庫(kù)音頻索引;
4)構(gòu)建查詢(xún)機(jī)制;
5)根據(jù)查詢(xún)索引和音頻索引之間的相似性,從而對(duì)不同的音樂(lè)片段進(jìn)行檢索。
而針對(duì)基于內(nèi)容的音樂(lè)檢索中,其重要針對(duì)的格式為MIDI、MP3、WAV等格式而言。
同時(shí)在檢索算法為實(shí)現(xiàn)的核心部分,也是關(guān)鍵。而對(duì)于檢索算法的設(shè)計(jì)中,主流的算法包括特征串匹配算法、N-grams音樂(lè)檢索算法等,如其中的基于特征串匹配算法其重要的原理則如圖1所示。
圖1 特征串匹配算法
通過(guò)對(duì)上述檢索算法的總結(jié),都存在著在特征的提取中只提取某個(gè)屬性的特征,導(dǎo)致在檢索中存在著很大的重復(fù)性。同時(shí)為提高在非結(jié)構(gòu)化的P2P網(wǎng)絡(luò)中的資源搜索,提出資源動(dòng)態(tài)重分配的協(xié)議或者并行和分解的檢索算法,從而提高對(duì)P2P網(wǎng)絡(luò)中音樂(lè)資源的搜索效率。對(duì)此,文中則基于P2P網(wǎng)絡(luò)下,提出一種全局和局部索引結(jié)合的模型,其具體的思路則如圖2所示。
圖2 音樂(lè)檢索模型設(shè)計(jì)思路
2.1非結(jié)構(gòu)化網(wǎng)絡(luò)中節(jié)點(diǎn)關(guān)系描述
與傳統(tǒng)的文本信息檢索來(lái)講,音樂(lè)文件需要一個(gè)更為高效的檢索算法。因此通常為提高索引的效果,通常會(huì)對(duì)音樂(lè)文件構(gòu)建專(zhuān)門(mén)的索引結(jié)構(gòu)。但對(duì)音樂(lè)文件索引結(jié)構(gòu)的構(gòu)建需要更大的存儲(chǔ)空間,并需要更為高性能的查詢(xún)能力。傳統(tǒng)針對(duì)音樂(lè)索引的構(gòu)建都是通過(guò)分割音樂(lè)片段的方式,文中則提出一種不需要考慮傳統(tǒng)的音樂(lè)片段的長(zhǎng)度,而直接在各個(gè)節(jié)點(diǎn)當(dāng)中構(gòu)建一個(gè)全局索引和局部索引,其具體的節(jié)點(diǎn)關(guān)系圖則如圖3所示。
圖3 P2P網(wǎng)絡(luò)中節(jié)點(diǎn)組織關(guān)系
在圖3中可看出,在每個(gè)節(jié)點(diǎn)中都構(gòu)建了一個(gè)全局索引和一個(gè)局部索引,對(duì)不同節(jié)點(diǎn)的用戶(hù)來(lái)講,都可對(duì)該范圍內(nèi)的資源進(jìn)行搜索。
2.2信息預(yù)處理
在不同格式的音樂(lè)文件當(dāng)中,每首歌曲中會(huì)存在大量的重復(fù)的片段,由此導(dǎo)致大大增加了索引結(jié)構(gòu)的復(fù)雜度,對(duì)此要提高索引的效率和準(zhǔn)確度其首要的步驟是解決其中重復(fù)片段,必須對(duì)音樂(lè)文件信息進(jìn)行預(yù)處理,消除其中存在的冗余。
而在眾多的音樂(lè)文件當(dāng)中,通常是兩個(gè)小節(jié)作為一個(gè)主題,一個(gè)主題包括旋律。由此主旋律通常成為經(jīng)常重復(fù)的主題。對(duì)此,很多的研究者通常只提取第一個(gè)主題旋律作為其主要的特征,從而減少了檢索的時(shí)間,但是這種方式卻降低了檢索的精確度。由此本文為提高精確度,將全部的主題信息都提取出來(lái),并去除其中的冗余信息。通過(guò)這樣的方法,其不僅可降低整體的復(fù)雜度,同時(shí)還可有效的保障其精度。
在音樂(lè)中,通常音調(diào)更能夠影響一首音樂(lè)的主題,因此本文以主題當(dāng)中的及標(biāo)準(zhǔn)差作為兩個(gè)關(guān)鍵的主題特征因素,假設(shè)為在一段音樂(lè)旋律中的第i個(gè)音符體現(xiàn)出的音高,其平均音高和標(biāo)準(zhǔn)差的計(jì)算則為:
在公式(1)、(2)中k表示為某個(gè)主題當(dāng)中音符的個(gè)數(shù)。
以某民族音樂(lè)的片段為例,通過(guò)對(duì)該MIDI文件的主題進(jìn)行處理之后,從而可得到這兩個(gè)主題的平均音高和標(biāo)準(zhǔn)差,具體則如圖4所示。
圖4 某民族音樂(lè)的兩個(gè)主題
通過(guò)對(duì)主題的處理,得到其兩個(gè)不同主題的pˉ、dˉ。通過(guò)這種方法,將該民族音樂(lè)歌曲當(dāng)中的所有的主題全部提取出來(lái),從而可得到其主題分別為I=I1、I2……In。通過(guò)再通過(guò)計(jì)算之后,得到不同的I值,由此則消除了其中的重復(fù)的片段,減少了檢索的片段,大大提高了檢索的時(shí)間。
2.3局部索引建立
對(duì)局部索引的建立,本文則利用稀疏矩陣作為其特征矩陣,在不同的行和列當(dāng)中存儲(chǔ)不同音樂(lè)文件的旋律特征。如圖5為B節(jié)點(diǎn)的局部索引圖。
在該圖中,其中的行代表的節(jié)點(diǎn)中所共享的音樂(lè),其中的第i行則代表第i首音樂(lè)。同時(shí)其中的列則為該音樂(lè)特征的區(qū)間。通過(guò)對(duì)其進(jìn)行的分析,將該音樂(lè)空間分為7個(gè)不同的區(qū)間段,同時(shí)根據(jù)中整數(shù)部分的大小進(jìn)行排列,如整數(shù)部分為2,則將其直接放入到第2行。由此每個(gè)不同的元素都是同首歌分配到一個(gè)區(qū)所構(gòu)成的子矩陣,并通過(guò)有序鏈表對(duì)<高音值,標(biāo)準(zhǔn)差>進(jìn)行存儲(chǔ),從而以此類(lèi)推形成了一個(gè)有序鏈表索引結(jié)構(gòu),并最終通過(guò)一種稀疏矩陣的方式表達(dá)出來(lái)。
文中則假設(shè)B點(diǎn)中包含3首不同的民族音樂(lè),通過(guò)對(duì)其標(biāo)準(zhǔn)差和高音平均值的計(jì)算,將其插入到行列中則得到上述的圖5的結(jié)果。
2.4全局索引構(gòu)建
在P2P網(wǎng)絡(luò)中構(gòu)建全局索引的目的是提高網(wǎng)絡(luò)的連通性,以此提高在查詢(xún)中網(wǎng)絡(luò)的查詢(xún)速度。其具體的方式則如圖6所示。
在圖6中,通過(guò)建立不同節(jié)點(diǎn)之間的聯(lián)系的方式,并通過(guò)RST的記憶功能,每次F搜索到匹配的音樂(lè)片段后,對(duì)其RST更新一次,并在與有關(guān)聯(lián)的P2P節(jié)點(diǎn)中對(duì)自身的RST進(jìn)行更新和保存,從而通過(guò)這種不斷的搜索,讓該P(yáng)2P網(wǎng)絡(luò)中的音樂(lè)資源不斷擴(kuò)大,從而改變了傳統(tǒng)的盲目搜索的方式。
圖5 B點(diǎn)的局部索引圖
圖6 F節(jié)點(diǎn)請(qǐng)求發(fā)送圖
在對(duì)音樂(lè)信息的檢索中,通過(guò)上述對(duì)特征的提取可知道,只需要在查詢(xún)中搜索音樂(lè)ID即可獲取相關(guān)的音樂(lè)信息。而在系統(tǒng)進(jìn)行最初搜索的時(shí)候,其中各個(gè)節(jié)點(diǎn)中的RST為空,此時(shí)進(jìn)行的搜索的量非常的大,必須對(duì)全部節(jié)點(diǎn)進(jìn)行搜索,通過(guò)搜索后將匹配的信息返回給節(jié)點(diǎn),并將其存入到RST中。這種情況下通常會(huì)消耗掉大量的網(wǎng)絡(luò)資源,占用很大的帶寬,但是隨著搜索的不斷深入和網(wǎng)絡(luò)的穩(wěn)定,這種搜索的效果也變得越來(lái)越好。因此,當(dāng)網(wǎng)絡(luò)在穩(wěn)定后,將其查詢(xún)的過(guò)程設(shè)定為:
當(dāng)查詢(xún)請(qǐng)求在達(dá)到P2P網(wǎng)絡(luò)中的某個(gè)節(jié)點(diǎn)Q的時(shí)候,首先該節(jié)點(diǎn)的RST與每個(gè)元素進(jìn)行匹配,如成功則將該行的元素信息發(fā)送給請(qǐng)求節(jié)點(diǎn),并停止信息轉(zhuǎn)發(fā),如果沒(méi)有則通過(guò)局部索引的方式進(jìn)行查找,并轉(zhuǎn)發(fā)給其他的節(jié)點(diǎn),知道TTL范圍為0則結(jié)束。
通過(guò)PeerSim模擬器構(gòu)建一個(gè)P2P網(wǎng)絡(luò),在該網(wǎng)絡(luò)中包含1 000個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)周?chē)噙B的節(jié)點(diǎn)保持在1~5個(gè),同時(shí)準(zhǔn)備500首民族歌曲進(jìn)行。通過(guò)對(duì)這500首民族音樂(lè)的提取,并采用隨機(jī)的方式將其放入到不同的節(jié)點(diǎn)中。最后通過(guò)檢驗(yàn)得到如圖7和圖8的結(jié)果。
圖7 局部索引建立后的響應(yīng)時(shí)間
圖8 全局索引下的查詢(xún)次數(shù)變化
通過(guò)利用全局和局部索引的方式,改變了傳統(tǒng)的基于內(nèi)容的音樂(lè)信息檢索中存在的精準(zhǔn)度低和查詢(xún)速度慢的問(wèn)題,為提高音樂(lè)檢索系統(tǒng)的檢索效率提供了很好的參考模型。
[1]李志敏,譚敏生,趙治國(guó).混合P2P模式資源搜索算法的改進(jìn)研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2009(9):46,57-59.
[2]傅鸝,孫堅(jiān),付春雷.基于語(yǔ)義的音樂(lè)檢索系統(tǒng)[J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué)版,2011(1):40-43.
[3]李鵬,周明全,夏小亮,等.改進(jìn)的基音檢測(cè)方法及在音樂(lè)檢索中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2011(6):127-130.
[4]王小鳳,耿國(guó)華,劉曉寧,等.基于相對(duì)特征的音樂(lè)哼唱多句檢索算法[J].計(jì)算機(jī)應(yīng)用研究,2011(3):918-920.
[5]熊德華,秦開(kāi)懷.一種基于空間索引技術(shù)的全局光照快速繪制算法[J].計(jì)算機(jī)應(yīng)用與軟件,2011(4):267-270,279.
[6]藍(lán)天,李揚(yáng),鐘婷,等.旋律提取技術(shù)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2011(5):1618-1622.
[7]王植.P2P網(wǎng)絡(luò)資源搜索算法研究及其改進(jìn)[J].現(xiàn)代電子技術(shù),2011(12):41-43.
[8]孫永佼,袁野,王國(guó)仁.P2P環(huán)境下面向不確定數(shù)據(jù)的Topk查詢(xún)[J].計(jì)算機(jī)學(xué)報(bào),2011(11):2155-2164.
[9]孟必平,王騰蛟,李紅燕,等.分片位圖索引:一種適用于云數(shù)據(jù)管理的輔助索引機(jī)制 [J].計(jì)算機(jī)學(xué)報(bào),2012(11): 2306-2316.
[10]張二芬,徐淮杰.基于內(nèi)容的音樂(lè)語(yǔ)義特征描述方法[J].電子設(shè)計(jì)工程,2013(1):31-33.
[11]張滇,岳磅,江小燕,等.應(yīng)對(duì)海量數(shù)據(jù)檢索:分布式局部索引的架構(gòu)[J].計(jì)算機(jī)時(shí)代,2013(8):1-4.
[12]李鵬,王小明,王小鳳,等.旋律彈性匹配實(shí)現(xiàn)Web哼唱檢索[J].計(jì)算機(jī)科學(xué),2014(12):192-196.
Construction and im p lementation of nationalmusic retrievalm odel based on content
WANG Jian-jian
(Department ofMusic,BaojiUniversity of Arts and Sciences,Baoji721013,China)
Aiming at the problem ofethnicmusic resource searching in unstructured P2Pnetworks,a nationalmusic retrieval modelbased on content is proposed.Through the establishmentof local index and global indexmodel,the local index isused to construct the featurematrix,extract the ID and feature of the nationalmusic,remove the duplicate problem in the retrieval. Finally,the model is verified by simulation software,and the simulation results of 500 different nationalmusic files are simulated.
content;nationalmusic;global index;local index;music ID
TN99
A
1674-6236(2016)19-0066-03
2015-11-04稿件編號(hào):201511033
王健健(1981—),女,陜西寶雞人,碩士,講師。研究方向:高校音樂(lè)教學(xué)。