李倩 李德
摘要:音樂版權(quán)的保護實質(zhì)上是對創(chuàng)作音樂者智慧結(jié)晶的保護。如何提高音樂版權(quán)的唯一性,防止音樂抄襲現(xiàn)象的泛濫,一直是音樂領(lǐng)域的難題。本文基于時下熱門的音頻特征提取技術(shù),對音頻進行多特征提?。好窢柕棺V系數(shù)、響度范圍、靜音幀比例等,生成唯一的特征值序列,將其加密后作為水印,利用LSB算法嵌入到音頻中,起到有效的版權(quán)聲明作用,為音頻數(shù)字水印與特征提取結(jié)合提出一種可能性,為音樂版權(quán)保護的未來提出展望。
關(guān)鍵詞:音頻數(shù)字水印 特征提取 版權(quán)保護
一、緒論
音樂版權(quán)的保護旨在保護音樂的原創(chuàng)性與知識產(chǎn)權(quán),版權(quán)保護的核心是保護創(chuàng)作者的靈感與智慧體現(xiàn)。然而如今的信息互聯(lián)時代,竊取音樂旋律、盜版的手段方式更加五花八門,例如,在未經(jīng)創(chuàng)作者允許的情況下在原聲帶音頻的基礎(chǔ)上修改創(chuàng)作,或者以不明顯的模仿方式直接盜用原曲的旋律與曲調(diào)等。這種盜取避開了音頻數(shù)字水印的保護,是否存在抄襲情況始終依賴于人的經(jīng)驗分析。而音頻信號是帶有語音、音樂、音效的有規(guī)律的聲波的信息載體,其中語音和音樂是是音頻信號的主要內(nèi)容。本文提出音頻數(shù)字水印與特征識別分析結(jié)合的方式來有效判定:對音頻進行多特征提取,得到一個特征值序列,將該序列作為水印利用音頻數(shù)字水印嵌入算法嵌入音頻中,更好的作為版權(quán)保護音頻。
二、結(jié)合特征提取的版權(quán)保護實現(xiàn)
(一)音樂的三要素
音樂的三要素分為:旋律、節(jié)奏、和聲。旋律又稱“曲調(diào)”,是構(gòu)成音樂的首要要素。旋律是含有音高和節(jié)奏的人聲或樂器的樂音序列,它在音樂中不同的排列位置產(chǎn)生樂音的復(fù)合音效;節(jié)奏是由長短、強弱不同的節(jié)拍組成的有序整體,沒有節(jié)奏的旋律只是單調(diào)的音符集合,沒有音樂的美感,是抄襲者容易篡改的一個部分;和聲即在同一時間由兩個或兩個以上音高的音組合發(fā)聲形成的聲音,用來描述不同音高音符之間關(guān)系的不同帶來的音效的差異,起到渲染烘托的作用。對于音樂的特征基于這三個基本要素進行分析提取。
(二)音樂特征提取
音樂的特征有很多類別,本文使用了幾種簡單常用但具有唯一識別音頻的幾個特征:梅爾倒譜系數(shù)(MFCC)、響度、響度范圍、靜音幀比例。梅爾倒譜系數(shù)(Mel-scale Frequency Cepstral Coefficients)是基于人耳的聽覺機理在梅爾標度頻率域提取出來的信號倒譜系數(shù),主要根據(jù)人耳對音頻的反應(yīng)結(jié)果對音頻進行分析:首先對音頻信號進行預(yù)處理,然后對處理后的信號進行快速傅里葉變換,得到譜線能量和Mel濾波能量,將Mel濾波能量進行對數(shù)運算后進行DCT倒譜,得到MFCC特征;響度反應(yīng)了音頻能量的大小,由于音強與音高的變化都會引起響度變化,所以響度側(cè)面體現(xiàn)了這兩個因素在音頻中的影響;響度范圍即音頻中最大響度與最小響度之差;靜音幀比例指短時能量在一定閾值范圍內(nèi)的音頻幀,靜音幀比例即為其占全部音頻幀的比重。
(三)音頻數(shù)字水印的提取與解碼
利用得到的四個特征值,對其進行加密后,轉(zhuǎn)換成二進制形式,得到四個二進制序列,利用最低比特位替代法(Least Significant Bits, LSB)進行嵌入。最低比特位替代法是音頻信息隱藏中使用最廣泛最簡單的算法之一。本文的使用方法:首先對原始音頻根據(jù)時域平均提取采樣點,對其進行預(yù)處理,去除部分雜聲減少干擾;再將提取出來的特征值計算轉(zhuǎn)換得到一個標識性的二進制特征序列,即為水印內(nèi)容;之后將每個采樣點的最低的4個比特位替換成水印二進制特征序列的4位對應(yīng)二進制編碼,水印成功被嵌入。提取水印的過程采用與嵌入完全逆向的方式,找到采樣點的最低位將數(shù)據(jù)提取出來,利用密鑰進行解密,得到水印內(nèi)容。整個過程的實現(xiàn)步驟如圖1所示。
三、總結(jié)
將音頻特征生成唯一的標識序列作為水印嵌入音頻中,能夠更加有效地聲明音樂作品的唯一性,無論誰對原版音頻做了改動,特征值都不會再相同,抄襲者也無法解析篡改特征值。本文提出的生成音頻數(shù)字水印的特征只選取了主要的幾種,音頻特征還包括線性預(yù)測倒譜系數(shù)(Linear Prediction Cepstrum Coefficient)、小波系數(shù)等等,越具有標識性的音頻特征值在版權(quán)保護中的應(yīng)用越有效力。特征提取識別技術(shù)的發(fā)展對未來音樂版權(quán)的保護會有更大的應(yīng)用前景,但對于音樂版權(quán)的保護不能僅僅依賴技術(shù),更關(guān)鍵的是提高人們對音樂著作權(quán)的保護意識。國內(nèi)對于音樂作品的版權(quán)定義始終模糊,抄襲現(xiàn)象依舊層出不窮。如何發(fā)揮音頻數(shù)字水印的最大實際作用,可以基于多大的相似度對音樂抄襲定性,是研究者們需要長期努力的方向。加強對音樂版權(quán)的保護力度,加大對抄襲盜版違法行為的懲治與抵制,是眾多創(chuàng)作者的心之所向。
參考文獻
[1]高慶.用于版權(quán)保護的音頻數(shù)字水印算法研究[D].武漢理工大學(xué),2008.
[2]胡耀文.音頻信號特征提取及其分類研究[D].昆明理工大學(xué),2018.
[3]徐罡.音樂相似性研究及其在檢索系統(tǒng)中的應(yīng)用[D].電子科技大學(xué),2015.
[4]于臘梅.基于版權(quán)保護的音頻數(shù)字水印概述[J].電聲技術(shù),2019,43(02):15-17.
[5]劉丹,張乃堯,朱漢城.音樂特征識別的研究綜述[J].計算機工程與應(yīng)用,2002(24):74-77.