歐陽(yáng)督
(湖南師范大學(xué)附屬中學(xué) 410006)
淺談數(shù)字音頻指紋技術(shù)的應(yīng)用
歐陽(yáng)督
(湖南師范大學(xué)附屬中學(xué) 410006)
數(shù)字音頻指紋技術(shù)的誕生給人們的娛樂(lè)生活帶來(lái)了更多的方便,利用該種技術(shù),可以快速尋找出想要的音樂(lè)。本文主要針對(duì)數(shù)字音頻指紋技術(shù)的基本概念、產(chǎn)生背景以及具體應(yīng)用進(jìn)行分析。
數(shù)字音頻指紋技術(shù);概念;應(yīng)用
隨著計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,人們對(duì)網(wǎng)絡(luò)的運(yùn)用日益增多,網(wǎng)上也出現(xiàn)了海量的視頻、音樂(lè)等信息,在此背景下如果采用傳統(tǒng)的手工選取歌曲顯得較為吃力,此時(shí)數(shù)字音頻指紋自動(dòng)識(shí)別技術(shù)應(yīng)用而生,并且成為相關(guān)工業(yè)界相關(guān)科研研究的熱門(mén)問(wèn)題。數(shù)字音頻指紋是指一種數(shù)字簽名,它代表了某段音樂(lè)的聲學(xué)特征。本文主要介紹數(shù)字音頻技術(shù)的產(chǎn)生背景、基本概念和性質(zhì)以及它的應(yīng)用,提出了里面存在的問(wèn)題和有效措施。
1.1 數(shù)字音頻指紋技術(shù)的基本概念及產(chǎn)生背景
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,音頻壓縮技術(shù)得以完善,網(wǎng)上存儲(chǔ)了大量的音樂(lè)信息,原先采用的手工截取技術(shù)已經(jīng)不能適應(yīng)新的形式,這就使得數(shù)字音頻技術(shù)應(yīng)運(yùn)而生。音頻指紋簡(jiǎn)單地的說(shuō)就是一種數(shù)字簽名,它代表了音樂(lè)中隱含的聲學(xué)特征。此種技術(shù)的主要目的就是建立起一個(gè)對(duì)兩種音頻數(shù)據(jù)的感知質(zhì)量進(jìn)行有效比較的系統(tǒng)。這里的比較對(duì)象不是音頻數(shù)據(jù)本身,而是對(duì)數(shù)字指紋的比較。比如說(shuō)大量的音樂(lè)信息在數(shù)據(jù)庫(kù)里面存儲(chǔ)的時(shí)候,就有歌名和作者信息、歌詞等音頻數(shù)據(jù),這時(shí)指紋就可以作為截取歌曲的索引。
通常情況下音頻指紋系統(tǒng)包含聽(tīng)覺(jué)特征計(jì)算算法和搜索對(duì)比算法兩個(gè)部分。對(duì)一段音樂(lè)的具體識(shí)別過(guò)程為,首先利用指紋識(shí)別算法分析出要識(shí)別的音樂(lè)的音頻特征,然后通過(guò)提取算法和指紋對(duì)比算法在數(shù)據(jù)庫(kù)中尋找出原始的指紋,并且提取出相關(guān)信息返回給用戶(hù)。
使用音頻指紋技術(shù)進(jìn)行信息提取的好處主要體現(xiàn)在:①有效減少了對(duì)硬盤(pán)容量的要求;②能夠進(jìn)行模糊對(duì)比,受音頻信號(hào)失真影響較小;③指紋數(shù)據(jù)庫(kù)尺寸較小有利于高效搜索。
1.2 音頻檢索技術(shù)和數(shù)字水印技術(shù)的比較
在普通人的認(rèn)知中,音頻檢索技術(shù)和數(shù)字水印技術(shù)是沒(méi)有太大區(qū)別的,但是實(shí)質(zhì)上兩者的數(shù)字指紋概念有著本質(zhì)的區(qū)別。數(shù)字水印技術(shù)主要針對(duì)于盜版進(jìn)行追蹤的,每次音頻信息經(jīng)過(guò)拷貝以后,就會(huì)嵌入不同的水印,那么此項(xiàng)技術(shù)就可以有效追尋到盜版分發(fā)的源頭。而音頻檢索技術(shù)就是對(duì)于未知音頻的音頻識(shí)別技術(shù)。
1.3 音頻指紋的性質(zhì)
音頻指紋技術(shù)主要應(yīng)用在海量的音頻信息中檢索出需要的數(shù)據(jù),那么它具有以下幾個(gè)方面的特性:
準(zhǔn)確性:這一特性包括對(duì)信息檢索的正確識(shí)別率、還有檢索過(guò)程中的漏檢率以及誤檢率。
魯棒性:是指數(shù)據(jù)庫(kù)中的音頻信息遭受到了較為嚴(yán)重的信號(hào)處理以后,仍然能夠被識(shí)別出來(lái)。為了取得強(qiáng)魯棒性的特征,指紋需要具有對(duì)聽(tīng)覺(jué)重要內(nèi)容的音頻特征進(jìn)行有效提取的能力。
區(qū)分性:不同歌曲之間的指紋差異較大,但是同一歌曲的不同版本也具有較小的指紋差異,那么音頻指紋技術(shù)就應(yīng)該能夠區(qū)分這些細(xì)小的差別。
可靠性:同一首歌曲的準(zhǔn)確識(shí)別是數(shù)字音頻指紋技術(shù)的重要保障,誤檢率越小,歌曲被準(zhǔn)確識(shí)別的幾率就會(huì)越大。
2.1 音樂(lè)識(shí)別
音樂(lè)識(shí)別是數(shù)字音頻技術(shù)最初的應(yīng)用目的,也是目前應(yīng)用最為廣泛的功能之一。現(xiàn)在已經(jīng)廣泛應(yīng)用到了日常的商業(yè)產(chǎn)品當(dāng)中。如美國(guó)與荷蘭共同開(kāi)發(fā)出了手機(jī)音樂(lè)識(shí)別軟件。比如說(shuō)用戶(hù)想要知道歌曲的名字和作家信息的時(shí)候,就可以用手機(jī)撥打服務(wù)電話(huà),通過(guò)手機(jī)傳給服務(wù)器一段音樂(lè)片段,隨后服務(wù)器就把相關(guān)信息發(fā)送到用戶(hù)的手機(jī)上。此外,西班牙、英國(guó)等多個(gè)娛樂(lè)公司都利用此技術(shù)進(jìn)行此類(lèi)服務(wù)的提供。我國(guó)酷我音樂(lè)有限公司也利用此技術(shù)實(shí)現(xiàn)了歌曲的查找和匹配功能。
2.2 音頻內(nèi)容控制和跟蹤
一方面實(shí)現(xiàn)了發(fā)行端控制功能,歌曲上傳者在數(shù)據(jù)庫(kù)中搜索出音樂(lè)然后自己決定它的播放權(quán)。另一方面?zhèn)鬏斝诺赖谋O(jiān)控,通過(guò)此項(xiàng)功能發(fā)布者見(jiàn)識(shí)電視臺(tái)是否已經(jīng)支付了報(bào)仇,并且可以利用此功能進(jìn)行播放統(tǒng)計(jì),以便進(jìn)行收費(fèi)標(biāo)準(zhǔn)制定。同時(shí)廣告商也要利用此程序監(jiān)視電視臺(tái)是否按協(xié)議進(jìn)行播放了。這些需求都要求數(shù)據(jù)庫(kù)具有及時(shí)更新的功能。
2.3 增值服務(wù)
不同的用戶(hù)有著自己的性格特征,他們所要搜索的信息也不盡相同,所以元信息可以按照不同的功能進(jìn)行信息的存儲(chǔ),利用指紋技術(shù)用戶(hù)可以根據(jù)自己的需求方便快捷地查找到自己需要的信息。
總之,隨著信息社會(huì)的發(fā)展,人們對(duì)網(wǎng)絡(luò)的需求日益增加,數(shù)字音頻指紋技術(shù)有效加強(qiáng)了網(wǎng)絡(luò)中音頻信息的檢索功能,為用戶(hù)提供了很大的方便。
[1]張敏,歐陽(yáng)建權(quán),李澤洲,劉 煒.一種快速的特定音頻指紋提取方法[J].計(jì)算機(jī)工程,2010(02).
[2]劉亞多,李偉,李曉強(qiáng),汪竹蓉,馮瑞.壓縮域魯棒音樂(lè)指紋算法研究[J].電子學(xué)報(bào),2010(05).
[3]關(guān)耀鏵,申 凌,吳 云,趙 勇.音頻指紋搜索中數(shù)據(jù)預(yù)處理的改進(jìn)算法[J].計(jì)算機(jī)工程與應(yīng)用,2010(21).
[4]周亦敏,牟同鑫.采用復(fù)倒譜和子串匹配的音頻指紋算法研究[J].上海理工大學(xué)學(xué)報(bào),2010(03).
TP391.41
A
1004-7344(2016)35-0310-01
2016-11-20