高 健,劉星星,楊 珂
(上海大學 機電工程與自動化學院,上海 200072)
自適應最小能量諧波相位偏轉音頻水印算法
高 健,劉星星,楊 珂
(上海大學 機電工程與自動化學院,上海 200072)
隨著計算機網(wǎng)絡的飛速發(fā)展,多媒體音頻的傳輸越來越便利,以致音頻作品的版權保護也顯得日趨重要。針對離散余弦變換(DCT)的頻譜系數(shù)符號具有良好魯棒性的特點,文中提出了一種基于最小能量諧波相位偏轉的音頻水印算法。該算法依據(jù)音頻幅值平均值具備良好的魯棒性特點,將音頻數(shù)據(jù)根據(jù)水印長度進行分段處理,對每個數(shù)據(jù)段去絕對值的平均值進行離散余弦變換,通過偏轉最小能量諧波的相位實現(xiàn)水印信息的嵌入。為了控制水印的嵌入強度,引入了品質因子這一性能指標,將音頻文件分解為若干水印可嵌入段和水印不可嵌入段,確保水印信息的嵌入對音頻數(shù)據(jù)的改變控制在較小范圍內(nèi)。實驗結果表明,該算法不僅具有非常好的不可感知性,而且對常規(guī)信號處理操作具備較好的魯棒性。
離散余弦變換;符號;品質因子;MP3壓縮
數(shù)字水印技術是指將具有標識性的信息嵌入到圖像、音頻、視頻等載體中,但要保持載體原有的使用價值,并要盡可能避免被人類的感知系統(tǒng)察覺[1-3]。數(shù)字音頻水印技術作為保護數(shù)字音頻作品版權的重要手段,是當前學術界的一個研究熱點。對于音頻水印技術而言,近年來,研究人員提出了許多時、頻域音頻水印算法。時域算法[4-5]主要有回聲隱藏、相位編碼等;頻域算法主要有離散傅里葉變換(DFT)[6]、離散余弦變換(DCT)[7-9]、離散小波變換(DWT)[10-14]。
文獻[3]從時域角度提出了一種基于鄰域平均的魯棒水印算法,該算法同時具備良好的不可感知性和對常規(guī)信號處理操作、去同步的抖動攻擊以及隨機剪切等的抵抗能力。但該算法對整段音頻選取了相同的量化步長而非自適應的量化步長。量化步長的取值偏小或偏大分別會影響水印的抵抗攻擊能力和音頻質量。文獻[6]基于音頻DCT系數(shù)的統(tǒng)計特征,提出了一種最大似然水印檢測方法,采用擴頻方式將水印嵌入DCT域,獲取對應的高斯混合模型,再通過最大似然檢測方法,進行水印信息的判斷與提取。從檢測可靠性上說,該文獻提出的水印檢測算法比傳統(tǒng)檢測方法更高。但在檢測過程中,該方法還需通過密鑰來尋找初始的水印嵌入位置,實際應用價值不高。
文中基于音頻數(shù)據(jù)壓縮前后的DCT系數(shù)符號具有良好的魯棒性這一特性,提出了一種最小能量諧波相位偏轉的音頻水印算法。該算法依據(jù)中低頻段最小能量諧波符號改變后導致的音頻數(shù)據(jù)改動量是否在品質因子的控制范圍內(nèi)這一特性,將音頻數(shù)據(jù)段分為水印可嵌入段與水印不可嵌入段。在水印可嵌入段中通過改變最小中低頻段頻譜系數(shù)符號,實現(xiàn)最小能量諧波相位偏轉,從而完成水印信息的嵌入。由于諧波符號具有天然較好的魯棒性,文中所提出的方法對如何協(xié)調(diào)水印魯棒性和水印透明性上做出了一些有意義的探索。
一維DCT變換公式如下:
(1)
(2)
其中,k,i=1,2,…,n。
(3)
(4)
(5)
由式(5)可見,數(shù)組X=[x1,x2,…,xN]受到擾動影響后,對應的DCT頻譜系數(shù)在以下兩種情形下會發(fā)生變號:
由此可知,當數(shù)組X=[x1,x2,…,xN]的擾動量絕對值不超過其本身數(shù)值時,系數(shù)F1不會發(fā)生變號,從而說明DCT系數(shù)中直流系數(shù)的符號魯棒性很強。
F2=c2[x1a1+x2a2+…+x8a8]
此時ΔF2為最大負值(極端情形)。于是
表1給出了某一音頻文件經(jīng)MP3壓縮攻擊后8點DCT系數(shù)的變號概率表。
表1 8位DCT變換的各位置系數(shù)變號概率表
表1數(shù)據(jù)通過如下對比實驗獲得:選擇某一wav音頻文件A(碼率1 411kbps,采樣率44.1kHz),先作MP3壓縮處理,獲得MP3音頻文件B(碼率128kbps,采樣率44.1kHz),再將音頻文件B解壓為wav音頻文件C。依次計算A和C相鄰5個音頻采樣點的絕對值平均值,每8點絕對值平均值做1次DCT變換,連續(xù)做了4 000次后,得到8點DCT變號概率。取單個采樣點的絕對值進行8點DCT變換,與取5個采樣點的絕對值平均值進行8點DCT變換相比,雖然水印嵌入容量更大,但水印的魯棒性較差。由表1可知,直流分量頻譜系數(shù)的符號在壓縮攻擊后系數(shù)符號不變,中低頻系數(shù)變號概率較小,也小于高頻系數(shù)的變號概率,由此說明中低頻系數(shù)的符號具有較好的魯棒性。
2.1 品質因子
結合人類的感覺系統(tǒng)和心理學的感知機理對數(shù)字水印算法進行研究,是近年來該領域的研究熱點。對于音頻水印算法來說,由于人類的聽覺系統(tǒng)要比視覺系統(tǒng)敏銳得多,所以數(shù)字音頻水印算法對透明性的要求要比圖像水印算法高得多。一般情況下,嵌入水印的強度越大,算法的魯棒性越好,透明性越差;反之,嵌入水印的強度越小,算法的魯棒性越差,透明性越好??傊?,魯棒性和透明性之間相互矛盾。為了解決這個嚴重的矛盾關系,文中通過品質因子的引入,控制了水印嵌入強度過大的問題。
(6)
其中,0≤Q(i)<1,x≠0。
文中Q(x)按式(7)給出:
Q(i)=aebx(i)
(7)
2.2 可嵌入水印與不可嵌入水印數(shù)據(jù)段
文中算法取音頻文件相鄰5點絕對值平均值,按8點絕對值平均值做DCT變換,相鄰8點絕對值平均值稱為一個水印信息(0或1)的嵌入段。選取DCT中低頻段(第2~5個系數(shù))中絕對值最小的系數(shù),判斷該數(shù)據(jù)段是否能嵌入水印,具體做法如下:
(1)按8點位置品質因子計算各點可改動的最大量:
(2)計算DCT(x(n+1),x(n+2),…,x(n+8)),確定最小諧波系數(shù)(最小系數(shù))位置,即
(3)確定數(shù)據(jù)段是否為可嵌入水印段。
(8)
2.3 水印嵌入算法
假設原始音頻信號為A,數(shù)字水印為二值圖像,記為W,音頻水印嵌入過程如下:
步驟2:對每個數(shù)據(jù)段40個數(shù)據(jù)依次按5點計算絕對值平均值,共計8個絕對值平均值;原始音頻數(shù)據(jù)A轉化為絕對值平均值數(shù)據(jù)B,B大小為Size×Times×8。
步驟3:按照2.2節(jié)所述方法判斷各數(shù)據(jù)段是否為可嵌入水印數(shù)據(jù)段。
步驟4:若數(shù)據(jù)段為可嵌入數(shù)據(jù)段,則在DCT系數(shù)的第2~5位置中選取第二最小系數(shù)fs,其中
步驟6:水印嵌入方法。
①若該數(shù)據(jù)段嵌入水印信息“1”,且fm>0,則視為水印信息已自然嵌入。
同理,若數(shù)據(jù)段嵌入水印信息“0”,采用類似方法處理。
步驟8:按照y1,y2,…,y8的取值對數(shù)據(jù)段中的40個點進行修正,以嵌入水印信息。
2.4 水印提取算法
步驟2:對每個數(shù)據(jù)段40個數(shù)據(jù)依次按5點計算絕對值平均值,共計8個絕對值平均值;將音頻數(shù)據(jù)C轉化為絕對值平均值數(shù)據(jù)D,D大小為Size×Times×8。
步驟3:結合2.2節(jié)所述方法,判斷各數(shù)據(jù)段是否為已植入水印信息數(shù)據(jù)段。
步驟5:結合2.3節(jié)所述方法,每個水印信息(0或1)均被多次重復嵌入,提取水印時,統(tǒng)計同一水印信息提取后“1”的個數(shù)與“0”的個數(shù),如果“1”的個數(shù)大于等于“0”的個數(shù),則判定為“1”;否則為“0”。
由于水印可嵌入段和不可嵌入段完全依賴于對應的最小諧波系數(shù)的數(shù)值,而該數(shù)值的大小會因音頻數(shù)據(jù)的改動而發(fā)生一定范圍內(nèi)的改變。因此在水印提取過程中,會因為這些關鍵數(shù)值的改動而導致水印可嵌入段和不可嵌入段的誤判。為了較好地解決這個問題,文中采用多重(40重)水印嵌入的方法,按照少數(shù)服從多數(shù)的原則定義對應的水印信息。以下實驗將某音樂文件按照水印圖像大小和水印嵌入重數(shù)分為64×64×40段。
文中選取了4首不同風格的音樂文件進行實驗。其中一雙聲道音頻文件的各參數(shù)如下:采樣率為44.1kHz,比特率為16b/s,時長為280s。水印為64×64的二值圖像。實驗內(nèi)容包括:
(1)MP3壓縮:先將含水印音頻分別壓縮到320kbps,192kbps,128kbps,然后再解壓還原到wav格式文件;
(2)疊加噪聲:加入高斯白噪聲,信噪比為35dB;
(3)低通濾波:采用6級巴特沃斯低通濾波器,截止頻率為10kHz;
(4)重量化:先將音頻從16比特量化到8比特,然后再量化到16比特;
(5)重采樣:先將音頻下采樣到22.05kHz,然后再上采樣到44.1kHz[15-16]。
在水印魯棒性的客觀評估方面,采用誤碼率(BitErrorRatio,BER)和歸一化相似系數(shù)NC衡量水印的提取準確度。嵌入水印信息后,音頻的信噪比SNR為40.425 1dB。常規(guī)信號處理后水印檢測的實驗結果如表2所示。
表2 常規(guī)信號處理后水印檢測結果
從表2實驗數(shù)據(jù)可以看出,在各類攻擊下,文中算法具有較低的誤碼率和較高的相似系數(shù)。該算法對常規(guī)信號處理的攻擊具備較好的抵抗能力。另一方面,為了更直觀地評估算法的抵抗性能,還可以觀察水印提取圖像的可辨識度,如圖1所示。
圖1 原始水印圖像和水印提取圖像
結合圖1的提取水印圖像和各個攻擊類型來分析,水印的提取準確度隨MP3壓縮程度的增大有所降低,在MP3格式碼率為128kbps下,所提取的水印圖像仍可通過肉眼較清晰地辨識出水印信息。并且,從提取的水印圖像上可以看出,算法對添加白噪聲、重量化以及重采樣等攻擊均具有較好的魯棒性。
為了進一步測試算法對音頻文件聽覺質量的影響,采用了國際電信聯(lián)盟ITU推薦的BS.1116定義的主觀評價標準SDG和BS.1387音頻質量聽覺評價標準中的PEAQ測試工具對含水印音頻進行主觀和客觀的評價。文中對4首不同風格的音樂進行了SDG和PEAQ的實驗測試,結果如表3所示。
表3 SDG和PEAQ測試值
通過對表3測試數(shù)據(jù)的分析,SDG測試平均分值約為-0.500 0,平均PEAQ值約為-0.198 4,其中最小PEAQ值為-0.206 9,最大PEAQ值為-0.190 8。實驗結果表明,水印算法具備較好的不可感知性。
文中結合理論分析和對比實驗對DCT系數(shù)符號的魯棒性進行分析,驗證了中低頻段的DCT系數(shù)符號具備較好的魯棒性。通過品質因子的引入對水印嵌入強度進行了控制,從而較好地實現(xiàn)了水印信息的不可感知性。同時,利用多次重復嵌入方法,提高了提取水印的準確率。實驗結果表明,提出的水印算法對常規(guī)信號處理操作,尤其是MP3壓縮類攻擊,在保證一定的音頻質量前提下,具備較好的抵抗力。但是,在判斷可嵌入水印段和不可嵌入水印段的過程中,由于各類攻擊的影響會導致誤判,在一定程度上降低了水印提取的成功率。另一方面,文中提出的算法對數(shù)據(jù)長度較短的音頻文件可能因數(shù)據(jù)量不夠而無法完成水印嵌入。以上問題有待進一步的分析與研究。
[1] 金 聰.數(shù)字水印理論與技術[M].北京:清華大學出版社,2008:1-20.
[2] 李秀瀅,段曉毅,王建新.一種心理聲學模型的自同步音頻水印方案[J].計算機工程與應用,2013,49(8):96-99.
[3]CoxIJ,MillerMI.Thefirst50yearsofelectronicwatermarking[J].JournalofAppliedSignalProcessing,2002,2:126-132.
[4] 張金全,王宏霞,李學華.基于鄰域平均的魯棒音頻水印算法[J].鐵道學報,2012,34(7):43-48.
[5]XiangY,NatgunanathanI,PengD,etal.Adual-channeltime-spreadechomethodforaudiowatermarking[J].IEEETransactionsonInformationForensicsandSecurity,2012,7(2):383-392.
[6]SinghJ,GargP,DeA.MultiplicativewatermarkingofaudioinDFTmagnitude[J].MultimediaToolsandApplications,2014,71(3):1431-1453.
[7] 林曉丹.基于高斯混合模型的DCT域水印檢測方法[J].自動化學報,2012,38(9):1445-1448.
[8] 任克強,李 慧,謝 斌.基于DWT和DCT的自適應雙重音頻水印[J].計算機應用研究,2013,30(7):2120-2123.
[9] 凡 超,王 忠,肖留威,等.改進的DCT域音頻水印算法[J].計算機工程與設計,2011,32(4):1351-1355.
[10] Alshammas H A.Robust audio watermarking based on dynamic DWT with error correction[C]//Proceedings of ITU kaleidoscope:building sustainable communities.[s.l.]:IEEE,2013:1-6.
[11] 劉 芳,李學斌.一種基于混沌與DWT的數(shù)字音頻水印算法[J].微計算機信息,2011,27(1):193-194.
[12] 黃雄華,蔣偉貞,王宏霞,等.基于比值的小波域數(shù)字音頻盲水印算法[J].鐵道學報,2011,33(5):66-71.
[13] 馬德洋,盧 忱,范九倫.一種均勻量化小波能量的盲提取音頻水印算法[J].微電子學與計算機,2013,30(3):43-46.
[14] 王向陽,牛盼盼.基于音頻統(tǒng)計特性的數(shù)字水印嵌入算法[J].自動化學報,2008,34(8):1001-1003.
[15] 韓紀慶.音頻信息處理技術[M].北京:清華大學出版社,2007.
[16] 程佩青.數(shù)字信號處理教程[M].北京:清華大學出版社,2007:69-77.
An Adaptive Audio Watermarking Algorithm Based on Minimum Energy of Harmonic Phase Deflection
GAO Jian,LIU Xing-xing,YANG Ke
(School of Mechatronic Engineering and Automation,Shanghai University,Shanghai 200072,China)
With the rapid development of computer network,the transportation of multi-media audio is becoming more and more convenient,which makes the right protection of audio works more important.For the symbol of spectral coefficients has robustness for spectral coefficients Discrete Cosine Transform (DCT),the novel audio watermarking algorithm based on the minimum energy-harmonic phase deflection has been proposed.Based on audio amplitude average with good robustness characteristics,the audio data is segmented according to the length of the watermarking,and average value out of absolute value for each data segment is carried on DCT,implementation of the embedding of watermarking through deflection of phase for minimum energy harmonic.In order to control the strength of the embedding watermarking,the algorithm uses the quality factor as a performance index.Audio files are divided into several watermark embedding segments and watermark segments cannot be embedded.This object is to ensure that the embedded watermark information has a little effect on audio data.The experimental results show that the proposed algorithm has a good performance in terms of imperceptibility,and also has a high robustness for the conventional signal processing operations.
discrete cosine transform;symbol;quality factor;MP3 compression
2015-07-05
2015-10-16
時間:2016-03-22
國家自然科學基金青年基金(71201097)
高 健(1961-),男,副教授,博士,研究方向為音頻水印、圖像編碼;劉星星(1990-),女,碩士研究生,研究方向為音頻水印。
http://www.cnki.net/kcms/detail/61.1450.TP.20160322.1519.054.html
TP309
A
1673-629X(2016)05-0110-05
10.3969/j.issn.1673-629X.2016.05.023