吳德陽(yáng),胡森,王苗苗,金海波,曲長(zhǎng)波,唐勇
(1.燕山大學(xué)信息科學(xué)與工程學(xué)院,河北 秦皇島 066004;2.遼寧工程技術(shù)大學(xué)軟件學(xué)院,遼寧 葫蘆島 125105)
隨著信息時(shí)代的發(fā)展,各種形式的數(shù)字作品在網(wǎng)絡(luò)中可以輕易獲取,同時(shí)也出現(xiàn)了數(shù)字內(nèi)容版權(quán)保護(hù)問(wèn)題[1]。數(shù)字水印技術(shù)可以通過(guò)將水印信息嵌入載體實(shí)現(xiàn)版權(quán)保護(hù),在近些年受到了廣泛關(guān)注。在圖像中嵌入信息會(huì)不可避免地對(duì)圖像質(zhì)量產(chǎn)生影響,而且存在穩(wěn)健性和不可見(jiàn)性的矛盾,零水印[2]的提出解決了這個(gè)問(wèn)題,從圖像中提取具有唯一性和穩(wěn)健性的特征序列,與版權(quán)標(biāo)識(shí)建立聯(lián)系后作為零水印保存至認(rèn)證中心,完成圖像版權(quán)的注冊(cè)。零水印生成的過(guò)程主要可分為2 個(gè)部分:圖像特征提取及特征與版權(quán)建立聯(lián)系(如特征與水印異或生成零水?。?。零水印算法的穩(wěn)健性、運(yùn)行效率和虛警率等評(píng)價(jià)指標(biāo),主要受圖像特征提取部分的影響;從圖像提取特征后,與版權(quán)標(biāo)識(shí)建立聯(lián)系生成零水印,在版權(quán)認(rèn)證過(guò)程中,可由零水印和圖像特征得到版權(quán)標(biāo)識(shí),實(shí)現(xiàn)版權(quán)可視化;在零水印的生成過(guò)程中,通常需要加入加密算法,以提升零水印的安全性。
在目前的圖像零水印研究中,圖像特征提取的方法主要可分為以下幾種?;谧儞Q域特征,如雙樹(shù)復(fù)小波變換(DTCWT,dual-tree complex wavelet transform)[3-4]、輪廓波變換(CT,contourlet transform)[5]、非亞采樣輪廓波變換[6]、曲波變換(CT,curvelet transform)[7]、尺度不變特征變換(SIFT,scale invariant feature transform)[8]、Gabor 變換[9]、平移不變剪切波變換(SIST,shift-invariant shearlet transform)[10]、元胞自動(dòng)機(jī)變換(CAT,cellular automata transform)[11]等,在得到穩(wěn)定系數(shù)后,可直接將其構(gòu)造為圖像特征,或進(jìn)一步對(duì)系數(shù)進(jìn)行離散余弦變換(DCT,discrete cosine transform)[3-5,8-10,12]、奇異值分解(SVD,singular value decomposition)[9-10,12]、改進(jìn)奇異值分解[7,13]等操作提取其主要能量用于構(gòu)造特征。基于空域特征,使用極諧變換計(jì)算圖像的不變矩特征,如極諧變換(PHT,polar harmonic transform)[14-15]、小數(shù)階極諧變換(DoPHT,decimal-order polar harmonic transform)[16]、四元數(shù)極諧變換(QPHT,quaternion polar harmonic transform)[17-18]、四元數(shù)徑向分?jǐn)?shù)Charlier 矩(QRFrCM,quaternion radial fractional Charlier moment)[18]、四元數(shù)極諧傅里葉矩(QPHFM,quaternion polar harmonic Fourier moment)[19-20]等,直接從空域提取特征,將子塊均值和整體均值穩(wěn)定關(guān)系構(gòu)造成圖像特征[21-22],構(gòu)建神經(jīng)網(wǎng)絡(luò)模型提取圖像穩(wěn)健特征[23]。在上述的零水印研究中,大多關(guān)注于提升圖像特征的穩(wěn)定性,具有較好穩(wěn)健性,但當(dāng)需要保護(hù)的圖像數(shù)量較多或圖像相似度較高時(shí),會(huì)出現(xiàn)虛警問(wèn)題,受攻擊圖像的零水印與虛警圖像的零水印區(qū)分度較低,將未受保護(hù)的圖像誤判成已保護(hù)的圖像。
在現(xiàn)有的低虛警零水印研究中,多從特征提取的角度解決相似圖像的虛警問(wèn)題,從圖像中提取具有穩(wěn)健性和較高唯一性的特征,用于生成零水印。文獻(xiàn)[14]研究了醫(yī)學(xué)圖像零水印的相似區(qū)分問(wèn)題,利用同階幅值和同重復(fù)幅值關(guān)系的穩(wěn)定性構(gòu)建特征,為所有幅值指定了多個(gè)參考值,將數(shù)值大小關(guān)系構(gòu)造成二值矩陣,以降低相似圖像特征的相似性。在10 幅醫(yī)學(xué)圖像的虛警實(shí)驗(yàn)中,平均誤碼率(BER,bit error ratio)和最小誤碼率分別為0.363 1和0.262 9。文獻(xiàn)[15]計(jì)算圖像的3 個(gè)極諧變換矩,分別是PCET(polar complex exponential transformation)、PCT(polar cosine transform)和PST(polar sine transform),選擇不重復(fù)幅值構(gòu)造特征序列,根據(jù)特征序列相鄰數(shù)值之間的大小關(guān)系構(gòu)建二值特征,用于生成零水印,在相似度較高的自然圖像進(jìn)行虛警測(cè)試,相似圖像生成的零水印的誤碼率在0.5左右。文獻(xiàn)[24]將圖像分成多個(gè)同心圓環(huán)區(qū)域,并計(jì)算每一區(qū)域的均值、方差、偏度、峰度信息殘差特征,二值化之后將區(qū)域內(nèi)的4 種特征構(gòu)造成一個(gè)區(qū)域的特征,在相似圖像虛警測(cè)試中,誤碼率的平均值和最小值分別為0.4 左右和0.2 左右。文獻(xiàn)[25]首先利用完備局部二值模式(CLBP,completed local binary pattern)構(gòu)造3 幅CLBP 符號(hào)圖和3 幅CLBP幅值圖,將其劃分成多個(gè)同心圓環(huán)區(qū)域,并計(jì)算區(qū)域的均值、方差、偏度、峰度,二值化之后作為圖像特征,在相似圖像虛警測(cè)試中,誤碼率的平均值和最小值分別為0.463 6 和0.111 1。文獻(xiàn)[26]研究了眼底醫(yī)學(xué)圖像零水印的相似區(qū)分問(wèn)題,將眼底醫(yī)學(xué)圖像的圓形區(qū)域分成多個(gè)扇形子塊,計(jì)算相鄰子塊之間的差值,量化成四值特征向量作為圖像特征,同時(shí)建立特征庫(kù),在版權(quán)認(rèn)證時(shí),先在特征庫(kù)中進(jìn)行相似度檢索,以區(qū)分受保護(hù)圖像和未受保護(hù)圖像。文獻(xiàn)[14-15,24-26]分別從矩特征和圓環(huán)分塊特征構(gòu)造的角度,解決相似圖像零水印的虛警問(wèn)題,雖然可使不同圖像的零水印具有一定的區(qū)分度,但均是針對(duì)固定的特征提取算法和圖像類(lèi)型,可擴(kuò)展性較差,在不同圖像零水印區(qū)分度方面仍有可提升空間。
在上述研究的基礎(chǔ)上,為提升不同圖像零水印的可區(qū)分性,提出了一種基于區(qū)域異或和三值量化的高分辨零水印算法。從圖像中提取出2 種特征,通過(guò)冗余構(gòu)造特征、特征索引分區(qū)域異或等操作,將2 種特征共同構(gòu)造成零水??;通過(guò)水印冗余構(gòu)造、去冗余三值量化等操作,在版權(quán)認(rèn)證階段擴(kuò)大相似特征之間的差異,使受保護(hù)圖像與虛警圖像的零水印具有較高的區(qū)分度,以解決圖像零水印的虛警問(wèn)題。本文的主要貢獻(xiàn)如下。
1) 分析了零水印虛警問(wèn)題的發(fā)生原因,指出了不相似圖像之間也可能發(fā)生虛警問(wèn)題,并提出解決圖像零水印虛警問(wèn)題的方法。
2) 提出了一種分區(qū)域異或算法,將圖像的2 種特征融合構(gòu)造成零水印,避免由某一特征唯一性不足導(dǎo)致不同圖像的特征相似度過(guò)高。
3) 提出了冗余構(gòu)造和三值量化算法,通過(guò)控制量化閾值,擴(kuò)大表現(xiàn)不同圖像之間的特征差異。
通常在基于圖像特征提取的零水印算法中,從圖像中提取穩(wěn)健特征代表一幅圖像,當(dāng)2 幅圖像的特征相似度較高時(shí),生成的零水印也會(huì)相似,可使用一幅圖像從另一幅圖像生成的零水印中提取出可識(shí)別的版權(quán)信息,將未受版權(quán)保護(hù)的圖像認(rèn)定為已受保護(hù)的圖像,導(dǎo)致虛警問(wèn)題。該類(lèi)問(wèn)題主要是由特征的唯一性不足引起的,根據(jù)載體圖像是否相似,可將其分為以下2 種。1) 相似圖像之間的虛警問(wèn)題:從圖像中提取的特征往往可以表現(xiàn)圖像的特點(diǎn),當(dāng)2 幅圖像相似,并且使用同一特征提取算法提取特征時(shí),容易使2 幅圖像特征相似度較高,從而導(dǎo)致虛警問(wèn)題。2) 不相似圖像之間的虛警問(wèn)題:在零水印算法中,通常從灰度或彩色圖像中提取出較短的二值序列作為特征,因此二值特征的多樣性必定遠(yuǎn)小于原始圖像的多樣性。隨著圖像數(shù)量的增大,可能會(huì)出現(xiàn)視覺(jué)效果相差較明顯,但特征相似度較高的圖像,引發(fā)虛警問(wèn)題。
對(duì)于第一種由相似圖像引發(fā)的虛警問(wèn)題,如圖1所示,為一組較相似的頭部CT 圖像,提取頻域特征[3]和空域特征[22],對(duì)比特征相似度,使用BER 作為相似度度量。表1 和表2 分別為相似圖像的頻域和空域特征的相似度,不同圖像的最低誤碼率分別為0.031 3 和0.092 8,而通常誤碼率在0.5 左右時(shí),區(qū)分度較好,因此傳統(tǒng)特征提取算法從相似圖像中提取出的特征相似度較高,會(huì)引發(fā)虛警問(wèn)題。
圖1 較相似的頭部CT 圖像
表1 相似圖像頻域特征相似度(BER)
表2 相似圖像空域特征相似度(BER)
對(duì)于第二種情況引發(fā)的虛警問(wèn)題,選取Intel 圖像分類(lèi)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),該數(shù)據(jù)集中共有14 034 幅彩色圖像,圖像內(nèi)容分成了6 個(gè)類(lèi)別,多數(shù)圖像之間差異較明顯,也存在少量的重復(fù)圖像和相似圖像。從圖像中提取空域和頻域特征,分別表現(xiàn)為32×32 和32×1的二值矩陣,使用誤碼率度量數(shù)據(jù)集中所有圖像二值特征的相似度,如圖2 所示。
圖2(a)和圖2(b)分別為不同圖像之間頻域特征和空域特征的誤碼率,不同圖像特征之間的誤碼率大多集中在0.45 左右,雖然提取的特征具有一定的唯一性,但仍然存在誤碼率較小的情況。即隨著圖像數(shù)量的增大,可能出現(xiàn)原始圖像不相似,而提取到的特征相似度較高的情況,引發(fā)虛警問(wèn)題。
圖2 不同圖像特征誤碼率
圖3 和圖4 分別為頻域特征和空域特征相似圖像,其中,頻域特征和空域特征相似圖像對(duì)應(yīng)相似特征的誤碼率均小于0.1,但每一組圖像從視覺(jué)上均具有較高的辨識(shí)度,說(shuō)明不相似圖像之間也可能存在虛警問(wèn)題。同時(shí),由于空域特征和頻域特征具有不同的特點(diǎn),如表3 所示,當(dāng)一種特征誤碼率較高時(shí),另一種特征誤碼率一般較低。
圖3 頻域特征相似圖像
圖4 空域特征相似圖像
表3 不相似圖像特征誤碼率
零水印算法需從圖像中提取特征構(gòu)造零水印,當(dāng)不同圖像的特征相似度較高時(shí),會(huì)引發(fā)虛警問(wèn)題,因此可通過(guò)擴(kuò)大不同圖像特征差異,避免虛警問(wèn)題。本文提出了冗余構(gòu)造特征、冗余構(gòu)造水印、三值量化、特征索引分區(qū)域異或等操作,擴(kuò)大相似圖像之間的特征差異,從而解決零水印虛警問(wèn)題。
1.2.1特征索引的區(qū)域異或
為提高零水印算法的安全性、降低零水印算法虛警率、使版權(quán)信息可視化表示,提出了一種特征索引的區(qū)域異或算法。從圖像中提取特征,表示成二值序列,重構(gòu)成大小為M×N的二值矩陣F′FEA,同時(shí)將二值水印Mw冗余構(gòu)造成大小為M×N的水印Mww,根據(jù)矩陣F′FEA中數(shù)值選擇水印Mww中像素與2 個(gè)二值矩陣M1、M2異或,得到零水印Z,如式(1)所示。
在版權(quán)認(rèn)證過(guò)程中,從圖像中提取出大小為M×N的矩陣F′′FEA,根據(jù)矩陣F′′FEA中數(shù)值選擇零水印Z中像素與2 個(gè)二值矩陣M1、M2異或,得到版權(quán)認(rèn)證圖像M′ww,如式(2)所示。
其中,i∈ {1,2,3,…,M}、j∈ {1,2,3,…,N}為矩陣中元素位置索引,M1和M2均為M×N的隨機(jī)生成的二值矩陣,當(dāng)使用引發(fā)虛警的特征相似的圖像進(jìn)行版權(quán)認(rèn)證時(shí),從虛警圖像中提取出與矩陣F′FEA具有較高相似度的特征矩陣F′′FEA,矩陣F′′FEA由矩陣F′FEA修改部分元素得到。特征矩陣的差異矩陣DF和差異率df,以及隨機(jī)矩陣的差異矩陣DM如式(3)~式(5)所示。
其中,DF和DM為二值矩陣,分別表示特征差異和隨機(jī)矩陣的差異,當(dāng)DF和DM中的某一點(diǎn)為0 時(shí),表明在該點(diǎn)處不存在差異;當(dāng)DF和DM中的某一點(diǎn)為1 時(shí),表明在該點(diǎn)處存在差異。在式(2)的版權(quán)認(rèn)證過(guò)程中,當(dāng)DM(i,j)=0時(shí),即M1(i,j)=M2(i,j),滿(mǎn)足Z(i,j)⊕M1(i,j)=Z(i,j)⊕M2(i,j),此時(shí)無(wú)論DF(i,j)的取值為0或1,均滿(mǎn)足Mww(i,j)=M′ww(i,j);當(dāng)DM(i,j)=1時(shí),即M1(i,j)≠M(fèi)2(i,j),此時(shí)若DF(i,j)=1,則Mww(i,j)≠M(fèi)′ww(i,j),若DF(i,j)=0,則Mww(i,j)=M′ww(i,j)。因此只有當(dāng)DF(i,j)和DM(i,j)均為1 時(shí),版權(quán)認(rèn)證得到的M′ww(i,j)會(huì)出現(xiàn)錯(cuò)誤,由于M1和M2為隨機(jī)二值矩陣,因此矩陣中數(shù)值不相同的概率為P(DM(i,j)=1)=0.5;F′FEA和F′′FEA分別為零水印構(gòu)造和版權(quán)認(rèn)證過(guò)程中所用到的圖像特征,二者之間差異可由誤碼率μ表示,因此矩陣中數(shù)值不同的概率為P(DF(i,j)=1)=μ。
當(dāng)M1和M2為隨機(jī)二值矩陣時(shí),特征索引分區(qū)域異或后,版權(quán)認(rèn)證水印M′ww中數(shù)值錯(cuò)誤的概率為P(DM(i,j)=1)P(DF(i,j)=1)=0.5μ,即版權(quán)認(rèn)證水印的誤碼率約為0.5μ。
不同的特征提取算法往往具有不同的特點(diǎn),如表3 所示,當(dāng)2 幅圖像的某一種特征相似度較高時(shí),使用另一種特征提取算法提取到的特征相似度往往較低,可據(jù)此解決不相似圖像的虛警問(wèn)題。使用圖像特征代替隨機(jī)二值矩陣M1,以降低零水印算法的虛警率;使用由密鑰生成的混沌二值矩陣代替M2,以提升零水印算法安全性。此時(shí)零水印構(gòu)造和版權(quán)認(rèn)證過(guò)程如式(6)和式(7)所示。
其中,Z為零水印,Mww為冗余水印,F(xiàn)′FEA和F′′FEA分別為零水印構(gòu)造和版權(quán)認(rèn)證過(guò)程中的圖像特征,分別為零水印構(gòu)造和版權(quán)認(rèn)證過(guò)程中所用到的另一種特征,為混沌二值矩陣,M′ww為版權(quán)認(rèn)證后得到的冗余水印。
1.2.2冗余水印與三值量化
將大小為m3m4的二值水印Mw冗余構(gòu)造成m3m4R′的冗余二值水印MRw,在冗余水印MRw中修改隨機(jī)位置的二值數(shù)據(jù),以模擬版權(quán)認(rèn)證過(guò)程后得到的結(jié)果,修改數(shù)量為βm3m4R′,其中β∈ [0,1]表示冗余水印MRw在版權(quán)認(rèn)證后被修改的程度,矩陣MRw中每一個(gè)比特被修改的概率為
其中,R′為冗余構(gòu)造水印的冗余度,α∈ [0,1]為三值量化參數(shù),αR′和(1-α)R′為量化閾值。矩陣M′w中,令每個(gè)數(shù)值的改變量為即
由式(12)可得
圖5 數(shù)值分布
使用二值水印圖像的零水印算法在版權(quán)認(rèn)證后,通常得到的是二值認(rèn)證圖像,當(dāng)二值圖像發(fā)生錯(cuò)誤時(shí),表現(xiàn)為數(shù)值0 和1的互換。在本文提出的三值量化中,三值矩陣中的數(shù)值0 和1 主要來(lái)自水印圖像Mw,用于表示版權(quán)信息,矩陣中的0.5 表現(xiàn)為圖像中的灰色像素點(diǎn),主要用于遮蔽版權(quán)信息。當(dāng)三值圖像中灰色點(diǎn)較少時(shí),圖像主要表示原本的版權(quán)信息;當(dāng)三值圖像中灰色點(diǎn)較多時(shí),圖像主要信息被灰色替代,無(wú)法識(shí)別出版權(quán)信息。圖6 為三值圖像中存在不同數(shù)量的灰色像素時(shí)對(duì)應(yīng)的版權(quán)圖像。
圖6 三值圖像中存在不同數(shù)量的灰色像素時(shí)對(duì)應(yīng)的版權(quán)圖像
由于版權(quán)認(rèn)證結(jié)果為三值矩陣,其中數(shù)值0和1 難以出現(xiàn)錯(cuò)誤,量化過(guò)程引入的數(shù)值0.5 為原二值水印中不存在的數(shù)值,因此三值圖像中灰色像素點(diǎn)的數(shù)量越多,版權(quán)信息受到的影響越大。為測(cè)量三值矩陣與版權(quán)信息之間的差異,可通過(guò)誤碼率參數(shù)計(jì)算,如式(14)所示。
在零水印構(gòu)造中,首先從圖像中提取頻域特征和空域特征,再將空域特征、頻域特征和版權(quán)水印冗余構(gòu)造成大小為128 ×128的矩陣,以頻域特征為索引矩陣,用于挑選版權(quán)水印的像素點(diǎn),分別與空域特征和密鑰矩陣異或,得到零水印。
從圖像中提取空域特征[22],將大小為512 ×512 ×3的彩色圖像的亮度分量不重疊分塊,為增加特征穩(wěn)定性,令每個(gè)子塊大小為16 ×16,根據(jù)子塊均值和亮度分量整體均值的大小關(guān)系構(gòu)建特征,得到大小為32 ×32的空域特征SPf。再使用離散余弦變換(DCT,discrete cosine transform)提取圖像的頻域特征[3],將彩色圖像特征降維提取亮度分量,每個(gè)子塊的大小為2 ×2,計(jì)算子塊均值構(gòu)建成大小為256 ×256的矩陣,進(jìn)行DCT,將低頻系數(shù)的正負(fù)性構(gòu)建成圖像頻域特征。
圖像空域特征和頻域特征提取過(guò)程如圖7 所示。為使特征更加穩(wěn)定,在低頻系數(shù)中,除直流系數(shù)、與直流系數(shù)相鄰的交流系數(shù)以外,選擇16 個(gè)系數(shù),根據(jù)其正負(fù)性二值生成16 bit的二值序列,再以一倍冗余構(gòu)造成32 bit 二值序列FRf作為頻域特征。
圖7 圖像特征提取
將大小為32 × 32的空域特征fSP冗余構(gòu)造成大小為128×128的特征FSP,根據(jù)32 bit 頻域特征序列fFR冗余構(gòu)造FFR,構(gòu)造方法為
其中,cmn為構(gòu)造FSP的子塊,m∈ {1,2,3,4}、n∈ {1,2,3,4},由16 個(gè)cmn共同組成大小為128 ×128的特征矩陣FSP;ck為構(gòu)造FFR的子塊,k∈{1,2,3,…,32},每個(gè)子塊大小為128×4,i∈ {1,2,3,…,128}、j∈ {1,2,3,4}為ck內(nèi)部元素的下標(biāo)索引,由32 個(gè)ck共同組成大小為128 ×128的特征矩陣FFR。同時(shí)將32 × 32的版權(quán)標(biāo)識(shí)w不重疊分塊,子塊大小為生成大小為(4p) ×(4p)的混沌矩陣L,將其中數(shù)值量化成pq種,每種數(shù)值的數(shù)量相同,保存為子塊排列方式密鑰K1,根據(jù)式(19)和式(20)的方法,將子塊冗余排布。
其中,p和q為子塊排布位置索引,i∈ {1,2,3,…,4p}、j∈ {1,2,3,…,4q},冗余構(gòu)造的W矩陣由bpq組成,總大小為128 ×128的冗余版權(quán)標(biāo)識(shí)W。
空域特征和頻域特征的冗余構(gòu)造過(guò)程如圖8(a)和圖8(b)所示,令p=2、q=2,冗余構(gòu)造版權(quán)水印步驟及得到的結(jié)果如圖8(c)所示。
圖8 冗余構(gòu)造過(guò)程
將冗余構(gòu)造后的頻域特征FFR作為索引矩陣,將冗余版權(quán)標(biāo)識(shí)W分割成2 個(gè)區(qū)域,分別與冗余構(gòu)造的空域特征FSP和隨機(jī)生成的二值矩陣密鑰K2異或,得到零水印Z,如式(21)所示。
其中,i∈ {1,2,3,…,128}、j∈ {1,2,3,…,128}為像素位置索引。特征索引區(qū)域異或流程如圖9 所示。
圖9 特征索引區(qū)域異或流程
版權(quán)水印提取過(guò)程和零水印生成過(guò)程相似,使用相同的方法從圖像提取特征并冗余構(gòu)造,由冗余圖像特征和零水印提取出冗余構(gòu)造的版權(quán)水印,將其去冗余化,使用三值量化得到認(rèn)證結(jié)果。
使用2.1節(jié)方法提取特征,2.2節(jié)方法冗余構(gòu)造。從需要認(rèn)證版權(quán)的圖像中提取大小為128 ×128的空域特征F′SP和頻域特征F′FR,根據(jù)頻域特征挑選零水印Z中的像素點(diǎn),分別與空域特征F′SP和密鑰K2異或,得到冗余版權(quán)水印W′,如式(22)所示。
其中,i∈{1,2,3,…,128}、j∈ {1,2,3,…,128}為矩陣內(nèi)元素索引。冗余版權(quán)水印提取過(guò)程如圖10 所示,從攻擊后的圖像中提取冗余的頻域特征F′FR和空域特征F′SP,然后根據(jù)零水印信息得到冗余版權(quán)水印W′。
圖10 冗余版權(quán)水印提取過(guò)程
劃分冗余版權(quán)水印W′為不重疊的子塊,子塊大小與2.2 節(jié)中一致,為,將子塊標(biāo)記為,其中m∈{ 1,2,3,…,4p}、n∈{1,2,3,…,4q},根據(jù)排布方式密鑰K1去冗余化,如式(23)所示。
其中,m∈ {1,2,3,…,4p}、n∈ {1,2,3,…,4q}為子塊位置索引,a11,a12,…,apq是大小為、初值為0的矩陣,將全部的經(jīng)過(guò)式(23)和式(24)的運(yùn)算后得到大小為32 ×32 水印w′。
其中,w′中每個(gè)像素點(diǎn)的數(shù)值范圍為0~16。根據(jù)式(25),將水印w′量化成只有3 個(gè)數(shù)值的矩陣wfinal,3 個(gè)數(shù)值為{0,0.5,1},將wfinal作為最終提取結(jié)果,完成版權(quán)認(rèn)證。
其中,i∈ {1,2,3,…,32}、j∈ {1,2,3,…,32}為wfinal內(nèi)像素索引,s1和s2為2 個(gè)量化閾值即s1=αR′、s2=(1-α)R′,滿(mǎn)足 0≤s1≤s2≤ 16,α為三值量化參數(shù),R′為版權(quán)水印冗余度。當(dāng)量化閾值為s1=1、s2=15時(shí),圖11 為冗余版權(quán)水印W′經(jīng)過(guò)去冗余三值量化后得到最終三值矩陣wfinal的過(guò)程。
圖11 去冗余三值量化
為驗(yàn)證本文低虛警零水印方案的有效性,從眼底醫(yī)學(xué)圖像、頭部醫(yī)學(xué)圖像、肺部CT 圖像、USC-SIPI 圖像、Intel 圖像分類(lèi)等數(shù)據(jù)集中選取部分彩色圖像進(jìn)行實(shí)驗(yàn),并與零水印方案[8,12,14-16]進(jìn)行對(duì)比,對(duì)比數(shù)據(jù)均通過(guò)對(duì)文獻(xiàn)中零水印方案復(fù)現(xiàn)得到。復(fù)現(xiàn)文獻(xiàn)[14]所設(shè)定的最大階數(shù)為5;復(fù)現(xiàn)文獻(xiàn)[15]中3 種極諧變換最大階數(shù)均為18;復(fù)現(xiàn)文獻(xiàn)[16]使用原文推薦參數(shù),將得到的3 個(gè)零水印相互異或,組成一個(gè)零水印進(jìn)行實(shí)驗(yàn)。
所有對(duì)比實(shí)驗(yàn)均以512 ×512 ×3 大小的彩色圖像和32 ×32的二值水印進(jìn)行實(shí)驗(yàn),在MATLAB 2015b 軟件平臺(tái)下進(jìn)行實(shí)驗(yàn)。以誤碼率為相似度度量標(biāo)準(zhǔn),其中本文算法進(jìn)行了三值量化,使用式(14)計(jì)算三值圖像與二值圖像的誤碼率參數(shù)。為便于與其他文獻(xiàn)對(duì)比,將三值認(rèn)證圖像量化成二值圖像(將三值圖像中的0.5 置0)計(jì)算誤碼率。
將冗余水印進(jìn)行多值量化,引入除0 和1 以外的數(shù)值遮蔽原始二值信息,測(cè)試三值、四值和五值量化的3 種量化方式,以表現(xiàn)不同量化方法對(duì)量化后版權(quán)圖像的影響。三值量化方式如式(11)所示,四值和五值的量化方式如下:在三值量化的基礎(chǔ)上,以參數(shù)α量化出數(shù)值0 和1,將剩余數(shù)值按照其數(shù)值范圍等分區(qū)間,進(jìn)一步量化成{0.33,0.66}和{0.25,0.5,0.75}。量化過(guò)程對(duì)二值信息的遮蔽程度由冗余水印被修改程度β和三值量化參數(shù)α確定。在冗余度R′=16的條件下進(jìn)行實(shí)驗(yàn),對(duì)比不同量化方式的結(jié)果,如表4 所示。
表4 中,當(dāng)β為0.1 和0.3 時(shí),可由量化參數(shù)α控制三值量化的結(jié)果是否顯示出版權(quán)信息,而對(duì)于四值和五值量化,不同α的量化結(jié)果均顯示出了版權(quán)信息,表明當(dāng)冗余水印被修改程度較小時(shí),四值和五值量化無(wú)法避免虛警問(wèn)題。
表4 不同量化方式的量化結(jié)果
由1.2.2 節(jié)中的結(jié)論可知,三值量化參數(shù)α需要根據(jù)參數(shù)β調(diào)試,以達(dá)到區(qū)分虛警圖像和抵抗攻擊的目的。對(duì)引發(fā)虛警問(wèn)題的圖1、圖3、圖4 中的圖像進(jìn)行測(cè)試,對(duì)每一組虛警圖像生成零水印并進(jìn)行版權(quán)認(rèn)證,提取到冗余水印后,計(jì)算2 幅圖像的誤碼率,冗余度參數(shù)R′=16。計(jì)算得到的冗余水印誤碼率即參數(shù)β,在三值量化參數(shù)α不變的情況下,冗余版權(quán)水印差異β越大,得到的三值認(rèn)證圖像與正確水印的差異也越大,因此,為避免虛警問(wèn)題,當(dāng)β較小時(shí),應(yīng)使得到的三值量化矩陣與正確水印具有較大差異。
經(jīng)過(guò)測(cè)試,最小的冗余版權(quán)水印的差異參數(shù)β=0.0776,為解決虛警問(wèn)題,應(yīng)使參數(shù)α< 0.077 6,選擇α=0.062 5進(jìn)行后續(xù)實(shí)驗(yàn)。
在虛警測(cè)試中,先將一幅圖像生成零水印,再使用與其特征相似的虛警圖像進(jìn)行版權(quán)認(rèn)證。選用的圖像均易導(dǎo)致特征相似,從而引發(fā)虛警問(wèn)題。
4.2.1不相似圖像的虛警測(cè)試
對(duì)于不相似圖像虛警問(wèn)題,選用圖3、圖4 中可引發(fā)傳統(tǒng)零水印算法[3,22]虛警問(wèn)題的圖像進(jìn)行實(shí)驗(yàn),主要用于測(cè)試本文提出的方案能否解決原有的虛警問(wèn)題,實(shí)驗(yàn)及對(duì)比結(jié)果如表5 和表6 所示。
表5 和表6 分別為圖3 和圖4的虛警測(cè)試結(jié)果。文獻(xiàn)[8,14-16]是基于圖像不變矩特征和SIFT 特征點(diǎn)的零水印算法,提取的特征與空域特征[22]、頻域特征[3]具有較大差異,因此均不存在嚴(yán)重的虛警問(wèn)題。文獻(xiàn)[12]將彩色圖像構(gòu)造成張量并展開(kāi)后,根據(jù)子塊均值和整體均值之間的穩(wěn)定關(guān)系構(gòu)造特征,因此與空域特征提取算法[22]具有一定的相似度。同時(shí),由于其將版權(quán)標(biāo)識(shí)冗余構(gòu)造,導(dǎo)致提取結(jié)果的虛警程度進(jìn)一步上升,出現(xiàn)了較嚴(yán)重的虛警問(wèn)題。本文算法同時(shí)提取了圖像的空域特征和頻域特征,當(dāng)某一種特征相似度較高時(shí),可由另一種特征擴(kuò)大生成零水印的差異,并通過(guò)三值量化操作將差異擴(kuò)大顯示,解決虛警問(wèn)題。
表5 頻域特征相似圖像虛警測(cè)試
表6 空域特征相似圖像虛警測(cè)試
4.2.2相似圖像的虛警測(cè)試
對(duì)于相似圖像的虛警問(wèn)題,不同類(lèi)型的相似圖像具有不同的特點(diǎn),如醫(yī)學(xué)圖像往往表現(xiàn)為細(xì)節(jié)上的微弱差異,自然圖像和遙感圖像往往表現(xiàn)為拍攝視角的變化和對(duì)象狀態(tài)的變化等。使用多種類(lèi)型的相似圖像進(jìn)行虛警測(cè)試,以驗(yàn)證本文算法對(duì)相似圖像零水印的分辨性,并與其他文獻(xiàn)對(duì)比。選取如圖12所示的相似圖像進(jìn)行虛警測(cè)試,測(cè)試結(jié)果如表7所示。
表7 相似圖像虛警測(cè)試結(jié)果
圖12 多組不同類(lèi)型的相似圖像
文獻(xiàn)[8]將SIFT 特征點(diǎn)描述子構(gòu)建成矩陣提取特征,當(dāng)檢測(cè)的特征點(diǎn)發(fā)生變化時(shí),會(huì)使特征發(fā)生較大變化,因此在圖12(e)、圖12(f)的拍攝視角變化圖中,出現(xiàn)了一定程度的虛警問(wèn)題。文獻(xiàn)[12]主要根據(jù)子塊均值與整體均值構(gòu)建特征,并將版權(quán)水印冗余構(gòu)造,導(dǎo)致在多種相似圖像之間均存在虛警問(wèn)題。文獻(xiàn)[14,16]中,由于矩特征對(duì)視角和結(jié)構(gòu)的變化敏感,對(duì)圖像細(xì)節(jié)不敏感,因此在圖12(a)中,相似圖像的虛警程度較高。文獻(xiàn)[15]從圖像中提取3 種PHT 矩,挑選矩系數(shù)構(gòu)造特征,由于計(jì)算的3 種矩特征具有一定的差異,因此在虛警測(cè)試中不同圖像之間差異可以表現(xiàn)為特征差異,使相似圖像生成的零水印具有較高的可辨識(shí)度。本文算法中同樣提取了2 種特征構(gòu)造零水印,因此可避免相似圖像之間的虛警問(wèn)題。
為了測(cè)試本文算法的穩(wěn)健性能,選用眼底和頭部醫(yī)學(xué)圖像、遙感圖像、自然圖像進(jìn)行測(cè)試,穩(wěn)健測(cè)試圖像如圖13 所示。
圖13 穩(wěn)健性測(cè)試圖像
表8 為圖13 中多幅圖像在非幾何攻擊下的平均誤碼率和最大誤碼率。文獻(xiàn)[8]基于SIFT 特征點(diǎn)描述子提取圖像特征,雖然SIFT 特征點(diǎn)具備一定的穩(wěn)健性,但不足以抵抗測(cè)試中的幾種非幾何攻擊。文獻(xiàn)[12]是在大小為64 ×64的水印下進(jìn)行的實(shí)驗(yàn),在本次實(shí)驗(yàn)的復(fù)現(xiàn)中,為統(tǒng)一測(cè)試,使用了更小的水印圖像,從而使冗余度更高,因此穩(wěn)健性強(qiáng)于文獻(xiàn)[12]水平。文獻(xiàn)[14-16]基于圖像矩特征構(gòu)造零水印,具有共同的特點(diǎn),在高強(qiáng)度噪聲攻擊下穩(wěn)健性不佳。文獻(xiàn)[14]在構(gòu)造特征過(guò)程中,利用矩系數(shù)同行同列的系數(shù)大小關(guān)系構(gòu)造特征,因此可以計(jì)算更少的階數(shù),增加了特征穩(wěn)定性,使其相比于另外2 種基于矩的零水印算法[15-16]具有更高的穩(wěn)健性。本文算法在特征提取階段,提取了圖像的2 種特征[3,22],每種特征在非幾何攻擊中均具有較強(qiáng)的穩(wěn)定性,在圖像受攻擊后仍能穩(wěn)定不變,多幅測(cè)試圖像的最大誤碼率小于0.070 0,因此本文算法對(duì)噪聲、濾波、JPEG 壓縮攻擊具有較強(qiáng)穩(wěn)健性。
表8 圖13 中多幅圖像在非幾何攻擊下的平均誤碼率和最大誤碼率
表9 為幾何攻擊下的平均誤碼率和最大誤碼率。文獻(xiàn)[8]提取的SIFT 特征點(diǎn)對(duì)幾何攻擊具有較高穩(wěn)健性,但將特征點(diǎn)描述子排列構(gòu)造成矩陣后,若部分特征點(diǎn)缺失或錯(cuò)位,則會(huì)導(dǎo)致描述子的排列方式發(fā)生改變,降低穩(wěn)健性。文獻(xiàn)[12]將版權(quán)水印冗余,構(gòu)造的操作提升了算法穩(wěn)健性。文獻(xiàn)[14-16]基于矩特征構(gòu)造零水印,由于矩特征良好的縮放和旋轉(zhuǎn)不變性,對(duì)該2 種攻擊具有強(qiáng)的穩(wěn)健性。但同時(shí)由于極諧不變矩的特性,對(duì)剪切和平移攻擊穩(wěn)健性不佳。在低強(qiáng)度的邊角剪切攻擊中,由于所剪切的部分未被用于計(jì)算矩特征,因此文獻(xiàn)[14-16]在左上角剪切的攻擊中,誤碼率均為0。本文算法在空域特征[22]提取算法的基礎(chǔ)上,選用了更大的分塊方式,增加了特征穩(wěn)定性;在頻域特征[3]提取算法的基礎(chǔ)上,在低頻部分選擇16 個(gè)交流系數(shù),增加了特征穩(wěn)定性,因此在低強(qiáng)度的幾何攻擊下具有較強(qiáng)穩(wěn)健性。
表9 幾何攻擊下的平均誤碼率和最大誤碼率
針對(duì)由特征相似引起的虛警問(wèn)題,分析了零水印虛警問(wèn)題的產(chǎn)生原因,提出了區(qū)域異或算法,融合2 種特征構(gòu)建零水印,當(dāng)某一特征相似度過(guò)高時(shí),由另一特征避免不同圖像生成的零水印過(guò)于相似。在版權(quán)認(rèn)證階段,提出了三值量化算法,將冗余版權(quán)圖像去冗余后,進(jìn)行三值量化,擴(kuò)大表示圖像特征差異,使虛警圖像和受攻擊圖像的認(rèn)證結(jié)果具有良好的區(qū)分度。在水印冗余構(gòu)造和區(qū)域異或算法中加入了混沌矩陣并保存為密鑰,提升了算法的安全性,混沌矩陣可由混沌系統(tǒng)根據(jù)密鑰生成,使密鑰便于用戶(hù)保存。本文提出的零水印算法使用空域特征和頻域特征共同構(gòu)造零水印,具有較低的虛警率,但仍然不能完全避免零水印的虛警問(wèn)題,并且穩(wěn)健性主要依賴(lài)于特征提取算法,當(dāng)提取到的特征穩(wěn)健性不佳時(shí),算法整體穩(wěn)健性會(huì)急劇下降。未來(lái)將通過(guò)增加提取特征的種類(lèi)、使用包含多種攻擊的穩(wěn)健特征提取算法來(lái)彌補(bǔ)本文的不足之處。