高光勇,龔金林
(1.九江學院網(wǎng)絡與信息安全研究所,江西 九江 332005;2.九江學院圖書館,江西 九江 332005)
面向數(shù)字圖書館信息資源的可逆認證方案*
高光勇1,龔金林2
(1.九江學院網(wǎng)絡與信息安全研究所,江西 九江 332005;2.九江學院圖書館,江西 九江 332005)
針對目前數(shù)字圖書館信息資源因被篡改而引起的認證問題,提出一種篡改自恢復可逆認證解決方案。當對待檢測圖像進行完整性認證時,只需根據(jù)提取的分塊檢測比特即可判定待檢測圖像是否遭受篡改以及遭受篡改的位置。如沒有遭受篡改,表明待檢測圖像通過完整性認證,并且能還原待檢測圖像至原始狀態(tài)。否則,表明待檢測圖像沒有通過完整性認證,然后可利用壓縮感知重構技術對篡改內(nèi)容進行恢復。
數(shù)字圖書館;可逆認證;篡改恢復
近十年來,隨著因特網(wǎng)技術和數(shù)字信息技術的普及,數(shù)字資源共享平臺(例如數(shù)字圖書館)的建設也得到快速發(fā)展。數(shù)字圖書館通過對數(shù)字信息資源的整合與共享,大大提高了信息資源的利用效率。但是在信息傳播變得便捷的同時,對數(shù)字資源的篡改變得更加容易,進而引起的版權問題也日益突出[1]。如何在促進數(shù)字信息資源共建共享的同時,又能真正實現(xiàn)知識產(chǎn)權的保護,已成為科研技術人員必須解決的緊迫課題。本文將可逆認證技術應用于數(shù)字圖書館信息資源的版權保護中,針對數(shù)字圖像提出一種篡改自恢復可逆認證解決方案,能夠有效避免傳統(tǒng)水印技術的不可逆性以及不能還原被篡改內(nèi)容等缺點,為數(shù)字信息資源的產(chǎn)權保護提供有力的技術支撐。
目前,用于數(shù)字資源產(chǎn)權保護的數(shù)字水印技術主要分為三類:魯棒嵌入水印、零水印以及可逆水印。魯棒嵌入水印是一種傳統(tǒng)數(shù)字水印技術,主要是利用信號處理技術在數(shù)字作品的空域或頻域中嵌入認證信息,檢測時通過提取的認證信息來判別數(shù)字信息的版權歸屬。魯棒水印技術主要考慮在外來攻擊(如在數(shù)字作品上疊加噪音、對數(shù)字作品進行縮放、旋轉(zhuǎn)及裁剪等)下是否仍能正確提取水印信息。過去十年有大量應用于數(shù)字資源版權保護的魯棒數(shù)字水印方案被提出。鄧成等[2]提出了一種基于仿射協(xié)變區(qū)域的抗幾何攻擊數(shù)字水印算法。蘭宇琳[3]提出一種基于奇異值分解及獨立成分分析的數(shù)字音頻水印算法。Shao等[4]利用正交傅里葉-梅林矩和混沌映射實現(xiàn)了一種魯棒水印方案。這些方案對常規(guī)信號處理、幾何攻擊以及組合攻擊均具有較好的魯棒性。
由于傳統(tǒng)的魯棒嵌入水印在水印的魯棒性和不可感知性上的矛盾始終存在,為了解決這一問題,溫泉等[5]提出了零水印技術,即采用數(shù)字媒體的重要特征去構造水印信息,在此過程中數(shù)字媒體自身并沒有被修改。郝世博等[6]以數(shù)字圖像為例,利用分塊壓縮感知技術對原始圖像進行觀測,將觀測值與Arnold變換后的版權信息結合,構造零水印信息。該方法在一定程度上有助于圖書館、博物館、檔案館數(shù)字信息資源的版權保護。Gao等[7]基于貝塞爾-傅里葉矩的不變性提出一種零水印方案,相對其他零水印技術,該方案能更好地抵抗信號處理及幾何攻擊。
盡管零水印不損害數(shù)字資源的原始性,但是在版權認證時,零水印存在需借助第三方并且具有較高的誤警率等不足,這使得零水印技術的推廣使用受到限制。近來,一種名為可逆水印的版權保護技術引起人們的重視??赡嫠∏度胨⌒畔⒌綌?shù)字媒體,認證時通過提取嵌入的水印信息來判別版權歸屬,同時數(shù)字媒體在水印信息提取后能可逆還原至原始狀態(tài)。Tian[8]首次利用鄰居像素間差分的擴展嵌入水印信息,認證完成后進行嵌入過程逆向處理即可恢復原始數(shù)字信息。Dragoi等[9]提出一種基于像素塊局部預測的可逆水印認證方案。姜明芳[10]提出一種面向電子圖書的可逆可見水印方案。該方案在保護電子圖書版權的同時,可提供用戶預訂與預覽功能,僅授權用戶可去除可見水印而獲得高清電子圖書。
雖然目前提出的基于可逆水印的版權保護方案具有較好的認證效果,但是大多數(shù)算法沒有涉及數(shù)字資源的被篡改內(nèi)容的定位及其恢復。
篡改自恢復可逆認證方案的主要思想是首先對數(shù)字圖像進行可逆增強,因為嵌入水印會降低數(shù)字圖像的可視性,而可逆增強可以提高數(shù)字圖像的視覺質(zhì)量,并且在需要的時候可以恢復被增強圖像至原始狀態(tài)。然后可逆地嵌入各圖像分塊的特征信息到相應的各分塊像素中。當進行完整性認證時,認證者利用從各分塊提取的信息來判斷各圖像分塊的完整性,如果各圖像塊均完整,則該數(shù)字圖像通過認證;否則認為非完整的分塊受到篡改,并利用已有的信息,結合壓縮感知重構技術實現(xiàn)對篡改分塊的恢復。下面首先介紹認證方案用到的可逆圖像增強及壓縮感知技術,然后詳細給出篡改自恢復可逆認證的具體設計方案,最后給出應用實例。
2.1可逆圖像增強
通常可逆水印算法在嵌入水印時主要考慮嵌入容量及嵌入圖像的峰值信噪比(PSNR),希望在盡可能嵌入更多水印信息的同時,保留較高的PSNR值。但嵌入容量與PSNR是一對矛盾體,很難實現(xiàn)最佳的折中。為了解決這個問題,有關文獻[11]提出先通過對圖像增強來改善圖像的視覺質(zhì)量,在實現(xiàn)增強的同時嵌入部分水印,然后在增強后的圖像里再嵌入更多水印信息。因為圖像質(zhì)量在一開始已被增強,因而盡管有更多水印嵌入,圖像的可視性仍有保證。同時采用的增強技術是可逆的,當需要的時候可以將嵌入圖像還原為原始圖像。
2.2壓縮感知
壓縮感知(CS)的概念于2006年由Donoho[12]正式提出后,便很快受到相關研究領域的國內(nèi)外學者的高度重視,并于2007年被MIT評選為十大科技進展之一。壓縮感知理論突破了經(jīng)典香農(nóng)定理的瓶頸,其核心思想是通過遠少于奈奎斯特頻率的釆樣數(shù)據(jù),同時實現(xiàn)信號的采樣和壓縮。
壓縮感知理論主要由信號的稀疏表示、信號的線性測量和信號的重建算法組成。信號的稀疏表示是指如果信號投影到正交變換基后獲得的絕大部分變換系數(shù)的絕對值接近零值,那么稱生成的變換向量是稀疏或者近似稀疏的,同時該稀疏向量可以看作是原始信號的一種簡潔表達。只有能被稀疏表示的信號才能應用壓縮感知技術,換句話說,信號的稀疏表示是壓縮感知的先驗條件。信號的線性測量是通過稀疏表示的原始信號與事先選擇的穩(wěn)定性好的感知矩陣的乘積來獲得原始信號的線性投影測量值,這里測量值的數(shù)據(jù)量遠小于原始信號的數(shù)據(jù)量。最后,通過測量值及感知矩陣,并利用信號重建算法可重新構造出原始信號。
2.3具體設計方案
2.3.1水印嵌入過程
圖1可逆水印嵌入過程框圖
圖1直觀地顯示了水印嵌入過程,具體步驟如下:
第1步:對數(shù)字圖像進行可逆增強。通過對圖像的直方圖峰值進行平移以實現(xiàn)直方圖均衡化,從而達到增強圖像視覺質(zhì)量的目的。在直方圖平移的過程中以可逆的方式嵌入一些秘密信息,例如數(shù)字作品擁有者的版權信息等。
第2步:對增強后的圖像進行分塊處理,分塊大小為16×16。然后對各分塊進行隨機置亂,置亂后的分塊被劃分為若干個分組,每個分組含16個分塊。
第3步:對每個圖像塊分別進行余弦變換(DCT),因為每個分塊含256像素,所以變換后的DCT系數(shù)為256個,這樣每個分組就含有4096個DCT系數(shù)。每個分組的DCT系數(shù)可看作為1×4096矩陣,然后乘以一個滿足正態(tài)分布的4096×368參考矩陣后得到1×368矩陣。矩陣中的368個數(shù)值稱為參考值。
第4步:隨機置亂所有分組的參考值,并將其劃分為N/256個集合,每個集合含23個參考值。這里N表示數(shù)字圖像的像素數(shù)量。
第5步:通過某量化函數(shù)將所有參考值量化為大小位于[-32,31]的整數(shù)形式,每個整數(shù)值用6比特表示,這樣每集合就含有138比特參考值。
第6步:用64比特表示每分塊的位置信息,即32比特被用來表示分塊的第一個像素的橫坐標,另32比特表示分塊的第一個像素的縱坐標。然后每分塊的64位位置比特、256×8位像素比特及對應的138位參考比特被輸入一個哈希函數(shù),通過計算輸出得到31位哈希比特。
第7步:利用隨機函數(shù)生成31位標簽比特。然后31位哈希比特與31位標簽比特進行異或運算后獲得31位檢測比特。
第8步:利用基于預測誤差擴展的可逆嵌入算法[13],將138位參考比特與31位檢測比特共169位比特嵌入到相應的圖像分塊?;陬A測誤差的可逆嵌入算法通過相鄰的三個像素來預測當前像素值,然后計算預測像素值和實際像素值的誤差,并在誤差擴展后進行比特信息的嵌入。如果第1輪不能完成所有169比特的嵌入,則可通過第2輪、第3輪等多輪執(zhí)行來完成所有比特的嵌入。最后獲得最終嵌入圖像。
2.3.2水印提取及篡改檢測過程
水印提取及篡改檢測過程如圖2所示:
第1步:對接收圖像進行分塊,分塊大小為16×16。利用基于預測誤差擴展的可逆提取算法[14],提取各圖像分塊里嵌入的138位參考比特及31位檢測比特。
第2步:類似于水印嵌入過程,獲得各分塊位置比特。然后將各分塊的64位位置比特、256×8位像素比特及提取的138位參考比特輸入哈希函數(shù),通過計算輸出得到31位哈希比特。最后,各分塊的31位哈希比特與提取的對應的31位檢測比特進行異或運算后獲得31位標簽比特。
第3步:比較各分塊的標簽比特,如超過40%的分塊具有相同的31位標簽比特,那么認為該31位標簽比特是嵌入過程所使用的標簽比特,并把這31位標簽比特記為B。將所有分塊的標簽比特與B計較,把結果不一致的分塊標記為保留塊,結果不一致的分塊標記為篡改塊。如所有分塊都與B一致,則表明沒有篡改發(fā)生,該接收圖像通過完整性認證。如存在篡改塊,則完整性認證失敗,可對篡改塊內(nèi)容進行恢復以進一步證明該遭受篡改圖像是來自原始圖像。
第4步:如接收圖像通過完整性認證,則執(zhí)行可逆增強算法的逆過程,提取嵌入的秘密信息并還原數(shù)字圖像至原始狀態(tài),即獲得與原始數(shù)字圖像一致的圖像。
第5步:如接收圖像沒有通過完整性認證,則采用與嵌入過程相同的方法對各分塊進行隨機置亂,置亂后的分塊被劃分為若干個分組,每個分組含16個分塊。
第6步:針對每個分組,設被篡改分塊的數(shù)目為z,首先把從(16-z)個保留塊里提取的參考比特換算為十進制參考值,然后利用量化函數(shù)對參考值進行反量化。
第7步:利用反量化后的參考值、從保留塊里計算得到的余弦變換系數(shù)以及嵌入過程用過的參考矩陣,通過公式計算獲得z個篡改塊的參考值的近似值S[14]。由于余弦變換系數(shù)大部分接近零,即具有稀疏性,因而可利用壓縮感知重構技術對其重新構造。這里使用S和參考矩陣,通過正交匹配追蹤算法[15](一種壓縮感知重構技術)重構出z個篡改塊的余弦變換系數(shù)。因為壓縮感知技術的有損性,重構出的余弦變換系數(shù)相比原始系數(shù)有小部分信息丟失。然后對這些余弦變換系數(shù)進行逆變換后生成恢復后的圖像塊。最后結合圖像所有分組的保留分塊,得到還原后的近似圖像。近似圖像相比原始圖像雖然有部分信息損失,但總體上仍能體現(xiàn)圖像原貌,這有助于進一步證明該接收圖像是在原始圖像上進行篡改后的結果。
圖2可逆水印提取及篡改檢測過程框圖
2.4應用實例
采用通用測試數(shù)字圖像Lena作為實例,應用本文提出可逆認證方案進行實驗,測試結果如圖3所示。圖3(a)為原始Lena圖像;圖3(b)為應用本文方案的嵌入水印圖像;圖3(c)是對圖3(b)進行完整性認證后可逆還原后的圖像,計算衡量兩幅圖像質(zhì)量相似度的客觀指標PSNR(峰值信噪比),可得PSNR為無窮大,表明圖3(c)和圖3(a)完全一致,并且通過完整性認證的圖像可以被還原至原始狀態(tài)。圖3(d)是對圖3(b)進行篡改后的圖像;對圖3(d)進行的完整性認證失敗后,自恢復篡改內(nèi)容后的圖像如圖3(e)所示,可以看出,恢復后的圖像雖然在篡改位置的內(nèi)容和原始圖像相比仍有些細微差別,但總體保持了原始圖像的特征,從而間接證明了圖3(c)是源自圖3(b)。
圖3測試結果.(a)原始Lena圖像,(b)嵌入水印圖像,(c)認證通過,還原后的圖像,(d)遭受篡改后的圖像,(e)篡改恢復后的圖像
根據(jù)數(shù)字圖書館數(shù)字資源版權保護的研究現(xiàn)狀,本文提出一種篡改自恢復可逆認證方案。通過應用可逆增強、壓縮感知以及基于預測誤差擴展的可逆水印技術,實現(xiàn)了對數(shù)字作品的完整性認證,并能將通過認證的數(shù)字作品還原至原始狀態(tài)。通過標簽比特能定位被篡改內(nèi)容的位置,并利用從保留分塊提取的參考值去恢復篡改分塊的內(nèi)容?;謴瓦^程不需要借助外部數(shù)據(jù),僅通過數(shù)字作品自身即可實現(xiàn)。最后通過實際用例證明了提出方案的有效性。
[1]楊子伍.數(shù)字圖書館建設中知識產(chǎn)權保護的關鍵技術[J].河南圖書館學刊,2006(2):115-117.
[2]鄧成,李潔,高新波.基于仿射協(xié)變區(qū)域的抗幾何攻擊圖像水印算法[J].自動化學報,2010(2):221-228.
[3]蘭宇琳.數(shù)字圖書館音頻信息資源版權保護研究[J],數(shù)字圖書館論壇,2015(1):42-46.
[4]SHAO Z,SHANG Y.Robust watermarking using orthogonal Fourier-Mellin moments and chaotic map for double images[J]. Signal Processing,2016(3):522-531.
[5]溫泉,孫錟鋒,王樹勛.零水印的概念與應用[J].電子學報,2003(2):214-216.
[6]郝世博,朱學芳.面向圖博檔的分塊壓縮感知圖像零水?。跩].現(xiàn)代圖書情報技術,2014(4):87-93.
[7]GAO G Y,JIANG G P.Bessel-Fourier moment-based robust image zero-watermarking[J].Multimedia Tools and Applications,2015(3):841-858.
[8]TIAN J.Reversible data embedding using a difference expansion[J].IEEE Transactions on Circuits and Systems for Video Technology,2003(8):890-896.
[9]DRAGOI I,COLTUC D.On local prediction based reversible watermarking[J].IEEE Transactions Image Processing,2015(4): 1244-1246.
[10]姜明芳.適用于電子圖書版權保護的可逆可見水印方案[J].現(xiàn)代情報,2014(2):58-61.
[11]WU H,DUGELAY J,SHI Y Q.Reversible image data hiding with contrast enhancement[J].IEEE Signal Processing Letters,2015(1):81-85.
[12]DONOHO D L.Compressed Sensing[J].IEEE Transactions on Information Theory,2006(4):1289-1306.
[13]THODI D M,RODRIQUEZ J J.Expansion embedding techniques for reversible watermarking[J].IEEE Transactions on Image Processing,2007(3):721-730.
[14]ZHANG X,QIAN Z,REN Y,etc.Watermarking with flexible self-recovery quality based on compressive sensing and compositive reconstruction[J].IEEE Transactions on Information Forensics and Security,2011(4):1223-1232.
[15]TROPP J A,GILBERT A C.Signal recovery from random measurements via orthogonal matching pursuit[J].IEEE Transactions on Information Theory,2007(12):4655-4666.
(編發(fā):王域鋮)
Reversible Authentication Scheme for Information Resources of Digital Library
GAO Guang-yong1,GONG Jin-lin2
(1.Institute of Network and Information Security,Jiujiang University,Jiujiang 332005,China;2.Library of Jiujiang University,Jiujiang 332005,China)
Aiming at the authentication issue raised from the tampered information resources of digital library,this paper proposes a solving scheme for the reversible authentication with self-recovery of tampered content.When the detected image is authenticated,we can determine if the tamper happens and the tampered image location only by the extracted detection bits.If the tamper does not happen,then it manifests that the content of detected image passes the integrity authentication and the image can be restored to its original state.Otherwise,the integrity authentication for the content of detected image fails,and then the tampered content is recovered by compressive sensing reconstruction.
digital library;reversible authentication;tamper recovery
G250.76
G250.76
A
2095-5197(2016)03-0044-05
高光勇(1973-),男,副教授,博士,研究方向:數(shù)字媒體信息安全;龔金林(1973-),男,副研究館員,碩士,研究方向:數(shù)字圖書館信息處理。
2016-02-22