高光勇,龔金林
(1.九江學(xué)院網(wǎng)絡(luò)與信息安全研究所,江西 九江 332005;2.九江學(xué)院圖書館,江西 九江 332005)
數(shù)字圖書館是以電子格式存儲海量多媒體信息,并能對這些信息資源進行高效操作,如增加、刪除、修改、檢索信息以及提供訪問接口和信息保護等,是一個國家的數(shù)字教育平臺、數(shù)字文化平臺、數(shù)字資源中心,極大地推動國家信息基礎(chǔ)設(shè)施建設(shè)。隨著數(shù)字技術(shù)和網(wǎng)絡(luò)化的發(fā)展,快捷準確的數(shù)字傳輸手段為無數(shù)商家?guī)砹藷o限機遇,但是也提出了新的挑戰(zhàn),數(shù)字產(chǎn)品被侵權(quán)、盜版和隨意篡改等現(xiàn)象不斷發(fā)生,針對該現(xiàn)象國內(nèi)外研究者已開始探索如何更好地保護自己產(chǎn)品的合法權(quán)益[1-2]。
對于數(shù)字圖書館信息資源知識產(chǎn)權(quán)認證技術(shù)的研究,始于20世紀90年代末,在21世紀初逐步發(fā)展起來,并取得了一定的進展,其研究包括理論研究和應(yīng)用研究。
在理論研究方面,目前的研究主要包括DRM(數(shù)字版權(quán)管理技術(shù))、數(shù)字水印和數(shù)字指紋技術(shù)等。1)對于DRM的研究,目前主要集中在介紹DRM技術(shù)[3]、DRM系統(tǒng)結(jié)構(gòu)[4]及DRM 在電子圖書(E-book)中的應(yīng)用[5]。這些研究對現(xiàn)有DRM系統(tǒng)結(jié)構(gòu)進行了分析,并說明如何應(yīng)用在數(shù)字圖書中,基本上都認為現(xiàn)有DRM技術(shù)能夠有效地保護數(shù)字圖書版權(quán),而很少提及DRM技術(shù)的不足,并針對這些不足提出相應(yīng)的改進建議。2)對于數(shù)字水印技術(shù)和數(shù)字指紋技術(shù)的研究在國內(nèi)得到廣泛的開展,其中對于數(shù)字水印技術(shù)的研究相對較成熟,尤其在數(shù)字圖書方面的應(yīng)用十分普遍[6],但現(xiàn)有的研究也沒有太多的突破,尤其針對數(shù)字水印技術(shù)安全分析及如何解決這些安全的研究較少。數(shù)字水印技術(shù)主要用于盜版取證,而數(shù)字指紋可以用來在盜版發(fā)生后追蹤盜版者,這方面的研究成為現(xiàn)在研究的熱點。王祖喜等[7]在《基于殘留特征跟蹤的抗合謀數(shù)字指紋》一文中通過設(shè)計一種數(shù)字指紋的線性無關(guān)特征碼,提出基于協(xié)同學(xué)的殘留特征跟蹤的抗合謀數(shù)字指紋,將協(xié)同學(xué)應(yīng)用于數(shù)字指紋的合謀跟蹤,建立了一套基于殘留特征跟蹤的抗合謀數(shù)字指紋方案,將指紋編碼嵌入到數(shù)字產(chǎn)品中來追蹤盜版者。無論是數(shù)字水印技術(shù)還是數(shù)字指紋技術(shù),還是其他版權(quán)保護技術(shù),都存在一些缺陷。如數(shù)字水印技術(shù)對盜版追蹤能力較差,數(shù)字指紋在盜版預(yù)防能力較差。所以,一般情況都是將這些技術(shù)進行混合使用,這方面的研究也在進行中,應(yīng)該是將來各個出版商努力的方向。
在應(yīng)用研究上,以方正Apabi、超星及書生之家等為主的一批數(shù)字圖書館系統(tǒng)紛紛采用了數(shù)字版權(quán)認證技術(shù),并取得一定的進展。如方正Apabi數(shù)字版權(quán)保護技術(shù)(Apabi DRM)在保護電子圖書,防止電子圖書的非授權(quán)二次傳播,保證作者與出版商的利益在出版、發(fā)行、圖書借閱、讀者閱讀各個環(huán)節(jié)不被侵害等方面發(fā)揮了重要的作用。方正Apabi DRM在數(shù)字圖書交易的體系結(jié)構(gòu)、數(shù)字圖書館對E-book DRM的支持以及E-book DRM計數(shù)機制等方面有所創(chuàng)新。超星、書生之家等也采用了一些成熟的版權(quán)保護技術(shù),并很好地保護了相關(guān)電子圖書的版權(quán),阻止一些侵權(quán)行為發(fā)生。
在理論研究上,國外的DRM技術(shù)體系已相當完善,不論從安全性還是從實用性上看,都比較成熟,并且得到了廣泛應(yīng)用。文獻[8]提出了一個適用于個人版權(quán)保護的DRM體系結(jié)構(gòu);DRM在移動內(nèi)容應(yīng)用中的研究逐漸成為一個研究熱點,Irwin[9]提出了針對移動內(nèi)容服務(wù)的OMA DRM體系結(jié)構(gòu),并對該體系結(jié)構(gòu)進行詳細分析研究;數(shù)字水印在數(shù)字版權(quán)保護中己經(jīng)成為十分成熟的技術(shù),新的研究主要是針對安全性研究,在算法上進行突破,使得數(shù)字水印技術(shù)更加安全。Lee等[10]介紹了一種混合水印技術(shù)對數(shù)字圖像進行保護,這種水印技術(shù)將版權(quán)信息插入到數(shù)字圖像中達到版權(quán)保護作用,并通過過濾攻擊等試驗,確保版權(quán)保護的安全性。Nezhadarya等[11]提出一種基于統(tǒng)一量化方向梯度向量的魯棒數(shù)字水印方案,該方案通過對多小波尺度下的顯著梯度向量角度進行量化來嵌入水印,算法增強了水印的不可見性,提高了對幅度縮放攻擊及其他常見攻擊的抵抗能力,同時也擴大了水印的嵌入容量。
在應(yīng)用研究上,國外電子圖書在版權(quán)認證上發(fā)展比較成熟,一方面是以軟件公司為主的文件格式和瀏覽器的開發(fā),如微軟公司和Adobe公司等;另一方面體現(xiàn)在傳統(tǒng)出版商的轉(zhuǎn)型,如德國施普林格出版社的Springer Link電子圖書采用了在PDF格式加密的技術(shù),很好地保護了版權(quán),而且使得用戶在利用該電子圖書時也很方便。此外,像NetLibrary、Ebrary及金圖等電子圖書系統(tǒng)在版權(quán)保護上也很成功,并受到世界各地讀者歡迎。
目前,數(shù)字圖書館信息資源知識產(chǎn)權(quán)保護取得了長足的進展,但仍存在一些問題。如DRM、數(shù)字水印和數(shù)字指紋技術(shù)等實現(xiàn)了對數(shù)字作品版權(quán)的基本認證,但不能對遭受惡意篡改的數(shù)字作品的篡改位置進行定位以及恢復(fù)遭受篡改的內(nèi)容,同時因為篡改引起的水印提取失真或根本不能提取,從而導(dǎo)致版權(quán)認證失敗。此外,當授權(quán)用戶對數(shù)字作品的質(zhì)量要求較高時,不能很好地去除隱藏的輔助信息(如數(shù)字水印、指紋等)以便可逆地恢復(fù)至原始作品。針對這些問題,提出采用最新的壓縮感知理論,利用智能可逆水印技術(shù)來實現(xiàn)對數(shù)字圖書館信息資源的知識產(chǎn)權(quán)保護,在對數(shù)字作品提供版權(quán)基本認證的同時,還可以達到篡改定位、篡改內(nèi)容恢復(fù)以及數(shù)字作品的智能可逆還原的目的。因而對數(shù)字圖書館信息資源的知識產(chǎn)權(quán)保護具有重要的理論和現(xiàn)實意義。
首先介紹常規(guī)數(shù)字水印技術(shù)的原理,然后提出利用最新的壓縮感知理論及智能可逆水印技術(shù)以更好地實現(xiàn)數(shù)字圖書館信息資源產(chǎn)權(quán)保護的無損認證方法。
數(shù)字水印是將文字、序列號、圖像標志等標識或版權(quán)信息嵌入到數(shù)字作品中,然后通過軟件系統(tǒng)對嵌入水印的讀取與檢測,以識別數(shù)字作品是否為盜版或是否被篡改。常規(guī)數(shù)字水印技術(shù)會對原始數(shù)字作品造成一定的損害,并且該損害是不可逆的。圖1、圖2顯示了常規(guī)數(shù)字水印技術(shù)的嵌入和提取過程。常規(guī)數(shù)字水印技術(shù)能夠?qū)崿F(xiàn)信息資源的產(chǎn)權(quán)認證,但對授權(quán)用戶來說,嵌入水印的數(shù)字媒體不能被可逆地恢復(fù)至原始作品,這會使得授權(quán)用戶獲得的是與原始作品有所不同的數(shù)字作品,從而造成授權(quán)用戶的利益受損??赡嫠∈且环N無損認證新技術(shù),可對水印后作品進行可逆還原,同時,結(jié)合最新的壓縮感知理論,能實現(xiàn)對遭受篡改攻擊的數(shù)字作品的篡改檢測及篡改定位,并可將遭篡改區(qū)域恢復(fù)至原始狀態(tài)。根據(jù)嵌入水印的可見性,可逆水印可分成不可見可逆水印和可見可逆水印。下兩節(jié)將分別闡述這兩種無損認證方法。
圖1 常規(guī)數(shù)字水印技術(shù)的嵌入過程
圖2 常規(guī)數(shù)字水印技術(shù)的提取過程
不可見可逆水印一般通過量化技術(shù)將水印信息嵌入到數(shù)字作品的變換域系數(shù)中,嵌入水印后的數(shù)字作品從表面上覺察不到水印的存在,當需要版權(quán)信息認證時,利用軟件提取作品中的水印信息進行驗證。當授權(quán)用戶對數(shù)字作品的質(zhì)量要求較高時,能通過去除隱藏的水印信息來恢復(fù)原始作品。為了保證水印方案的可逆性,嵌入時可采用逆變換不損失信息的整數(shù)小波變換[12]。
一定容量的水印信息嵌入可能降低水印后數(shù)字作品的可視性,影響其使用價值。如何保證嵌入可逆水印時既保證數(shù)字作品的可視性又保證最大容量的水印嵌入,這是可逆水印方案面臨的關(guān)鍵問題。為了解決這個問題,可對水印嵌入過程中的水印嵌入閾值(嵌入強度)進行智能選擇,以保證嵌入水印容量和水印后數(shù)字作品的可視性達到有效的折中,即在嵌入利于認證的一定大小的水印信息后,數(shù)字作品仍能保持與原始作品的基本一致性,不會影響用戶的常規(guī)使用。智能選擇過程一般可通過遺傳算法[13]、符號混沌系統(tǒng)[14]等優(yōu)化方法實現(xiàn)。
對數(shù)字圖書館的數(shù)字資源進行篡改是一種常見的攻擊,具有較大危害性,可以利用最新的壓縮感知(CS,Compressed Sensing)理論來檢測篡改及還原內(nèi)容。壓縮感知[15]是傳統(tǒng)信息論的一個延伸,但是又超越了傳統(tǒng)的壓縮理論,成為了一門嶄新的子分支,其基本思路是從盡量少的數(shù)據(jù)中提取盡量多的信息,或者說利用提取出的少量特征信息來表示原始的大量數(shù)據(jù)。毫無疑問,壓縮感知是一種有著極大理論和應(yīng)用前景的想法,它從誕生之日起到現(xiàn)在不過幾年時間,其影響卻已經(jīng)涉及大半個應(yīng)用科學(xué)。在保護數(shù)字資源時,首先使用壓縮感知方法感知數(shù)字作品的特征信息。該特征信息是數(shù)字作品的完整描述,使用特征信息可以對遭受篡改的數(shù)字作品的篡改位置進行定位。然后根據(jù)篡改位置所對應(yīng)的感知特征信息,尋求合適的重建算法,實現(xiàn)對數(shù)字作品篡改內(nèi)容的自動恢復(fù),并可根據(jù)需要對篡改恢復(fù)后的數(shù)字作品進行水印嵌入逆處理,以去掉嵌入信息還原至原始數(shù)字作品。
圖3直觀顯示了利用壓縮感知的不可見可逆水印的嵌入方案框圖。首先,對數(shù)字作品進行直方圖修改,以防止嵌入水印后溢出現(xiàn)象的發(fā)生。其次,對修改后的數(shù)字作品進行整數(shù)小波變換,并對生成的小波系數(shù)進行適當?shù)膲嚎s和量化,把壓縮量化系數(shù)與原始系數(shù)的差記為量化誤差。接下來,將量化誤差(作為輔助信息)和水印信息一起嵌入到數(shù)字作品中。信息嵌入通過小波系數(shù)的壓縮和擴展來實現(xiàn),同時,為了保證嵌入水印量和數(shù)字作品視覺質(zhì)量的有效平衡,采用符號混沌系統(tǒng)對水印嵌入閾值進行智能選擇。水印嵌入閾值是對嵌入容量進行調(diào)節(jié)的一個關(guān)鍵參數(shù),嵌入閾值越大,能嵌入的水印信息就越多,但是同時導(dǎo)致水印后數(shù)字作品視覺質(zhì)量下降越快。符號混沌系統(tǒng)具有良好的遍歷性、隨機性、規(guī)律性等特點,適合用于快速、準確地優(yōu)化選擇最佳參數(shù),因而這里使用符號混沌系統(tǒng)來智能選擇水印嵌入閾值,使得嵌入水印量和數(shù)字作品視覺質(zhì)量滿足用戶的需求。換句話說,在嵌入固定量的水印信息后,水印后數(shù)字作品能獲得最佳視覺質(zhì)量。再次,對嵌入水印后小波系數(shù)進行逆整數(shù)小波變換以獲得嵌入水印的數(shù)字作品。最后,對水印后數(shù)字作品信息進行分塊壓縮感知處理,獲取其特征信息,將特征信息在IPR(intellectual property rights)數(shù)據(jù)庫中注冊,用于日后對數(shù)字作品的篡改檢測。
圖3 利用壓縮感知的不可見可逆水印嵌入方案框圖
利用壓縮感知的篡改檢測及水印提取基本是不可見可逆水印嵌入方案的逆過程,其流程如圖4所示。在數(shù)字圖書館數(shù)字作品認證時,首先,對待檢測數(shù)字作品進行分塊壓縮感知處理,提取出分塊特征信息,并與IPR數(shù)據(jù)庫中注冊的分塊特征信息進行比較,以檢測數(shù)字作品是否被篡改及遭受篡改的分塊區(qū)域。如沒發(fā)現(xiàn)篡改,就進行水印提??;如確定篡改區(qū)域,則先利用已注冊的對應(yīng)遭受篡改分塊區(qū)域的特征信息,采用感知重建算法對受篡改區(qū)域進行恢復(fù)。其次,通過對整數(shù)小波變換系數(shù)的擴展來提取水印信息和量化誤差,并利用量化誤差對小波系數(shù)進行恢復(fù)。最后,對恢復(fù)后的小波系數(shù)進行逆整數(shù)小波變換獲得原始數(shù)字作品。
相對于不可見可逆水印技術(shù)來說,采用可見可逆水印技術(shù)嵌入的水印不僅具有可逆性,而且嵌入的水印對人眼可見,一般使用半透明的圖標作為可見水印??梢娍赡嫠〖夹g(shù)通常應(yīng)用在需對數(shù)字作品的所有權(quán)或來源進行當場識別的特殊場合。當使用者獲得授權(quán)后,即可利用特定的解碼系統(tǒng)刪除數(shù)字作品上的可見水印以獲得完整的作品。
數(shù)字作品的中間部分一般容易吸引用戶的注意力,所以將可見水印嵌入到該區(qū)域可以起到很好的廣告及認證效果,這部分區(qū)域也稱為感興趣區(qū)(ROI,Region Of Interesting)。為了滿足以后的數(shù)字作品還原,可見水印的嵌入算法應(yīng)具有可逆性。同時考慮到可見水印的半透明性,在水印嵌入時對原始作品的改動不能過大,過大會完全遮住原始作品,當然改動不能過小,過小則可能不能顯現(xiàn)可見水印。數(shù)學(xué)中的雙邊映射函數(shù)[16]具有一一對應(yīng)性的特點,可以用來嵌入水印以保證可逆性。嵌入水印比特信息時可以把原始作品改動k△大小,△為雙邊映射參數(shù),如將0映射為3,3映射為6,那么△值為3。k為嵌入密鑰,以保證方案的安全性,同時可以利用k值調(diào)節(jié)可見水印的透明性。在去除可見水印時只要做相反的雙邊逆映射即可實現(xiàn)。
圖4 利用壓縮感知的篡改檢測及水印提取方案框圖
圖5直觀顯示了可見可逆水印的方案框圖。首先,選定數(shù)字作品的ROI區(qū)域,根據(jù)對可見水印透明性的實際需求選擇合適的密鑰k和雙邊映射參數(shù)△,然后通過改動數(shù)字作品信息嵌入水印比特,最終獲得含有人眼可見半透明水印的受保護數(shù)字作品。如需在可見可逆水印中增加篡改攻擊檢測及篡改內(nèi)容還原的功能,可參照不可見可逆水印的方案,引入壓縮感知理論來實現(xiàn)??梢娍赡嫠∪コ桨溉鐖D6所示,通過密鑰k和參數(shù)△做雙邊逆映射即可刪除嵌入的可見水印,獲得恢復(fù)后的原始數(shù)字作品。
圖5 可見可逆水印嵌入方案框圖
圖6 可見可逆水印去除方案框圖
在數(shù)字資源(數(shù)字圖書、數(shù)字圖像、數(shù)字視頻等)進入數(shù)字圖書館之前,針對不同用戶需求和數(shù)字作品的保護屬性,選擇在數(shù)字資源中嵌入不可見可逆水印或可見可逆水印以供有限權(quán)限讀者閱讀和下載,對具有完全權(quán)限的讀者可通過提供密鑰將水印刪除以實現(xiàn)正常、清晰、完整地使用原始數(shù)字作品。當遇到數(shù)字資源版權(quán)糾紛時,可通過提取出的水印證明版權(quán)。一些用戶可能會對下載的數(shù)字資源實施篡改,以求達到不能正確提取水印,導(dǎo)致認證失敗。這時可利用IPR庫中注冊的特征信息進行篡改檢測,并恢復(fù)篡改內(nèi)容,進而實現(xiàn)水印信息的完整提取,最終完成版權(quán)認證。
隨著數(shù)字圖書館的飛速發(fā)展,信息資源的產(chǎn)權(quán)保護技術(shù)也取得較大進步。雖然目前的保護技術(shù)實現(xiàn)了對數(shù)字資源版權(quán)的基本認證,但不能檢測受篡改的數(shù)字作品的篡改區(qū)域,也不能恢復(fù)受篡改的原始內(nèi)容,同時不能很好滿足授權(quán)用戶去除水印以獲得原始作品的要求。對此,本文提出將一種無損認證新技術(shù)應(yīng)用到數(shù)字圖書館中,以更好地實現(xiàn)對信息資源產(chǎn)權(quán)的保護。該無損認證方法通過將最新的壓縮感知理論與可逆水印技術(shù)相結(jié)合,不僅滿足了數(shù)字作品的基本認證需求,還實現(xiàn)受篡改數(shù)字作品的篡改定位、內(nèi)容恢復(fù),且能針對對數(shù)字作品質(zhì)量具有較高需求的授權(quán)用戶,可以實現(xiàn)水印去除以獲得原始數(shù)字作品。
[1]周軍.對數(shù)字圖書館的版權(quán)保護技術(shù)的比較研究[J].圖書館論壇,2006(3):104-106.
[2]楊曉秋.數(shù)字圖書館文獻傳遞服務(wù)的著作權(quán)保護問題調(diào)查與分析[J].圖書館學(xué)研究,2013(4):93-97.
[3]孫晶,徐政萍.DRM技術(shù)在e-Book中的應(yīng)用[J].情報技術(shù),2005(9):37-39.
[4]殷沈琴,張計,龍郝群.電子書數(shù)字版權(quán)管理技術(shù)應(yīng)用進展研究[J].圖書館雜志,2012(8):60-63.
[5]向林芳.論DRM在數(shù)字圖書館中的應(yīng)用——以方正Apabi為例[J].高校圖書館工作,2011(6):85-87.
[6]沈生進.數(shù)字水印在數(shù)字圖書館中的應(yīng)用[J].圖書館雜志,2001(8):27-29.
[7]王祖喜,王文宗.基于殘留特征跟蹤的抗合謀數(shù)字指紋[J].軟件學(xué)報,2011(8):1884-1896.
[8]KENNY S.Applying digital rights management systems to privacy rights management[J].Computers&Security,2002(7):648-664.
[9]IRWINJ.Digital rights management:The open mobile alliance DRM specifications[J].Information Security Technical Report,2004(4):21-30.
[10]LEE Z,LIN S.A hybrid watermarking technique applied to digital images[J].Applied Softed Computing,2007(3):798-808.
[11]NEZHADARYA E,WANG J.Robust image watermarking based on multiscale gradient direction quantization[J].IEEE Transactions on Information Forensics and Security,2011(4):1200-1213.
[12]余先川,張君蘭,張立保.基于整數(shù)小波變換的空間矢量數(shù)據(jù)壓縮方法[J].地球科學(xué)(中國地質(zhì)大學(xué)學(xué)報),2011(2):381-385.
[13]LEVY E,DAVID O,NETANYAHU N.Painter Classification Using Genetic Algorithms[C].Cancun:IEEE Congress on Evolutionary Computation,2013:3027-3034.
[14]王福來.基于復(fù)合符號混沌的偽隨機數(shù)生成器及加密技術(shù)[J].物理學(xué)報,2011(11):110517-1-110517-8.
[15]BARKER P B,Ernst T M.Acceleration of 1H MR Metabolic Imaging with Compressed Sensing[J].Radiology,2013(2):686-686.
[16]VLEESCHOUWER C D,DELAIGLE J F.Circular interpretation of bijective transformations in lossless watermarking for media asset management[J].IEEE Transactions on Multimedia,2003(1):97-105.