丁 凱 孟,朱 長 青
(1.南京師范大學(xué)虛擬地理環(huán)境教育部重點實驗室,江蘇 南京 210023;2.金陵科技學(xué)院網(wǎng)絡(luò)與通信工程學(xué)院,江蘇 南京 211169)
?
基于金字塔模型的遙感影像感知哈希認證算法
丁 凱 孟1,2,朱 長 青1
(1.南京師范大學(xué)虛擬地理環(huán)境教育部重點實驗室,江蘇 南京 210023;2.金陵科技學(xué)院網(wǎng)絡(luò)與通信工程學(xué)院,江蘇 南京 211169)
針對遙感影像數(shù)據(jù)量較大的特點,提出一種基于金字塔模型的遙感影像感知哈希認證算法。首先,在原始遙感影像基礎(chǔ)上通過重采樣建立不同分辨率的影像層,并根據(jù)認證的粒度要求對各層影像進行格網(wǎng)劃分;然后,通過分塊DCT變換提取各格網(wǎng)單元的內(nèi)容特征,進而構(gòu)造格網(wǎng)單元的感知哈希序列,最終得到原始遙感影像的感知哈希序列。影像認證端可以認證不同分辨率影像層的內(nèi)容完整性,也可以驗證初始影像的內(nèi)容完整性。實驗與分析表明,該算法能夠?qū)崿F(xiàn)不同尺度下的遙感影像內(nèi)容完整性認證,并對篡改區(qū)域進行定位。
遙感影像;感知哈希;金字塔模型;完整性認證
遙感影像是獲取地表環(huán)境、資源等地學(xué)專題信息的重要載體,在國民經(jīng)濟發(fā)展中具有重要價值。但遙感影像處理技術(shù)的發(fā)展、計算機網(wǎng)絡(luò)的開放性及其固有的缺陷等,使得遙感影像在傳輸與使用過程中易遭受各種無意或有意的篡改攻擊。如果遙感影像的完整性、真實性受到質(zhì)疑,則其使用價值將大大降低。與此同時,遙感影像獲取技術(shù)的飛速發(fā)展,使得遙感影像的空間分辨率越來越高,數(shù)據(jù)量也越來越大。采用分層分塊策略的金字塔模型在影像瀏覽和顯示等方面有著獨特的優(yōu)勢,已得到廣泛應(yīng)用[1]。然而,現(xiàn)有針對影像金字塔的研究大多側(cè)重于金字塔的數(shù)據(jù)組織和應(yīng)用模型,安全方面的研究相對較少。因此,遙感影像的認證技術(shù)研究具有重要意義。
傳統(tǒng)的認證方法主要采用Hash函數(shù)實現(xiàn)數(shù)據(jù)的認證。但Hash函數(shù)(如SHA1和MD5)對數(shù)據(jù)的變化過于敏感,即使數(shù)據(jù)發(fā)生1 bit的改動,都無法通過認證。然而,遙感影像在使用過程中,經(jīng)過格式轉(zhuǎn)換、水印嵌入等操作之后,其內(nèi)容并沒有改變,變化的只是遙感影像的信息載體。這種情況下,Hash函數(shù)不能很好地認證遙感影像。感知哈希(Perceptual Hashing)為遙感影像的認證提供另一種可行的解決方法。感知哈希與Hash函數(shù)的顯著區(qū)別是:數(shù)據(jù)經(jīng)過格式轉(zhuǎn)換等不改變有效內(nèi)容的操作,感知哈希散列不發(fā)生變化或者變化很小。本文針對海量遙感影像數(shù)據(jù)的認證問題,研究基于金字塔模型的遙感影像感知哈希算法。
1.1 感知哈希
感知哈希是指一個多媒體對象的感知特征通過壓縮生成的簡短摘要,即將具有相同感知內(nèi)容的多媒體數(shù)字表示唯一地映射為一段數(shù)字摘要,并滿足感知魯棒性和安全性[2]。根據(jù)多媒體對象的不同,感知哈??煞譃閳D像感知哈希、音頻感知哈希、視頻感知哈希等。圖像感知哈希算法具有如下特征[3]:魯棒性,指內(nèi)容相同或相近的圖像生成的感知哈希散列應(yīng)相同或相近;唯一性,指內(nèi)容不同的圖像應(yīng)產(chǎn)生差異較大的感知哈希序列;安全性,從感知哈希序列中得不到圖像的有效內(nèi)容信息;復(fù)雜度,要求感知哈希算法具有較低的計算復(fù)雜度。此外, “篡改定位”也逐漸在許多感知哈希算法中實現(xiàn)。其中,魯棒性是感知哈希與密碼學(xué)Hash函數(shù)最大的區(qū)別。
目前,已有諸多學(xué)者展開圖像感知哈希的相關(guān)研究。Fridrich等提出一種基于低頻DCT系數(shù)的穩(wěn)健哈希算法[4],該算法利用了低頻DCT系數(shù)對圖像內(nèi)容有重要影響的特性產(chǎn)生感知哈希序列,能夠抵抗JPEG壓縮、濾波攻擊等,但是不能抵抗幾何攻擊。Monga等[5]提出一種基于特征點的感知哈希算法,該算法使用Morlet小波變換捕獲線性結(jié)構(gòu)的拐點作為圖像特征點,可以表征重要的視覺感知成分,具有很好的魯棒性,但計算復(fù)雜度較高。劉兆慶等[6]提出一種基于SIFT的圖像哈希算法,該算法選擇SIFT特征向量進行壓縮生成感知哈希序列,對幾何攻擊具有很好的魯棒性。Tang等[7]提出一種用于彩色圖像的感知哈希算法,將圖像從RGB顏色空間轉(zhuǎn)換到HSI和YCbCr顏色空間后,提取每個圖像分塊的統(tǒng)計特征生成感知哈希序列。Sun等[8]提出一種基于壓縮感知和傅立葉-梅林變換的感知哈希算法,有效壓縮了圖像的特征信息。
但是,針對遙感影像(尤其是海量遙感影像)的相關(guān)研究并不多。相對于普通的圖像數(shù)據(jù),遙感影像具有數(shù)據(jù)海量性的特點,往往可以達到數(shù)G甚至數(shù)十G,因此現(xiàn)有的圖像感知哈希算法無法直接應(yīng)用于遙感影像。此外,遙感影像常用于空間定位、地物提取等,對量測精度有很高要求?,F(xiàn)有圖像感知哈希算法針對圖像全局進行特征提取,直接應(yīng)用于海量遙感影像的認證,將無法有效檢測其局部細微變化,因此不能滿足遙感影像對認證精度的要求。
1.2 金字塔模型
金字塔模型是一種多分辨率的層次結(jié)構(gòu)模型[9],能夠滿足海量遙感影像實時顯示與漸進式傳輸?shù)囊?。遙感影像,尤其是海量、高分辨率遙感影像的特征表達具有鮮明的層次性[10]。遙感影像在分析與使用過程中,不同地物的識別存在著很明顯的分辨率差異,所使用的影像也存在明顯的分辨率差異。例如,植被分布識別的影像分辨率可以遠低于城市建筑物識別的影像分辨率;同一分辨率的影像中,水域的識別相比于城市建筑物的識別也更為容易。所以,同一種數(shù)據(jù)特征,在不同尺度下的描述可能并不相同。這里,尺度是地學(xué)數(shù)據(jù)的重要特征,一般指數(shù)據(jù)所表達的空間范圍的相對大小和時間相對長短[11]。單一分辨率的影像并不能滿足所有的分析與應(yīng)用,而多尺度的分析方法可以形成具有層次結(jié)構(gòu)的特征集合,可以獲取更為精確、客觀的信息?;诙喑叨炔呗栽O(shè)計感知哈希算法,可以增強算法魯棒性,并擴展其應(yīng)用。但是,現(xiàn)有的圖像感知哈希算法大多針對固定分辨率的圖像提取內(nèi)容特征,無法滿足遙感影像多尺度的認證需求。
影像金字塔的構(gòu)建是一個迭代變換的過程[12]:原始大數(shù)據(jù)量的影像作為金字塔的底層,對一幅原始影像首先按照不同分辨率進行分層,再對各層影像進行分塊,建立一系列范圍相同、但分辨率不同的影像。其中,原始影像分辨率最高,重采樣得到的影像分辨率則隨著金字塔層數(shù)的增加而降低。構(gòu)建金字塔模型常用的重采樣算法包括最近鄰插值、雙線性插值、立方卷積算法等[13,14]。
本文算法的總體流程如下:首先,構(gòu)建影像金字塔,得到不同分辨率的各級影像,并對每一級影像進行格網(wǎng)劃分;然后,針對每個格網(wǎng)單元,采用DCT變換的方式生成其感知哈希序列;最后,得到原始影像基于金字塔模型的感知哈希序列。在數(shù)據(jù)接收端,用戶根據(jù)實際需求,對相應(yīng)分辨率的影像層進行完整性認證,并對可能的篡改進行定位。
2.1 構(gòu)建影像金字塔
首先,構(gòu)建影像金字塔,并對每層進行均勻格網(wǎng)劃分。具體步驟:1)初始影像作為金字塔的底層,即第0層,并對其進行格網(wǎng)劃分;2)在第0層基礎(chǔ)上,通過雙線性插值,構(gòu)建長、寬各為原始影像1/2的像素矩陣,即影像金字塔第1層,并對其進行格網(wǎng)劃分;3)在影像金字塔第1 層的基礎(chǔ)上,采用相同的方法,構(gòu)建影像第2層,并對其進行格網(wǎng)劃分;4)依次類推,構(gòu)建上一層影像,最后形成一個多層次的影像金字塔。
影像層進行格網(wǎng)劃分的粒度越細,篡改定位的精度也就越高,且算法能夠感知影像層更細微的變化。但是,格網(wǎng)劃分的過細,將會消耗更多的計算時間和存儲空間。所以,格網(wǎng)劃分的粒度應(yīng)當(dāng)根據(jù)計算效率、影像大小及篡改定位粒度等因素決定。為了滿足遙感影像對認證精度的要求,同時兼顧效率,格網(wǎng)單元應(yīng)在128×128~256×256之間為宜。每個格網(wǎng)單元可由坐標(biāo)(level,x,y) 進行唯一標(biāo)識,其中,level表示格網(wǎng)單元所在的層,x和y分別表示格網(wǎng)單元所在的行和列。
2.2 生成感知哈希序列
感知哈希的關(guān)鍵在于內(nèi)容特征的提取。現(xiàn)有感知哈希算法中,DCT變換是感知哈希常用的特征提取方式,能夠很好地滿足魯棒性、摘要性、唯一性等要求。圖像經(jīng)過DCT變換之后,部分較大的AC系數(shù)保持著大量能量和紋理信息,可以很好地反映原始圖像的內(nèi)容特征。所以,本文算法采用DCT變換生成格網(wǎng)單元的感知哈希序列,具體步驟如下:1)預(yù)處理,將格網(wǎng)單元轉(zhuǎn)變?yōu)?55階的灰度圖,并通過重采樣將分辨率調(diào)整為m×m(實驗中m=32)。2)將m×m灰度圖分割為n×n(實驗中n=8)的分塊,每個分塊進行DCT變換,并選取每個分塊的DC系數(shù)和3個低頻AC系數(shù)。該過程忽略了高頻AC系數(shù),能夠增強哈希序列對噪聲的魯棒性。3)將提取的系數(shù)量化為二值序列。DC系數(shù)的量化規(guī)則為:首先計算各分塊DC系數(shù)均值,DC系數(shù)大于均值時置為1,否則置為0。AC系數(shù)的量化規(guī)則為:計算各分塊對應(yīng)位置的系數(shù)均值,系數(shù)大于對應(yīng)的均值時置為1,否則置為0。4)加密量化后的二值序列。加密算法可以選擇主流的對稱加密算法(基于密鑰長度靈活性的考慮,本文采用RC4算法)。加密后的字符串就是格網(wǎng)單元的感知哈希序列,記為PH(level,x,y),其中,level、x、y的意義等同于格網(wǎng)單元的坐標(biāo)。
為便于影像的認證,將每層影像的格網(wǎng)單元感知哈希序列串聯(lián),記為PHlevel;串聯(lián)各層影像的PHlevel得到原始遙感影像的感知哈希序列,記為PH。
2.3 多尺度的完整性認證與篡改定位
(1)
其中:h1和h2為長度是L的感知哈希序列。兩個感知哈希序列的歸一化Hamming距離越大,說明相應(yīng)的影像內(nèi)容差別也就越大。如果兩個感知哈希的歸一化Hamming距離低于設(shè)置的閾值Th,說明相應(yīng)的區(qū)域沒有發(fā)生能夠感知的差別,可以認為內(nèi)容上保持不變;反之,說明相應(yīng)的區(qū)域內(nèi)容發(fā)生較大變化,也就是遭到了某種可能的篡改。閾值Th的設(shè)定能夠調(diào)節(jié)算法魯棒性和篡改敏感性間的矛盾。
對不同的影像層進行完整性認證,篡改定位的粒度也不同。對影像的第0層,也就是原始影像進行完整性認證,得到的認證精度最高,如果發(fā)生篡改,那么篡改定位的粒度也最細。但對第0層進行認證不僅時間消耗最大,而且也不必要。如果某一影像層的內(nèi)容被確認篡改,那么原始影像相應(yīng)區(qū)域的內(nèi)容也遭到了某種篡改。
本文選用Tiff格式遙感影像(圖1,見封2),數(shù)據(jù)大小約為380M,空間分辨率為10 000×10 000。實驗硬件平臺為:3.1GHz主頻的CPU,可用內(nèi)存2.99G,軟件開發(fā)平臺為VisualStudio2010和C。
構(gòu)建原始影像的金字塔。初始影像作為金字塔的第0層,并對其進行64×64的均勻格網(wǎng)劃分;在第0層基礎(chǔ)上,通過雙線性插值,構(gòu)建影像金字塔第1層,其長、寬分別為5 000,并對其進行32×32均勻格網(wǎng)劃分;依次類推,構(gòu)建影像第2層、第3層和第4層,大小分別是2 500×2 500、1 250×1 250、725×725,并分別進行16×16、8×8、4×4的格網(wǎng)劃分,形成5個影像層的金字塔。然后計算每個格網(wǎng)單元的感知哈希序列,實際是長度為64的0~1序列(可用8個字節(jié)表示)。
在影像接收端進行完整性認證與篡改定位。用戶根據(jù)實際情況選擇影像金字塔的不同影像層進行完整性認證。其中,閾值Th通過實驗設(shè)定為0.02。圖2為影像局部被篡改后,不同影像層的相同區(qū)域的格網(wǎng)單元對比實例。圖2e所示的格網(wǎng)單元相對于圖2a和2c的格網(wǎng)單元,包含的范圍更大,分辨率也更低。圖2b、圖2d和圖2f分別為篡改區(qū)域在不同影像層的格網(wǎng)單元。
圖2 篡改格網(wǎng)單元示例
Fig.2 Tamper grid examples
表1所示為圖2所示的格網(wǎng)篡改之后與原始格網(wǎng)單元的歸一化Hamming距離對比。由表1可知,越底層的影像層,篡改識別能力逐步增強。但是,如前文所述,篡改識別能力的提高將會增加計算開銷。
相同的篡改在金字塔不同影像層的篡改定位粒度也不相同。圖3(見封2)分別為第0層、第1層和第2層的篡改定位結(jié)果,雖然3個影像層均能檢測到篡改,但第0層的篡改定位粒度最為精確。
表1 不同影像層的瓦片篡改對比示例
Table 1 Tamper comparison of the grids at different layers
歸一化Hamming距離格網(wǎng)單元(2,14,14)篡改前后0.031250格網(wǎng)單元(1,28,28)篡改前后0.046875格網(wǎng)單元(0,57,57)篡改前后0.109375
在漸進式網(wǎng)絡(luò)傳輸過程中,用戶往往先收到分辨率較低的影像,然后收到分辨率逐步提高的影像。如果收到的低分辨率影像已經(jīng)檢測到篡改,可能沒必要接收后繼的高分辨率影像層。
本文算法的安全性依托于RC4算法的安全性,在加密密鑰安全的情況下,算法有足夠的安全保障。
本文針對遙感影像的數(shù)據(jù)海量性特點,提出一種基于金字塔模型的遙感影像的感知哈希算法。該算法在原始遙感影像基礎(chǔ)上建立不同分辨率的影像層,每層影像進行格網(wǎng)劃分后,通過DCT變換提取各格網(wǎng)單元的內(nèi)容特征生成感知哈希序列。本文算法在多個尺度下提取影像的內(nèi)容特征,符合人類對影像數(shù)據(jù)從整體到局部的感知過程,也為多尺度的遙感影像分析方法奠定基礎(chǔ),同時為海量影像的漸進式傳輸提供了可行的認證方法。實驗與分析表明,本文算法能夠?qū)崿F(xiàn)海量遙感影像不同尺度下的內(nèi)容完整性認證,但本文算法存在著認證信息數(shù)據(jù)量較大的不足。影像特征更為有效的壓縮與摘要化的表示方法將是下一步研究的重點。
[1] 程承旗,張恩東,萬元嵬,等.遙感影像剖分金字塔研究[J].地理與地理信息科學(xué),2010,25(1):19-23.
[2] 牛夏牧,焦玉華.感知哈希綜述[J].電子學(xué)報,2008,36(7):1405-1411.
[3] 張維克,孔祥維,尤新剛.安全魯棒的圖像感知哈希技術(shù)[J].東南大學(xué)學(xué)報(自然科學(xué)版),2007,37(1):188-192.
[4] FRIDRICH J,GOLJAN M.Robust Hash functions for digital watermarking[A].GOLJAN M.Proceedings International Conference on Information Technology:Coding and Computing[C].2000.178-183.
[5] MONGA V,EVANS B L.Perceptual image hashing via feature points:Performance evaluation and tradeoffs[J].Image Processing,IEEE Transactions on,2006,15(11):3452-3465.
[6] 劉兆慶,李瓊,劉景瑞,等.一種基于SIFT的圖像哈希算法[J].儀器儀表學(xué)報,2011,32(9):2024-2028.
[7] TANG Z,ZHANG X,DAI X,et al.Robust image hash function using local color features[J].AEU-International Journal of Electronics and Communications,2013,67(8):717-722.
[8] SUN R,ZENG W.Secure and robust image hashing via compressive sensing[J].Multimedia Tools and Applications,2014,70:1651-1665.
[9] 馬琪,謝忠.海量柵格地理數(shù)據(jù)的組織與調(diào)度[J].地理與地理信息科學(xué),2009,24(6):39-41.
[10] PARKER J A,KENYON R V,TROXEL D E.Comparison of interpolating methods for image resampling[J].Medical Imaging,IEEE Transactions on,1983(1):31-39.
[11] 徐磊,吳立新,車德福,等.面向數(shù)據(jù)集成的城市空間數(shù)據(jù)內(nèi)涵與特征分析[J].地理與地理信息科學(xué),2005,21(6):25-28.
[12] 鄒勤,賈永紅.一種基于形態(tài)金字塔的遙感影像融合方法及其性能評價[J].武漢大學(xué)學(xué)報 (信息科學(xué)版),2006(11):971-974.
[13] 萬元嵬,程承旗,宋樹華.大數(shù)據(jù)量遙感影像快速顯示剖分組織方法研究[J].地理與地理信息科學(xué),2009,25(3):33-36.
[14] 孫顯,付琨,王宏琦.高分辨率遙感圖像理解[M].北京:科學(xué)出版社,2011.
A Perceptual Hash Algorithm Based on Pyramid Model for Remote Sensing Image Authentication
DING Kai-meng1,2,ZHU Chang-qing1
(1.KeyLaboratoryofVirtualGeographicEnvironment,MinistryofEducation,NanjingNormalUniversity,Nanjing210023;2.CollegeofNetworkandCommunicationEngineering,JinlingInstituteofTechnology,Nanjing211169,China)
In the light of the massive characteristic of remote sensing image,a perceptual Hash algorithm based on pyramid model for remote sensing image authentication is proposed.Firstly,multi-resolution image layers are build based on the original remote sending image by resampling,and the image layers are divided into grids in accordance with the authentication requirement.Secondly,the feature of the grid is extracted by block DCT transform to generate the grid perceptual Hash,and then the perceptual Hash value of the remote sensing image is gotten.At the authentication end,the content integrity of the remote sensing image or the image layer with different resolution can be verified through the
Hash value.The experiments indicated that the algorithm can authenticate remote sensing image at different scale and locate the tampered area.
remote sensing image; perceptual Hash algorithm; pyramid model; integrity authentication
2014-08-23;
2014-10-14
國家自然科學(xué)基金項目(41301413);國家社科基金重大項目(11&ZD162);江蘇省自然科學(xué)基金項目(BK20130903)
丁凱孟(1985-),男,博士研究生,主要研究方向為地理數(shù)據(jù)安全。E-mail:dingkaimeng@foxmail.com
10.3969/j.issn.1672-0504.2015.02.004
TP391
A
1672-0504(2015)02-0016-04