王昊,張黎明,張鑫港,劉明軒
(1.蘭州交通大學(xué) 測繪與地理信息學(xué)院,蘭州 730070;2.蘭州交通大學(xué) 地理國情監(jiān)測技術(shù)應(yīng)用國家地方聯(lián)合工程研究中心,蘭州 730070;3.甘肅省地理國情監(jiān)測工程實(shí)驗(yàn)室,蘭州 730070)
高光譜遙感技術(shù)因其獨(dú)特的光譜特征,被廣泛地應(yīng)用于林業(yè)及農(nóng)業(yè)精細(xì)化管理[1]、軍事探測[2]、土地覆蓋分類[3]、現(xiàn)代化城市規(guī)劃與建設(shè)[4]等諸多領(lǐng)域,成為對地觀測的重要技術(shù)之一。計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展使得信息共享與傳播變得更加便捷高效,因此高光譜遙感影像勢必迎來更大規(guī)模的傳播與應(yīng)用。然而,隨著遙感影像處理技術(shù)日漸成熟,增加了影像在傳播過程中面臨非法篡改的風(fēng)險(xiǎn)。因此,高效可靠的高光譜遙感影像內(nèi)容完整性認(rèn)證是保證影像應(yīng)用的重要基礎(chǔ)。
基于感知哈希的數(shù)據(jù)內(nèi)容完整性認(rèn)證技術(shù)是近幾年國內(nèi)外學(xué)者的研究熱點(diǎn)。感知哈希技術(shù)是實(shí)現(xiàn)原始多媒體數(shù)據(jù)到與數(shù)據(jù)相對應(yīng)的感知摘要集的過程,可以將具有相同感知內(nèi)容的數(shù)據(jù)唯一地映射成一段數(shù)字摘要[5]。與數(shù)字簽名和數(shù)字水印相比[6-7],感知哈希具有較高的魯棒性和安全性,并且為數(shù)據(jù)內(nèi)容的識別、檢索以及認(rèn)證提供了可靠的技術(shù)支撐[8-11]。由于感知哈希在多媒體圖像內(nèi)容完整性認(rèn)證和圖像檢索等方面具有良好的性能,基于感知哈希的地理空間數(shù)據(jù)完整性的認(rèn)證逐漸成為近些年學(xué)者們研究的重點(diǎn)內(nèi)容。Zhang等[12]首次提出一種基于感知哈希的矢量地理數(shù)據(jù)認(rèn)證方法,該方法對常見的矢量數(shù)據(jù)攻擊都具有較好的魯棒性。另外,張鑫港等[13]結(jié)合DEM數(shù)據(jù)特點(diǎn),提出了一種適用于DEM數(shù)據(jù)認(rèn)證與篡改定位的感知哈希算法,采用DCT提取DEM數(shù)據(jù)的特征信息,并結(jié)合DEM數(shù)據(jù)的高程相對中誤差,實(shí)現(xiàn)了對DEM數(shù)據(jù)中局部數(shù)據(jù)惡意篡改的檢測與定位。此外,基于感知哈希的遙感影像內(nèi)容完整性認(rèn)證算法也受到廣泛關(guān)注。丁凱孟等[14-16]提出了一系列遙感影像內(nèi)容完整性認(rèn)證算法,其中,基于改進(jìn)的U-Net模型的高分辨率遙感影像完整性認(rèn)證感知哈希算法創(chuàng)新性地實(shí)現(xiàn)了基于影像邊緣特征的感知哈希技術(shù)與深度學(xué)習(xí)的結(jié)合[17],從而更加精確地檢測影像內(nèi)容是否遭遇篡改,并且對高分辨率遙感影像常見的內(nèi)容保持操作具有極高的魯棒性,但該算法對局部篡改定位能力不足。Zhang等[18]提出了顧及影像全局特征與局部特征的高分辨率遙感影像內(nèi)容完整性算法,結(jié)合SURF特征提取方法和Zernike矩提取影像的局部特征和全局特征,實(shí)現(xiàn)了對影像不同類型攻擊方式的識別,以及對影像局部篡改的檢測與定位。然而,這兩種算法都是在影像的灰度圖像上提取用于完整性認(rèn)證的空間特征,未能顧及影像的光譜特征信息。此外,Ding等[19]提出了一種用于多光譜影像認(rèn)證的感知哈希算法,通過波段聚類以及融合波段的邊緣特征實(shí)現(xiàn)了對多光譜遙感影像的內(nèi)容完整性認(rèn)證,在影像完整性認(rèn)證的過程中考慮到了波段信息的重要性,具有良好的魯棒性。
綜上所述,現(xiàn)有的遙感影像內(nèi)容完整性算法可以為高光譜遙感影像的內(nèi)容完整性認(rèn)證提供重要的參考,但其直接用于高光譜遙感影像存在以下問題:將影像轉(zhuǎn)換為灰度圖像進(jìn)而提取影像空間特征信息的方式,對高光譜影像的光譜信息利用不足,不能充分結(jié)合高光譜影像的數(shù)據(jù)特征;高光譜影像包含眾多的子波段,以波段聚類處理及特征融合的方式提取影像特征的處理過程相對比較復(fù)雜,計(jì)算量大。鑒于此,本文提出一種顧及光譜信息的高光譜影像內(nèi)容認(rèn)證感知哈希算法,實(shí)現(xiàn)對高光譜影像內(nèi)容完整性的認(rèn)證;在對影像中局部地物修改保持敏感的同時,能夠容忍部分常見的內(nèi)容保持操作,具有較好的魯棒性。
本文提出一種顧及光譜信息的高光譜遙感影像內(nèi)容認(rèn)證感知哈希算法。特征提取是感知哈希當(dāng)中的關(guān)鍵步驟。首先,在格網(wǎng)劃分的基礎(chǔ)上,基于K-均值聚類,從地物分類的直方圖統(tǒng)計(jì)結(jié)果中提取影像的光譜信息特征描述符fspectral;然后,通過計(jì)算影像的Zernike矩生成格網(wǎng)單元高光譜影像的空間特征描述符fspatial;最后,將二者結(jié)合,作為每個格網(wǎng)單元影像最終的特征描述,用以生成影像的感知哈希序列。對于高光譜數(shù)據(jù)而言,本文提出的影像感知哈希序列生成的流程如圖1(a)所示,其中上行部分是原影像空間特征提取的計(jì)算過程,下行部分是光譜特征提取過程,具體計(jì)算將在后續(xù)逐一展開闡述。按照上述感知哈希序列生成的方式,提取每一個格網(wǎng)影像的感知哈希序列。影像認(rèn)證過程中,采用上述同樣的方式生成待認(rèn)證每一個格網(wǎng)單元影像的感知哈希序列,通過計(jì)算原始影像與待認(rèn)證影像之間的哈希序列的差異性,實(shí)現(xiàn)對影像完整性的認(rèn)證。圖1(b)為影像完整性認(rèn)證的過程。
圖1 算法基本框架
遙感影像的發(fā)展與進(jìn)步主要體現(xiàn)在兩個方面:一是通過改進(jìn)遙感器視場角來提高影像空間分辨率;二是增加影像的波段數(shù)量并降低各個子波段的帶寬,從而提高影像的光譜分辨率[20]。高光譜遙感影像正是遙感影像光譜分辨率取得突破性提高的重要產(chǎn)物。與其他類型的遙感影像不同,高光譜遙感影像通常包含了幾十個、幾百個甚至幾千個子波段,不同波段所對應(yīng)的光譜信息可應(yīng)用于不同的應(yīng)用場景,因此,高光譜影像中包含極其豐富的光譜信息。雖然高光譜遙感影像的空間分辨率不及高分辨率遙感影像,但是作為一種基本的遙感影像,同樣包含豐富的地物信息,加之?dāng)?shù)量較多的子波段,高光譜遙感影像往往有著較大的數(shù)據(jù)量。
因此,研究適用于高光譜遙感影像內(nèi)容完整性認(rèn)證的感知哈希算法需考慮以下因素。
1)與高分辨率遙感影像不同,僅考慮影像的空間特征信息會造成影像當(dāng)中光譜信息的遺漏,因此,最佳的方式是能夠兼顧光譜特征信息和空間特征信息,并將二者用于生成影像的特征描述。
2)考慮到高光譜遙感影像較大數(shù)據(jù)量帶來的算法效率問題,逐波段的特征提取方式勢必會增加算法的復(fù)雜度和算法的計(jì)算效率。
現(xiàn)有影像中局部惡意篡改定位方法的基本思路是:對影像進(jìn)行相應(yīng)的格網(wǎng)劃分,通過對每一個格網(wǎng)里的內(nèi)容進(jìn)行認(rèn)證,進(jìn)而確定篡改的位置。參考該方法,本文算法中因?yàn)樯婕暗交贙-均值算法的影像地物分類,因此,為了消除分類過程中影像邊緣部分對分類精度的影響,采用滑動窗口的形式對圖2所示的原始影像I進(jìn)行格網(wǎng)劃分。其中,每一個格網(wǎng)的大小為200×200,滑動步長為100。實(shí)際當(dāng)中,若影像邊界的格網(wǎng)不足200,則用0對該格網(wǎng)進(jìn)行補(bǔ)全,其中,每一個格網(wǎng)單元的影像為Iij(i=1,2,3…;j=1,2,3…),i和j分別為格網(wǎng)劃分后的行格網(wǎng)數(shù)索引和列格網(wǎng)數(shù)索引。
圖2 影像格網(wǎng)劃分方式
格網(wǎng)劃分后的每一個格網(wǎng)單元影像Iij通過兩個并行的方式分別進(jìn)行空間特征和光譜特征的提取(圖1(a)),主要包括基于地物分類的光譜特征提取和基于Zernike矩的影像空間特征提取。
1)光譜特征。光譜信息是遙感影像解譯的重要信息之一,高光譜遙感影像可以明顯地提高土地覆蓋和土地利用分類的能力[21]。因此,本文在影像光譜信息提取的第一個階段對影像進(jìn)行地物分類處理。
非監(jiān)督的影像分類方法,是高光譜遙感影像分類常用的分類方法之一。K-均值算法是非監(jiān)督分類方法當(dāng)中一種典型的動態(tài)聚類方法,也是一種較為普遍的方法[22]。本文采用K-均值算法對原影像進(jìn)行分類處理。
(1)
式中:k是格網(wǎng)影像地物分類的類別數(shù);n1,n2,…,nk是每一類地物所對應(yīng)的像元直方圖統(tǒng)計(jì)的結(jié)果。本文定義k的值為10,即將每一個格網(wǎng)影像中地物以同樣的計(jì)算方式分為固定的10類,基于K-均值算法的地物分類過程中,類別k往往都是通過人為設(shè)定的方式確定的,這是K-均值算法在影像分類過程中固有的缺陷。但是,本文只研究通過K-均值算法提取影像的光譜特征,關(guān)于k值與分類精度之間的關(guān)系本文不做進(jìn)一步的研究。
2)空間特征。Zernike矩于1934年被提出,極坐標(biāo)下單位圓上n階m次的Zernike核函數(shù)定義如式(2)所示。
Vn,m(ρ,θ)=Rn,m(ρ)ejmθ,ρ≤1
(2)
式中:j表示虛數(shù)單位;極坐標(biāo)下的單位圓上的核函數(shù)集{Vn,m(ρ,θ)}滿足正交性;{Rn,m(ρ)}是一個徑向多項(xiàng)式。
二維圖像f(x,y)的Zernike矩在直角坐標(biāo)系和極坐標(biāo)系下的定義如式(3)至式(4)所示。
(3)
(4)
Zernike矩作為一個正交矩具有以下特性:復(fù)數(shù)矩、完備性、正交性、旋轉(zhuǎn)不變性[23]。對于圖像而言,低階Zernike特征向量描述的是圖像的整體特征,其高階特征向量可以很好地描述圖像的細(xì)節(jié)特征。本文采用Zernike矩提取高光譜影像中的空間特征信息,從而生成影像的空間特征描述符。利用影像的Zernike矩進(jìn)行高光譜影像的空間特征提取,其中3階至12階Zernike矩的數(shù)量如表1所示。
表1 不同階Zernike矩統(tǒng)計(jì)結(jié)果
(5)
為了生成格網(wǎng)影像的感知哈希序列,需要對上述過程中所生成的空間特征描述符和光譜特征描述符展開進(jìn)一步處理。實(shí)際計(jì)算過程中可以發(fā)現(xiàn),通過Zernike矩提取到的影像空間特征描述符數(shù)量級較小,而光譜特征描述的計(jì)算結(jié)果會是一個數(shù)量級比較大的結(jié)果。因此,本文通過調(diào)節(jié)因子N使得每個格網(wǎng)影像的空間特征描述符和光譜特征描述盡可能保持在統(tǒng)一數(shù)量級上。同時,本文算法在影像特征提取的過程中,顯而易見地,通過直方圖統(tǒng)計(jì)結(jié)果生成的影像光譜特征描述對噪聲等相關(guān)類型攻擊的魯棒性較差。因此,在格網(wǎng)影像感知哈希序列過程中,通過權(quán)重因子α協(xié)調(diào)空間特征描述符和光譜特征描述符在魯棒性方面的優(yōu)劣。通過以上方式,確保影像完整性認(rèn)證結(jié)果的準(zhǔn)確性和算法整體的魯棒性,具體計(jì)算過程如式(6)所示。
(6)
通過這種方式,最終格網(wǎng)影像的中間感知哈希序列是長度為39的十進(jìn)制序列。
為進(jìn)一步增加感知哈希序列的安全性,需要對該感知哈希序列進(jìn)行加密處理。由于混沌系統(tǒng)對初始值變化敏感,而且計(jì)算速度快,因此,采用混沌系統(tǒng)生成加密密鑰。采用Logistic映射生成混沌序列。Logistic映射的表達(dá)如式(7)所示。
(7)
假設(shè)K∈(0,1)是數(shù)據(jù)發(fā)行方和用戶共享的加密密鑰,通過式(8)可以生成串行密鑰對感知哈希序列進(jìn)行加密。
(8)
L=(L1,L1,…,L39)
(9)
(10)
在影像的感知哈希序列生成的基礎(chǔ)上,影像完整性認(rèn)證是比較數(shù)據(jù)發(fā)行方原始影像與用戶方待認(rèn)證影像的感知哈希序列之間的差異性實(shí)現(xiàn)的,若二者之間的差異性度量結(jié)果小于某一閾值T,則判定該影像的內(nèi)容未發(fā)生改變,否則判定為已篡改影像。
本算法在影像完整性認(rèn)證過程中,用戶對生成的感知哈希序列進(jìn)行對應(yīng)的解密,提取原始影像和待認(rèn)證影像的中間哈希,并逐次計(jì)算原始影像與待認(rèn)證影像的每一個格網(wǎng)影像的感知哈希序列的歐氏距離,表達(dá)如式(11)所示。
(11)
通過對比計(jì)算的結(jié)果dis與閾值T的關(guān)系實(shí)現(xiàn)對影像完整性的認(rèn)證:若dis≤T,判定該影像內(nèi)容無篡改;若dis>T,判定該影像為篡改影像。通過以上方法,影像完整性認(rèn)證的最終結(jié)果可以將整幅影像的局部篡改定位到具體的格網(wǎng)當(dāng)中。同時,由于影像在預(yù)處理過程中采用滑動的思想進(jìn)行可重疊的格網(wǎng)劃分,因此,定位到的篡改格網(wǎng)之間的相互重疊部分便是影像中局部篡改的區(qū)域。這種方式對篡改的區(qū)域?qū)崿F(xiàn)了更加精細(xì)的定位,閾值的計(jì)算方式在實(shí)驗(yàn)部分進(jìn)行闡述。
本文選用2018 IEEE GRSS Data Fusion比賽所提供的高光譜數(shù)據(jù)[25],該數(shù)據(jù)共包含48個波段,空間分辨率為1 m,光譜范圍為380~1 050 nm。從原始影像中裁取三幅大小為1 200像素×1 200像素的影像作為本算法的實(shí)驗(yàn)數(shù)據(jù),用以驗(yàn)證該算法的有效性。
合理的閾值T是影像在完整性認(rèn)證過程中的關(guān)鍵所在。一般來說,隨著閾值的增加,所生成的影像感知哈希序列能夠容忍更多的失真操作,但同時也會增加影像中局部篡改定位的準(zhǔn)確率。因此,選取合理的篡改認(rèn)證閾值T是提高算法性能關(guān)鍵所在。該閾值要保證能夠精確識別影像當(dāng)中的局部惡意篡改的同時,增加算法對常見的內(nèi)容保持操作的可容忍性(即魯棒性)。閾值確定的過程如下。
定義2個集合:W0為未遭遇篡改的格網(wǎng)影像的集合(dis≤T);W1為篡改的格網(wǎng)影像的集合(dis>T)。定義真正率和真假率分別如式(12)、式(13)所示。
Pd=P{dis≤T|W0}
(12)
Pf=P{dis>T|W1}
(13)
對圖3中的原始數(shù)據(jù),采用部分替換的方式,對原圖中的地物進(jìn)行不同規(guī)模的篡改,生成對應(yīng)的篡改數(shù)據(jù)集。對于所有格網(wǎng)影像,如圖3所示,通過調(diào)整歐氏距離,繪制Pd和Pf的變化趨勢曲線。從圖中可以清楚地觀察到,隨著閾值T的增大,Pd呈不斷增長的趨勢,同時當(dāng)T<2.5時,Pf可以忽略不計(jì)。
圖3 Pd、Pf、Pm的變化趨勢
為進(jìn)一步確定篡改格網(wǎng)影像和原始格網(wǎng)影像之間的判別閾值,需另外定義假負(fù)率Pm,表達(dá)如式(14)所示。
Pm=P{dis>T|W0}
(14)
式中:Pm和Pd是兩種相對立的情況,即Pm=1-Pd。通常情況下,選擇等誤差率點(diǎn)(equal error rate point,EERP)作為工作點(diǎn),即Pf=Pm。本算法中,當(dāng)T=2.68時,為原始格網(wǎng)影像與篡改格網(wǎng)影像判別的最佳閾值,即上述過程中提到的工作點(diǎn)。
為驗(yàn)證算法在影像局部篡改定位能力方面的性能,應(yīng)用上述方式對圖3所示的測試數(shù)據(jù)當(dāng)中的篡改影像進(jìn)行局部篡改定位的測試。如圖4所示,算法可以在格網(wǎng)的基礎(chǔ)上通過格網(wǎng)之間的重疊部分,對影像的局部惡意篡改區(qū)域進(jìn)行更加精細(xì)的定位,其中,篡改規(guī)模最小的區(qū)域只占原始影像的3.31%,這說明,本算法能夠識別并定位影像中較為細(xì)微的篡改。
圖4 影像局部篡改定位結(jié)果
另外,本算法可以檢測出高光譜影像中的波段刪減操作。影像中部分波段被刪減后,全體格網(wǎng)影像認(rèn)證的平均歐氏距離與局部篡改后的全體格網(wǎng)影像的平均歐氏距離的統(tǒng)計(jì)結(jié)果如表2所示。從表2可以直觀地看出,即使影像中僅一個波段的數(shù)據(jù)被刪除,計(jì)算得到的平均歐氏距離也遠(yuǎn)大于篡改影像,這說明該算法可以在實(shí)現(xiàn)局部篡改定位的同時,識別出影像的波段刪除以及常見的波段重組操作。
表2 影像篡改的平均歐氏距離統(tǒng)計(jì)結(jié)果
本文算法主要通過基于影像格網(wǎng)劃分的思想完成對影像中局部篡改的定位,而基于影像塊的認(rèn)證算法需要對算法的可分性做進(jìn)一步的研究[26]。換言之,從同一影像中隨機(jī)選取一對子塊影像,并比較二者之間的感知哈希距離,其目的在于檢驗(yàn)算法所生成的感知哈希序列能否正確區(qū)別感知上不同的子塊影像,這一過程可以體現(xiàn)出算法在塊級別上的惡意篡改檢測能力。本文對約60 000對子塊進(jìn)行感知哈希序列的度量,最后得到的感知哈希序列度量距離的平均值為4.32,該結(jié)果大于設(shè)定的篡改判定閾值,說明算法在塊級別的影像上具有較好的可分性。
結(jié)合感知哈希的數(shù)據(jù)完整性認(rèn)證方法的魯棒性是指,由于原始數(shù)據(jù)經(jīng)過相關(guān)內(nèi)容保持操作之后,數(shù)據(jù)本身的內(nèi)容并沒有發(fā)生改變,或者改變極小且不影響數(shù)據(jù)的進(jìn)一步應(yīng)用,故而最終的認(rèn)證結(jié)果不會將這類數(shù)據(jù)判定為已篡改數(shù)據(jù)。通常情況下,遙感影像在實(shí)際使用過程中,會出現(xiàn)不同格式以及存儲形式的影像數(shù)據(jù)。與原始影像相比,這類影像本身內(nèi)容并未遭遇篡改。因此,要保證算法對這類影像的魯棒性。本算法對影像的DAT格式轉(zhuǎn)換、BIL格式轉(zhuǎn)換、BIP格式轉(zhuǎn)換、BSQ格式轉(zhuǎn)換以及LSB水印嵌入進(jìn)行了魯棒性測試。本文采用認(rèn)證率驗(yàn)證算法的魯棒性。認(rèn)證率是影像認(rèn)證過程中,判定為內(nèi)容完整的格網(wǎng)影像的數(shù)量與總的格網(wǎng)影像數(shù)量的比值。魯棒性測試結(jié)果如表3所示。
表3 魯棒性測試結(jié)果 %
用于影像內(nèi)容完整性認(rèn)證的感知哈希算法的安全性是指算法所生成的感知哈希序列的抗偽造能力,具體來說包括:其他不可信任的用戶不能僅通過原影像偽造授權(quán)用戶得到的原始感知哈希序列;感知哈希序列的生成過程應(yīng)當(dāng)是不可逆的,即不能通過感知哈希序列還原或偽造原始數(shù)據(jù)。本文通過Logistic算法對生成的中間感知哈希序列進(jìn)行加密與置亂,通過這種方式消除了感知哈希序列與對應(yīng)影像之間的相關(guān)性,同時提高了隨機(jī)性,保證生成的感知哈希序列的抗碰撞性。
本文提出了一種顧及光譜信息的高光譜遙感影像內(nèi)容完整性認(rèn)證感知哈希算法,整體上實(shí)現(xiàn)了對影像中局部地物惡意篡改的定位,并且對部分常見的內(nèi)容保持操作具有較好的魯棒性。本文主要研究了以下內(nèi)容:研究高光譜遙感影像與其他類型遙感影像之間數(shù)據(jù)本身的區(qū)別,并通過K-均值聚類算法,構(gòu)建高光譜遙感影像的光譜信息特征描述符;研究Zernike矩在影像空間特征提取過程中的特性,構(gòu)建高光譜遙感影像的空間特征描述符;影像完整性認(rèn)證過程中,在格網(wǎng)劃分思想的基礎(chǔ)上,通過真正率、假正率以及假負(fù)率之間的關(guān)系確定判定閾值,從而將影像中的局部惡意篡改定位到具體的子塊當(dāng)中。但該算法在地物分類的精度以及其他類型的失真操作的魯棒性方面需要進(jìn)一步的提升,從而實(shí)現(xiàn)更加精確的影像局部篡改定位。因此,更加精細(xì)的高光譜影像光譜特征提取,以及更為魯棒的影像內(nèi)容完整性認(rèn)證算法是下一步研究的重點(diǎn)內(nèi)容。