李 兵,趙明華,王 鋒
(西安理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,陜西 西安 710048)
伴隨大數(shù)據(jù)時(shí)代的來臨,數(shù)字圖像被廣泛使用于人們的工作生活中,圖像編輯與處理工具也得到迅猛發(fā)展,通過圖像編輯工具可以偽造出真假難辨的數(shù)字圖像,顛覆了人類“眼見為實(shí)”的傳統(tǒng)觀念[1]。尤其是將數(shù)字圖像篡改應(yīng)用在政治、軍事及司法等敏感領(lǐng)域時(shí),會(huì)對(duì)社會(huì)的平穩(wěn)發(fā)展帶來很多負(fù)面影響。由此可以看出,關(guān)于數(shù)字圖像篡改檢測(cè)的研究擁有重要意義[2]。
數(shù)字水印是通過數(shù)字嵌入的形式將信息隱藏在數(shù)字化媒體內(nèi),以此完成隱秘傳輸、身份驗(yàn)證、版權(quán)保護(hù)等功能,將此種手段應(yīng)用于數(shù)字圖像內(nèi),能夠極大地維護(hù)圖像的信息安全,具備極高的應(yīng)用價(jià)值。文獻(xiàn)[3]提出了基于SVD和直方圖的JPEG同幅圖像篡改盲檢測(cè)方法,分析了基于小波變換和奇異值分解方法對(duì)同幅圖像拼接篡改檢測(cè)的缺點(diǎn),結(jié)合相關(guān)重要的思想,構(gòu)建了一種改進(jìn)算法,該算法運(yùn)用SVD提取圖像塊特征,并采用偏移頻率的直方圖來確定閾值。但是該方法的圖像篡改盲檢測(cè)精度較低。文獻(xiàn)[4]提出了基于雙信息統(tǒng)計(jì)與引力聚類的圖像篡改檢測(cè)方法,利用Hessian矩陣來準(zhǔn)確提取圖像的特征點(diǎn),通過圖像的梯度直方圖來描述圖像的方向特征,并聯(lián)合圖像的顏色信息,構(gòu)造雙信息統(tǒng)計(jì)機(jī)制,獲取圖像的特征向量,計(jì)算特征向量間的歐氏距離,構(gòu)造近似測(cè)量模型,對(duì)圖像特征進(jìn)行匹配,利用引力聚類方法,實(shí)現(xiàn)圖像特征點(diǎn)的聚類,精準(zhǔn)檢測(cè)復(fù)制-粘貼篡改內(nèi)容。但是該方法的圖像篡改盲檢測(cè)時(shí)間較長,導(dǎo)致檢測(cè)效率較低。
針對(duì)上述問題,本文提出一種基于大數(shù)據(jù)的圓對(duì)稱擴(kuò)頻數(shù)字圖像篡改盲檢測(cè)方法。首先通過基于大數(shù)據(jù)的圓對(duì)稱擴(kuò)頻數(shù)字圖像水印算法,利用偽隨機(jī)發(fā)生器得到一個(gè)圓形水印,將初始圖像進(jìn)行DFT轉(zhuǎn)換,得到嵌入水印后的數(shù)字圖像,并精準(zhǔn)判斷出圖像是否被惡意篡改;其次建立圖像篡改模型,識(shí)別圖像來源,探測(cè)圖像完整性,并對(duì)篡改方位實(shí)現(xiàn)有效定位;然后利用雙重變換下數(shù)字圖像篡改盲檢測(cè)方法,以此檢測(cè)圖像的真實(shí)性;最后進(jìn)行仿真,證明本文方法的適用性及檢測(cè)精度和效率均優(yōu)于傳統(tǒng)方法,可在真實(shí)場(chǎng)景中進(jìn)行廣泛應(yīng)用。
在大數(shù)據(jù)環(huán)境下,擴(kuò)頻通信是指通過偽隨機(jī)碼將被傳輸信號(hào)采取頻譜擴(kuò)展,讓占據(jù)的信道帶寬遠(yuǎn)遠(yuǎn)高于在一般通信狀態(tài)下的最小帶寬。圓對(duì)稱擴(kuò)頻數(shù)字圖像是將一圓對(duì)稱水印嵌入到了圖像的頻域中,使用擴(kuò)頻通信技術(shù)輸送一個(gè)窄帶水印,以此達(dá)到不可感知性及魯棒性統(tǒng)一的目的。
本文提出的水印算法是基于變換域方法,使用DFT特征在圖像頻域內(nèi)嵌入一個(gè)圓對(duì)稱擴(kuò)頻水印,可以準(zhǔn)確判斷出圖像是否被篡改,能夠有效保護(hù)數(shù)字圖像的數(shù)據(jù)安全。
若初始圖像是實(shí)型離散函數(shù)I(x,y),0≤x≤N-1、0≤y≤N-1,且N=M,那么將此二維離散傅立葉轉(zhuǎn)換表示為
(1)
如果M、Φ是復(fù)數(shù)F(u,v)的振幅及相位,那么可得到
M=|F(u,v)|,Φ=∠F(u,v)
(2)
水印嵌入可劃分為三部分。首先通過偽隨機(jī)發(fā)生器生成一個(gè)圓形水印
(3)
式中,wi表示偽隨機(jī)矢量w的第i個(gè)分量,R表示圓形水印半徑。式(3)證明偽隨機(jī)發(fā)生器陸續(xù)輸出均位于以頻域原點(diǎn)為中心的圓內(nèi),位于圓外的點(diǎn)賦值都是0[5]。
其次,將初始圖像采取DFT變換,把W(u,v)引入初始圖像傅氏頻度的振幅內(nèi)
Mw(u,v)=M(u,v)+αWc(u,v)
(4)
式中,α為按照經(jīng)驗(yàn)挑選的視覺參數(shù)值,可以維護(hù)水印的透明度及魯棒性。
最后,將Mw與Φ進(jìn)行IDFT變換,獲取嵌入水印后的數(shù)字圖像Iw(x,y)。
檢測(cè)水印不需要初始圖像作為參照,僅需要把待測(cè)圖像采取傅立葉逆向轉(zhuǎn)換,然后從水印嵌入的位置進(jìn)行水印提取,提取后的水印因?yàn)榘跏紙D像的頻譜成分和惡意襲擊,所以與原本水印擁有很大差別。此時(shí)要使用一個(gè)判斷準(zhǔn)則來斷定是否參雜水印數(shù)據(jù)[6]。本文運(yùn)用水印和原水印的關(guān)聯(lián)性當(dāng)作權(quán)衡標(biāo)準(zhǔn),將其描述為
(5)
式中,W′與W依次為待判斷水印和正確水印,Corr值的擇取范圍在[0,1]之間,若該關(guān)聯(lián)值超出某個(gè)臨界值,則斷定該數(shù)字圖像內(nèi)擁有水印。
若JPEG壓縮時(shí)的量化,采用四舍五入的取整手段,那么可得到
(6)
式中[·]為四舍五入取整,Q1為初始量化步長。
如果沒有實(shí)現(xiàn)量化的系數(shù)是du,采取兩次量化后的系數(shù)是D2,兩次量化的步長依次為Q1、Q2,則
(7)
不論Q1是奇數(shù)還是偶數(shù),只要沒有量化的DCT系數(shù)du處在上面區(qū)間之中,那么雙重壓縮量化后獲得的系數(shù)是D2,所以可利用區(qū)間長度構(gòu)建數(shù)字圖像篡改模型
(8)
現(xiàn)階段,許多數(shù)字圖像都是利用JPEG圖像壓縮標(biāo)準(zhǔn)進(jìn)行儲(chǔ)存,在JPEG圖像的空域篡改處理后會(huì)再次進(jìn)行JPEG壓縮,將其保存為JPEG格式[7]。
將模型與雙重壓縮效應(yīng)進(jìn)行融合可以看出,若一張JPEG圖像包括篡改與非篡改部分,則非篡改部分的DCT系數(shù)依舊具備雙量化功效,此部分和初始JPEG圖像雙重壓縮后的對(duì)照部分相同,篡改部分將不具備雙壓縮效果[8]。
通過構(gòu)建數(shù)字圖像篡改模型,可以有效鑒別圖像的來源及完整性,并對(duì)圖像被篡改位置進(jìn)行精準(zhǔn)定位。
假設(shè)一個(gè)二維函數(shù)f(x,y)的Radon變換為此函數(shù)平面中一組直線的線積分,將其描述為
P(r,θ)=R(r,θ){f(x,y)}
(9)
其中,|r|表示原點(diǎn)O與直線的間距,θ∈[0,π]表示直線和y軸之間的夾角,δ(r)為Dirac函數(shù)。
通過式(9)可知,Radon變換是把二維函數(shù)f(x,y)沿直線r-xcosθ-ysinθ=0實(shí)現(xiàn)積分,借此得到在隨機(jī)(r,θ)位置上,f(x,y)沿該直線的求和值P(r,θ)。Radon變換針對(duì)數(shù)字圖像的幾何轉(zhuǎn)換具有以下特質(zhì):
1)平移特質(zhì),可將平移過程描述為式(10),式中r0=x0cosθ+y0sinθ0。
R(r,θ){f(x-x0,y-y0)}=P(r-r0,θ)
(10)
2)旋轉(zhuǎn)特質(zhì),其中旋轉(zhuǎn)角度是φ
R(r,θ){f(xcosφ+ysinφ,-xcosφ+ysinφ)}
=P(r,θ+φ)
(11)
3)尺度變換特質(zhì),其中尺度變換元素是λ,且λ≠0
(12)
此外,當(dāng)f(x,y)為持續(xù)變化的狀態(tài)時(shí),每個(gè)點(diǎn)及每個(gè)方向噪聲的Radon變換為一個(gè)常量,且該常量與噪聲的平均值相同,均等于0,因此可以得到
(13)
這就表示零均值的加性噪聲對(duì)Radon變換后的數(shù)字圖像不會(huì)發(fā)生影響[9]。
利用極坐標(biāo)代表二維函數(shù)g(r,θ)的解析Fourier-Mellin變換,將其表達(dá)成
(14)
其中,s=σ-iu,u是一個(gè)實(shí)數(shù)參變量,σ是一個(gè)不小于0的實(shí)常數(shù),通常取值為0.5。對(duì)P(r,θ)采取Fourier-Mellin變換,可將式(14)轉(zhuǎn)換為
(15)
通過上式可知,利用Radon變換和Fourier-Mellin變換后,初始數(shù)字圖像f(x,y)的旋轉(zhuǎn)變換就轉(zhuǎn)變成一個(gè)相位元素,初始圖像的尺度變換就轉(zhuǎn)變成一個(gè)幅度元素[10]。
在本文方法中,要預(yù)先將數(shù)組圖像采取疊加分塊處理,將整張圖像根據(jù)范圍像素位移分割成多個(gè)疊加塊,塊大小的設(shè)定不能高于篡改塊。
如果圖像大小是M*N,疊加塊大小是R*R,那么分割的疊加塊數(shù)量可描述為
S=(M-R+1)*(N-R+1)
(16)
因此,可將式(15)表示成
(17)
根據(jù)不變函數(shù)Z(u,k)所提取的圖像,其旋轉(zhuǎn)變換和尺度變換的不變特性為
(18)
(19)
(20)
(21)
式中,μ表示函數(shù)Z(u,k)的平均值,M、N分別是Z(u,k)的行數(shù)和列數(shù),這四個(gè)特性值可以檢測(cè)出數(shù)據(jù)圖像是否有旋轉(zhuǎn)、縮放等篡改動(dòng)作。由此,可以對(duì)圖像內(nèi)每個(gè)疊加塊的四個(gè)特性值進(jìn)行提取,將提取獲得的三維特性矩陣描述
Bi,j(1:4)=[e1,e2,e3,e4]
(22)
復(fù)制粘貼篡改會(huì)使圖像內(nèi)包含兩個(gè)相近塊,通過計(jì)算每個(gè)疊加塊提取的特性相近度,就能找出兩個(gè)相近塊在數(shù)字圖像的區(qū)域位置。本文使用歐氏距離來推算出每個(gè)特性矢量的相近度大小。歐氏距離的推導(dǎo)解析式為
(23)
利用式(24)更深層地計(jì)算相近度大小
(24)
將設(shè)定閾值T和式(24)的計(jì)算結(jié)果進(jìn)行對(duì)比,在s>T的情況下,表明圖像內(nèi)包含相近區(qū)域。
因?yàn)樵跀?shù)字圖像中擁有諸多平坦區(qū)域,在篡改盲檢測(cè)時(shí)極有可能發(fā)生虛警反應(yīng),所以判斷結(jié)果一方面要設(shè)置一個(gè)適當(dāng)?shù)拈撝礣,另一方面還要使用主轉(zhuǎn)移矢量算法去除錯(cuò)誤塊。此外,針對(duì)數(shù)字圖像的劃分,分塊越大,檢測(cè)效率就越好,在相同閾值T的基礎(chǔ)上,誤檢的幾率也就越高;反之,如果分塊的劃分太小,檢測(cè)精度雖然較高,但降低了檢測(cè)效率,同時(shí)虛警反應(yīng)概率也相對(duì)很高。經(jīng)過多次驗(yàn)證,本文將數(shù)字圖像篡改盲檢測(cè)的分塊大小確定為8×8。
通過上述過程,可以進(jìn)一步明確圖像的真實(shí)性,并在大數(shù)據(jù)環(huán)境下對(duì)篡改區(qū)域的旋轉(zhuǎn)平移等篡改狀態(tài)進(jìn)行精準(zhǔn)檢測(cè)。
為了驗(yàn)證本文所提基于大數(shù)據(jù)的圓對(duì)稱擴(kuò)頻數(shù)字圖像篡改盲檢測(cè)方法的有效性,利用MATLAB平臺(tái),在Windows 10操作系統(tǒng),處理器為AMD Athlon(tm)II P360 Dual-Core Processor 2.30 GHz,內(nèi)存為24G,測(cè)試圖像的幀率為30fps,分辨率為800*600的環(huán)境下進(jìn)行仿真對(duì)比實(shí)驗(yàn)。圖1為原始數(shù)字圖像。
圖1 原始數(shù)字圖像
圖像在進(jìn)行合成類篡改時(shí),篡改區(qū)域的大小、預(yù)想及初始圖像壓縮因子的差值都會(huì)對(duì)檢測(cè)方法的精度造成較大影響。篡改圖像如圖2所示。
圖2 篡改圖像及區(qū)域
本文在上述實(shí)驗(yàn)環(huán)境下,將壓縮因子的取值范圍設(shè)定在0~100。將篡改區(qū)域面積占全部圖像面積的百分比作為權(quán)衡篡改比例的原則。
圖3為本文方法與文獻(xiàn)[3]方法、文獻(xiàn)[4]方法在不同篡改比例下不同壓縮因子差值的檢測(cè)精度。
圖3 篡改盲檢測(cè)精度對(duì)比結(jié)果
根據(jù)圖3中的數(shù)據(jù)可知,伴隨篡改比例的增多,文獻(xiàn)[3]方法和文獻(xiàn)[4]方法可以很清楚地看出權(quán)衡篡改區(qū)域及無篡改區(qū)域的不一致性,檢測(cè)精度也逐步上升,但篡改盲檢測(cè)精度最高只有13%和33%。而伴隨篡改比例的增多,本文方法的檢測(cè)精度呈現(xiàn)出先上升后下降的趨勢(shì),最高篡改盲檢測(cè)精度為87%,這是因?yàn)楸疚姆椒ㄊ墙?gòu)在圖像DCT系數(shù)的統(tǒng)計(jì)特征內(nèi)的,若篡改區(qū)域很小,統(tǒng)計(jì)特征不會(huì)發(fā)生顯著變化,因此檢測(cè)精度下降。綜上所述,本文方法的篡改盲檢測(cè)精度優(yōu)于文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的篡改盲檢測(cè)精度。
為了進(jìn)一步驗(yàn)證本文方法的有效性,對(duì)本文方法、文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的數(shù)字圖像篡改盲檢測(cè)時(shí)間進(jìn)行對(duì)比分析,對(duì)比結(jié)果如圖4所示。
圖4 圖像篡改盲檢測(cè)時(shí)間對(duì)比
根據(jù)圖4可知,當(dāng)?shù)螖?shù)為5時(shí),本文方法的數(shù)字圖像篡改盲檢測(cè)時(shí)間比文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的數(shù)字圖像篡改盲檢測(cè)時(shí)間短,本文方法的數(shù)字圖像篡改盲檢測(cè)時(shí)間在142s內(nèi),而文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的數(shù)字圖像篡改盲檢測(cè)時(shí)間均在160s內(nèi)。說明本文方法的檢測(cè)耗時(shí)較少,檢測(cè)效率較高。
為了提升數(shù)字圖像篡改部分檢測(cè)精度及效率,本文提出一種基于大數(shù)據(jù)的圓對(duì)稱擴(kuò)頻數(shù)字圖像篡改盲檢測(cè)方法。通過將特征標(biāo)識(shí)嵌入數(shù)字圖像內(nèi),保護(hù)圖像數(shù)據(jù)安全,利用基于JPEG雙重壓縮效應(yīng)的數(shù)字圖像篡改模型,檢測(cè)圖像完整度,對(duì)篡改位置實(shí)施精確定位;運(yùn)用Radon變換及解析Fourier-Mellin變換明確圖像的真實(shí)度。通過仿真,驗(yàn)證本文方法檢測(cè)精度及效率均優(yōu)于傳統(tǒng)方法,具備較高的優(yōu)越性。