徐 亮,史金昌
(黃淮學(xué)院 信息工程學(xué)院,河南 駐馬店 463000)
數(shù)字化時代,人們獲取、處理數(shù)字圖像變得越發(fā)容易,借助各種圖像處理軟件可以得到預(yù)期效果的各種圖像,從而愉悅?cè)藗兊木瘢找比藗兊乃囆g(shù)情操。先進的技術(shù)往往是把“雙刃劍”。給人們?nèi)粘I罨蚩萍佳芯繋矸奖愕耐瑫r也帶來許多負面的影響。各種篡改偽造的數(shù)字圖像將給社會的公正和穩(wěn)定帶來威脅,給政治、經(jīng)濟、文化、新聞和科學(xué)的真實性帶來極其嚴重的負面影響。面對網(wǎng)絡(luò)中大量的篡改偽造圖片,目睹數(shù)字圖像篡改造假事件的不斷出現(xiàn),人們迫切需要權(quán)威可信的能夠鑒別數(shù)字圖像真?zhèn)蔚募夹g(shù)。因此,本文研究建立圖像真實與否的分類算法,提取能區(qū)別正常圖像和篡改偽造圖像的特征,對圖像進行檢測。
為了尋求高效、準確、實用的篡改檢測技術(shù),研究人員從篡改者的角度研究其篡改的種類、思路和方法。全面、系統(tǒng)、深入的了解對篡改圖像的各種方法。分清數(shù)字圖像偽造篡改的各種手段和具體方法,對構(gòu)造篡改與取證的博弈模型以及篡改檢測算法的提高意義深遠。實際應(yīng)用中,比較常用的篡改過程如圖1所示。
圖1 圖像篡改過程Fig.1 Process of image forgery
關(guān)于數(shù)字圖像的篡改偽造手段,Dartmouth大學(xué)的HanyFarid[1]教授將偽造手段分為合成、變種、潤飾、增強、計算機生成和繪畫6類。周琳娜博士根據(jù)自己的研究成果在HanyFarid教授分類的基礎(chǔ)上又增加了數(shù)字圖像版權(quán)篡改、二次獲取圖像和圖像攜密篡改共九種類型,并將其歸類為圖像真實性篡改、完整性篡改、原始性篡改和版權(quán)篡改4個部分[2]。數(shù)字圖像都具有圖像內(nèi)容本身、圖像的來源、圖像的版權(quán)3個方面的屬性。數(shù)字圖像的篡改偽造技術(shù)也是從這3個方面進行的,一是對圖像來源的混淆偽造;二是對數(shù)字圖像內(nèi)容的篡改;三是對數(shù)字圖像版權(quán)的篡改。其中,對數(shù)字圖像內(nèi)容的篡改偽造是目前最流行、使用最廣泛的篡改偽造方法,也是數(shù)字圖像被動盲取證研究的重點。對數(shù)字圖像內(nèi)容的篡改可以歸為內(nèi)容的真實性篡改和內(nèi)容的完整性篡改兩類,如圖2所示。
圖2 篡改分類模型Fig.2 Tamper classification model
數(shù)字圖像內(nèi)容真實性就是圖像內(nèi)容真假的問題。圖像篡改者通過相應(yīng)的企圖偽造與原始圖像所表達或呈現(xiàn)出不同甚至截然相反的意義。篡改技術(shù)包括:圖像拼接(復(fù)制粘貼、縮放、旋轉(zhuǎn))、圖像潤飾(非線性伽馬校正、模糊、羽化、銳化、邊緣平滑、壓縮)、圖像增強(色彩、灰度級、亮度、對比度的調(diào)整)、變形等。
1)圖像拼接是將兩幅圖像對應(yīng)且具有一定標志性特征點找出,利用相應(yīng)的技術(shù)將一幅圖像中的對象漸變?yōu)榱砭哂辛硪粡垐D像中對象特征的圖像。找出兩幅圖像中的對應(yīng)特征點是這種篡改手段的關(guān)鍵,然后對兩幅圖像以不同的權(quán)重在對應(yīng)的特征點上疊加,這樣得到的偽造圖像就兼有兩幅圖像的特征。圖像拼接技術(shù)是圖像篡改操作最常見的手段。篡改者選取兩幅或兩幅以上圖像中感興趣的部分區(qū)域,將它們合成一幅圖像,以達到篡改者預(yù)期的目的和效果。在篡改者實施圖像拼合偽造操作的過程中復(fù)制粘貼(copy-move)是其必然要用到的方法。然而,不同圖像中篡改方感興趣的區(qū)域其大小和角度可能需要調(diào)整,這就會涉及到圖像的縮放和旋轉(zhuǎn)。無論是復(fù)制粘貼、縮放、旋轉(zhuǎn),在圖像拼合的篡改偽造過程中都必然引入原始圖像所沒有的篡改痕跡和各種統(tǒng)計特征,或者破壞原始圖像中固有的自然統(tǒng)計特征。通過對這些特定操作帶來的不同痕跡和特征進行提取、比較、分析,可以檢測圖像內(nèi)容的真實性甚至定位篡改偽造區(qū)域。這在數(shù)字圖像的被動盲取證領(lǐng)域是普遍采用的方法。
2)圖像潤飾是一種將圖像拼接篡改后,遺留在篡改區(qū)域且能直接看出的篡改痕跡消除的技術(shù)。這種技術(shù)的主要手段是對篡改區(qū)域進行模糊、羽化、銳化、柔化、縮放、修補、非線性伽馬校正、邊緣平滑、壓縮等清除因為拼接所帶來的偽造痕跡,使圖像更具欺騙性。
3)圖像增強是一種突出圖像中的特殊對象的技術(shù)。這種技術(shù)的特點是不顯著改變圖像中的內(nèi)容,其主要對圖像特定對象的對比度、顏色、背景等進行改變,對圖像中目標區(qū)域或人、物進行突出或者淡化。
4)圖像的變形是一種比較特殊的數(shù)字圖像修改和漸變方法,它是將一個人或者一個物體逐漸演變成另一個人或物的過程,或者形成一個兼有兩者形態(tài)特征的一個綜合體。這類圖像修改多見于動畫和影視制作中,當(dāng)然也屬于對圖像內(nèi)容的篡改之列。
數(shù)字圖像內(nèi)容完整性是指在原始圖像上刪減或者增加額外的信息或圖像區(qū)域,有選擇有目的的將篡改后的圖像內(nèi)容呈現(xiàn)給圖像的接收者。它包括分別對可見信息和不可見信息的篡改。對可見信息的刪減和增加,它會讓呈現(xiàn)在人們視野下的圖像包含或者不包含某種信息。在原始圖像中隱藏秘密信息,通過利用原始圖像的傳播和通信來達到傳遞隱秘信息的目的,這類操作屬于對圖像不可見信息的篡改。目前這方面的篡改主要體現(xiàn)在信息隱藏即隱寫術(shù)領(lǐng)域。這是另一個目前關(guān)注度很高并正得到系統(tǒng)研究的學(xué)科領(lǐng)域。
從篡改分類的角度可將圖像拼接取證包括復(fù)制粘貼和旋轉(zhuǎn)縮放,如圖3所示。
圖3 圖像拼接取證技術(shù)模型Fig.3 Forensics model of image joining
圖像拼接必然要經(jīng)過復(fù)制粘貼,絕大多數(shù)為了獲得合適大小和角度的感興趣區(qū)域還要經(jīng)過旋轉(zhuǎn)和縮放。復(fù)制粘貼又分為同副圖像內(nèi)的復(fù)制粘貼和不同圖像間的復(fù)制粘貼,同副圖像內(nèi)的復(fù)制粘貼必然導(dǎo)致圖像數(shù)值出現(xiàn)完全相同或相似區(qū)域;不同圖像間的復(fù)制粘貼必然導(dǎo)致不同區(qū)域具有不同的來源特征或不同的圖像統(tǒng)計特征;而旋轉(zhuǎn)縮放必然導(dǎo)致重采樣。所以從這些角度著手可以對拼接篡改進行有效檢測。
同副圖像內(nèi)進行復(fù)制粘貼,因為圖像篡改塊來自同一圖像,所以在該圖像內(nèi),一定存在與該篡改塊完全相同或者相似的圖像區(qū)域,研究者目前主要將圖像分成不同的區(qū)域塊,采用匹配搜索的方法對這種類型的篡改進行檢測。
不同圖像的復(fù)制-粘貼篡改是指兩張或者多張圖像中的不同部分拼接到一張圖像上,以達到偽造成是同一個整體圖像的效果。這種方式的篡改較copy-move使用的更為廣泛,造成的風(fēng)波會更為人所關(guān)注。相比copy-move篡改,由于多幅圖像的亮度、光線、色彩等區(qū)別較大,因此往往遺留的拼接痕跡會比較明顯。篡改者往往會進一步使用邊緣模糊等潤飾操作,以期消除這樣的痕跡。因此,成功的不同圖像的拼接篡改都是多種篡改方式合作后的結(jié)果。圖4為不同圖像中的復(fù)制-粘帖篡改的一個實例。
檢測不同圖像間的復(fù)制粘貼篡改的方法有:基于光源方向不一致性的方法、基于雙相干特征和邊緣百分比特征檢測的方法和基于圖像獲取設(shè)備不一致的方法。
2.2.1 基于光源方向不一致性的方法
圖4 不同圖間的篡改圖Fig.4 Splicing in the different image
取自兩幅或兩幅以上圖像的區(qū)域,其原始光照方向很難具有一致性,因此,估計圖像中某一區(qū)域或某一物體的光照方向,如果區(qū)域或不同物體具有不同的光照方向,可以認為不同區(qū)域或物體來源不同,進而鑒定篡改。如MahajanD提出基于球面頻率不變量的檢測圖像的光照一致性方法[3]。但缺點是需要人工提取圖像邊界且在沒有直接光源,比如陰天的條件下是不適用的,另外,其只能估計光源的二維方向,而不是實際中的三維方向[4]。
2.2.2 基于雙相干特征和邊緣百分比特征檢測方法
Ng首先使用雙相干幅度和相位特征進行拼接圖像檢測[5]。將雙相干特征直接應(yīng)用于探測圖像拼接效果并不理想,檢測精度僅為62%(隨機判斷的精度為50%)。為了進一步加強檢測效率,Ng又提出了兩個基本的方法,即刻畫對雙相干敏感的圖像特征和估計拼接不變量[6],并由此導(dǎo)出了3個新的特征:雙相干幅度和相位變化的預(yù)測殘差特征,以及邊緣百分比特征。雙相干特征結(jié)合邊緣百分比特征可以顯著提高圖像拼接的檢測準確率,由62%提升至72%。但是該算法中使用的圖像數(shù)據(jù)是128×128的塊,而不是一幅完整的、有意義的圖像,而且要求拼接圖像沒有進行后處理操作。
2.2.3 基于圖像獲取設(shè)備不一致方法(不同數(shù)碼相機)
基于圖像獲取設(shè)備不一致的方法又分為:基于CFA插值一致性的檢測方法、基于模式噪聲一致性的檢測方法、基于相機響應(yīng)函數(shù)一致性的檢測方法和基于色差一致性檢測方法。
1)基于CFA插值一致性的檢測方法 基本思想是使用了某一像素領(lǐng)域內(nèi)若干像素的真實值通過一定的規(guī)則,進行線性或者非線性組合、優(yōu)化得到插值后的像素值。這種插值使得真實的自然圖像每個色彩通道內(nèi)的像素值之間存在固有的相關(guān)性。而篡改拼接圖像會破壞這種相關(guān)性?;贑FA插值檢測的方法具有不錯的認證效果,缺點是需要大量訓(xùn)練樣本進行訓(xùn)練,但對于高明的偽造者,可以模擬插值來再現(xiàn)這種相關(guān)性使上述認證方法失效。
2)模式噪聲一致性檢測 圖像中的噪聲分為環(huán)境噪聲和數(shù)碼相機的模式噪聲(Pattern Noise),環(huán)境噪聲不容易區(qū)別。但不同型號的數(shù)碼相機具有不同的模式噪聲,如果圖像中的某一區(qū)域的模式噪聲不同于其他區(qū)域,那么可以認為該區(qū)域是被篡改的。這類方法的缺點是檢測時需要有照片獲取設(shè)備或者一些由該設(shè)備拍攝的照片。另外,由于硬件的固有特征會受到相機變焦或者曝光程度等影響而難以準確提取。
3)相機響應(yīng)函數(shù)一致性檢測
數(shù)碼相機的數(shù)字圖像形成過程要采用色彩校正、白平衡、伽馬校正等操作,由于不同的相機有不同的響應(yīng)功能,利用單幅圖中不同色彩間的邊緣像素反推估計不同區(qū)域的響應(yīng)函數(shù),若結(jié)果不一致則可認為圖像經(jīng)過篡改。這類方法的缺點同樣是需要有照片獲取設(shè)備或者一些由該設(shè)備拍攝的照片,另外,如果拼接圖像是由同一相機甚至同一型號相機拍攝的不同圖像拼接而成的,此法失效。
4)色差一致性檢測
由于真實場景的光照連續(xù)性和數(shù)字圖像獲取設(shè)備其光學(xué)成像系統(tǒng)的缺陷,圖像局部色彩、灰度等會具有一致性的色彩失真。而篡改圖像會破壞整幅圖像的色差一致性。Johnson提出了一種利用橫向色差不一致性的篡改檢測方法。如果篡改區(qū)域較小,該方法檢測效果比較理想,但如果篡改區(qū)域較大或者是全局篡改,該方法不理想。
2.2.4 基于統(tǒng)計特征分類的盲檢測算法
為了使圖像相素沒有突變,使照片看起來更加自然,產(chǎn)生數(shù)字圖像的設(shè)備一般都含有光學(xué)低通裝置,也即相當(dāng)于對產(chǎn)生的圖像進行低通濾波,使之產(chǎn)生的數(shù)字圖像的相鄰像素具有連續(xù)性。圖像經(jīng)過簡單的復(fù)制-粘貼而不經(jīng)過任何后繼的潤飾操作,篡改區(qū)域的像素邊界會產(chǎn)生不連續(xù)的變化,因此提取出對邊界突變較為敏感的特征來建立檢測算法將是一個可行的思路。
Tan-Tsong Ng和Shi-Fu Chang在文獻[7]中具體使用了3類5個特征進行訓(xùn)練分類,這3類5個特征分別為:
1)圖像雙譜的幅值和相角
圖像的歸一化的雙譜的表達式如下:
其中x*表示x的伴隨矩陣。相角的熵:
圖像經(jīng)過復(fù)制—粘貼操作后,其復(fù)制區(qū)域邊界的不連續(xù)會導(dǎo)致該位置圖像塊雙譜幅值的變大,并且該位置的相角會以0和90的整數(shù)倍增加。
2)估計原圖與檢測圖的雙譜幅值差以及相角差
在盲取證的過程中,往往需要提取多維特征,其中的一些特征對圖像篡改前后的變化不敏感,而另一些會有很明顯的感應(yīng)。因此尋找并得到對圖像篡改前后較為敏感的特征是檢測算法中最重要的一步。經(jīng)過驗證,圖像的雙譜幅值和相角是很好的可建立檢測算法的特征,它們在圖像經(jīng)過篡改操作前后都會有明顯的差異。
算法是基于這樣的理論依據(jù):假設(shè)每一幅待檢測圖像A都存在一個原圖B,A與B大體一致,只是B是數(shù)碼相機拍攝的原始圖像,這樣就可以通過比較圖像A和圖像B的雙譜幅值和相角,判斷A是否為經(jīng)過篡改操作的圖像。這種方法的很關(guān)鍵的一步是能不能精確估計出原始圖,因為在任何的取證過程中,都不可能提供原始圖給取證者進行比較。因此,比較實用的方法是將待檢測圖像分為紋理部分和細節(jié)部分,用紋理部分來近似的估計原始圖像。則待檢測圖和原始圖的雙譜幅值差和相角差的表示為:Δfm=fm′-af m;Δfp=fp-af p,式中的a和b是用fisher線性判決訓(xùn)練得到的,其選擇原則是使篡改圖和原始圖之間的雙譜幅值和相角有最大的差值。
3)圖像的紋理復(fù)雜度
圖像背景越復(fù)雜,圖像的雙譜幅值和相角就越大,所以在引入了以上4個特征后,進一步以圖像的紋理復(fù)雜度作為特征來進行相似重疊塊的匹配。這里紋理復(fù)雜度主要以圖像的邊緣相素占總體相素的百分比來表示。圖像的邊緣是用canny算子進行提取的。
這樣,提取出5個對圖像復(fù)制—粘貼篡改較為有效的特征量,然后用支持向量機對這5個特征量進行訓(xùn)練分類。這種方法可達到72%的正確檢測率。
在數(shù)字圖像篡改檢測中,通過對圖像特征的提取及分類建立算法,識別出篡改圖像和自然圖像。此類算法通常采用兩種方法對算法分類性能做評價:一種是常用的評價參數(shù)TP、TN、Accuracy。其中TP、TN分別表示真實、篡改圖像的分類正確率,Accuracy則是算法中最為關(guān)注的總體檢測正確率。而另一種是用ACU表示ROC(the Receiver Operation Characteristics Curve)曲線下的面積來衡量分類效果。AUC越大,則分類效果越好。針對拼接篡改的檢測算法,其檢測效果基本能令人滿意,復(fù)制區(qū)域的定位及其檢測率能夠達到理想的檢測結(jié)果,甚至復(fù)制區(qū)域經(jīng)過邊緣模糊、旋轉(zhuǎn)、縮放等后繼處理,也能達到很好的檢測效果。
雖然目前在數(shù)字圖像篡改檢測上的研究一時成為熱點,且已出的成果也很多。就總結(jié)目前的檢測算法可以看出,雖然研究很多、所得算法也很豐富,但許多現(xiàn)有檢測算法的特征組成依賴于圖像內(nèi)容的本身,而圖像的來源以及圖像本身內(nèi)容的復(fù)雜性,都給取證算法的建立增加了不小的難度,現(xiàn)有綜合檢測正確率都很難突破90%,這是目前檢測算法中一個很難突破的瓶頸。
[1]Farid H.Creating and Detecting Doctoredand Virtual Image:Implications to the Child Pornography Prevention Act[EB/OL].(2012)http://www.ists.Dart-mouth.edu/library/tr-2004-518.pdf
[2]周琳娜.數(shù)字圖像盲取證技術(shù)研究[D].北京:北京郵電大學(xué),2007.
[3]Mahajan D,Ramamoorthi R,Curless B.A theory of frequency domain in variants:spherical harmonic identities for BRDF/lighting transferandimage consistency[J].IEEE Transactionson Pattern Analysisand Machine Intelligence,2008,30(2):197-213.
[4]Lukas J,F(xiàn)ridrich J,Goljan M.Detecting digital image for geriesusingsensorpatternnoise[C]//California,USA:Proceedings of the SPIE:Security,Steganography,and Watermarking of Multimedia Contents.SanJose,2006:362-372.
[5]Ng T T,Chang S F,Sun Q B.Blinddetection of photomontage using higher order statistics[C]//Canada:IEEE International Symposium on Circuits and Systems,2004:688-691.
[6]Ng T T,ChangS F.Blind detection of digital photomontage using higher order statistics[C]//ADVENT Technical Report,Columbia University,2004.
[7]Tian T N,Shih F C.A model for image splicing[C]//Singapore:In IEEE International Conference on Image Processing,2004:1169-1172.