李志偉
(江蘇科技大學 江蘇 鎮(zhèn)江 212000)
隨著時代的發(fā)展,圖像因為其信息體現(xiàn)效果直觀、自然、更具感染力的特點成為信息表達與傳遞的重要載體,攝取的圖像可以迅速直觀的反映現(xiàn)場的真實情景從而提供堅實有力證據(jù),隨著現(xiàn)代數(shù)字技術(shù)的不斷發(fā)展,數(shù)字圖像漸漸取代膠片圖像充斥在人們的工作生活的各個方面,而同時,數(shù)碼影像科技與圖形后期處理技術(shù)的不斷發(fā)展,相繼出現(xiàn)了各種功能強大的數(shù)字圖像編輯及處理工具如Photoshop、ACDSee、iPhoto等,為攝影工作者的圖片拍攝、后期處理、藝術(shù)創(chuàng)作帶來了極大的便利,非專業(yè)人員也可以熟練使用這些工具。網(wǎng)絡(luò)上傳播的各種惡搞圖片就是通過這些工具制造的。新的技術(shù)娛樂了我們的同時也挑戰(zhàn)了人們“耳聽為虛,眼見為實”的傳統(tǒng)觀念,照片讓人們看到的內(nèi)容再也不能輕易的信以為真,甚至會誤導人們的判斷。盡管絕大多數(shù)人都是本著增強圖像效果的目的來對圖像進行修改的,但是也不乏有部分別有用心的人會利用此手段來達到自己不可告人的目的。小到讓夫妻感情不和家庭破裂,大到破壞國際關(guān)系引發(fā)戰(zhàn)爭。在娛樂界、政界、新聞出版界和科學界等領(lǐng)域,國內(nèi)外都出現(xiàn)了不少令人震驚的圖像篡改或偽造的案例,這些案例無一例外地帶來了或輕或重的不良影響。
復制粘貼的應用是圖像的拼合的基礎(chǔ),也是最常用的圖像偽造手段。旋轉(zhuǎn)和縮放功能的應用是為了獲得圖片修改者要突出的內(nèi)容。復制粘貼分為在同一幅圖像中復制粘貼和不同幅圖像中的復制粘貼。
同幅圖像內(nèi)復制粘貼篡改是把圖像中的一部分區(qū)域進行復制(被復制區(qū)域)并粘貼到同一幅圖像的不相交區(qū)域(篡改區(qū)域)中,以達到某種特定的目的,或是去除圖像中某部分重要內(nèi)容(如圖1)或是改變圖像中目標數(shù)量(如圖2),復制粘貼篡改是一種簡單而有效的圖像篡改技術(shù)。
圖1中通過對左邊圖像中某個細胞進行復制旋轉(zhuǎn)拉伸等的操作后粘貼在原圖中形成了右圖中的樣子。
圖1 改變了小鼠胚胎干細胞的數(shù)量Fig.1 Change the figure of mouse Embryonic Stem Cells
圖2 覆蓋掉了中間的一朵花Fig.2 The bloom in the middle is covered
圖2 中通過對花枝部分的采樣提取,粘貼覆蓋在花朵上,形成了右圖的情況。
區(qū)域復制粘貼篡改技術(shù)的特點決定了篡改圖像的一大特征,即經(jīng)區(qū)域復制粘貼篡改的圖像有不少于兩塊面積的相似區(qū)域。國內(nèi)外大量的專家和學者通過實驗得出了如下結(jié)論:在自然圖像中存在相似大面積區(qū)域相似的概率是非常小的,其中“大面積區(qū)域”規(guī)定為不小于原始圖像尺寸的0.85%,大面積平坦區(qū)域的圖像除外。當我們通過一定的方法鑒定一幅數(shù)字圖像中存在大面積區(qū)域相似,那么這幅數(shù)字圖像被篡改的概率就非常高。
不同圖像之間的復制粘貼操作要比同一幅圖片中的應用更多。該操作通過對一幅圖像中的目標進行選取復制(摳圖),可能還會進行旋轉(zhuǎn)、拉伸、縮放等操作,然后粘貼到另一幅圖像中,為了提高偽造效果,讓篡改不被人察覺,還會對粘貼后的目標邊緣進行相應的柔化潤飾,甚至為了避免不同圖像光照不同帶來的影響,將篡改后圖像放在同一光源下,進行再次成像。因此,不同圖像間的復制粘貼篡改手段復雜多樣,針對各種篡改手段的鑒定方法也有不少,但是各種修飾手段的綜合利用無疑加大了該類篡改圖像鑒定的難度,要使圖像篡改鑒定具有有效實用性還有很長的一段路要走。
復制粘貼篡改鑒定就是要判斷一幅現(xiàn)有圖像中是否存在復制粘貼區(qū)域,并定位出篡改區(qū)域。由于在同一幅圖中進行復制粘貼操作一般不會引起圖像在亮度、色彩等方面比較明顯的變化,很難引起人們視覺上的懷疑,如果拼接區(qū)域不明顯,圖像篡改將會很難被察覺。同幅圖像進行復制粘貼時圖像會存在完全相同或者比較相似的區(qū)域,若將圖像分成不同的塊,同幅圖像內(nèi)復制粘貼篡改鑒定的問題則可以轉(zhuǎn)換為檢測圖像內(nèi)部是否有大量內(nèi)容相似的兩個塊。通過窮舉的算法搜索匹配的內(nèi)容,就可以鑒別出這張圖片是否經(jīng)過復制粘貼過。本文所提出的算法也以此作為判斷圖像是否被篡改的準則。
Popescu A C等[1]提出了主成分分析法,即(Principal Component Analysis,PCA),其核心思想就是通過一定的方法降低特征空間的維數(shù),把區(qū)域塊矩陣通過主成分分解技術(shù),使得每一列和行的主成分代表一個區(qū)域塊,再對這些區(qū)域塊進行檢測。2003年,J.Fridrich[2]給出了基于量化DCT(Discrete Cosine Transform)系數(shù)的方法,這種方法將DCT量化系數(shù)進行了字典排序。PCA分析大小比較固定的圖像塊,降低了特征維數(shù),從而比Fridrich給出DCT塊系統(tǒng)字典排序方法更加容易抓住檢測的特征。PCA技術(shù)具有魯棒性,能夠很好的抵抗JPEG壓縮、噪聲等微小變化的攻擊。Li等于小波和奇異值的分解算法[3],主要特點就是降低維數(shù)和縮小圖像的尺寸進而大大的減少運算量。但是上述算法中存在的通用的問題就是圖像精確匹配的運算量比較大,雖然模糊匹配比精確匹配的運算量相應的減少,但是其運算量還是比較大。匹配監(jiān)測的重大前提是圖像數(shù)值出現(xiàn)了完全相同或者比較相近的區(qū)域[4],篡改者往往不是通過單一的復制粘貼的篡改技術(shù),還會運用潤飾、壓縮等篡改技術(shù),這樣會大大降低粘貼區(qū)域和原始區(qū)域的相似度,使得檢測成功的概率大大降低。另外,出現(xiàn)大面積相似平滑區(qū)域會出現(xiàn)虛警[5]。
目前來說,常見的對圖像內(nèi)容進行篡改大多是對圖像中的某一連通區(qū)域,通過復制粘貼離篡改區(qū)域稍遠的區(qū)域?qū)?shù)字圖像進行局部篡改,達到不易被人察覺的目的。若實現(xiàn)篡改者的目的,圖像的篡改區(qū)域一般會大于原始圖像尺寸的0.85%[6],若太小很難能夠消除圖像的某一明顯特征。因此,我們首先給出了區(qū)域復制篡改模型的一些合理假設(shè):
圖3 圖像內(nèi)部復制粘貼篡改Fig.3 Copy-paste tempering in same image
1)僅作簡單復制粘貼,沒有旋轉(zhuǎn)縮放的操作;
2)被復制的區(qū)域D2是一個連通“無洞”的區(qū)域;
3)有且僅有一個區(qū)域D1被篡改為D2,且 D1∩D2=■;
4)對應篡改塊的轉(zhuǎn)移量距離不小于L;
5)D2的面積不小于0.85%的圖像大小。
這可描述為在一幅篡改圖像f′(D1)中,兩個區(qū)域D1,D2?D 和一個轉(zhuǎn)移向量 d=(d1,d2)(|D1|=|D2|>|D|×0.85%,|d|>L)
其中,f(x,y)是原始圖像的灰度值(對于彩色圖像是一個表示 RGB 各顏色通道灰度值組成的三維向量),D={(x,y)|1≤x≤M,1≤y≤N},D2是被復制的區(qū)域,D1是被篡改的區(qū)域。因此篡改后的圖像f′可表示為:
檢測算法所要做的就是判斷一幅給定的圖像中是否存在這樣不知其形狀與位置的區(qū)域D1,D2。如果存在則定出其區(qū)域。
倘若篡改后的圖像不做任何的后續(xù)處理,則圖像中D1,D2的值是精確相等,檢測是一個簡單的區(qū)域匹配的問題。但是,這樣篡改后的圖像會在D1區(qū)域產(chǎn)生不一致的邊界信息。為了消除其邊界效應,同時為了增加檢測的難度,篡改者往往會對 f′(x,y)做后續(xù)的處理操作,如加噪、模糊、有損的JPEG壓縮等。經(jīng)過后處理操作的篡改圖像,其邊界效應會明顯減少,視覺上更難以發(fā)現(xiàn),并且D1,D2區(qū)域上的對應像素的值一般都變得不相等,檢測的復雜性將大大增加。
用小波變換進行圖像分解,使用小波變換完成圖像分解的方法很多,例如,均勻分解(Uniform decomposition)、非均勻分解 (Non-uniform decomposition)、 八帶分解 (Octave-band decomposition)、小 波 包 分 解 (Wavelet-packer decomposition)等。其中八帶分解是使用最廣的一種分解方法,這種分解方法把低頻部分分解成比較窄的頻帶,而對每一級分解得到的高頻部分不再進一步進行分解。
對靜態(tài)二維數(shù)字圖像,可先對其進行若干次二維DWT變換,將圖像信息分解為高頻成分H、V和D和低頻成分A。相當于降維操作,這樣根據(jù)需要對低頻部分A或者高頻部分H、V和D進行編碼操作,大大減少數(shù)據(jù)量。
離散余弦變換(Discrete Cosine Transform,DCT)的變換核為余弦函數(shù)。 DCT是數(shù)碼率壓縮需要常用的一個變換編碼方法。任何連續(xù)的實對稱函數(shù)的傅里葉變換中只含余弦項,因此余弦變換與傅里葉變換一樣有明確的物理意義。
DCT對圖像處理是先將整體圖像分成N*N像素塊,然后對N*N像素塊逐一進行DCT變換。由于大多數(shù)圖像的高頻分量較小,相應于圖像高頻分量的系數(shù)經(jīng)常為零,加上人眼對高頻成分的失真不太敏感,所以可用更粗的量化。這樣就將對像素的操作轉(zhuǎn)化為對變換系數(shù)的操作,大大縮小了計算量。
字典排序(lexicographical order)[7]是一種對于隨機變量形成序列的排序方法。復制粘貼篡改取證的關(guān)鍵問題是如何檢測和定位篡改區(qū)域。被篡改區(qū)域是由若干個與原圖像部分相似的圖像塊組成,兩者對應成為相似塊對,而這些相似塊對必定大量集中且具有一致的偏移向量,所以尋找具有相同偏移向量的相似塊對就可以解決問題。通過對特征矩陣進行字典排序來尋找相似塊對。
在得到特征矩陣后對其按字典排序,即將特征矩陣中的每一行作為一個整體進行字典排序,因為相似的圖像塊對應的向量相近,字典排序后兩個向量會位于排序后矩陣的相鄰位置,遍歷排序后特征矩陣,對相鄰的兩行計算它們對應圖像塊坐標值的偏移向量,并統(tǒng)計其頻率,若偏移向量值符合條件,且偏移頻率大于閾值,說明圖像中存在篡改區(qū)域。
1)假設(shè)待檢測的圖像為大小M×N的圖像,先用Marr高通濾波器對圖像進行濾波;
2)對濾波后圖像低頻部分分塊,將待檢測的圖像分解成b×b的小塊,相鄰小塊之間的要求是只有一行(或一列)不相交,因此共有 S=(M-b+1)(N-b+1)個圖像塊;
3)對每一個小波低頻系數(shù)塊進行DCT變換得到每一個圖像塊的DCT系數(shù),然后用事先規(guī)定好的量化矩陣對DCT系數(shù)量化;
4)把每一個圖像塊的量化DCT系數(shù)表示成向量形式,所有的圖像塊的向量組成矩陣;
5)對這個矩陣進行字典排序,即將特征矩陣中的每一行作為一個整體進行字典排序,先記錄每個行向量s(i)所代表的圖像塊的位置(xi,yi),因為相似的圖像塊對應的向量相近,字典排序后兩個向量會位于排序后矩陣的相鄰位置,相似塊對應的向量組成集合A;
6)對相鄰的兩行計算它們對應圖像塊坐標值的偏移向量,并統(tǒng)計其頻率,若偏移向量值符合條件,且偏移頻率大于閾值L,說明圖像中存在篡改區(qū)域;
7)新建一個跟原圖像同樣大小的全零矩陣,把集合A中所有向量所代表的圖像塊位置賦值255,這樣得到的圖像中白色區(qū)域即篡改區(qū)域。
從網(wǎng)上找到的哥倫比亞大學圖像檢測數(shù)據(jù)庫,從中選取50幅大小為128×128的格式為bmp的圖像做實驗。
實驗中各參數(shù)設(shè)置如下:偏移量閾值L=50,分塊大小b=16, 各 特 征 相 似 閾 值 由 實 驗 方 法 得 到[2.5,1.5,3.0,0.006,0.005,0.005,0.005]。當輸入圖像被篡改過,算法沒有出現(xiàn)誤判時,我們定義檢測率和錯誤率:
其中 D1,D2為原始篡改區(qū)域,R1,R2為檢測到的篡改區(qū)域,在沒有任何后處理的情況下,本文算法的檢測率達到0.991 23。
此外,本文算法還能抵抗下面的攻擊類型:高斯模糊(n1=n2=5,方差δ2=1)及混合操作(先進行高斯模糊,然后加高斯白噪聲(SNR=24 dB),最后做JPEG壓縮)。
表1 高斯模糊及混合操作下的檢測率和錯誤率Tab.1 Detection rate and error rateunder Gaussian blur and mixed operating
在無后續(xù)處理的前提下,原圖像大小不變,篡改區(qū)域大小逐漸增加,錯誤率檢測情況如下:
表2 檢測率、錯誤率隨篡改域大小的變化Tab.2 Test result of tampering detection according to tamper size
本文結(jié)合Li的小波和奇異值的分解算法和J.Fridrich的基于量化DCT系數(shù)的方法,在去除冗余的基礎(chǔ)上再次進行降維,減少了原匹配操作時的大量運算,同時算法有一定的抗噪聲攻擊性,提高了檢測的效果。但是這類檢測對待檢測圖像依賴程度很高,實用性差。
[1]Popescu A C,F(xiàn)arid H.Exposing digital forgeries by detecting traces of resampling[J].Signal Processing,IEEE Transactions on,2005,53(2):758-767.
[2]Fridrich A J,Soukal B D,Luká?A J.Detection of copy-move forgery in digital images [C]//in Proceedings of Digital Forensic Research Workshop,2003.
[3]Li G,Wu Q,Tu D,et al.A sorted neighborhood approach for detecting duplicated regions in image forgeries based on DWT and SVD [C]//Multimedia and Expo,2007 IEEE International Conference on,2007:1750-1753.
[4]Shi Y Q,Chen C,Chen W.A natural image model approach to splicing detection[C]//Proceedings of the 9th workshop on Multimedia&security.ACM,2007:51-62.
[5]Hsu Y F,Chang S F.Detecting image splicing using geometry invariants and camera characteristics consistency[C]//Multimedia and Expo, 2006 IEEE International Conference on.IEEE,2006:549-552.
[6]周琳娜,何德全,楊義先.數(shù)字圖像盲取證技術(shù)研究[D].北京:北京郵電大學學報,2007.
[7]駱偉祺,黃繼武,丘國平.魯棒的區(qū)域復制圖像篡改檢測技術(shù)[J].計算機學報,2007,30(11):1998-2007.LUO Qi-wei,HUANG Ji-wu,QIU Guo-ping.Robust image regional tamper detection technology[J].Chinese Journal of Computers,2007,30(11):1998-2007.