程格平 王毅
摘 要: 圖像處理軟件的廣泛使用使數(shù)字圖像的篡改和偽造變得更加容易,這給圖像數(shù)據(jù)的安全性帶來(lái)嚴(yán)重影響。數(shù)字圖像取證是解決這個(gè)問題的關(guān)鍵技術(shù),逐漸成為研究熱點(diǎn)。反取證技術(shù)能夠有效降低或消除取證技術(shù)的檢測(cè)效果,尚沒有得到應(yīng)有的重視。提出一種針對(duì)JEPG壓縮的反取證技術(shù),通過在壓縮圖像的DCT系數(shù)中添加適當(dāng)?shù)脑肼曇瞥炕瘔K效應(yīng),從而去除圖像取證的檢測(cè)證據(jù)。實(shí)驗(yàn)結(jié)果表明,所提出的方法能夠明顯降低JEPG圖像取證方法的檢測(cè)性能。
關(guān)鍵詞: 壓縮圖像; 圖像取證; 反取證技術(shù); 量化效應(yīng); 檢測(cè)性能
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2015)09-12-02
Anti-forensic method based on image compression
Cheng Geping, Wang Yi
(School of Mathematical and Computer Sciences, Hubei University of Arts and Science, Xiangyang, Hubei 441053, China)
Abstract: The widespread use of image processing software makes it easy to tamper and counterfeit a digital image, which will lead to serious influence to the security of image data. The digital image forensics is the key technology to solve the problem and is gradually becoming the research focus. Anti-forensics technology can effectively reduce or eliminate the detection effect of the forensics, but it has not been paid due attention. In this paper, an anti-forensics technology is proposed for JEPG compression, which removes the quantization blocking artifacts by adding appropriate noise to the DCT coefficients in a compressed image, so as to eliminate forensic detection evidence of the image. The experimental results show that the proposed method can significantly reduce the detection performance of the JEPG image forensics.
Key words: compressed image; image forensics; anti-forensics; quantization artifacts; detection performance
0 引言
數(shù)碼相機(jī)的迅速普及和多媒體技術(shù)的快速發(fā)展,使得數(shù)字圖像的獲取、修改和編輯更加簡(jiǎn)單,同時(shí)也對(duì)涉及數(shù)字圖像原始性、真實(shí)性和完整性的應(yīng)用領(lǐng)域帶來(lái)日趨嚴(yán)重的安全隱患。因此,數(shù)字圖像的內(nèi)容保護(hù)和真實(shí)性鑒定逐漸成為國(guó)內(nèi)外研究的重要課題。圖像取證技術(shù)通過分析圖像數(shù)據(jù)的統(tǒng)計(jì)特性,對(duì)偽造或篡改的數(shù)字圖像進(jìn)行檢測(cè)和鑒定,具有廣泛的實(shí)際應(yīng)用前景。
近年來(lái),出現(xiàn)了許多有效的圖像取證技術(shù)和方法。Hany Farid等人[1]利用來(lái)源圖像在不同方向的高階統(tǒng)計(jì)特性,采用多尺度小波分解和高階統(tǒng)計(jì)建模的方法對(duì)照片圖像、掃描圖像和計(jì)算機(jī)生成圖像進(jìn)行取證,獲得了較好的取證效果,尤其對(duì)計(jì)算機(jī)生成圖像具有較高的檢測(cè)效率。
JEPG是數(shù)字圖像壓縮最為流行的壓縮標(biāo)準(zhǔn),廣泛應(yīng)用于各種圖像處理領(lǐng)域?;ヂ?lián)網(wǎng)上傳播的數(shù)字圖像大都經(jīng)過JEPG壓縮,而網(wǎng)絡(luò)圖像獲取的便捷性則為圖像的合成與偽造提供了豐富的資源。因此,針對(duì)JEPG圖像的取證技術(shù)得到了研究人員的廣泛關(guān)注,許多JEPG取證方法相繼被提出。文獻(xiàn)[2]通過對(duì)JEPG壓縮的量化矩陣與特定數(shù)字相機(jī)的量化矩陣數(shù)據(jù)庫(kù)進(jìn)行匹配,識(shí)別待檢測(cè)壓縮圖像的獲取來(lái)源。由于JEPG圖像存儲(chǔ)的是圖像分塊后的量化DCT系數(shù),對(duì)圖像的局部數(shù)據(jù)進(jìn)行篡改將會(huì)產(chǎn)生圖像的塊效應(yīng)[3],此現(xiàn)象能夠用于檢測(cè)和定位圖像被篡改的區(qū)域。
現(xiàn)有的數(shù)字圖像取證方法都基于一定的假設(shè)條件,即待檢測(cè)圖像預(yù)先沒有經(jīng)歷反取證技術(shù)的處理,通過檢測(cè)和識(shí)別圖像內(nèi)容操作的痕跡來(lái)鑒定數(shù)字圖像的真實(shí)性[4]。但在實(shí)際應(yīng)用中,這種假設(shè)并不一定成立。因此,研究反取證技術(shù)有助于發(fā)現(xiàn)和改進(jìn)已有數(shù)字圖像取證技術(shù)的不足。
目前,關(guān)于數(shù)字圖像反取證方面的研究較少。Kirchner M和Bohme R[5]利用反取證算法移除圖像的旋轉(zhuǎn)與縮放痕跡,使得針對(duì)圖像旋轉(zhuǎn)與縮放的取證檢測(cè)失效。文獻(xiàn)[6]提出了一種實(shí)用的反取證方法,通過修改經(jīng)過對(duì)比度增強(qiáng)處理的圖像像素值,移除對(duì)比度增強(qiáng)在圖像中留下的痕跡,從而達(dá)到反取證的目的。Huang[7]等人研究發(fā)現(xiàn),采用相同的量化矩陣重復(fù)壓縮一副JEPG圖像,圖像的DCT系數(shù)將會(huì)單調(diào)減少,并使用隨機(jī)置換策略成功檢測(cè)壓縮處理操作過程。針對(duì)這種JEPG取證方法,文獻(xiàn)[8]比較經(jīng)歷兩次壓縮后DCT系數(shù)之間的關(guān)系,根據(jù)圖像紋理的復(fù)雜度自適應(yīng)修改少量DCT系數(shù),使得JEPG取證方法的檢測(cè)器失效,而且能夠保持較好的圖像視覺質(zhì)量。
本文提出一種基于壓縮圖像的反取證方法,通過移除壓縮圖像中DCT系數(shù)的量化效應(yīng),隱藏JEPG壓縮的證據(jù)。
1 JPEG壓縮的取證方法
為了便于存儲(chǔ)和傳輸,大部分?jǐn)?shù)字圖像都以JEPG壓縮的格式存在。對(duì)于一副灰度圖像,JEPG壓縮算法包括三個(gè)基本步驟:
⑴ 將圖像劃分為8×8像素塊,對(duì)每塊進(jìn)行DCT變換,得到DCT系數(shù)X;
⑵ 選取適當(dāng)?shù)馁|(zhì)量因子,根據(jù)量化表中的量化步長(zhǎng)對(duì)每塊相應(yīng)位置(i,j)的DCT系數(shù)進(jìn)行量化,得到量化值=round(X/Δi,j);
⑶ 對(duì)量化的DCT系數(shù)進(jìn)行Zigzag掃描并重新排序,再使用哈夫曼編碼得到JPEG壓縮的圖像數(shù)據(jù)。
JPEG圖像的解壓縮是壓縮的逆過程。反量化操作使用量化表的表項(xiàng)乘以量化DCT系數(shù),得到解量化系數(shù)Y=·Δi,j,然后對(duì)解量化系數(shù)進(jìn)行反DCT變換,并將所得到的結(jié)果在0~255之間進(jìn)行取值,像素值大于255或小于0的像素分別取值為255和0。
由于量化過程的不可逆性,JPEG壓縮具有有損壓縮的特性,從而引起解碼圖像的量化塊效應(yīng)。這是因?yàn)榻?jīng)過量化與反量化操作,DCT系數(shù)值并不相等,其系數(shù)直方圖會(huì)發(fā)生變化。因此,JPEG取證技術(shù)利用DCT系數(shù)的量化塊效應(yīng)來(lái)判斷數(shù)字圖像是否經(jīng)歷JPEG壓縮,并能夠估計(jì)壓縮所使用的量化矩陣。
2 JPEG壓縮的反取證方法
數(shù)字圖像反取證技術(shù)的基本原理是針對(duì)某種取證算法,利用后處理方法消除圖像篡改操作所保留的痕跡[9]。為了使JPEG壓縮取證算法失效,JPEG壓縮的反取證方法需要移除量化效應(yīng),使得壓縮圖像的量化DCT系數(shù)分布與未經(jīng)壓縮的圖像接近或相似。因此,本文提出一種針對(duì)JPEG壓縮的反取證方法,通過在JPEG壓縮圖像的量化DCT系數(shù)添加適當(dāng)?shù)脑肼?,使得量化DCT系數(shù)分布不再向量化步長(zhǎng)的整數(shù)倍聚集。算法的關(guān)鍵在于加性噪聲的選擇,具體算法如下:
⑴ 將待檢測(cè)灰度BMP圖像進(jìn)行8×8分塊DCT變換,每塊選擇AC分量得到DCT系數(shù)X;
⑵ 根據(jù)適當(dāng)?shù)膲嚎s因子,選擇量化表中的量化步長(zhǎng)Δi,j(i,j=1,…,7)對(duì)相應(yīng)的AC系數(shù)重新量化取整,得到量化的DCT系數(shù)
⑴
⑶ 選擇位于區(qū)間且服從均勻分布的偽隨機(jī)信號(hào)N,添加到量化的DCT系數(shù),得到修改的反取證量化DCT系數(shù)Z,即:
⑵
在每個(gè)分塊位置(i,j)上,修改的反取證量化DCT系數(shù)和未經(jīng)量化的DCT系數(shù)的絕對(duì)誤差滿足不等式
⑶
對(duì)于未經(jīng)量化的DCT系數(shù)來(lái)說(shuō),Δi,j相對(duì)較小,因而添加噪聲后引起的圖像視覺失真能夠控制在允許的范圍內(nèi)。
3 實(shí)驗(yàn)?zāi)M及結(jié)果
為了檢驗(yàn)反取證算法的有效性,本實(shí)驗(yàn)從測(cè)試圖像庫(kù)中選擇灰度BMP測(cè)試圖像,使用質(zhì)量因子65對(duì)標(biāo)準(zhǔn)測(cè)試圖像進(jìn)行JEPG壓縮,解壓后使用提出的反取證算法修改壓縮圖像。在算法的執(zhí)行過程中,實(shí)驗(yàn)?zāi)M選取圖像DCT系數(shù)AC分量(2,2),系數(shù)直方圖的變化結(jié)果如圖1、圖2和3所示。
在JEPG圖像的壓縮過程中,圖像數(shù)據(jù)統(tǒng)計(jì)特性的變化是圖像取證的重要依據(jù)。從圖1可以看到,經(jīng)歷量化操作,JPEG圖像的DCT系數(shù)直方圖呈現(xiàn)拉普拉斯分布,與已有的研究結(jié)果一致[10]。圖2表明,經(jīng)過反量化操作,解碼圖像的DCT系數(shù)值直方圖集中在量化步長(zhǎng)的整數(shù)倍附近,導(dǎo)致JEPG圖像發(fā)生塊效應(yīng)。而使用反取證算法修改DCT系數(shù),如圖3所示,塊邊界的跳變被反取證量化DCT系數(shù)和未經(jīng)量化的DCT系數(shù)的絕對(duì)誤差所替代,使得經(jīng)過反取證修改的圖像與未經(jīng)壓縮的圖像的統(tǒng)計(jì)特性類似。
4 結(jié)束語(yǔ)
針對(duì)JPEG圖像取證技術(shù),本文提出一種移除圖像塊效應(yīng)的反取證算法。在JPEG壓縮圖像中,通過在量化DCT系數(shù)添加符合一定條件的偽隨機(jī)噪聲,使得反取證修改的系數(shù)分布與未經(jīng)量化的系數(shù)分布相匹配,從而去除JPEG壓縮取證的檢測(cè)痕跡。實(shí)驗(yàn)結(jié)果表明,提出的反取證算法能夠有效移除JPEG壓縮的量化塊效應(yīng)。
反取證技術(shù)通常是隨著取證技術(shù)的出現(xiàn)而產(chǎn)生的,未來(lái)的工作需要更深入地研究數(shù)字圖像取證技術(shù)的理論和方法,利用反取證技術(shù)增加取證技術(shù)的難度,從而有效促進(jìn)圖像取證技術(shù)向深層次發(fā)展。
參考文獻(xiàn):
[1] Farid H. Creating and detecting doctored and virtual images[J].
Implications to The Child Pornography Prevention Act,2004:280-291
[2] Hany F. Digital image ballistics from JPEG quantization[R].
Technical Report TR2006-583, Department of Computer Science, Dartmouth College,2006.
[3] Fridrich J. Feature-based steganalysis for JPEG images and its
implications for future design of steganographic schemes[C]//Information Hiding. Springer Berlin Heidelberg,2005:67-81
[4] 周琳娜.數(shù)字圖像盲取證技術(shù)研究[D].北京郵電大學(xué),2007.
[5] Kirchner M, Bohme R. Hiding traces of resampling in digital images[J].
Information Forensics and Security, IEEE Transactions on,2008.3(4):582-592
[6] Barni M, Fontani M, Tondi B. A universal technique to hide traces
of histogram-based image manipulations[C]//Proceedings of the on Multimedia and security.ACM,2012:97-104
[7] Huang F, Huang J, Shi Y Q. Detecting double JPEG compression
with the same quantization matrix[J].Information Forensics and Security, IEEE Transactions on,2010.5(4):848-856
[8] Li H, Luo W, Huang J. Anti-forensics of double JPEG
compression with the same quantization matrix[J]. Multimedia Tools and Applications,2014:1-16
[9] 蘆明,牛少彰,黃艷麗.數(shù)字圖像取證技術(shù)[J].中國(guó)電子商情: 通信市
場(chǎng),2013.5:58-63
[10] Lam E Y, Goodman J W. A mathematical analysis of the DCT
coefficient distributions for images[J]. Image Processing, IEEE Transactions on,2000.9(10):1661-1666