王波,殷建峰,李亞賓
(大連理工大學(xué)信息與通信工程學(xué)院,遼寧 大連 116024)
JPEG壓縮對相機(jī)型號來源取證的影響分析
王波,殷建峰,李亞賓
(大連理工大學(xué)信息與通信工程學(xué)院,遼寧 大連 116024)
針對實際取證場景中經(jīng)網(wǎng)絡(luò)傳輸?shù)腏PEG壓縮圖像,分析了基于彩色濾波陣列(CFA)插值系數(shù)特征、局部二進(jìn)制模式(LBP)以及圖像質(zhì)量(IQM)和高階小波統(tǒng)計特征這3種典型的相機(jī)型號來源取證方法的性能,評估了社交平臺和網(wǎng)絡(luò)媒體情況下已有來源取證算法的性能。實驗結(jié)果表明,隨著圖像壓縮質(zhì)量的下降,相機(jī)型號來源鑒別準(zhǔn)確率迅速下降,已有方法在實際應(yīng)用中的性能仍然有待提高。
相機(jī)型號來源取證;JPEG壓縮;彩色濾波陣列;局部二進(jìn)制模式;圖像質(zhì)量測量;小波變換
在現(xiàn)實生活中,隨著社交平臺不斷發(fā)展,微信、QQ、微博幾乎成為多數(shù)人日常生活的重要組成部分。與此同時,網(wǎng)絡(luò)數(shù)字媒體蓬勃壯大,無論是使用范圍、生成數(shù)量還是影響力,都大大超越了傳統(tǒng)媒體,甚至有將傳統(tǒng)紙媒取而代之的趨勢,人們所獲得的信息大多來自于網(wǎng)絡(luò),真相和流言也往往始于網(wǎng)絡(luò)。數(shù)字圖像在網(wǎng)絡(luò)中傳播的過程中,出于傳輸速率、網(wǎng)絡(luò)存儲能力以及數(shù)據(jù)流量限制等方面的考慮,可能經(jīng)歷了尺寸變換、壓縮、潤色等圖像處理過程,JPEG便是常用的一種壓縮標(biāo)準(zhǔn)。但由于用戶終端屏幕分辨率等因素的限制,這些經(jīng)過壓縮的圖像并不會產(chǎn)生明顯的視覺差異,依然保持了良好的顯示效果。鑒于實際需要進(jìn)行相機(jī)來源鑒別的數(shù)字圖像往往是這些從網(wǎng)絡(luò)獲得的經(jīng)過壓縮的數(shù)字圖像,它們的數(shù)據(jù)特性和統(tǒng)計分布與原始圖像存在一定差異,因此目前性能優(yōu)秀的各種實現(xiàn)相機(jī)來源鑒別方法的有效性和可靠性有必要進(jìn)行重新評估,增強(qiáng)相關(guān)算法對于JPEG壓縮圖像的頑健性,真正地實現(xiàn)對普遍的JPEG壓縮圖像也能獲得良好的性能才更具有實用價值。
為了測試JPEG壓縮圖像對相機(jī)型號來源鑒別的影響,本文使用典型的3種方法:基于彩色濾波陣列插值系數(shù)特征、基于局部二進(jìn)制模式特征、基于圖像質(zhì)量測量(IQM)結(jié)合高階小波統(tǒng)計特征,利用SVM分類器進(jìn)行訓(xùn)練和測試,評估3種方法對于壓縮圖像的頑健性。下面對這3種方法的核心特征進(jìn)行介紹。
2.1 彩色濾波陣列插值
目前,市場上的數(shù)碼相機(jī)往往在感光器件前端放置一個彩色濾波陣列,以便在一個像素點獲得RGB中的某一個顏色分量,隨后通過CFA插值算法估計出該像素點另外2個顏色分量。CFA的排列、對應(yīng)的濾波模式及插值算法決定了獲取圖像數(shù)據(jù)的統(tǒng)計特征。王波等[8]在2009年針對CFA插值系數(shù)的估計和插值算法的盲檢測問題,提出了一種基于協(xié)方差矩陣的CFA插值盲檢測方法,其核心思想是將協(xié)方差矩陣引入插值系數(shù)方程的建立和求解當(dāng)中。對于不含噪聲、未壓縮的CFA插值圖像,該算法的檢測準(zhǔn)確率高達(dá)99%。
利用文獻(xiàn)[8]中的思路,采用線性插值模型對插值系數(shù)進(jìn)行估計。以G通道為例,設(shè)選擇鄰域為(2k+1)(2k+1)大小,待插值點為(m,n)點,則CFA插值的一般模型如下。其中,ag、ar、ab分別表示插值的權(quán)值系數(shù),
i,j i,j i,j r、g、b分別代表紅色、綠色、藍(lán)色通道像素值。對于給定的數(shù)字圖像,利用文獻(xiàn)[4]給出的方法,將240維CFA插值系數(shù)的均值和240維插值系數(shù)的方差構(gòu)成480維特征向量,從而鑒別相機(jī)來源。
2.2 局部二進(jìn)制模式
文獻(xiàn)[5]中提出了一種基于LBP的相機(jī)來源鑒別算法。該算法考慮每個點與8個鄰域數(shù)據(jù)點之間關(guān)系,構(gòu)成包含相機(jī)成像過程中遺留痕跡的模型,該模型可以被定義為
其中,R代表鄰域半徑,P代表圓上的樣本點數(shù),設(shè)置P=8,R=1。gc和gp分別代表中心像素點的灰度階和鄰域像素點的灰度階,LBP特征的星座圖分布如圖1(a)所示。
圖1 LBP特征星座圖
定義函數(shù)S為
計算中心像素點與周圍點的差值,并根據(jù)函數(shù)S進(jìn)行二值量化和編碼,就可以獲得如圖1(b)所示的LBP模型。理論上共可獲得256(256=28)種可能的LBP分布模型,將其中出現(xiàn)頻率較高的部分記為“uniform”的LBP,其余為“non-uniform”的LBP。對其中出現(xiàn)頻率較高的59個模型進(jìn)行統(tǒng)計,構(gòu)成59維的特征。在紅色和綠色2個顏色通道,分別從空域圖像、經(jīng)過預(yù)測誤差處理的圖像、經(jīng)過一階小波變換的圖像中提取該特征獲得354(354=59×3×2)維特征[9]。
2.3 圖像質(zhì)量特征與高階小波特征
孫雪輝[10]指出,數(shù)碼相機(jī)幾乎全部采用了12位模數(shù)轉(zhuǎn)換器(ADC, analog to digital converter),會引入顏色丟失和噪聲增強(qiáng),因此圖像質(zhì)量評價也可作為相機(jī)來源鑒別的特征。圖像質(zhì)量特征是評價圖像質(zhì)量客觀性的方法和手段,通過量化描述這些不可察覺的差異,不僅可以對圖像的感知變化進(jìn)行評價,還可以分析不可感知的變化。本)文也采用文獻(xiàn)[11,12]中13維的圖像質(zhì)量特征,如表1所示。
表1 13維圖像質(zhì)量特征的構(gòu)成
Lyu等[13]認(rèn)為不同的圖像采集設(shè)備成像過程中會引入不同的設(shè)備特征,并可以在頻域的不同方向和尺度得到反映,基于此,他們使用多尺度小波變換提取了高維統(tǒng)計特征來描述設(shè)備差異。Wang等[14]認(rèn)為數(shù)碼相機(jī)成像過程的內(nèi)在缺陷和圖像處理可以用于實現(xiàn)相機(jī)來源鑒別,于是提取了高階小波特征和小波系數(shù)特征作為特征向量。本文對圖像進(jìn)行4階小波變換,選擇RGB三色通道的第4層低頻系數(shù)、水平高頻系數(shù)、垂直高頻系數(shù)、對角高頻系數(shù)的均值、標(biāo)準(zhǔn)差、斜度、峰度作為特征,共形成48(48=3×4×4)維高階小波統(tǒng)計特征。均值、標(biāo)準(zhǔn)差、斜度、峰度的計算方法如下式(4)~式(7)中,Hk(i, j)表示水平分量,c和r分別表示其行數(shù)和列數(shù)。
本文實驗結(jié)合以上2種特征,共獲得61(61=13+48)維圖像特征。
3.1 實驗設(shè)置與參數(shù)
本文采用來自“Dresden Image Dataset”[15]圖像庫的5個相機(jī)型號的圖像,每個型號選取350幅JPEG圖像構(gòu)成實驗數(shù)據(jù)庫,如表2所示。
表2 實驗數(shù)據(jù)庫
實驗中采用的SVM分類器為LIBSVM-3.21。在實驗中,隨機(jī)選取每種相機(jī)的250幅JPEG圖像作為分類器的訓(xùn)練樣本,剩余100幅圖像作為原始測試樣本。
在仿真實驗中,以待測試原圖相機(jī)來源鑒別準(zhǔn)確率為基礎(chǔ),設(shè)置8個對照組。每個實驗組共500(500=100×5)幅測試圖像,共進(jìn)行27組實驗。表3為仿真實驗測試圖像的相關(guān)信息。
表3 仿真實驗測試圖像
在實際社交平臺的圖像實驗中,每類相機(jī)隨機(jī)選擇20幅圖像,選擇最常用的社交媒體微信、QQ和微博,在Wi-Fi環(huán)境下對測試圖像進(jìn)行上傳/下載或傳送,獲得經(jīng)過社交平臺處理的JPEG圖像。每個測試組為100(100=20×5)幅圖像,共進(jìn)行9組實驗,與待測試原圖相機(jī)來源鑒別準(zhǔn)確率做對照。其中,微信平臺為安卓客戶端,QQ平臺為電腦客戶端,微博平臺為電腦瀏覽器網(wǎng)頁端。同時,為了避免社交媒體傳送時圖像分辨率的變化對實驗結(jié)果的影響,測試圖像統(tǒng)一從原始圖像左上區(qū)域選取1 024×1 024像素大小的子圖像,然后進(jìn)行社交媒體的傳送壓縮。表4為經(jīng)過社交媒體壓縮后的實驗測試圖像的相關(guān)信息。
表4 實際實驗測試數(shù)據(jù)
3.2 實驗結(jié)果與分析
如上所述,為了完成基于CFA插值特征、LBP特征、IQM結(jié)合高階小波特征的相機(jī)來源鑒別方法在面對JPEG壓縮圖像時的性能比較和評估,本文按照第2節(jié)給出的實驗設(shè)置,分別基于3類特征完成了36組測試實驗。實驗結(jié)果如表5、圖2和圖3所示。
表5 各測試組平均相機(jī)來源鑒別準(zhǔn)確率
仿真實驗結(jié)果表明,對于原始圖像測試,3類算法均可達(dá)到比較好的性能:基于CFA插值特征鑒別準(zhǔn)確率達(dá)到99.4%;基于LBP特征鑒別準(zhǔn)確率達(dá)98.0%;基于IQM結(jié)合高階小波特征略遜一籌,也達(dá)到了84.8%。
圖2 相機(jī)型號來源取證準(zhǔn)確率隨JPEG圖像壓縮質(zhì)量變化的關(guān)系
整體來看,隨著JPEG圖像質(zhì)量因子的下降,3類算法的鑒別準(zhǔn)確率也迅速下降,尤其在圖像質(zhì)量因子由95下降至90時,3類算法的鑒別準(zhǔn)確率從80%左右快速降至50%左右,圖像質(zhì)量因子下降至65時,3類算法的鑒別準(zhǔn)確率基本已經(jīng)穩(wěn)定在20%左右,幾乎相當(dāng)于對測試樣本隨機(jī)分類。
相對而言,基于IQM結(jié)合高階小波特征的鑒別準(zhǔn)確率隨JPEG圖像質(zhì)量因子的下降變化更為緩和,但也明顯不能滿足現(xiàn)實需要?;贑FA特征的鑒別盡管在原始圖像測試條件下獲得了最高的準(zhǔn)確率,但當(dāng)JEPG圖像質(zhì)量因子下降時,其準(zhǔn)確率下降也最為劇烈,難以在現(xiàn)實中實現(xiàn)應(yīng)用。這表明單純依賴相機(jī)參數(shù)的特征在面對JPEG壓縮圖像時的頑健性更差。
3類算法的相機(jī)來源鑒別準(zhǔn)確率隨JPEG圖像質(zhì)量因子的變化趨勢和3類算法性能的橫向比較如圖2所示。
實際實驗結(jié)果顯示,對于從普通社交平臺微信、QQ、微博獲取的圖像,相機(jī)來源鑒別結(jié)果的準(zhǔn)確率與其壓縮算法有很大關(guān)系,不同社交媒體下的實驗結(jié)果差異很大。對于通過微博壓縮的圖像進(jìn)行相機(jī)來源鑒別,基于CFA特征的鑒別準(zhǔn)確率較高,為95.0%。此時基于IQM結(jié)合高階小波特征的準(zhǔn)確率明顯下降,僅有58.0%,基于LBP特征的鑒別準(zhǔn)確率為84.3%,與質(zhì)量因子為95的標(biāo)準(zhǔn)JPEG壓縮試驗結(jié)果相近。讀取壓縮圖像的量化表并與標(biāo)準(zhǔn)量化表對比,發(fā)現(xiàn)微博對原圖進(jìn)行了質(zhì)量因子為95的壓縮,此時的鑒別準(zhǔn)確率也與測試實驗相符。同樣地微信對話對圖像進(jìn)行壓縮的質(zhì)量因子為90,此時3類特征的鑒別準(zhǔn)確率都略高于50%,但并不具有實際應(yīng)用的意義。而經(jīng)過QQ對話壓縮的圖像,鑒別準(zhǔn)確率已降至25.0%左右,接近于統(tǒng)計學(xué)上隨機(jī)分類的概率?,F(xiàn)有算法對社交媒體壓縮圖像的來源鑒別準(zhǔn)確率仍有待提高。
從社交平臺獲取的圖像與原始圖像相機(jī)來源鑒別準(zhǔn)確率對比如圖3所示。
圖3 社交平臺壓縮圖像與原始圖像相機(jī)型號來源取證準(zhǔn)確率對比
圖4~圖6的混淆矩陣清晰地展現(xiàn)了每一類圖像的相機(jī)來源鑒別的結(jié)果。其中,對角線代表測試圖像被正確分類的百分比,其他則代表錯誤分類的百分比。
圖4 CFA特征檢測混淆矩陣
圖5 LBP特征檢測混淆矩陣
圖6 IQM+高階小波特征檢測混淆矩陣
本文針對JPEG圖像壓縮質(zhì)量對相機(jī)來源鑒別的影響,對基于CFA插值系數(shù)特征、基于LBP特征、基于IQM結(jié)合高階小波特征在不同JPEG圖像壓縮質(zhì)量下進(jìn)行相機(jī)來源鑒別3種算法的性能進(jìn)行了比較和評估。隨著JPEG圖像壓縮質(zhì)量的下降,3種算法性能迅速下降,在質(zhì)量因子約為85時性能已經(jīng)非常不理想,而在面對實際網(wǎng)絡(luò)社交平臺的測試圖像時,算法性能與社交媒體壓縮算法有很大關(guān)系,但基本與實驗中相同質(zhì)量因子的準(zhǔn)確率相符,當(dāng)社交媒體對圖像的壓縮因子小于90后,已難以在現(xiàn)實情境中滿足相機(jī)來源鑒別的需求。因此,目前使用的相機(jī)來源鑒別的相關(guān)算法亟待改進(jìn)。
[1] PIVA A. An overview on image forensics[J]. ISRN Signal Processing, 2013, (1): 1-22.
[2] 王波. 利用成像引入特征的數(shù)字圖像被動盲取證研究[D]. 大連:大連理工大學(xué), 2010. WANG B. Study on passive and blind digital image forensics using characteristics introduced by image formation[D]. Dalian: Dalian University of Technology, 2010.
[3] KOT A C, CAO H. Image and video source class identification[M]// Digital Image Forensics. New York:Springer Press, 2013: 157-178.
[4] SWAMINATHAN A, WU M, LIU K J R. Nonintrusive component forensics of visual sensors using output images[J]. IEEE Transac-tions on Information Forensics and Security, 2007, 2(1): 91-105.
[5] XU G, SHI Y Q. Camera model identification using local binary patterns[C]//IEEE International Conference on Multimedia and Expo(ICME). 2012: 392-397.
[6] KHARRAZI M, SENCAR H T, MEMON N. Blind source camera identification[C]//IEEE International Conference on Image Processing (ICIP). 2004: 709-712.
[7] SAN C K, LAM E Y, WONG K K Y. Automatic source cameraidentification using the intrinsic lens radial distortion[J]. Optics Express, 2006, 14(24): 11551-11565.
[8] 王波, 孔祥維, 尤新鋼, 等. 基于協(xié)方差矩陣的CFA插值盲檢測方法[J]. 電子與信息學(xué)報,2009,31(5):1175-1179. WANG B, KONG X W, YOU X G, et al. Blind CFA interpolation detection based on covariance matrix[J]. Journal of Electronics and Information Technology, 2009, 31(5):1175-1179
[9] TAN Y, WANG B, LI M, et al. Camera source identification with limited labeled training set[C]//The 14th International Workshop on Digital-forensics and Watermarking, Tokyo. 2015.
[10] 孫雪輝. 利用多特征和軟件成像的手機(jī)圖像盲取證技術(shù)[D]. 大連: 大連理工大學(xué),2010. SUN X H. Blind cell-phone image forensics based on multi- features and soft-imaging[D]. Dalian: Dalian University of Technology,2010.
[11] ISMAIL A. Steganalysis using image quality metrics[J]. IEEE Transactions on Image Processing, 2003, 12(2):221-229.
[12] ESKICOIGLU AM, FISHER P S. Image quality measures and their performance[J]. IEEE Transactions on Communication, 1995,43(12): 2959-2965.
[13] LYU S, FARID H. How realistic is photorealistic[J]. IEEE Transactions on Signal Processing, 2005, 53(2): 845-850.
[14] WANG B, GUO Y Q, KONG X W, et al. Source camera identification forensics based on wavelet features[C]//International Conference on Intelligent Information Hiding and Multimedia Signal Processing, Kyoto. 2009:702-705.
[15] GLOE T, BOHME R. The dresden image database' for benchmarking digital image forensics[J]. Journal of Digital Forensic Practice,2010, 3(2-4):150-159.
王波(1981-),男,四川自貢人,大連理工大學(xué)副教授,主要研究方向為數(shù)字圖像取證、信息隱藏與信息隱藏分析。
殷建峰(1994-),女,山西太原人,大連理工大學(xué)本科生,主要研究方向為數(shù)字圖像取證。
李亞賓(1994-),男,河南漯河人,大連理工大學(xué)碩士生,主要研究方向為數(shù)字圖像取證。
Performance evaluation for JPEG compression on model-based source camera identification
WANG Bo, YIN Jian-feng, LI Ya-bin
(School of Information and Communication Engineering, Dalian University of Technology, Dalian 116024, China)
Focusing on JPEG images transferred by social platform and network media from actual forensic cases,quantities of simulation experiments were carried out to evaluate the performance of three typical methods of model-based source camera identification. The methods are based on the feature of interpolation coefficients of color filter array (CFA), local binary pattern (LBP), and image quality measurement (IQM) with high-order wavelet statistic features. The experiments demonstrate that the accuracy decreases rapidly with the compression quality of images decreasing. As a result, methods of model-based source camera identification currently used are demanded better performance in practical scenes.
model-based source camera identification, JPEG compression, color filter array, local binary pattern,image quality measures, wavelet transform
網(wǎng)絡(luò)信息時代給人們的生活帶來了極大的便利,數(shù)字圖像已經(jīng)成為了信息的重要載體。同時,各種圖像處理編輯軟件和應(yīng)用迅速普及,圖像的篡改和偽造變得非常容易和便捷。近年來,在新聞、政治、司法以及科學(xué)等領(lǐng)域?qū)映霾桓F的篡改偽造數(shù)字媒體所引發(fā)的各類事件,沖擊著人們對新聞、司法乃至社會誠信體系的信心。也正因為數(shù)字媒體完整性和真實性分析的急切需求,催生了數(shù)字內(nèi)容取證技術(shù)的迅速發(fā)展[1]。相機(jī)型號來源鑒別是其中一個重要方面,并且應(yīng)運(yùn)而生了各種實現(xiàn)相機(jī)來源鑒別的方法?,F(xiàn)有的相機(jī)來源鑒別主要劃分為[2]:設(shè)備類型鑒別、設(shè)備型號鑒別、設(shè)備個體鑒別。本文僅討論設(shè)備型號的鑒別。相機(jī)來源鑒別通常被建模為機(jī)器學(xué)習(xí)中的分類問題[3]。Swaminathan等[4]通過建立線性模型來對彩色濾波陣列(CFA,color filter array)插值系數(shù)進(jìn)行準(zhǔn)確估計,獲得了在19個相機(jī)型號下90%的平均鑒別準(zhǔn)確率。Xu等[5]提出利用局部二進(jìn)制模式(LBP,local binary pattern)作為來源鑒別的統(tǒng)計特征,在18個相機(jī)型號樣本的情況下,獲得了高達(dá)98%的平均鑒別準(zhǔn)確率。Kharrazi等[6]提取了數(shù)字圖像中的顏色特征、圖像質(zhì)量特征以及高階小波特征共34維,獲得了88.0%的平均鑒別準(zhǔn)確率。Choi等[7]將不同型號數(shù)碼相機(jī)的鏡頭失真作為來源鑒別的核心特征,提取數(shù)字圖像中直線信息的失真來量化描述鏡頭的失真,進(jìn)而區(qū)分和鑒別不同型號數(shù)碼相機(jī)拍攝的圖像,測試結(jié)果準(zhǔn)確率達(dá)到96%。盡管這些方法在十幾個相機(jī)類別的情況下,都取得了較優(yōu)的性能,但這樣的結(jié)果大多都是基于實驗樣本來自拍攝設(shè)備的原始圖像。
s: The National Natural Science Foundation of China (No.61502076), Scientific Research Foundation of the Education Department of Liaoning Province (No.L2015114)
TN911.73
A
10.11959/j.issn.2096-109x.2016.00100
2016-07-12;
2016-08-19。通信作者:王波,bowang@dlut.edu.cn
國家自然科學(xué)基金資助項目(No.61502076);遼寧省教育廳科學(xué)研究基金資助項目(No.L2015114)