文/ 天津市公安局網(wǎng)安總隊(duì)高級(jí)工程師 宋濤天津市公安局網(wǎng)安總隊(duì)工程師 劉鑫
數(shù)字圖像區(qū)域偽造檢測(cè)系統(tǒng)的研究與實(shí)現(xiàn)
文/ 天津市公安局網(wǎng)安總隊(duì)高級(jí)工程師 宋濤天津市公安局網(wǎng)安總隊(duì)工程師 劉鑫
針對(duì)當(dāng)前我國(guó)刑事訴訟和司法鑒定領(lǐng)域急需解決的數(shù)字圖像真?zhèn)舞b定問(wèn)題,研發(fā)一套能夠?qū)Σ煌瑝嚎s比率的偽造圖片和存在克隆區(qū)域的偽造圖片進(jìn)行可信度量并給出檢測(cè)結(jié)果的軟件系統(tǒng)。本系統(tǒng)最終對(duì)單張照片的內(nèi)容可信度量的平均時(shí)間小于 10 秒鐘;像素級(jí)別的PS 區(qū)域檢測(cè)準(zhǔn)確率大于 90%,可有效的解決數(shù)字圖像的真?zhèn)螌?shí)時(shí)鑒定問(wèn)題。
數(shù)字圖像 取證 克隆區(qū)域 特征點(diǎn)
隨著全球信息化、電子化技術(shù)的發(fā)展,數(shù)字圖像處理技術(shù)的不斷普及,涉及數(shù)字圖像作為關(guān)鍵證據(jù)的案件越來(lái)越多,并且呈加速趨勢(shì),對(duì)數(shù)字圖像的編輯已經(jīng)被應(yīng)用到社會(huì)的各個(gè)領(lǐng)域。但是數(shù)字圖像極易不留痕跡地被復(fù)制和改動(dòng),使它的原始性和真實(shí)性不能得到正確體現(xiàn),因此其證據(jù)效力也成為當(dāng)前證據(jù)研究的熱點(diǎn)問(wèn)題。數(shù)字圖像的真?zhèn)舞b定也成為當(dāng)前我國(guó)刑事訴訟和司法鑒定領(lǐng)域急需解決的關(guān)鍵性問(wèn)題。
該系統(tǒng)通過(guò)圖片壓縮比率以及克隆區(qū)域定位技術(shù)檢測(cè)數(shù)字圖像內(nèi)容的可信度,自動(dòng)或半自動(dòng)的計(jì)算圖像的可信度,能夠解決由不同壓縮比率的圖片拼接而成和存在克隆區(qū)域情況的數(shù)字圖像內(nèi)容可信度量問(wèn)題和圖像偽造檢測(cè)。通過(guò)對(duì)該系統(tǒng)進(jìn)行研發(fā),能夠有效提高公安機(jī)關(guān)對(duì)于偽造圖像證據(jù)的鑒別能力,能夠有效降低聲像資料司法鑒定機(jī)構(gòu)對(duì)于偽造圖像證據(jù)的鑒定時(shí)間,具有較高的應(yīng)用價(jià)值。
2.1.1 輸入圖片,提取SIFT特征描述符
本方法所使用的特征點(diǎn)提取基于的是SIFT特征描述符。SIFT利用灰度極值得出的點(diǎn),通過(guò)高斯差的閾值設(shè)置和黑塞矩陣,將備選的極值點(diǎn)進(jìn)行篩選,除去一些邊緣響應(yīng)過(guò)于明顯的點(diǎn)和對(duì)比度過(guò)低的點(diǎn),結(jié)果具有尺度不變形,并且對(duì)尺度和光照也具有一定的健壯性。得出的特征點(diǎn)經(jīng)過(guò)精確定位的確定方向參數(shù)后構(gòu)成描述符矩陣,即是下一步得以進(jìn)行的基礎(chǔ)。
2.1.2 運(yùn)用ESS方法,得出初步定位矩形
對(duì)輸入的候選域以及待定位圖像進(jìn)行特征點(diǎn)的檢測(cè)和特征描述之后,就是對(duì)特征描述的匹配,以期達(dá)到盡可能多的正確特征點(diǎn)對(duì),減少錯(cuò)誤匹配。首先,根據(jù)候選域圖像的大小生成一個(gè)等大小的n乘m矩陣,矩陣中每一個(gè)元素代表對(duì)應(yīng)像素處的特征點(diǎn)的匹配與否。在本方法中,對(duì)于ESS的評(píng)分策略如下:
1、對(duì)于匹配的特征點(diǎn),賦予一個(gè)正分p;2、對(duì)于不匹配的特征點(diǎn),賦予一個(gè)負(fù)分n;3、對(duì)于其它的點(diǎn),分值為0。
接下來(lái),ESS使用了一個(gè)權(quán)值積分策略,將正分權(quán)值分別在對(duì)應(yīng)的權(quán)值矩陣中進(jìn)行積分(具體操作為:先縱向遍歷每一點(diǎn),將當(dāng)前分值與上一點(diǎn)分值求和作為該點(diǎn)的新分值;橫向亦然),使得正負(fù)權(quán)值矩陣中的每一點(diǎn)對(duì)應(yīng)分?jǐn)?shù)為這點(diǎn)對(duì)應(yīng)像素及其左上方構(gòu)成矩陣的總分,這樣的一個(gè)策略便于接下來(lái)計(jì)算每一個(gè)狀態(tài)的匹配分?jǐn)?shù)。[2]
2.1.3 建立極線(xiàn)幾何轉(zhuǎn)化基礎(chǔ)矩陣
如圖2-1(a),幾何一致性是真正的匹配點(diǎn)應(yīng)該具有的性質(zhì)之一,如圖中的x點(diǎn)和x’點(diǎn)(即是描述物體上的同一點(diǎn)X),那么根據(jù)極線(xiàn)幾何理論,描述同一物體的候選域與待定位圖像之間的正確匹配應(yīng)該同樣具有這樣一個(gè)轉(zhuǎn)化關(guān)系。本方法利用的是上一步ESS得出的定位矩形中的匹配點(diǎn),由于ESS的保守性,所以可以通過(guò)對(duì)上一步中的匹配點(diǎn)集的計(jì)算,可以得出基于極線(xiàn)幾何關(guān)系的3乘3轉(zhuǎn)化矩陣F?;A(chǔ)矩陣F經(jīng)過(guò)測(cè)試,有著較好的針對(duì)錯(cuò)誤匹配的甄別力。
圖2-1 a)為原始的候選域和待定位圖像,b) 閾值為0.8時(shí)的匹配點(diǎn)對(duì)(紅色和藍(lán)色),以及經(jīng)過(guò)幾何甄選后的匹配(紅色)。匹配點(diǎn)由319個(gè)減少為238個(gè),減少了34%
2.1.4 利用基礎(chǔ)矩陣甄選匹配點(diǎn)
根據(jù)幾何關(guān)系,對(duì)于圖片上的每一點(diǎn),通過(guò)以上基礎(chǔ)矩陣F,能夠在對(duì)應(yīng)圖片的對(duì)應(yīng)位置得出一條直線(xiàn),如圖1(b)中l(wèi)以及l(fā)’,則理論上每一對(duì)匹配點(diǎn)都應(yīng)該互相滿(mǎn)足這種關(guān)系。本方法就是通過(guò)這種幾何關(guān)系,利用公式l’= Fx求出待定位圖像中每一個(gè)匹配點(diǎn)x在候選域中的對(duì)應(yīng)直線(xiàn)l’;在候選域中,對(duì)應(yīng)的匹配點(diǎn)x據(jù)離該直線(xiàn)的幾何距離可以藉由直線(xiàn)距離公式得到一一甄別匹配點(diǎn)。經(jīng)過(guò)試驗(yàn),確實(shí)有較好的甄別效果,能夠有效去除錯(cuò)誤匹配點(diǎn)。[3]
相關(guān)公式:
其中,a1,a2,a3,b1,b2,b3,c1,c2,c3為基礎(chǔ)矩陣F的參數(shù),x, y為圖片上一點(diǎn)的齊次坐標(biāo)值,A,B,C為此點(diǎn)對(duì)應(yīng)直線(xiàn)的坐標(biāo)值。
2.1.5 遍歷匹配點(diǎn),矩陣增長(zhǎng)
由于矩陣增長(zhǎng)策略對(duì)于錯(cuò)誤匹配,尤其是不滿(mǎn)足幾何關(guān)系的錯(cuò)誤匹配極其敏感,經(jīng)過(guò)上一步之后,這樣的因素被有效排除,于是本方法可以采用矩陣增長(zhǎng)策略,遍歷當(dāng)前每一個(gè)匹配點(diǎn)(幾何限制之后的),如果在矩陣外就將矩陣邊界延伸到該匹配點(diǎn)對(duì)應(yīng)坐標(biāo);否則繼續(xù)遍歷。矩陣增長(zhǎng)后得出的矩形框即為最后的定位矩陣。
圖2-2 用了不同的候選域和待定位圖像,改良效果同樣很明顯a)為定位圖像,b)、c)、d)為ESS后的結(jié)果,e)、f)、g)為本方法改良后的結(jié)果
2.1.6 甄別真?zhèn)螀^(qū)域
直覺(jué)上,偽造區(qū)域相比原始圖片區(qū)域更加不自然。鑒于此,本方法依據(jù)目標(biāo)區(qū)域邊界內(nèi)與外的像素灰度值的差別,區(qū)分真?zhèn)螀^(qū)域。[4]對(duì)應(yīng)像素的能量值通過(guò)下式計(jì)算:
圖2-3 (a)原始圖片。(b)PS之后的圖片。(c)本方法檢測(cè)結(jié)果,其中黃色區(qū)域?yàn)榭寺^(qū)域,紅色矩形框內(nèi)為偽造區(qū)域。
現(xiàn)有盲檢測(cè)算法大都要求待檢測(cè)圖像是未壓縮的或者高質(zhì)量壓縮的圖像,針對(duì)廣泛應(yīng)用的JPEG有損壓縮圖像的可信度量檢測(cè)算法還比較少,本方法是在像素域進(jìn)行的JPEG合成圖像檢測(cè)。待檢測(cè)的JPEG合成圖像中有一部分圖像的質(zhì)量要比其余部分的質(zhì)量要低,將合成后的圖像以不同的質(zhì)量因子二次壓縮,通過(guò)比較其與母圖片的差別,利用K-S 統(tǒng)計(jì)(Kolmogorov-Smirnov Statistic)工具可確定偽造區(qū)域。[5]具體算法如下:
圖2-4 左上角為輸入圖片(質(zhì)量因子為85)。將圖片中心200*200的區(qū)域抽出,并以質(zhì)量因子為65壓縮后放回原處。其余圖片分別為質(zhì)量因子為[35 -85]壓縮后,與原圖片比較所得。
2.利用K-S統(tǒng)計(jì)區(qū)分差值圖像中的兩個(gè)不同區(qū)域:
其中,C1(u)和C2(u)表示差值圖像中兩個(gè)特定區(qū)域的累積概率。
以JetF16高壓縮比率(低清晰度)標(biāo)準(zhǔn)測(cè)試圖篡改為例,為達(dá)到視覺(jué)上的不可覺(jué)察性,將中間部分取出以質(zhì)量因子80進(jìn)行JPEG壓縮后放回原處,再用質(zhì)量因子90保存為JPEG文件。運(yùn)用上述二次JPEG壓縮方法檢測(cè)結(jié)果如圖2-5所示。
圖2-5 左邊為篡改的JetF16,右邊為檢測(cè)結(jié)果
本系統(tǒng)通過(guò)圖片壓縮比率以及克隆區(qū)域定位技術(shù)檢測(cè)數(shù)字圖像內(nèi)容的可信度,自動(dòng)或半自動(dòng)的計(jì)算圖像的可信度。能夠解決由不同壓縮比率的圖片拼接而成和存在克隆區(qū)域情況的數(shù)字圖像內(nèi)容可信度量問(wèn)題和圖像偽造檢測(cè)。通過(guò)對(duì)該系統(tǒng)進(jìn)行研發(fā),能夠有效提高公安機(jī)關(guān)對(duì)于偽造圖像證據(jù)的鑒別能力,能夠有效降低聲像資料司法鑒定機(jī)構(gòu)對(duì)于偽造圖像證據(jù)的鑒定時(shí)間,鑒定結(jié)果的準(zhǔn)確性。
3.1.1 基礎(chǔ)環(huán)境
本系統(tǒng)使用MFC框架,結(jié)合OpenCV開(kāi)源圖像處理庫(kù)實(shí)現(xiàn)對(duì)偽造圖像的檢測(cè),由于系統(tǒng)使用的是微軟的MFC框架,所以系統(tǒng)的目標(biāo)平臺(tái)目前只支持Windows。
3.1.2 開(kāi)發(fā)環(huán)境與工具
3.2.1 系統(tǒng)安裝
1.系統(tǒng)的基本配置
處理器 Pentium II及其兼容機(jī),Intel80x86處理器,主頻1GHZ以上內(nèi)存 內(nèi)存512M以上網(wǎng)絡(luò) 以太網(wǎng)IEEE 802.3 工業(yè)標(biāo)準(zhǔn)10 Mbps/100Mbps
2.開(kāi)發(fā)環(huán)境及工具
開(kāi)發(fā)平臺(tái) 微軟公司W(wǎng)indows XP/Windows Vista/Windows 7系統(tǒng)開(kāi)發(fā)環(huán)境 開(kāi)發(fā)集成環(huán)境為Microsoft Visual Studio 2010測(cè)試環(huán)境 測(cè)試工具主要為MFC開(kāi)發(fā)語(yǔ)言 程序使用MFC實(shí)現(xiàn),結(jié)合OpenCV開(kāi)源圖像處理庫(kù)
1、本系統(tǒng)安裝在安裝OpenCV 2.2及以上庫(kù)運(yùn)行環(huán)境下,并支持Windows NT 1.0以上Windows平臺(tái)。
2、安裝視頻監(jiān)控主動(dòng)防偽系統(tǒng):運(yùn)行ForgeryDetection.msi應(yīng)用程序,并按提示步驟完成安裝。
3.2.2 系統(tǒng)功能
雙擊桌面“雙擊Forgery.exe”快捷方式,啟動(dòng)系統(tǒng)。
圖3-1 程序主界面截圖
點(diǎn)擊文件導(dǎo)入待檢測(cè)圖片,并點(diǎn)擊Jpeg偽造檢測(cè)
圖3-2 導(dǎo)入不同壓縮比率偽造待檢圖片
輸出結(jié)果,紫紅色矩形框的部分為偽造區(qū)域
圖3-3 偽造區(qū)域結(jié)果
打開(kāi)待檢測(cè)圖片,并點(diǎn)擊區(qū)域檢測(cè)
圖3-4 導(dǎo)入克隆區(qū)域偽造待檢圖片
輸出結(jié)果,淺白色覆蓋的兩個(gè)區(qū)域?yàn)閭卧靺^(qū)域
圖3-5 偽造區(qū)域結(jié)果
分別對(duì)該系統(tǒng)進(jìn)行功能測(cè)試和模塊測(cè)試,測(cè)試情況如下:3.3.1 功能測(cè)試
表3-1 系統(tǒng)功能測(cè)試內(nèi)容
3.3.2 模塊測(cè)試
表3-2 系統(tǒng)模塊測(cè)試內(nèi)容
經(jīng)過(guò)對(duì)系統(tǒng)功能與模塊進(jìn)行測(cè)試,該系統(tǒng)模塊運(yùn)行正常,且可以實(shí)現(xiàn)全部功能。對(duì)于由不同壓縮比率,檢測(cè)正確率達(dá)到95%以上;對(duì)于存在克隆區(qū)域的數(shù)字圖片,檢測(cè)查全率達(dá)到85%以上,檢測(cè)正確率達(dá)到95%以上。對(duì)于復(fù)雜場(chǎng)景,例如克隆區(qū)域旋轉(zhuǎn)和放縮,本系統(tǒng)檢測(cè)正確率分別達(dá)到70%和85%以上。同時(shí)單張照片的內(nèi)容可信度量平均時(shí)間小于10秒鐘;像素級(jí)別的PS區(qū)域檢測(cè)準(zhǔn)確率大于90%。
當(dāng)前,面對(duì)越來(lái)越多的視聽(tīng)資料證據(jù),既給案件的偵破和審理提供了許多機(jī)遇,也給刑事技術(shù)工作帶來(lái)了巨大挑戰(zhàn)。第一,視聽(tīng)資料證據(jù)高科技含量的特點(diǎn)有別于傳統(tǒng)的證據(jù)形式,在鑒定技術(shù)方面有許多需要探索和研究的方面;第二,視聽(tīng)資料證據(jù)極易被篡改和編輯的特性,也使得視聽(tīng)資料司法鑒定相關(guān)技術(shù)的研究勢(shì)在必行。
數(shù)字圖像處理技術(shù)以其便捷的操作和強(qiáng)大的功能,為刑偵工作提供了良好的偵破條件,對(duì)于公安、司法實(shí)踐具有現(xiàn)實(shí)意義。由于數(shù)字圖像處理方法繁多,并且處理對(duì)象和處理效果各不相同,實(shí)踐應(yīng)用中,應(yīng)當(dāng)在準(zhǔn)確分析原始圖像的基礎(chǔ)上,采用多種不同的處理方法和算法,最后比較處理效果,擇優(yōu)取之。另外,在圖像處理中,可以使用Matlab等高級(jí)處理工具以提高鑒定效率,快速轉(zhuǎn)換研究思路,不斷的探索更新更有效的鑒定方法。[1]
目前,我國(guó)公安實(shí)戰(zhàn)和司法鑒定部門(mén)在視聽(tīng)技術(shù)方面的人才極度匱乏,能夠掌握和運(yùn)用這門(mén)技術(shù)的人才更是屈指可數(shù),這些都已經(jīng)成為嚴(yán)重制約視聽(tīng)資料在法庭上作為證據(jù)使用的瓶頸。利用數(shù)字圖像處理技術(shù)在視聽(tīng)資料證據(jù)領(lǐng)域進(jìn)行運(yùn)用,解決視聽(tīng)資料證據(jù)檢驗(yàn)和鑒定難題,已成為我國(guó)當(dāng)前司法體制現(xiàn)代化建設(shè)工作的重中之重。今后通過(guò)進(jìn)一步加強(qiáng)數(shù)字圖像處理技術(shù)在我國(guó)視聽(tīng)資料證據(jù)領(lǐng)域內(nèi)的開(kāi)發(fā)和應(yīng)用,將有利于推動(dòng)我國(guó)公安科學(xué)技術(shù)和司法訴訟的現(xiàn)代化建設(shè),為打擊犯罪、保護(hù)人民、維護(hù)社會(huì)穩(wěn)定作出積極的貢獻(xiàn)。
[1]宋濤,數(shù)字圖像處理技術(shù)在聲像資料司法鑒定中的應(yīng)用,信息網(wǎng)絡(luò)安全. 2011年第09期
[2]章毓晉著,圖像處理與分析,北京:清華大學(xué)出版社.1999
[3]賈永紅著,計(jì)算機(jī)圖像處理與分析,武漢大學(xué)出版社,2001
[4]岡薩雷斯著,阮秋琦、阮宇智等譯,數(shù)字圖像處理,北京電子工業(yè)出版社.2005
[5]Carson, C. Belonqie, S. Greenspan, H.,etal : image segmentation using expectation-maximization and its application to image querying. IEEE Trans. Pattern Anal. Machine Intell.,2002
中國(guó)安全防范技術(shù)與應(yīng)用2017年4期