王新月,劉 丹
圖像可以直觀、客觀地反映現(xiàn)實(shí)場景,因此,被視為有說服力的法庭物證,被廣泛應(yīng)用于刑事案件偵查與法庭取證過程中,同時(shí),圖像也越來越多地用于支持重要決策。但是,隨著科技的不斷發(fā)展、進(jìn)步,數(shù)碼相機(jī)、手機(jī)等拍照設(shè)備越來越普及,人們可以隨時(shí)隨地拍攝各種數(shù)字圖像,隨著計(jì)算機(jī)和互聯(lián)網(wǎng)的飛速發(fā)展,專業(yè)人士甚至可以通過AI 技術(shù)直接生成各種各樣的圖像,同時(shí),數(shù)字圖像的存儲(chǔ)與傳遞變得十分簡單。隨著網(wǎng)絡(luò)的迅速發(fā)展,數(shù)字圖像幾乎遍布了互聯(lián)網(wǎng)和現(xiàn)實(shí)生活中的每個(gè)角落。
在公安以及司法實(shí)踐中,越來越多的案件涉及圖像真實(shí)性檢驗(yàn)鑒定的問題。在司法審判中,越來越多的圖像的真實(shí)性受到涉案犯罪嫌疑人或當(dāng)事人的質(zhì)疑,大多數(shù)案件需要對圖像的真實(shí)性進(jìn)行檢驗(yàn)鑒定以后才能夠成為有效的法庭證據(jù)。為鑒別數(shù)字圖像與司法證據(jù)的可信性與真實(shí)性,以及數(shù)字圖像情報(bào)的可靠性??茖W(xué)、量化地證實(shí)數(shù)字圖像的真實(shí)性早已成為證據(jù)科學(xué)領(lǐng)域的一個(gè)非常重要的研究方向。
為了精確地鑒別數(shù)字圖像的真?zhèn)?,科研工作者們已?jīng)提出了很多數(shù)字圖像取證的方法。圖像取證技術(shù)一般分為主動(dòng)取證技術(shù)和被動(dòng)取證技術(shù)兩大類。圖像主動(dòng)取證的主要特點(diǎn)是必須事先將數(shù)字水印或簽名等信息嵌入到待傳輸圖像中,接收者在收到該圖像后通過特定密鑰提取該信息,根據(jù)提取出來的水印或簽名是否完整,判斷出該圖像是否經(jīng)過篡改[1-2]。在實(shí)際應(yīng)用的過程中,由于種種原因不能及時(shí)地將水印嵌入圖像,從而限制了該方法的應(yīng)用領(lǐng)域。另外,具備自動(dòng)添加水印功能的成像設(shè)備,其價(jià)格較為昂貴,生活中所使用的絕大多數(shù)的成像設(shè)備都不具備這一功能,因此,數(shù)字圖像主動(dòng)取證技術(shù)的應(yīng)用范圍很小。與主動(dòng)取證技術(shù)不同,數(shù)字圖像被動(dòng)取證技術(shù)僅僅依賴于圖像特征,不需要提前嵌入其他信息,因此,被動(dòng)取證技術(shù)的應(yīng)用范圍更廣,有較強(qiáng)的實(shí)用性,從而成為目前國內(nèi)外極具研究價(jià)值的一個(gè)研究方向。
PRNU 噪聲是由于在傳感器制造過程中,感光器件上硅片薄厚程度的不同造成的。入射光條件相同的情況下,感光元件的每個(gè)像素塊的表現(xiàn)并非完全相同。通常不同相機(jī)的PRNU 噪聲都不是相同的,就像人類的指紋一樣[3],PRNU 噪聲是傳感器模式噪聲中的一種。因此,Jan Lukás 等人提出將傳感器模式噪聲用于源相機(jī)檢測[4]。
PRNU 噪聲在經(jīng)過相機(jī)的一些后處理以及其他噪聲的添加之后,PRNU 噪聲依舊存在,并且被消除的難度很大。正是由于該特性的存在,PRNU 可以應(yīng)用到很多方向,主要有以下兩種[5]:第一種應(yīng)用方向是圖像來源檢測和對源相機(jī)的驗(yàn)證,在公安實(shí)踐和司法審判領(lǐng)域上發(fā)揮著越來越重要的作用;第二種應(yīng)用方向是圖像偽造檢測,在此過程中PRNU 噪聲相當(dāng)于是一種用來檢測圖像篡改的水印。因?yàn)橐恍┹^為常見的偽造圖像手段,例如,復(fù)制—粘貼篡改或者拼接篡改等方法會(huì)改變原始圖像的PRNU特征,當(dāng)一張照片上檢測出兩種或兩種以上不同的PRNU 特征時(shí),則可以判定該圖像為偽造圖像。
與數(shù)碼相機(jī)相比,智能手機(jī)的圖像傳感器要小幾十倍,像素的不均勻性更為明顯,而且智能手機(jī)的普及率和便攜性比數(shù)碼相機(jī)要高得多,因此本論文通過對手機(jī)拍攝的圖像進(jìn)行研究,分析市面上較為流行的華為手機(jī)PRNU,并利用光響應(yīng)非均勻性(PRNU)噪聲對篡改圖像進(jìn)行檢測。
本文的算法實(shí)現(xiàn)分為訓(xùn)練階段和測試階段。在訓(xùn)練階段中,首先通過Xiangui Kang 等人提出的基于八鄰域上下文自適應(yīng)插值(PCAI8)的邊緣自適應(yīng)傳感器模式噪聲預(yù)測器預(yù)測并提取PRNU 噪聲,對提取出的PRNU 噪聲進(jìn)行分塊處理,然后整合所有訓(xùn)練噪聲塊采用PCA 對其進(jìn)行降維處理、提取特征。在測試階段中,提取測試圖像的PRNU 噪聲,并進(jìn)行分塊處理,將每個(gè)噪聲塊與訓(xùn)練噪聲塊相比較,采用三階近鄰法對測試噪聲塊的所屬類別進(jìn)行判定,被篡改區(qū)域與原圖像所屬類別不一致,從而檢測出被篡改區(qū)域。
首先,本文采用Xiangui Kang 等人提出的基于八鄰域上下文自適應(yīng)插值(PCAI8)的邊緣自適應(yīng)傳感器模式噪聲預(yù)測器[6]對中心像素進(jìn)行預(yù)測,抑制圖像邊緣信息對PRNU 噪聲的干擾,以此更好地提取PRNU 噪聲。
在PCAI8 方法中,將中心像素標(biāo)記為c,其八鄰域分別記為(圖1):wn,n,en,w,e,ws,s,es,將局部區(qū)域分為:光滑區(qū)域、水平和垂直邊緣、左右對角線邊緣等類型,分別使用均值濾波器估計(jì)光滑區(qū)域的中心像素,沿對應(yīng)邊緣估計(jì)水平、垂直、對角線邊緣的中心像素值,其他區(qū)域則使用中值濾波器進(jìn)行估計(jì)。
圖1 中心像素及其八鄰域像素標(biāo)記
中心像素c 的預(yù)測方法表示為:
其次,將原圖像與預(yù)測數(shù)據(jù)相減,其差值即為提取的PRNU 噪聲。
最后,采用維納濾波的方法對結(jié)果進(jìn)行優(yōu)化,得到最終的PRNU 噪聲。
主成分分析(PCA)算法是最為常見的一種數(shù)據(jù)分析的方法,通常用于對高維數(shù)據(jù)進(jìn)行降維處理,經(jīng)過降維去除噪聲,發(fā)現(xiàn)數(shù)據(jù)中的模式,可用于提取數(shù)據(jù)中的主要特征分量[7]。PCA 的目標(biāo)是壓縮原數(shù)據(jù)量,用最少的維數(shù)來描述最重要的數(shù)據(jù)特征,通過線性變換將數(shù)據(jù)投影到一個(gè)新的坐標(biāo)系統(tǒng)中,以增大類間距離,減小類內(nèi)距離,便于后續(xù)的分類處理。
PCA 算法在本實(shí)驗(yàn)中的具體實(shí)現(xiàn)步驟:
A.將訓(xùn)練集中提取的所有PRNU 噪聲塊組成一個(gè)樣本矩陣A,矩陣A 的每一行為一個(gè)PRNU 噪聲塊的行向量;
B.計(jì)算矩陣A 中所有行向量的平均向量,記為向量B,將矩陣A 中每一維的數(shù)據(jù)分別減去向量B得到一個(gè)新矩陣,記為矩陣C;
C.計(jì)算矩陣C 的協(xié)方差矩陣D;
D.計(jì)算出協(xié)方差矩陣D 的特征向量及其特征值;
E.根據(jù)特征值的大小進(jìn)行降序排列,取所有特征值之和的百分之九十,及這些特征值對應(yīng)的特征向量,將這些特征向量組成投影矩陣P;
F. 矩陣A 與投影矩陣P 的乘積即為降維后數(shù)據(jù)。
本文中用PCA 算法將4800×90000 矩陣映射成4800×294 的矩陣。
在測試階段,首先提取測試圖像的PRNU 噪聲,滑動(dòng)分塊保存PRNU 噪聲,使每個(gè)測試PRNU 塊與特征向量相乘,將其投影到與訓(xùn)練PRNU 塊相同的坐標(biāo)系統(tǒng)中,再分別計(jì)算每個(gè)測試PRNU 塊與訓(xùn)練PRNU 塊的歐式距離,根據(jù)歐氏距離的大小來判定測試PRNU 塊與訓(xùn)練PRNU 塊的相似性,距離越大相似度越低,距離越小相似度越高,一般選用距離訓(xùn)練PRNU 塊最近的作為該測試塊的所屬類別。
選出其中與測試PRNU 塊距離最小的三個(gè)訓(xùn)練塊,計(jì)算這三個(gè)訓(xùn)練塊所屬的類分別標(biāo)記為類別1、類別2 和類別3,如果類別1 和類別2 且類別2 和類別3 不屬于同一類別,則該測試PRNU 塊屬于類別1;如果類別1 和類別2 相同,則該測試PRNU 塊屬于類別1,而類別2 與該測試PRNU 塊也是相似的;若類別2 和類別3 屬于同一類別,則該測試PRNU 塊屬于類別2,而類別3 與該測試PRNU 塊也是相似的,類別1 雖然與該測試PRNU 塊距離最近卻不屬于同一類別。
具體算法部分實(shí)現(xiàn)框圖如下(見圖2):
圖2 三階近鄰算法實(shí)現(xiàn)
本文選用華為榮耀9 和華為暢享Z 兩款相機(jī),分別使用原相機(jī)拍攝九張照片,其中五張照片作為訓(xùn)練圖像集,另外四張照片作為測試圖像集,隨機(jī)取景,光圈值、曝光時(shí)間、ISO 值、焦距等均設(shè)置為自動(dòng)模式。兩款手機(jī)的相機(jī)型號(hào)、原相機(jī)分辨率和圖像格式信息的對照見表1。
表1 相機(jī)型號(hào)、分辨率、圖像格式信息
實(shí)驗(yàn)過程中采用滑動(dòng)窗法對特征圖像進(jìn)行分塊處理,滑動(dòng)框尺寸為300×300,步長為100,本文方法檢測準(zhǔn)確率為70.15%。
本文是以Xiangui Kang 的論文A context-adap?tive SPN predictor for trustworthy source camera identifi?cation 中提到的方法PCAI8 來提取圖片PRNU 噪聲[4],使用PCA 降維法得到噪聲的特征值和特征向量,使用三階近鄰法的分類思想來判定測試噪聲塊所屬相機(jī)類型,從而檢測出圖像篡改區(qū)域。由于在訓(xùn)練階段和測試階段均采用分塊處理,因此,無需限定訓(xùn)練圖像與測試圖像的大小,也無需事先對圖像進(jìn)行裁剪。
隨著美圖秀秀、Photoshop 等圖像編輯工具的推出與普及,其一鍵式操作使得修改圖像內(nèi)容變得越來越容易,篡改圖像也越來越不易察覺,甚至可以做到以假亂真的程度,出于娛樂和美觀等目的來對圖像進(jìn)行修改, 給人們的生活增添了色彩,但是從商業(yè)、司法角度,或者以敲詐勒索為目的對圖像進(jìn)行惡意篡改[8],就會(huì)侵犯人們的名譽(yù)和財(cái)產(chǎn),嚴(yán)重的甚至?xí){社會(huì)的公平正義與社會(huì)穩(wěn)定,同時(shí),導(dǎo)致刑事案件在偵查、審判的過程中作為證據(jù)的數(shù)字圖像可信度越來越低。因此,設(shè)計(jì)檢測工具通過科學(xué)、量化的辦法來幫助確定一個(gè)數(shù)字圖像的真實(shí)性是必要的。本文的方法能夠較為準(zhǔn)確地檢測出圖像篡改區(qū)域,為證據(jù)的真實(shí)性提供量化依據(jù)。