王新月,劉 丹
圖像可以直觀、客觀地反映現(xiàn)實場景,因此,被視為有說服力的法庭物證,被廣泛應用于刑事案件偵查與法庭取證過程中,同時,圖像也越來越多地用于支持重要決策。但是,隨著科技的不斷發(fā)展、進步,數(shù)碼相機、手機等拍照設備越來越普及,人們可以隨時隨地拍攝各種數(shù)字圖像,隨著計算機和互聯(lián)網(wǎng)的飛速發(fā)展,專業(yè)人士甚至可以通過AI 技術直接生成各種各樣的圖像,同時,數(shù)字圖像的存儲與傳遞變得十分簡單。隨著網(wǎng)絡的迅速發(fā)展,數(shù)字圖像幾乎遍布了互聯(lián)網(wǎng)和現(xiàn)實生活中的每個角落。
在公安以及司法實踐中,越來越多的案件涉及圖像真實性檢驗鑒定的問題。在司法審判中,越來越多的圖像的真實性受到涉案犯罪嫌疑人或當事人的質疑,大多數(shù)案件需要對圖像的真實性進行檢驗鑒定以后才能夠成為有效的法庭證據(jù)。為鑒別數(shù)字圖像與司法證據(jù)的可信性與真實性,以及數(shù)字圖像情報的可靠性??茖W、量化地證實數(shù)字圖像的真實性早已成為證據(jù)科學領域的一個非常重要的研究方向。
為了精確地鑒別數(shù)字圖像的真?zhèn)危蒲泄ぷ髡邆円呀?jīng)提出了很多數(shù)字圖像取證的方法。圖像取證技術一般分為主動取證技術和被動取證技術兩大類。圖像主動取證的主要特點是必須事先將數(shù)字水印或簽名等信息嵌入到待傳輸圖像中,接收者在收到該圖像后通過特定密鑰提取該信息,根據(jù)提取出來的水印或簽名是否完整,判斷出該圖像是否經(jīng)過篡改[1-2]。在實際應用的過程中,由于種種原因不能及時地將水印嵌入圖像,從而限制了該方法的應用領域。另外,具備自動添加水印功能的成像設備,其價格較為昂貴,生活中所使用的絕大多數(shù)的成像設備都不具備這一功能,因此,數(shù)字圖像主動取證技術的應用范圍很小。與主動取證技術不同,數(shù)字圖像被動取證技術僅僅依賴于圖像特征,不需要提前嵌入其他信息,因此,被動取證技術的應用范圍更廣,有較強的實用性,從而成為目前國內外極具研究價值的一個研究方向。
PRNU 噪聲是由于在傳感器制造過程中,感光器件上硅片薄厚程度的不同造成的。入射光條件相同的情況下,感光元件的每個像素塊的表現(xiàn)并非完全相同。通常不同相機的PRNU 噪聲都不是相同的,就像人類的指紋一樣[3],PRNU 噪聲是傳感器模式噪聲中的一種。因此,Jan Lukás 等人提出將傳感器模式噪聲用于源相機檢測[4]。
PRNU 噪聲在經(jīng)過相機的一些后處理以及其他噪聲的添加之后,PRNU 噪聲依舊存在,并且被消除的難度很大。正是由于該特性的存在,PRNU 可以應用到很多方向,主要有以下兩種[5]:第一種應用方向是圖像來源檢測和對源相機的驗證,在公安實踐和司法審判領域上發(fā)揮著越來越重要的作用;第二種應用方向是圖像偽造檢測,在此過程中PRNU 噪聲相當于是一種用來檢測圖像篡改的水印。因為一些較為常見的偽造圖像手段,例如,復制—粘貼篡改或者拼接篡改等方法會改變原始圖像的PRNU特征,當一張照片上檢測出兩種或兩種以上不同的PRNU 特征時,則可以判定該圖像為偽造圖像。
與數(shù)碼相機相比,智能手機的圖像傳感器要小幾十倍,像素的不均勻性更為明顯,而且智能手機的普及率和便攜性比數(shù)碼相機要高得多,因此本論文通過對手機拍攝的圖像進行研究,分析市面上較為流行的華為手機PRNU,并利用光響應非均勻性(PRNU)噪聲對篡改圖像進行檢測。
本文的算法實現(xiàn)分為訓練階段和測試階段。在訓練階段中,首先通過Xiangui Kang 等人提出的基于八鄰域上下文自適應插值(PCAI8)的邊緣自適應傳感器模式噪聲預測器預測并提取PRNU 噪聲,對提取出的PRNU 噪聲進行分塊處理,然后整合所有訓練噪聲塊采用PCA 對其進行降維處理、提取特征。在測試階段中,提取測試圖像的PRNU 噪聲,并進行分塊處理,將每個噪聲塊與訓練噪聲塊相比較,采用三階近鄰法對測試噪聲塊的所屬類別進行判定,被篡改區(qū)域與原圖像所屬類別不一致,從而檢測出被篡改區(qū)域。
首先,本文采用Xiangui Kang 等人提出的基于八鄰域上下文自適應插值(PCAI8)的邊緣自適應傳感器模式噪聲預測器[6]對中心像素進行預測,抑制圖像邊緣信息對PRNU 噪聲的干擾,以此更好地提取PRNU 噪聲。
在PCAI8 方法中,將中心像素標記為c,其八鄰域分別記為(圖1):wn,n,en,w,e,ws,s,es,將局部區(qū)域分為:光滑區(qū)域、水平和垂直邊緣、左右對角線邊緣等類型,分別使用均值濾波器估計光滑區(qū)域的中心像素,沿對應邊緣估計水平、垂直、對角線邊緣的中心像素值,其他區(qū)域則使用中值濾波器進行估計。
圖1 中心像素及其八鄰域像素標記
中心像素c 的預測方法表示為:
其次,將原圖像與預測數(shù)據(jù)相減,其差值即為提取的PRNU 噪聲。
最后,采用維納濾波的方法對結果進行優(yōu)化,得到最終的PRNU 噪聲。
主成分分析(PCA)算法是最為常見的一種數(shù)據(jù)分析的方法,通常用于對高維數(shù)據(jù)進行降維處理,經(jīng)過降維去除噪聲,發(fā)現(xiàn)數(shù)據(jù)中的模式,可用于提取數(shù)據(jù)中的主要特征分量[7]。PCA 的目標是壓縮原數(shù)據(jù)量,用最少的維數(shù)來描述最重要的數(shù)據(jù)特征,通過線性變換將數(shù)據(jù)投影到一個新的坐標系統(tǒng)中,以增大類間距離,減小類內距離,便于后續(xù)的分類處理。
PCA 算法在本實驗中的具體實現(xiàn)步驟:
A.將訓練集中提取的所有PRNU 噪聲塊組成一個樣本矩陣A,矩陣A 的每一行為一個PRNU 噪聲塊的行向量;
B.計算矩陣A 中所有行向量的平均向量,記為向量B,將矩陣A 中每一維的數(shù)據(jù)分別減去向量B得到一個新矩陣,記為矩陣C;
C.計算矩陣C 的協(xié)方差矩陣D;
D.計算出協(xié)方差矩陣D 的特征向量及其特征值;
E.根據(jù)特征值的大小進行降序排列,取所有特征值之和的百分之九十,及這些特征值對應的特征向量,將這些特征向量組成投影矩陣P;
F. 矩陣A 與投影矩陣P 的乘積即為降維后數(shù)據(jù)。
本文中用PCA 算法將4800×90000 矩陣映射成4800×294 的矩陣。
在測試階段,首先提取測試圖像的PRNU 噪聲,滑動分塊保存PRNU 噪聲,使每個測試PRNU 塊與特征向量相乘,將其投影到與訓練PRNU 塊相同的坐標系統(tǒng)中,再分別計算每個測試PRNU 塊與訓練PRNU 塊的歐式距離,根據(jù)歐氏距離的大小來判定測試PRNU 塊與訓練PRNU 塊的相似性,距離越大相似度越低,距離越小相似度越高,一般選用距離訓練PRNU 塊最近的作為該測試塊的所屬類別。
選出其中與測試PRNU 塊距離最小的三個訓練塊,計算這三個訓練塊所屬的類分別標記為類別1、類別2 和類別3,如果類別1 和類別2 且類別2 和類別3 不屬于同一類別,則該測試PRNU 塊屬于類別1;如果類別1 和類別2 相同,則該測試PRNU 塊屬于類別1,而類別2 與該測試PRNU 塊也是相似的;若類別2 和類別3 屬于同一類別,則該測試PRNU 塊屬于類別2,而類別3 與該測試PRNU 塊也是相似的,類別1 雖然與該測試PRNU 塊距離最近卻不屬于同一類別。
具體算法部分實現(xiàn)框圖如下(見圖2):
圖2 三階近鄰算法實現(xiàn)
本文選用華為榮耀9 和華為暢享Z 兩款相機,分別使用原相機拍攝九張照片,其中五張照片作為訓練圖像集,另外四張照片作為測試圖像集,隨機取景,光圈值、曝光時間、ISO 值、焦距等均設置為自動模式。兩款手機的相機型號、原相機分辨率和圖像格式信息的對照見表1。
表1 相機型號、分辨率、圖像格式信息
實驗過程中采用滑動窗法對特征圖像進行分塊處理,滑動框尺寸為300×300,步長為100,本文方法檢測準確率為70.15%。
本文是以Xiangui Kang 的論文A context-adap?tive SPN predictor for trustworthy source camera identifi?cation 中提到的方法PCAI8 來提取圖片PRNU 噪聲[4],使用PCA 降維法得到噪聲的特征值和特征向量,使用三階近鄰法的分類思想來判定測試噪聲塊所屬相機類型,從而檢測出圖像篡改區(qū)域。由于在訓練階段和測試階段均采用分塊處理,因此,無需限定訓練圖像與測試圖像的大小,也無需事先對圖像進行裁剪。
隨著美圖秀秀、Photoshop 等圖像編輯工具的推出與普及,其一鍵式操作使得修改圖像內容變得越來越容易,篡改圖像也越來越不易察覺,甚至可以做到以假亂真的程度,出于娛樂和美觀等目的來對圖像進行修改, 給人們的生活增添了色彩,但是從商業(yè)、司法角度,或者以敲詐勒索為目的對圖像進行惡意篡改[8],就會侵犯人們的名譽和財產(chǎn),嚴重的甚至會威脅社會的公平正義與社會穩(wěn)定,同時,導致刑事案件在偵查、審判的過程中作為證據(jù)的數(shù)字圖像可信度越來越低。因此,設計檢測工具通過科學、量化的辦法來幫助確定一個數(shù)字圖像的真實性是必要的。本文的方法能夠較為準確地檢測出圖像篡改區(qū)域,為證據(jù)的真實性提供量化依據(jù)。