王瀟,張榮,郭立君
(寧波大學(xué)信息科學(xué)與工程學(xué)院,浙江 寧波 315211)
頑健合成圖像篡改檢測(cè)及定位
王瀟,張榮,郭立君
(寧波大學(xué)信息科學(xué)與工程學(xué)院,浙江 寧波 315211)
針對(duì)自然圖像與高度仿真的計(jì)算機(jī)生成圖像的合成圖像篡改檢測(cè)問(wèn)題,提出在YCbCr顏色空間基于差分直方圖和中心對(duì)稱局部二進(jìn)制模式提取圖像塊顏色和紋理特征的方法,通過(guò)訓(xùn)練后驗(yàn)概率支持向量機(jī)模型對(duì)待測(cè)圖像塊進(jìn)行識(shí)別。在不重疊分塊情況下先大致判斷篡改區(qū)域,然后在該區(qū)域內(nèi)逐像素分塊判別,最終實(shí)現(xiàn)篡改區(qū)域精確定位。實(shí)驗(yàn)結(jié)果表明,對(duì)128 dpi×128 dpi圖像塊的識(shí)別率達(dá)到94.75%,高于現(xiàn)有方法;對(duì)合成圖像篡改區(qū)域能夠?qū)崿F(xiàn)精確定位,且對(duì)旋轉(zhuǎn)、縮放操作表現(xiàn)出較好的頑健性。
合成圖像;特征提?。缓篁?yàn)概率支持向量機(jī);篡改檢測(cè)
隨著計(jì)算機(jī)圖形技術(shù)的發(fā)展,計(jì)算機(jī)生成圖像(computer graphic,CG)在互聯(lián)網(wǎng)、各種社交媒體上得到廣泛傳播,各種“以假亂真”的計(jì)算機(jī)生成圖像充斥在網(wǎng)絡(luò)和媒體中,其在社會(huì)傳媒、司法、保險(xiǎn)以及新聞出版等領(lǐng)域的惡意使用,給社會(huì)公信、司法公正及社會(huì)穩(wěn)定帶來(lái)了很大挑戰(zhàn)。針對(duì)計(jì)算機(jī)生成圖像的圖像真實(shí)性取證成為數(shù)字圖像安全領(lǐng)域的熱點(diǎn)問(wèn)題[1-3]。
在圖像取證領(lǐng)域,高度仿真的計(jì)算機(jī)生成圖像被看作圖像偽造的形式之一。目前針對(duì)計(jì)算機(jī)生成圖像的取證工作有兩個(gè)層次:對(duì)自然圖像(photographic image,PG)和計(jì)算機(jī)生成圖像的識(shí)別;對(duì)兩種來(lái)源(即自然圖像和計(jì)算機(jī)生成圖像)的圖像的合成篡改檢測(cè)和篡改區(qū)域定位。前者是一個(gè)簡(jiǎn)單的二分類問(wèn)題,其分類好壞主要取決于選取的分類特征[4];后者則相對(duì)復(fù)雜,其檢測(cè)性能主要受篡改塊大小、篡改操作的復(fù)雜程度等因素影響,對(duì)算法的頑健性要求較高。
針對(duì)前者兩類圖像的識(shí)別問(wèn)題,近年來(lái)引起圖像取證研究者的廣泛關(guān)注,并取得較大進(jìn)展。Farid[5]通過(guò)小波變換計(jì)算各子帶小波系數(shù)統(tǒng)計(jì)特征,實(shí)現(xiàn)了對(duì)自然圖像的有效識(shí)別,但特征維度太高。Peng[6]分析相機(jī)傳感器模式噪聲(sensor pattern noise,SPN)特征,提取SPN的統(tǒng)計(jì)特征及分形維數(shù)進(jìn)行分類檢測(cè)。Wu等人[7]提出基于差分直方圖(difference histogram,DH)特征的計(jì)算機(jī)生成圖像檢測(cè)方法。Li等[8]用局部二進(jìn)制模式(local binary pattern,LBP)圖像紋理特征描述子[9]構(gòu)造236維特征,分類準(zhǔn)確率達(dá)98.3%。在此基礎(chǔ)上,申鉉京等[10]采用多尺度局部二進(jìn)制計(jì)數(shù)(local binary count,LBC)模式,將特征維度降低到54維并取得了96.25%的分類準(zhǔn)確率。
上述算法對(duì)大尺寸的整幅圖像識(shí)別能夠達(dá)到較高的準(zhǔn)確率,但所提取的特征卻未必能進(jìn)一步應(yīng)用到較小尺寸的圖像塊分類中。Conotter等人[11]根據(jù)圖像在小波統(tǒng)計(jì)與模式噪聲方面的特點(diǎn),對(duì)圖像進(jìn)行適當(dāng)大小的重疊分塊,提取每一個(gè)圖像塊的216維小波統(tǒng)計(jì)特征和12維模式噪聲統(tǒng)計(jì)特征,實(shí)現(xiàn)對(duì)圖像中篡改區(qū)域的定位,但該方法對(duì)于兩類圖像塊的分類準(zhǔn)確率并不高。Ke等人[12]考慮圖像的顏色、紋理和形狀特點(diǎn),構(gòu)造107維特征,訓(xùn)練支持向量機(jī)(support vector machine,SVM),對(duì)兩類圖像的分類準(zhǔn)確率達(dá)到94.125%,相比小波特征[11]有所提高。但該算法在訓(xùn)練分類器模型時(shí)提取的是整幅圖像的特征,對(duì)一幅待測(cè)篡改圖像進(jìn)行小尺寸的圖像塊分類時(shí),并不能很好地適用于圖像塊的分類,因此識(shí)別率不高,定位效果并不理想。針對(duì)合成圖像的篡改檢測(cè)與區(qū)域定位問(wèn)題,分析并捕捉到更能區(qū)分兩類圖像塊內(nèi)在差異的特征,成為算法實(shí)現(xiàn)的重要一步。深入分析圖像塊在顏色、紋理方面的差異,在參考文獻(xiàn)[7]的基礎(chǔ)上,結(jié)合旋轉(zhuǎn)不變的中心對(duì)稱局部二進(jìn)制模式(central symmetry local binary pattern,CSLBP)直方圖,克服傳統(tǒng)LBP不能抵抗旋轉(zhuǎn)操作的局限性。使用大量的圖像塊訓(xùn)練后驗(yàn)概率支持向量機(jī)(posterior probability support vector machine,PPSVM)模型,而非簡(jiǎn)單地使用整幅圖像。另外,篡改區(qū)域定位時(shí),對(duì)參考文獻(xiàn)[11]采取直接對(duì)待測(cè)圖像重疊分塊的方法進(jìn)行改進(jìn),先對(duì)待測(cè)圖像進(jìn)行不重疊分塊判別,獲得大致篡改區(qū)域;然后在該區(qū)域內(nèi)采用重疊分塊檢測(cè)方法,最終精確判定圖像中拼接的區(qū)域。本文算法具有較高的分類準(zhǔn)確率,減少了在非篡改區(qū)域重疊分塊判決的時(shí)間,提高了檢測(cè)效率。
本文所提的合成圖像篡改檢測(cè)及定位算法流程如圖1所示。
2.1 分類器選擇對(duì)于訓(xùn)練圖像塊集 { x ∈ Rn, i = 1,2,L ,l} ,包i含大量自然圖像塊(正樣本)和計(jì)算機(jī)生成圖像塊(負(fù)樣本),假設(shè)每個(gè)圖像塊的標(biāo)簽為yi= {1,?1 },傳統(tǒng)的SVM模型[13]定義為一種特征空間上間隔最大的線性分類器。通過(guò)學(xué)習(xí)策略使間隔最大化[14],利用拉格朗日方法得到圖像塊的類別決策函數(shù):
圖1 本文算法流程
其中,αi*為優(yōu)化最優(yōu)分類面過(guò)程中其對(duì)偶問(wèn)題的最優(yōu)解, K( xi, xj) =?(xi)?(xj)為核函數(shù),表示圖像塊的預(yù)測(cè)類別。
傳統(tǒng)的 SVM能夠確定圖像塊的所屬分類標(biāo)簽,輸出分類標(biāo)簽為1或?1,對(duì)圖像塊的分類隸屬概率卻沒(méi)有說(shuō)明。在本文的合成篡改檢測(cè)中,圖像塊(尤其是包含異源內(nèi)容的圖像塊,如篡改塊邊緣區(qū)域的圖像塊)分類是一個(gè)不確定問(wèn)題,更期望得到測(cè)試圖像塊的后驗(yàn)類別概率P( yi= 1|xi),即該圖像塊屬于自然圖像塊的概率,而不是簡(jiǎn)單地將測(cè)試圖像塊二分類。根據(jù)Platt等人[15]提出的PPSVM模型,用Sigmoid 函數(shù)作為后驗(yàn)概率輸出函數(shù),得到測(cè)試圖像塊屬于自然圖像類別的概率:
其中, P( yi= 1|f( xi))表示圖像塊在傳統(tǒng)SVM 輸出 f( xi)的條件下屬于自然圖像塊的概率,而參數(shù)A、B可利用訓(xùn)練圖像塊集或其子集最大似然估計(jì)得到[12]。本文通過(guò)設(shè)置合理的閾值T,對(duì)計(jì)算得到的概率進(jìn)行判決,偏向CG圖像塊具有較高的概率,而偏向于PG圖像塊概率值較低,即:
其中,{ yi= 1}和{ yi=? 1}分別代表自然圖像塊和計(jì)算機(jī)生成圖像塊。
2.2 特征提取
計(jì)算機(jī)生成圖像在成像過(guò)程中,生成途徑和獲取手段都與自然圖像不同,不管是建模、潤(rùn)飾還是光照等都遠(yuǎn)不如自然產(chǎn)物復(fù)雜,在顏色、紋理等方面都不如自然圖像復(fù)雜。差分矩陣代表了圖像像素與周?chē)袼刂g的關(guān)系,反映圖像顏色分布情況和紋理的粗細(xì)程度。在DH基礎(chǔ)上,引入CSLBP紋理描述子對(duì)圖像塊進(jìn)行顏色和紋理特征的提取。
本文重點(diǎn)在于挖掘兩類圖像塊在顏色、紋理方面的特征差異,不同的顏色分量可以用來(lái)反映顏色特征,而紋理結(jié)構(gòu)可通過(guò)鄰近像素點(diǎn)之間的亮度層次變化來(lái)描述[16]。本文在YCbCr空間提取兩類圖像塊的DH和 CSLBP特征,并與常用的RGB、HSV空間的識(shí)別率對(duì)比后發(fā)現(xiàn),在YCbCr顏色空間提取的特征對(duì)PG和CG圖像塊的檢測(cè)率最高(見(jiàn)第3.2.1節(jié)),說(shuō)明此顏色空間提取的本文特征能夠很好地捕獲兩類圖像塊在顏色和紋理上的差異,適用于對(duì)合成圖像中篡改塊的檢測(cè)。
2.2.1 差分直方圖
與自然圖像相比,計(jì)算機(jī)生成圖像所采用的顏色比較單一,圖像中會(huì)出現(xiàn)大面積像素值相同或相近的圖像塊,在計(jì)算圖像的差分矩陣后,差分矩陣中會(huì)出現(xiàn)大面積的值為零或接近零的區(qū)域。在差分直方圖上表現(xiàn)為直方圖零值附近的區(qū)間會(huì)出現(xiàn)更多的像素點(diǎn)。為更全面描述圖像內(nèi)在特征,進(jìn)一步計(jì)算圖像的二階差分矩陣,并選擇水平、垂直、主對(duì)角以及次對(duì)角4個(gè)方向得到共14個(gè)差分矩陣,統(tǒng)計(jì)得到歸一化直方圖分布。示例圖像如圖1所示,PG與CG示例圖像及其DH分布如圖2所示(此處均選取Y通道)。
圖1 示例圖像
圖2 PG與CG示例圖像及其DH分布
H( n)與 H (? n)呈對(duì)稱性,取平均值。且當(dāng)n較大時(shí),區(qū)分度變得很小,因此只取區(qū)分度比較高的零值附近的前k個(gè)值,即:
這樣,每一幅圖像可計(jì)算得到 14(k+1)維特征向量(本文取k =3)。
2.2.2 中心對(duì)稱局部二進(jìn)制模式
根據(jù)Maenpaa等人[17]提出的CSLBP,比較中心像素的對(duì)稱像素對(duì)之間的大小關(guān)系,形成對(duì)圖像的一種表達(dá),用來(lái)描述圖像的局部紋理。相對(duì)于LBP,CSLBP具有旋轉(zhuǎn)不變性的優(yōu)點(diǎn)。具體描述如下:
其中,ni和是關(guān)于中心像素對(duì)稱的兩個(gè)像素,N表示中心像素鄰域內(nèi)的像素個(gè)數(shù),R表示鄰域半徑,th 為對(duì)稱的兩個(gè)像素的差值閾值(本文th = 0)。統(tǒng)計(jì)圖像中16種不同的CSLBP二進(jìn)制模式分布形成CSLBP分布直方圖,反映兩類圖像在色彩數(shù)量、邊緣信息以及平滑度等方面的差異。圖 3給出了幾例典型的自然圖像和計(jì)算機(jī)生成圖像在YCbCr空間中提取的Y通道CSLBP分布,其中,圖3(a)、圖3(b)都是相對(duì)比較平滑的圖像,計(jì)算機(jī)生成圖像(圖3(b))對(duì)應(yīng)的CSLBP分布直方圖(圖3(f))變化更平緩。對(duì)比紋理比較豐富的圖3(c)、圖3(d),也會(huì)有同樣發(fā)現(xiàn):計(jì)算機(jī)生成圖像(圖3(d))的變化(圖3(h))更平緩。實(shí)驗(yàn)證明,CSLBP直方圖特征可以有效表征兩類圖像塊的內(nèi)部紋理結(jié)構(gòu)特點(diǎn),捕獲它們?cè)诩y理方面的差異。
2.3 篡改檢測(cè)
盡管通過(guò)混合特征訓(xùn)練的分類器模型可以很好地識(shí)別計(jì)算機(jī)生成圖像塊與自然圖像塊,為了解決目前網(wǎng)絡(luò)媒體中常見(jiàn)的將計(jì)算機(jī)生成的對(duì)象或場(chǎng)景嵌入自然圖像中的篡改操作問(wèn)題,本文將訓(xùn)練好的模型進(jìn)一步應(yīng)用到此類篡改圖像的檢測(cè)定位中。本節(jié)重點(diǎn)在于如何運(yùn)用訓(xùn)練的分類器模型實(shí)現(xiàn)篡改部位的檢測(cè)與定位。
圖3 PG與CG示例圖像及其CSLBP分布
為了實(shí)現(xiàn)自然圖像與計(jì)算機(jī)生成圖像的合成篡改檢測(cè),現(xiàn)有的方法是對(duì)一幅M × N大小的待測(cè)圖像進(jìn)行大小為n × n重疊分塊,這樣可以得到(M ? n + 1)× (N ? n+ 1)個(gè)圖像塊。然后提取每一個(gè)圖像塊的特征。最后,送入訓(xùn)練好的分類器模型,計(jì)算每一個(gè)圖像塊分別屬于計(jì)算機(jī)生成圖像塊和自然圖像塊的概率。
在現(xiàn)有方法的基礎(chǔ)上,考慮到直接對(duì)待測(cè)圖像進(jìn)行重疊分塊、逐塊識(shí)別會(huì)使時(shí)間復(fù)雜度高,先對(duì)整幅圖像進(jìn)行大小為n × n的不重疊分塊,得到 M × N /n2個(gè)不重疊的圖像塊。用訓(xùn)練好的分類器模型對(duì)每一個(gè)圖像塊的提取特征進(jìn)行分類識(shí)別,后驗(yàn)概率支持向量機(jī)輸出屬于正類別的概率。分類結(jié)果偏向于自然圖像塊擁有較高的概率,分類結(jié)果偏向于計(jì)算機(jī)生成圖像的子塊概率值較低。通過(guò)設(shè)定合適的閾值將圖像子塊進(jìn)行分類,因?yàn)楦怕实姆秶鸀?0~1,閾值的選擇也為 0~1。當(dāng)圖像子塊的概率大于閾值T時(shí),該圖像子塊被認(rèn)為是自然圖像;小于閾值時(shí),被認(rèn)為是計(jì)算機(jī)生成圖像,由此確定篡改的大致區(qū)域。
為使取證更有說(shuō)服力,在大致定位篡改區(qū)域內(nèi)進(jìn)一步精確定位。精確定位的方法是在確定的大致范圍內(nèi)采取重疊分塊、逐塊判別。若其后驗(yàn)概率值 P( yi= 1|f( xi))小于T,認(rèn)為該圖像塊屬于篡改塊(計(jì)算機(jī)生成圖像塊),若大于或等于T,則判決為真實(shí)塊(自然圖像塊)。
通過(guò)實(shí)驗(yàn)評(píng)估本文算法的有效性,采用基于RBF(radial basis function)的 PPSVM 分類器(PPSVM工具包[15])實(shí)現(xiàn)圖像分類,所有實(shí)驗(yàn)在MATLAB 2015a 環(huán)境下進(jìn)行。
3.1 圖像庫(kù)與實(shí)驗(yàn)圖像集
實(shí)驗(yàn)中使用的圖像庫(kù)是PG和CG圖像庫(kù),所有圖像采用JPEG壓縮格式。PG圖像庫(kù)中包含800 幅由個(gè)人拍攝的照片圖像,圖像內(nèi)容包含晴天/陰天/雨天、白天/夜晚、室內(nèi)/室外、人物/建筑/風(fēng)景照等不同場(chǎng)景。CG圖像庫(kù)包含800幅高度逼真的計(jì)算機(jī)生成圖像,來(lái)自Columbia大學(xué)CG圖像庫(kù)[18]和www.raph.com網(wǎng)站,圖像內(nèi)容同樣包括不同主題。圖4和圖5分別給出文中使用的自然圖像和計(jì)算機(jī)生成圖像示例。
圖4 自然圖像示例
圖5 計(jì)算機(jī)生成圖像示例
為了能夠?qū)崿F(xiàn)待測(cè)圖像的篡改區(qū)域定位,將該圖像庫(kù)中的圖像進(jìn)行大小合適的分塊,構(gòu)造足夠數(shù)量的隨機(jī)圖像塊集。圖像集中分為自然圖像塊(正樣本,標(biāo)簽為1)和計(jì)算機(jī)生成圖像塊集(負(fù)樣本,標(biāo)簽為?1)各4 000塊,用于訓(xùn)練兩類圖像塊的分類器模型。
3.2 實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)中,將構(gòu)造的圖像塊集隨機(jī)分為訓(xùn)練集和測(cè)試集。進(jìn)行了兩方面的實(shí)驗(yàn)分析。首先是選擇顏色空間提取特征,訓(xùn)練分類器模型,評(píng)估其識(shí)別性能;其次是對(duì)提出的篡改檢測(cè)及定位算法的有效性進(jìn)行驗(yàn)證。
3.2.1 不同顏色空間的識(shí)別率
圖6給出了5幅經(jīng)典圖像及其在不同顏色空間的DH和CSLBP分布。通過(guò)觀察經(jīng)典圖像在不同顏色空間的DH和CSLBP直方圖分布,選擇合適的顏色通道。
進(jìn)一步,按照相同的流程分別在 RGB、HSV和 YCbCr顏色空間的各個(gè)通道提取兩類圖像128 dpi×128 dpi塊的DH和CSLBP特征,對(duì)兩類圖像塊的識(shí)別率進(jìn)行比較,實(shí)驗(yàn)結(jié)果見(jiàn)表1。
TPR(true positive rate,真正率)即被模型正確識(shí)別PG圖像塊的正確率,TNR(true negative rate,真負(fù)率)為模型正確識(shí)別CG圖像塊的正確率,ACC(accuracy,準(zhǔn)確率)為分類平均準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明:在YCbCr顏色空間提取的本文特征平均檢測(cè)率高于在RGB和HSV顏色空間,同時(shí),從YCbCr空間的各個(gè)通道檢測(cè)率可以看出,Y通道檢測(cè)率最高,而顏色通道Cb和Cr的檢測(cè)率相近。
圖6 經(jīng)典圖像的DH和CSLBP分布
表1 不同顏色空間實(shí)驗(yàn)結(jié)果對(duì)比
進(jìn)一步列舉本文特征在各顏色通道對(duì)圖像塊分類識(shí)別準(zhǔn)確率的接受者操作特征曲線(ROC曲線),如圖7所示,曲線越接近左上角表明該特征有更好的分類效果。因此選擇YCbCr空間,考慮特征維度,本文僅采用Y通道和Cb通道提取特征。
圖7 不同顏色空間特征識(shí)別率操作者受試曲線
3.2.2 PPSVM分類器有效性
為測(cè)試PPSVM分類器的有效性,實(shí)驗(yàn)過(guò)程中采用10倍交叉驗(yàn)證,隨機(jī)選擇圖像塊集的70%做訓(xùn)練集,剩余30%做測(cè)試集,調(diào)整閾值T,每一次測(cè)試均可得到測(cè)試圖像塊在不同閾值T下的識(shí)別準(zhǔn)確率。根據(jù)最小分類錯(cuò)誤率原則,取10次交叉驗(yàn)證的平均正確率最高時(shí)的閾值作為本文進(jìn)行兩類圖像塊判別的閾值T(即下文大致定位時(shí)的閾值)。本文使用的PPSVM與對(duì)比參考文獻(xiàn)[7,8]使用的標(biāo)準(zhǔn)SVM對(duì)比結(jié)果如圖8所示,當(dāng)閾值T=0.45時(shí),PPSVM分類器在128 dpi×128 dpi的圖像塊上分類準(zhǔn)確率達(dá)到94.75%,高于傳統(tǒng)SVM時(shí)94.4%的準(zhǔn)確率。
圖8 自然圖像和計(jì)算機(jī)生成圖像128 dpi×128 dpi圖像塊PPSVM與SVM檢測(cè)率對(duì)比
3.2.3 模型的識(shí)別性能
為了將所提出算法更加精確地應(yīng)用于下面的合成圖像局部篡改塊分析中,將圖像庫(kù)中的圖像分別裁剪為256 dpi ×256 dpi、128 dpi×128 dpi尺寸的圖像塊,在不同尺寸圖像塊上分別驗(yàn)證算法的有效性。對(duì)于不同尺寸的圖像塊集,隨機(jī)選取自然圖像塊與計(jì)算機(jī)生成圖像塊各2 000塊,分別提取Y通道和Cb通道的DH和CSLBP直方圖特征,訓(xùn)練PPSVM模型。
如圖9所示,列舉本文與對(duì)比文獻(xiàn)中幾種不同特征對(duì) 128 dpi×128 dpi圖像塊分類準(zhǔn)確率的ROC曲線,可以看出本文采用特征識(shí)別率高于對(duì)比文獻(xiàn),分類效果突出。
圖9 對(duì)比算法的ROC曲線
表2給出了本文所用DH+CSLBP特征訓(xùn)練模型與現(xiàn)有方法[5,7,8,11]所提取的特征在相同圖像塊集上的對(duì)比測(cè)試結(jié)果,結(jié)果表明本文提取的特征具有較好的識(shí)別能力。
表2 識(shí)別性能對(duì)比結(jié)果
圖10 本文算法對(duì)篡改圖像的定位結(jié)果
3.2.4 篡改定位結(jié)果
將本文提出的分類方法應(yīng)用到自然圖像中嵌入的計(jì)算機(jī)生成圖像塊的檢測(cè)上??紤]到篡改圖像出現(xiàn)的情況通常是在一幅自然圖像中生成某種自然界不存在的對(duì)象或者虛擬場(chǎng)景,一般來(lái)講插入的對(duì)象都具有一定大小及形狀,因此,在實(shí)驗(yàn)中對(duì)測(cè)試圖像進(jìn)行128 dpi×128 dpi分塊并采用之前訓(xùn)練的128 dpi×128 dpi分類器模型。應(yīng)用第2.3節(jié)提出的檢測(cè)方法,圖10給出了篡改檢測(cè)結(jié)果。其中,圖10(a)是5幅篡改后圖像,在真實(shí)的自然圖像中含有計(jì)算機(jī)生成的圖像塊;圖10(b)是篡改圖像的篡改位置;圖10(c)是在先對(duì)待測(cè)圖像進(jìn)行不重疊分塊后確定的大致篡改區(qū)域(T=0.45);圖10(d)給出了圖10(c)進(jìn)一步重疊分塊后的PPSVM檢測(cè)概率,越接近1表示該區(qū)域越接近真實(shí)區(qū)域(自然圖像);圖10(e)給出了最終定位效果,計(jì)算機(jī)生成圖像塊的中心像素標(biāo)記為0,并經(jīng)過(guò)腐蝕和膨脹形態(tài)學(xué)處理;圖10(f)給出了參考文獻(xiàn)[11]的定位結(jié)果。
3.2.5 幾何變換頑健性分析
為了驗(yàn)證本文算法對(duì)于抵抗常用的幾何變換(如縮放和旋轉(zhuǎn))操作的頑健性,本文又進(jìn)行了進(jìn)一步的實(shí)驗(yàn)。
定義分類準(zhǔn)確率 TPR和誤檢率 FPR;TP為篡改塊(計(jì)算機(jī)生成塊)判定為篡改塊的個(gè)數(shù);FN為篡改塊判定為真實(shí)塊(自然圖像塊)的個(gè)數(shù);FP為真實(shí)塊判定為篡改塊的個(gè)數(shù);TN為真實(shí)塊判定為真實(shí)塊的個(gè)數(shù)。分類準(zhǔn)確率和誤檢率分別定義為:
將測(cè)試集中的圖像塊分別按照不同的縮放因子和旋轉(zhuǎn)因子進(jìn)行縮放、旋轉(zhuǎn)處理,提取本文144維特征,利用前面的模型進(jìn)行分類檢測(cè)。檢測(cè)率見(jiàn)表3和表4。
表3 縮放情況下的檢測(cè)率
表4 旋轉(zhuǎn)情況下的檢測(cè)率
如圖11所示,篡改圖像塊分別經(jīng)過(guò)了旋轉(zhuǎn)、放大和縮小,篡改圖像均采用JPEG壓縮。
觀察篡改檢圖像的定位結(jié)果,本文所提算法對(duì)于抵抗旋轉(zhuǎn)、縮放幾何操作,具有很好的頑健性,能較好地定位出篡改區(qū)域。
圖11 本文算法幾何變換頑健性實(shí)驗(yàn)結(jié)果
本文基于圖像在YCbCr顏色空間的差分直方圖特征與局部二進(jìn)制特征,結(jié)合后驗(yàn)概率支持向量機(jī)訓(xùn)練對(duì)計(jì)算機(jī)生成圖像塊與自然圖像塊的分類模型,并將此模型進(jìn)一步應(yīng)用到包含有這兩類圖像的合成圖像篡改檢測(cè)與定位算法中。定位時(shí),提出“兩步走”策略,通過(guò)對(duì)圖像不重疊分塊進(jìn)行分類識(shí)別,定位出大致篡改區(qū)域,再進(jìn)一步在該區(qū)域內(nèi)進(jìn)行重疊分塊,檢測(cè)各個(gè)圖像子塊的類別,從而實(shí)現(xiàn)精確定位。經(jīng)大量實(shí)驗(yàn)表明,算法在保持較高的檢測(cè)率和檢測(cè)效率的情況下,對(duì)兩類圖像塊都具有較高的識(shí)別能力,并且能達(dá)到對(duì)篡改區(qū)域準(zhǔn)確定位的目的,且所提取的特征對(duì)幾何變換操作具有較強(qiáng)的頑健性。
[1]GAO S, ZHANG C, WU C L, et al. A hybrid feature based method for distinguishing computer graphics and photo-graphic image[C]//International Workshop on Digital Watermarking, September 17-19, 2013, Beijing, China. Berlin: Springer Berlin Heidelberg, 2013: 303-313.
[2]HOLMES O, BANKS M S, FARID H. Assessing and improving the identification of computer-generated portraits[J]. ACM Transactions on Applied Perception (TAP), 2016, 13(2): 7.
[3]AYYALASOMAYAJULA R S, PANKAJAKSHAN V. Differentiating photographic and PRCG images using tampering localization features[C]//International Conference on Computer Vision and Image Processing, January 12-13, 2016, Singapore. [S.l.:s.n.], 2017: 429-438.
[4]王亞?wèn)|, 張榮, 蔣檜慧, 等. 引入垂直全局表觀約束的中層特征行人再識(shí)別[J]. 電信科學(xué), 2017, 33(4): 114-125. WANG Y D, ZHANG R, JIANG H H, et al. Person re-identification using mid-level features with vertical global appearance constraint[J]. Telecommunications Science, 2017, 33(4): 114-125.
[5]LYU S, FARID H. How realistic is photorealistic?[J]. IEEE Transactions on Signal Processing, 2005, 53(2): 845-850.
[6]PENG F, ZHOU D, LONG M, et al. Discrimination of natural images and computer generated graphics based on multi-fractal and regression analysis[J]. AEU-International Journal of Electronics and Communications, 2017(71): 72-81.
[7]WU R, LI X, YANG B. Identifying computer generated graphics via histogram features[C]//2011 18th IEEE International Conference on Image Processing (ICIP), September 11-14, 2011, Brussels, Belgium. New Jersey: IEEE Press, 2011: 1933-1936.
[8]LI Z, YE J, SHI Y Q. Distinguishing computer graphics from photographic images using local binary patterns[M]. Berlin: Springer Berlin Heidelberg, 2012: 228-241.
[9]OJALA T, PIETIKAINEN M, MAENPAA T. Multi-resolution gray-scale and rotation invariant texture classification with local binary patterns[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(7): 971-987.
[10]申鉉京, 李夢(mèng)臻, 呂穎達(dá), 等. 基于 LBC 的計(jì)算機(jī)生成圖像盲鑒別算法[J]. 計(jì)算機(jī)科學(xué), 2015, 42(6): 135-138. SHEN X J, LI M Z, LV Y D, et al. Blind identification algorithm of photorealistic computer graphics based on local binary count[J]. Computer Science, 2015, 42(6): 135-138.
[11]CONOTTER V, CORDIN L. Detecting photographic and computer generated composites[C]//IS&T/SPIE Electronic Imaging. International Society for Optics and Photonics, August 12-14, 2011, Chennai, India. [S.l.:s.n.], 2011: 3238-3241.
[12]KE Y, MIN W, DU X, et al. Detecting the composite of photographic image and computer generated image combing with color, texture and shape feature[J]. Journal of Theoretical & Applied Information Technology, 2013, 49(2).
[13]CHANG C C, LIN C J. LIBSVM: a library for support vector machines[J]. ACM Transactions on Intelligent Systems and Technology(TIST), 2011, 2(3): 27.
[14]裴安山, 王讓定, 嚴(yán)迪群. 基于設(shè)備本底噪聲頻譜特征的手機(jī)來(lái)源識(shí)別[J]. 電信科學(xué), 2017, 33(1): 85-94. PEI A S, WANG R D, YAN D Q. Cell-phone origin identification based on spectral features of device self-noise [J]. Telecommunications Science, 2017, 33(1): 85-94.
[15]PLATT J. Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods[J]. Advances in Large Margin Classifiers, 2000, 10(4): 61-74.
[16]CHEN W. Detection of digital image and video forgeries[D]. Newark: New Jersey Institute of Technology, 2008.
[17]M?ENP?? T, PIETIK?INEN M. Texture analysis with local binary patterns[J]. Handbook of Pattern Recognition and Computer Vision, 2005(3): 197-216.
[18]NG T T, CHANG S F, HSU J, et al. Columbia photographic images and photorealistic computer graphics dataset[R]. 2005.
Robust tampering detection and localization of composite image
WANG Xiao, ZHANG Rong, GUO Lijun
College of Information Science and Engineering, Ningbo University, Ningbo 315211, China
Aiming at the problem of tamper detection of composite image of natural images and highly simulated computer-generated images, a method of extracting image block color and texture feature based on differential histogram and local binary texture descriptor in YCbCr color space was proposed. By training posterior probability support vector machine, the image block to be measured was identified. In the case of non-overlapping block, the approximate tampering area was general judged, then the block was discriminated by pixel in the region, ultimately the accurate location of tampering area was achieved. The experimental results show that the recognition rate of 128 dpi×128 dpi image blocks is 94.75%, which is higher than other methods. The tapering region of the synthesized image can be precisely positioned, and the rotation and scaling operation show good coercivity.
composite image, feature extraction, posterior probability support vector machine, tampering detection
s: Zhejiang Provincial Natural Science Foundation of China (No.LY17F030002), Zhejiang Province “Information and Communication Engineering” in the Top Priority of the Subject of Open Fund (No.xkxl1521, No.xkxl1516)
TP391
A
10.11959/j.issn.1000?0801.2017214
王瀟(1993?),女,寧波大學(xué)信息科學(xué)與工程學(xué)院碩士生,主要研究方向?yàn)閿?shù)字圖像取證與信息安全。
張榮(1974?),女,博士,寧波大學(xué)副教授,主要研究方向?yàn)閿?shù)字取證與信息安全。
郭立君(1970?),男,博士,寧波大學(xué)教授,主要研究方向?yàn)橛?jì)算機(jī)視覺(jué)與模式識(shí)別、移動(dòng)互聯(lián)網(wǎng)及其應(yīng)用。
2017?04?18;
2017?06?30
張榮,zhangrong@nbu.edu.cn
浙江省自然科學(xué)基金資助項(xiàng)目(No.LY17F030002);浙江省“信息與通信工程”重中之重學(xué)科開(kāi)放基金資助項(xiàng)目(No.xkxl1521,No.xkxl1516)