陳 升,李 智
貴州大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,貴陽 550025
圖像隱寫術(shù)是通信和隱私保護中利用圖像載體進行隱秘通信和保障安全的技術(shù),通常是在圖像空域中對像素值進行修改,進而完成對信息的隱藏,早期的非內(nèi)容自適應(yīng)隱寫算法,比如最低有效位替換算法(least significant bit,LSB),不針對載體內(nèi)容,將嵌入的0、1 bit流對載體圖像像素的最低比特位進行替換。目前,隱寫術(shù)的研究熱點是內(nèi)容自適應(yīng)隱寫術(shù),內(nèi)容自適應(yīng)的圖像隱寫術(shù)是將隱藏信息嵌入在內(nèi)容較為復(fù)雜的區(qū)域,這些區(qū)域很難被人眼所察覺,常見的自適應(yīng)隱寫術(shù)有HUGO[1]、WOW[2]、S-UNIWARD[3]。隱寫分析是應(yīng)對隱寫術(shù)所產(chǎn)生的安全問題并與之對抗的技術(shù),目前研究的熱點是內(nèi)容自適應(yīng)隱寫算法的被動隱寫分析,即判斷圖像是否經(jīng)過隱寫。
在傳統(tǒng)的被動隱寫分析研究中,主要有基于手工構(gòu)造特征的方案,常見的空域隱寫分析方法有基于構(gòu)造臨近像素差異矩陣的SPAM[4]、基于構(gòu)造高維共生矩陣的富模型SRM[5],以及通過估計待測圖像的修改概率圖,為殘差特征分配不同權(quán)重,在富模型基礎(chǔ)上改進后的tSRM[6]、maxSRM[7]等。隨著深度學(xué)習(xí)的發(fā)展,利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)完成隱寫分析任務(wù)得以實現(xiàn),Tang等[8]在2014年首次利用CNN進行隱寫分析,有了初始化預(yù)處理層卷積核參數(shù)的思想,提出一種簡稱TanNet的網(wǎng)絡(luò),性能優(yōu)于基于手工構(gòu)造特征的SPAM次于SRM。2015年Qian等[9]提出的隱寫分析網(wǎng)絡(luò)GNCNN中,利用固定KV核進行預(yù)處理第一層卷積核,卷積層使用高斯激活函數(shù)代替ReLU、Sigmoid,實現(xiàn)了與SRM相當(dāng)?shù)碾[寫檢測性能。Xu等[10]在2016年在網(wǎng)絡(luò)中引入批歸一化(BN),全局平均池化和絕對值激活函數(shù),提出簡稱XuNet的隱寫分析網(wǎng)絡(luò),首次超過SRM的隱寫檢測性能。2017年Ye等[11]利用SRM中的30個高通濾波器對網(wǎng)絡(luò)的第一層卷積核的參數(shù)初始化,自定義一種稱為截止線性單元的激活函數(shù),結(jié)合傳統(tǒng)隱寫分析的思想,在深度學(xué)習(xí)中引入選擇通道,提升了對隱寫嵌入的檢測。2018年,Boroumand等人提出SRNet[12],該模型整體由四部分不同作用的卷積層模塊組成,有效地利用BN層和殘差網(wǎng)絡(luò),并且加入通道選擇,提高了模型對隱寫算法的檢測準確率。
被動隱寫分析技術(shù),也是目前隱寫分析研究的熱點,在這一目標并不能對隱匿的信息采取進一步主動的措施,于是許多學(xué)者對進一步的隱寫負載定位展開研究,隱寫定位的研究既可判斷圖像是否經(jīng)過隱寫,也為進一步隱寫信息的提取提供了條件。
在隱寫術(shù)負載定位研究中,文獻[13]中,通過分析圖像色調(diào)直方圖變化來定位連續(xù)嵌入的空域彩色圖負載。2008年Ker等[14]對載體進行線性濾波處理后計算像素平均殘差,成功定位出非內(nèi)容自適應(yīng)隱寫算法LSB的隱寫像素。2012年,Quach等[15]基于像素頻數(shù)構(gòu)造權(quán)重表,定位出了組奇偶(group-parity)隱寫術(shù)的隱寫像素位置。2019年,Sun等[16]利用深度神經(jīng)網(wǎng)絡(luò),提出了用于定位LSB matching隱寫術(shù)[17]的有效負載像素的網(wǎng)絡(luò)模型,該網(wǎng)絡(luò)通過提取像素的臨近像素差異特征來區(qū)分像素和隱寫像素,臨近像素差異特征就是提取紋理區(qū)域的特征,而紋理區(qū)域中同時包含未經(jīng)嵌入和經(jīng)嵌入的像素,致使該方法容易將圖像中紋理區(qū)域中未經(jīng)嵌入的像素混淆造成誤報,該方法中將紋理區(qū)域的像素視為無效像素,而內(nèi)容自適應(yīng)隱寫術(shù)就是對視覺掩蔽效果較好紋理復(fù)雜的區(qū)域進行嵌入,無視掉紋理區(qū)域的像素該方法便對內(nèi)容自適應(yīng)隱寫術(shù)失效。然而目前,針對內(nèi)容自適應(yīng)隱寫術(shù)負載定位的研究近乎空白,僅查閱到一篇學(xué)位論文[18],該文獻的思想是從嵌入者的思路來預(yù)測隱寫后的隱寫像素的位置,用較低嵌入率的隱寫圖像預(yù)測二次嵌入的位置,一旦嵌入時的策略不再針對具體區(qū)域(傾向紋理區(qū)域),或者隨機嵌入至平滑區(qū)域,該方法便已失效。
本文針對目前隱寫分析往往只能判別載體圖像中是否存在隱密信息,并不能對隱密信息的具體位置進行標識,為進一步增強隱寫分析的實用性,將隱寫分析的研究目標拓展為自適應(yīng)隱寫術(shù)和非自適應(yīng)隱寫術(shù)LSB matching的負載像素定位,提出一種端到端的圖像隱寫定位網(wǎng)絡(luò)PSL_NET,在輸入端輸入一張圖像,輸出端預(yù)測得到圖像的負載像素位?;陬A(yù)測載體圖像每位像素的隱寫概率,最終定位出圖像的隱寫像素。研究的工作中包含以下內(nèi)容:
(1)利用傳統(tǒng)隱寫分析方法富模型中的30個線性的SRM高通濾波器初始化網(wǎng)絡(luò)第一層卷積核的參數(shù),提取出圖像的殘噪圖像,突出局部異常像素。
(2)本文利用深度殘差網(wǎng)絡(luò)[19]來提取隱寫特征,通過引入殘差模塊有效緩解網(wǎng)絡(luò)模型訓(xùn)練時反向傳播的梯度消失問題,進而解決深度網(wǎng)絡(luò)難以訓(xùn)練和性能退化的問題。
(3)基于逐像素概率預(yù)測來對圖像每位像素進行分析,利用標記出隱寫像素實際位置的掩碼圖像進行有監(jiān)督地學(xué)習(xí),增強網(wǎng)絡(luò)對局部隱寫像素的感知能力,無區(qū)別對待平滑或者紋理區(qū)域的像素,逐一預(yù)測圖像每位像素是真實位或是隱寫位的概率。
(4)從目標函數(shù)角度解決正負樣本的不均衡問題,訓(xùn)練時通過使用Focal loss[20]對比使用交叉熵損失提升對負樣本的學(xué)習(xí)權(quán)重,在測試時用于提升檢測精度。
嵌入的隱寫信息對于圖像就像是在圖像上疊加了微弱的噪聲,但這個噪聲改變了圖像像素之間存在的相關(guān)性。這些噪聲信號相對載體圖像的內(nèi)容極其微弱,人眼視覺無法分辨,通常網(wǎng)絡(luò)中采用預(yù)處理層計算圖像的殘噪圖像,排除圖像內(nèi)容對隱寫信號的干擾。對于載體圖像X,像素位xij的空間坐標為(i,j),其對應(yīng)的殘差圖像R中的像素為rij,rij的計算如公式(1):
N(xij)表示像素xij相鄰像素的集合,Pre(?)函數(shù)根據(jù)相鄰像素集合得到像素的預(yù)測值,其對應(yīng)的殘差圖像的像素值rij,可根據(jù)真實像素值與預(yù)測像素值的差值得到。
實際計算中,圖像X的殘噪圖像R,由圖像X經(jīng)預(yù)設(shè)的濾波K處理后得到,其中*表示卷積操作,如公式(2)所示:
傳統(tǒng)隱寫分析研究中有大量可選的濾波器,其中包括線性和非線性的濾波器,不同的卷積核能夠計算出不同的殘噪圖像。本文中利用富模型SRM中的30個線性的高通濾波器初始化第一層卷積核的參數(shù),這30個濾波器中包含:8個“1st”類、4個“2nd”類、8個“3rd”類、1個“Square3×3”、4個“Edge3×3”、1個“Square5×5”、4個“Edge5×5”。用這30個濾波器的參數(shù)初始化5×5卷積核的參數(shù)取代隨機產(chǎn)生的參數(shù),提取出圖像的殘噪圖像。
在卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)結(jié)構(gòu)越深非線性表達能力越好,但當(dāng)模型效果趨于飽和時,加深網(wǎng)絡(luò)不再發(fā)揮優(yōu)勢,甚至出現(xiàn)退化問題。研究學(xué)者提出殘差網(wǎng)絡(luò)解決這一問題,殘差網(wǎng)絡(luò)相比卷積神經(jīng)網(wǎng)絡(luò),通過在網(wǎng)絡(luò)中引入殘差模塊,該模塊在不同層之間加入捷徑連接得以實現(xiàn)。例如第l層的特征圖xl添加一條跳轉(zhuǎn)連接(shortcut),跳轉(zhuǎn)連接至第l+1層,兩個緊鄰層之間的殘差模塊求取的映射表示如公式(3)所示:
xl+1表示第l+1層的預(yù)測值,xl表示輸入,F(xiàn)(x,{wl})表示殘差映射。殘差學(xué)習(xí)單元由殘差學(xué)習(xí)分支和輸入的恒等映射分支組成。殘差模塊結(jié)構(gòu)如圖1所示。殘差模塊的加入有效地緩解了網(wǎng)絡(luò)模型訓(xùn)練時反向傳播的梯度消失問題,進而解決了深度網(wǎng)絡(luò)難以訓(xùn)練和性能退化的問題。
圖1 殘差模塊Fig.1 Residual module
在PSL_NET中,利用深度殘差網(wǎng)絡(luò)來提取隱寫特征,通道加深網(wǎng)絡(luò)來學(xué)習(xí)更為抽象、高級的特征,利用殘差模塊的跳轉(zhuǎn)連接匯集上下層特征,增強模型的非線性表達能力。
在判斷圖像x是否經(jīng)過隱寫的被動隱寫分析任務(wù)中,網(wǎng)絡(luò)的末端壓縮得到二維特征經(jīng)激活函數(shù)Softmax處理得到的二維概率,分別代表圖像是真實圖像和隱寫圖像的概率,概率表達式如公式(4),公式中y表示圖像x的預(yù)測值,可以等于0或者1,分別表示預(yù)測出圖像x是真實圖像和隱寫圖像,P(y)表示預(yù)測概率值;y?表示圖像x的實際值,可以等于0或者1,0表示真實圖像,1表示隱寫圖像。
求取概率的極大似然估計如公式(5)所示,通過最大化極大似然估計得到預(yù)測概率的最大值,表達式的最大值只需求解表達式負值的最小值得到,即最小化交叉熵損失,損失函數(shù)如公式(6)所示:
在本文中,逐一預(yù)測圖像x每位像素xij是真實和經(jīng)隱寫的概率,預(yù)測概率的表達式如公式(7)所示,公式中yij表示像素xij的預(yù)測值,可以等于0或者1,分別表示預(yù)測出像素xij是真實像素或者隱寫像素,P(yij)表示預(yù)測概率值;yij表示像素xij的實際值,可以等于0或者1,0表示真實像素,1表示隱寫像素。
像素預(yù)測概率的極大似然估計如公式(8)所示,同樣通過最大化極大似然估計得到預(yù)測概率的最大值,即通過最小化求取的交叉熵損失,圖像x每位像素的預(yù)測損失的平均值如公式(9)所示,其中h、w分別表示圖像x的高度和寬度:
本文的定位網(wǎng)絡(luò)中在訓(xùn)練時,輸入端輸入一張載體圖像、隱寫圖像,讓網(wǎng)絡(luò)學(xué)習(xí)隱寫像素對隱寫前后局部統(tǒng)計特性的改變來判定圖像的真實像素和隱寫像素,而載體圖像中像素位均為正樣本,隱寫圖像中的經(jīng)隱寫像素為負樣本,未經(jīng)隱寫位同樣為正樣本,這使得正負樣本出現(xiàn)不均衡問題,因此樣本不均衡問題也是本文研究的內(nèi)容,學(xué)術(shù)界中有通過自定義優(yōu)化的目標函數(shù)來解決這一問題,本文的任務(wù)重點學(xué)習(xí)負樣本特征,文獻[20]中的Focal loss用于提升困難樣本的權(quán)重,本文的實驗中同時使用Focal loss對比交叉熵損失,提升網(wǎng)絡(luò)對負樣本的學(xué)習(xí),F(xiàn)ocal loss如公式(10)所示,公式中γ為調(diào)節(jié)系數(shù),通過調(diào)節(jié)參數(shù)γ調(diào)節(jié)正負樣本的比例,γ大于1時,網(wǎng)絡(luò)中負樣本的學(xué)習(xí)權(quán)重增加。
本文提出隱寫定位網(wǎng)絡(luò)PSL_NET,網(wǎng)絡(luò)模型如圖2所示。網(wǎng)絡(luò)由預(yù)處理層、深度殘差層、像素預(yù)測層組成。預(yù)處理層中,采用SRM高通濾波器提取出包含多階隱寫信號的殘噪圖像;深度殘差層中,利用殘差結(jié)構(gòu)的跳轉(zhuǎn)連接匯集上下層的特征得到組合的特征,增強模型的特征表達能力;像素預(yù)測層中,利用標記出隱寫像素實際位置的掩碼圖像進行有監(jiān)督地學(xué)習(xí),加強網(wǎng)絡(luò)對局部隱寫像素的感知能力,無區(qū)別對待平滑和紋理區(qū)域的像素,逐一預(yù)測圖像每位像素位是真實像素或是隱寫像素的概率。
預(yù)處理層用于提取圖像的殘噪圖像,本文中利用富模型SRM中的30個SRM高通濾波器初始化網(wǎng)絡(luò)的第一層卷積核的參數(shù),并伴隨網(wǎng)絡(luò)自動化學(xué)習(xí),第一層卷積核大小為5×5,padding設(shè)置為2,對于1×256×256大小的載體圖像,提取的殘噪圖像大小保持不變,預(yù)處理層的高通濾波器充分抑制圖像的內(nèi)容,捕獲出水平、垂直、不同對角線的領(lǐng)域像素的殘噪信息,提取出包含多階隱寫信號的殘噪圖像,殘噪圖像中凸出局部范圍的異常像素。
經(jīng)預(yù)處理層提取的殘噪圖像,以殘差網(wǎng)絡(luò)為主進行隱寫特征的提取,利用殘差網(wǎng)絡(luò)保證加深網(wǎng)絡(luò)時非線性表達能力更好,同時避免隨著網(wǎng)絡(luò)的加深而出現(xiàn)退化的問題,殘差模塊中采用3×3卷積對領(lǐng)域范圍內(nèi)的隱寫特征進行建模。
本文的深度殘差層中包含13個Group,如圖2中所示,Group1~Group2采用30×3×3大小的卷積核,其中padding等于1,在卷積核之后添加批處理BN層,將分布拉到對梯度更為敏感的正太分布,而Group3~Group13中均采用殘差模塊,每個Group采用兩次30×3×3卷積層和BN層進行隱寫特征的提取,深度殘差層中利用殘差結(jié)構(gòu)的跳轉(zhuǎn)連接匯集上下層的特征得到組合的特征,增強模型的特征表達能力,不同Group之間采用ReLU非線性變換增強模型特征的非線性表達能力。經(jīng)Group1~Group13特征提取后的特征圖大小均為30×256×256。
圖2 PSL_NET網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 PSL_NET network structure
本文主要利用標記出隱寫像素實際位置的掩碼圖像進行有監(jiān)督地學(xué)習(xí),為網(wǎng)絡(luò)提供更多學(xué)習(xí)的信息,輸入端每張圖像都附帶一張掩碼圖像(Mask),掩碼圖像Mask的獲取策略如公式(11)所示,其中載體圖像IC經(jīng)某種隱寫算法嵌入后的隱寫圖像IS,像素位置(i,j)一旦嵌入,嵌入前后像素差值的絕對值大于0,則掩碼圖像Mask中對應(yīng)的像素位標記為1,若未嵌入,像素差值的絕對值為0,則掩碼圖像Mask中對應(yīng)的像素位標記為0,掩碼圖像反映了隱寫像素的實際分布。網(wǎng)絡(luò)包括檢測內(nèi)容自適應(yīng)隱寫算法和非自適應(yīng)隱寫算法LSB matching順序嵌入的圖像,經(jīng)內(nèi)容自適應(yīng)隱寫算法S-UNIWARD和經(jīng)非內(nèi)容自適應(yīng)隱寫算法LSB matching順序嵌入后的隱寫圖像和掩碼圖像可視后如圖3所示,掩碼圖像中標記為1的像素值用灰度值255進行顯示。
圖3 載體圖像、隱寫圖像和對應(yīng)的掩碼圖像Fig.3 Origin image,steganographic image and corresponding mask image
像素預(yù)測層的流程如圖4所示。利用像素預(yù)測層對經(jīng)深度建模得到多維高級特征進行降維壓縮得到二維通道的特征圖,壓縮得到的二維高級特征易于偵查局部異常像素;像素預(yù)測層中采用2×3×3卷積層和BN層處理得到二維通道特征,經(jīng)過Softmax激活函數(shù)得到2×256×256的概率圖,“0”“1”通道分別代表預(yù)測是未經(jīng)隱寫的概率分布圖P0和預(yù)測是經(jīng)過隱寫的概率分布圖P1,大小均為1×256×256。輸入端檢測圖像x的每位像素xij經(jīng)網(wǎng)絡(luò)預(yù)測得到二維概率,P0ij和P1ij,分別代表像素xij未經(jīng)改動或者經(jīng)過隱寫的概率,取二維概率的最大值所在的通道編號“0”或者“1”為預(yù)測的隱寫定位圖y中對應(yīng)像素位yij的值。訓(xùn)練過程有監(jiān)督進行,網(wǎng)絡(luò)通過最小化交叉熵損失反復(fù)迭代優(yōu)化直至隱寫定位圖無限逼近掩碼圖像,網(wǎng)絡(luò)采用的損失函數(shù)如公式(9)所示。
圖4 像素預(yù)測層的流程Fig.4 Process of pixel prediction layer
在訓(xùn)練訓(xùn)練時包含未經(jīng)改動載體圖像和經(jīng)隱寫的圖像,而在載體圖像中全部為標記為0的像素,而隱寫圖像中同樣包含標記為0的像素,這使得訓(xùn)練過程中出現(xiàn)正負樣本不均衡的問題,且本文研究的是隱寫像素的定位問題,隱寫像素作為負樣本是重點學(xué)習(xí)的內(nèi)容,因此解決樣本不均衡問題也是本文的研究內(nèi)容。在研究界中不少學(xué)者通過自定義的目標函數(shù)解決樣本不均衡的問題。本文在實驗中分別利用Focal loss和交叉熵損失,通過對比像素檢測準確度和負樣本的準確度來選擇最佳的目標函數(shù),F(xiàn)ocal loss如公式(10)所示。
網(wǎng)絡(luò)包含檢測內(nèi)容自適應(yīng)隱寫算法嵌入的圖像。內(nèi)容自適應(yīng)隱寫術(shù)的策略,是對視覺掩蔽效果較好紋理復(fù)雜的區(qū)域進行嵌入,從而盡可能地減小圖像質(zhì)量的損失,減少嵌密引發(fā)的異常,根據(jù)該原則定位網(wǎng)絡(luò)按理應(yīng)對有限區(qū)域進行分析,比如一些紋理區(qū)域應(yīng)具備更高經(jīng)過隱寫的可能性,而本文網(wǎng)絡(luò)的核心是利用實際標注的隱寫位加強網(wǎng)絡(luò)對局部異常像素的感知能力,局部領(lǐng)域像素內(nèi)的隱寫信號對隱寫前后統(tǒng)計特征無規(guī)則的改變,是有利于偵破的關(guān)鍵,所以本文的網(wǎng)絡(luò)對內(nèi)容自適應(yīng)隱寫算法的像素定位,不針對像素是否位于平滑或者紋理區(qū)域。
同時對非內(nèi)容自適應(yīng)隱寫術(shù)LSB matching進行像素定位,非自適應(yīng)隱寫術(shù)LSB matching是直接對圖像像素值的最低有效位進行±1,該算法對嵌入的區(qū)域進行選擇時,不針對紋理區(qū)域與平滑區(qū)域。本文對該算法進行檢測時,同樣利用有監(jiān)督學(xué)習(xí)加強網(wǎng)絡(luò)對局部異常像素的感知能力,定位網(wǎng)絡(luò)無區(qū)別對待平滑或者紋理區(qū)域的像素,使得網(wǎng)絡(luò)適用于檢測非內(nèi)容自適應(yīng)隱寫術(shù)LSB matching。
定位網(wǎng)絡(luò)對于隱寫圖像進行檢測的前提是預(yù)處理層中利用高通濾波器對圖像的殘留噪聲的提取,高通濾波器一般用于圖像紋理區(qū)域的提取,而在隱寫分析或是圖像取證中,更多是捕獲嵌入信息對局部相關(guān)性改變的痕跡,因此同樣適用于凸顯圖像平滑區(qū)域嵌入的噪聲信息;同時利用深度殘差層加深了網(wǎng)絡(luò)對局部異常像素的感知能力,而網(wǎng)絡(luò)的關(guān)鍵是有監(jiān)督方式對嵌入前后異同的學(xué)習(xí),掩碼圖像標記的實際隱寫像素為網(wǎng)絡(luò)提供了更多信息進行學(xué)習(xí),使網(wǎng)絡(luò)可以遷移至不同嵌入策略的圖像進行檢測,但同樣為內(nèi)存負載帶來一定的開銷且該策略也具備目前基于深度學(xué)習(xí)的隱寫分析研究的缺陷,綜述性文章[21]中提到的載體失配問題,大數(shù)據(jù)時代,數(shù)據(jù)多源異構(gòu),靜態(tài)的訓(xùn)練集始終難以覆蓋動態(tài)的檢測對象,一些學(xué)者的觀點是不同源數(shù)據(jù)需分開訓(xùn)練后再進行檢測,或者通過增加訓(xùn)練集中的數(shù)據(jù)來源和樣本數(shù)量來緩減該問題。
3.1.1 數(shù)據(jù)集
本文使用隱寫分析標準數(shù)據(jù)集BOSSbase v1.01進行評估,該數(shù)據(jù)集由10 000張512×512的PGM格式的灰度圖構(gòu)成,考慮到GPU計算限制,以圖像紋理區(qū)域為中心的方式裁剪圖像尺寸為256×256,構(gòu)造出10 000張大小的數(shù)據(jù)源;采用自適應(yīng)隱寫算法S-UNIWARD,實驗中驗證網(wǎng)絡(luò)在不同負載下的隱寫定位能力,每組訓(xùn)練集中包含8 000張載體圖像(cover)、隱寫圖像(stego),測試集中包含2 000張載體圖像、隱寫圖像;訓(xùn)練過程有監(jiān)督進行,數(shù)據(jù)集中每張圖像附帶一張二值掩碼圖像,掩碼圖像中真實像素位標記為0,隱寫像素位標記為1。
同時利用經(jīng)非內(nèi)容自適應(yīng)隱寫算法LSB matching順序嵌入后的圖像構(gòu)造出測試數(shù)據(jù)集。用Matlab庫中l(wèi)ena.png、coins.png、kobi.png三張嵌入圖像,分別對2 000張測試圖像進行嵌入,共同組成LSB隱寫算法的3組測試集,每組測試集中包含2 000張隱寫圖像,數(shù)據(jù)集中每張圖像附帶一張二值掩碼圖像(Mask)。
3.1.2 實驗環(huán)境
實驗的硬件環(huán)境是型號為tesla p40的GPU,網(wǎng)絡(luò)模型使用深度學(xué)習(xí)框架Pytorch實現(xiàn),CUDA版本為10.1;優(yōu)化器采用Adam,學(xué)習(xí)率設(shè)置為0.000 1,batch_size設(shè)置為2,其中包含1對載體圖像、隱寫圖像,周期epoch設(shè)置為50,1個周期迭代8 000次,模型的訓(xùn)練參數(shù)總計197 886。
3.1.3 評估標準
定位能力取決于能夠準確檢測隱寫圖像中的隱寫像素,同時取決于不對未經(jīng)隱寫的像素造成誤報,根據(jù)用于描述圖像像素真實分布的掩碼圖像和網(wǎng)絡(luò)模型預(yù)測出隱寫像素定位圖,采用像素檢測準確度(pixel accuracy,PA)對PSL_NET的隱寫定位性能進行表征,像素準確度的計算如公式(12)所示:
此外,定位網(wǎng)絡(luò)重要的功能是驗證隱寫像素的檢測能力,因此同時采用特異度(FPR)作為評價的指標,特異度的計算公式如公式(13)所示:
TP表示掩碼中標記是0,預(yù)測值也是0的像素樣本量;TN表示掩碼中標記是1,預(yù)測值也是1的像素樣本量;FN表示掩碼中標記是0,預(yù)測值是1的像素樣本量;FP表示掩碼中標記是1,預(yù)測值是0的像素樣本量。
3.2.1 PSL_NET在不同負載下的隱寫定位驗證
為了對網(wǎng)絡(luò)PSL_NET的隱寫定位進行驗證,首先采用自適應(yīng)隱寫算法S-UNIWARD在嵌入負載為0.1 BPP、0.2 BPP、0.3 BPP、0.4 BPP對網(wǎng)絡(luò)的隱寫像素定位能力進行驗證,單位BPP表示平均每位像素嵌入的比特數(shù),訓(xùn)練過程中采用交叉熵損失作為目標函數(shù)。PSL_NET在完成嵌入負載為0.4 BPP任務(wù)時,訓(xùn)練過程中在測試樣本上的損失下降過程如圖5所示,每組測試樣本中包含2 000張載體圖像、隱寫圖像,訓(xùn)練直至收斂時不同負載下的損失(Loss)、像素準確度(PA)以及特異度(FPR)如表1所示。
圖5 在負載為0.4 BPP的測試樣本上的損失下降過程Fig.5 Loss reduction process on test sample at payload of 0.4 BPP
表1 不同負載下的損失、像素準確度(PA)、特異度(FPR)Table 1 Loss,pixel accuracy and specificity under different payloads
實驗中,PSL_NET對不同負載下的圖像進行檢測時,像素檢測準確度(PA)有著較高的精度,隨機嵌入負載的增加檢測準確度降低,在不同負載下的隱寫圖像檢測時的特異度(FPR)存在一定的提升空間,但隨著負載增加精度保持穩(wěn)定;在損失下降過程中,80 000次迭代后損失平緩下降;在檢測圖像是否經(jīng)過隱寫的研究中,有著嵌入負載越大檢測準確度越高的公論,這一目標下的網(wǎng)絡(luò)是對隱寫信號分布的全局進行統(tǒng)計,依賴于全局的隱寫區(qū)域,負載越大網(wǎng)絡(luò)的感知能力越強,而在隱寫定位任務(wù)中嵌入負載越大局部范圍內(nèi)統(tǒng)計特性改變的差異性越大,檢測準確度降低,負載越大網(wǎng)絡(luò)對局部隱密信息越敏感,特異度提升,同時從準確度和特異度的差距可知,網(wǎng)絡(luò)對隱寫像素漏檢的幾率大于對真實像素造成的誤報率,這是訓(xùn)練時正負樣本不均衡造成的,本文從目標函數(shù)角度解決正負樣本的不均衡問題,在測試時用于提升精度。
3.2.2 采用Focal loss訓(xùn)練的隱寫定位驗證
從目標函數(shù)角度解決樣本不均衡問題,研究本文網(wǎng)絡(luò)PSL_NET在使用Focal loss進行訓(xùn)練時,能否解決正負樣本的不均衡問題并提升像素檢測準確度和特異度。同樣針對內(nèi)容自適應(yīng)隱寫算法S-UNIWARD在負載為0.1 BPP、0.2 BPP、0.3 BPP、0.4 BPP的圖像進行訓(xùn)練,訓(xùn)練過程中采用Focal loss為目標函數(shù),調(diào)節(jié)系數(shù)γ設(shè)置為2時為最佳,PSL_NET在完成嵌入負載為0.4 BPP任務(wù)時,訓(xùn)練過程中在測試樣本上的損失下降過程如圖6所示,訓(xùn)練直至收斂時對不同負載下測試圖像檢測時的損失(Loss)、像素準確度(PA)以及特異度(FPR)如表2所示,每組測試樣本中包含2 000張載體圖像、隱寫圖像。
圖6 采用Focal loss在負載為0.4 BPP的測試集上的損失下降過程Fig.6 Loss reduction process on test set at payload of 0.4 BPP using Focal loss
表2 采用Focal loss在測試集上的損失(Loss)、像素準確度(PA)、特異度(FPR)Table 2 Loss,pixel accuracy and specificity using Focal loss on test set
Focal loss中調(diào)節(jié)系數(shù)γ設(shè)置為2時,對于正樣本而已,像素yij為負樣本的概率1-P0ij的γ次方就會變小,這時的損失函數(shù)值變得更小,F(xiàn)ocal loss中調(diào)節(jié)系數(shù)γ的目的就是減少正樣本在訓(xùn)練中的權(quán)重,從而使得訓(xùn)練過程網(wǎng)絡(luò)更專注于負樣本的學(xué)習(xí)。在實驗中,PSL_NET對經(jīng)內(nèi)容自適應(yīng)隱寫算法S-UNIWARD在不同嵌入負載下的隱寫圖像使用Focal loss進行訓(xùn)練后,對測試樣本進行檢測時,相對于使用交叉熵損失訓(xùn)練的網(wǎng)絡(luò),像素準確度和特異度均得到一定的提升,負載為0.1 BPP提升尤為明顯,由此可見通過改變目標函數(shù)提升了網(wǎng)絡(luò)對于負樣本的學(xué)習(xí)。
3.2.3 對非自適應(yīng)隱寫術(shù)LSB matching的隱寫定位驗證
內(nèi)容自適應(yīng)隱寫術(shù)是對圖像中視覺掩蔽效果較好紋理復(fù)雜的區(qū)域進行嵌入,從而盡可能地減小圖像質(zhì)量的損失,減少嵌密引發(fā)的異常。非自適應(yīng)隱寫術(shù)LSB matching是直接對圖像像素的最低有效位進行±1,對嵌入的區(qū)域進行選擇時,不針對載體圖像的紋理區(qū)域與平滑區(qū)域,在實驗中利用針對內(nèi)容自適應(yīng)隱寫算法S-UNIWARD在負載為0.4 BPP的隱寫圖像采用交叉熵損失已訓(xùn)練至收斂的網(wǎng)絡(luò),對經(jīng)過非內(nèi)容自適應(yīng)LSB matching隱寫算法分別順序嵌入Matlab庫中l(wèi)ena.png、coins.png、kobi.png三張圖像組成的3組測試數(shù)據(jù)集進行檢測,每組測試數(shù)據(jù)集中包含2 000張載體圖像、隱寫圖像,像素準確度(PA)如表3所示。
表3 對LSB Matching隱寫術(shù)的像素準確度(PA)Table 3 Pixel accuracy for LSB matching
實驗可知,針對自適應(yīng)隱寫算法S-UNIWARD在負載為0.4 BPP的隱寫圖像以訓(xùn)練至收斂的網(wǎng)絡(luò)PSL_NET,遷移至檢測非內(nèi)容自適應(yīng)隱寫算法LSB經(jīng)順序嵌入3張不同圖像的測試集時算法仍然有效,LSB matching的嵌入策略不針對載體圖像內(nèi)容進行嵌入,本文的網(wǎng)絡(luò)對隱寫像素進行檢測時,無區(qū)別對待平滑或者紋理區(qū)域的像素,通過對標記數(shù)據(jù)的學(xué)習(xí)增強網(wǎng)絡(luò)對局部領(lǐng)域像素內(nèi)異常隱寫信號的敏感度,使得網(wǎng)絡(luò)亦可適用于非內(nèi)容自適應(yīng)LSB隱寫算法的隱寫像素,但由于順序嵌入圖像后使載體圖像承受了更大的嵌入負載,檢測難度較大使得準確度下降。
3.2.4 對PSL_NET的對比仿真分析
對本文提出的PSL_NET與文獻[16]中提出的針對LSB matching隱寫術(shù)有效嵌入負載像素定位的深度神經(jīng)網(wǎng)絡(luò)(簡稱DNN)獲取圖像隱密信息的效果進行對比仿真和分析,兩種方法針對內(nèi)容自適應(yīng)隱寫術(shù)S-UNIWARD在負載為0.4 BPP的隱寫圖像進行訓(xùn)練和測試,在測試集上的像素準確度和特異度如表4所示,測試集中包含2 000張載體圖像、隱寫圖像。以及分別用兩種方法完成內(nèi)容自適應(yīng)隱寫術(shù)S-UNIWARD在負載為0.4 BPP任務(wù)已訓(xùn)練至收斂的網(wǎng)絡(luò)對載體圖像、經(jīng)內(nèi)容自適應(yīng)隱寫術(shù)S-UNIWARD在負載為0.4 BPP嵌入后的隱寫圖像進行檢測,以BOSSbase v1.01中第1 108張圖像作為樣張對兩種方法生成的隱寫定位圖像的效果進行可視化對比,該樣張中紋理和平滑區(qū)域的分布直觀。如圖7所示,輸入端為載體圖像、經(jīng)內(nèi)容自適應(yīng)隱寫算法S-UNIWARD在負載為0.4 BPP處理后的隱寫圖像,掩碼圖像為預(yù)先標注出隱寫像素位置的圖像,隱寫定位圖分別經(jīng)PSL_NET、DNN預(yù)測得到,可視時將DNN獲取的標簽(label)轉(zhuǎn)換成定位圖對兩種方法的效果進行對比。
表4 兩種方法在測試集上的像素準確度(PA)和特異度(FPR)Table 4 Pixel accuracy and specificity of two methods on test set
圖7 兩種方法獲取的隱寫定位圖Fig.7 Steganographic location map obtained by two methods
DNN中通過提取隱寫圖像中每位像素的臨近像素差異矩陣構(gòu)造出的72維特征向量作為輸入進行訓(xùn)練,在預(yù)測像素時將紋理區(qū)域的像素視為無效隱寫像素,因為臨近像素差異矩陣本質(zhì)用于提取圖像紋理區(qū)域的信息,然而內(nèi)容自適應(yīng)隱寫術(shù)是對圖像中視覺掩蔽效果較好紋理復(fù)雜的區(qū)域進行嵌入,如若無視掉紋理區(qū)域的像素,該方法便對內(nèi)容自適應(yīng)隱寫術(shù)的隱寫定位無效,因此本文的對比仿真中采用該方法時將紋理區(qū)域的像素視為有效像素。如表4中,兩種方法對測試集中的數(shù)據(jù)進行檢測時,特異度相當(dāng)然而像素檢測準確度相差明顯,因為DNN通過手工提取臨近像素差異特征的均方作為輸入,該特征對圖像紋理區(qū)域的像素敏感,而測試集中載體圖像與隱寫圖像占比為1∶1,該方法檢測載體圖像時,載體圖像中紋理區(qū)域的像素并未經(jīng)嵌入?yún)s被誤報,導(dǎo)致準確度降低。
如圖7所示,測試樣張中上方為平滑區(qū)域,下方為紋理區(qū)域,輸入端載體圖像經(jīng)PSL_NET、DNN預(yù)測得到的隱寫定位圖中,DNN方法對載體圖像的紋理區(qū)域敏感,標識出了載體圖像中未經(jīng)隱寫的像素,而PSL_NET中僅極少量未經(jīng)隱寫的像素被標識,兩種方法對內(nèi)容自適應(yīng)隱寫術(shù)S-UNIWARD負載為0.4 BPP的隱寫圖像的隱秘信息定位時,對比樣張的上方可知兩種方法都可捕獲部分圖像平滑區(qū)域的隱寫信息,DNN基于手工提取的特征對平滑區(qū)域的隱秘信息提取更為準確,樣張的隱寫定位圖的下方區(qū)域中,兩種方法均能捕獲圖像紋理區(qū)域的隱寫信息,但PSL_NET中僅有少量未經(jīng)隱寫的信息被錯誤地標識。對內(nèi)容自適應(yīng)隱寫術(shù)的隱寫分析研究中,在特征選取時既要保證可以捕獲出紋理復(fù)雜區(qū)域的隱秘信息,同時保證不對紋理復(fù)雜區(qū)域中未經(jīng)隱寫的像素造成誤報,本文中利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)自動學(xué)習(xí)抽象的隱寫特征的特點,使得網(wǎng)絡(luò)能夠區(qū)分出紋理復(fù)雜區(qū)域中嵌入的隱秘信息,PSL_NET可捕獲平滑區(qū)域的隱秘信息亦可證得該方法適用于LSB matching隱寫術(shù)的隱寫像素定位。對比仿真可知,本文的方法相對DNN的優(yōu)勢在于對未經(jīng)隱寫的像素有更低的誤報率并且完全端到端實現(xiàn)。
本文針對目前隱寫分析往往只能判別載體圖像中是否存在隱密信息,并不能對隱密信息的具體位置進行標識,為進一步增強隱寫分析的實用性,將隱寫分析的研究目標拓展為自適應(yīng)隱寫術(shù)和非自適應(yīng)隱寫術(shù)LSB matching的隱寫定位。提出一種端到端的圖像隱寫分析定位網(wǎng)絡(luò)PSL_NET,在輸入端輸入一張圖像,輸出端得到預(yù)測的隱寫定位圖。在預(yù)處理層中,利用空域富模型的高通濾波器提取殘噪圖像;在深度殘差層中,通過深度殘差學(xué)習(xí)增強隱寫特征的表達能力;像素預(yù)測層中,利用標記出隱寫像素實際位置的掩碼圖像進行有監(jiān)督地學(xué)習(xí),加強網(wǎng)絡(luò)對局部隱寫像素的感知能力,無區(qū)別對待平滑或者紋理區(qū)域的像素,逐一預(yù)測圖像每位像素是真實位或是隱寫位的概率。最后,從目標函數(shù)層面解決正負樣本的不均衡問題,訓(xùn)練時通過使用Focal loss對比使用交叉熵損失提高對負樣本的學(xué)習(xí)權(quán)重,在測試時用于提升檢測精度。
在基于隱寫分析標準數(shù)據(jù)源BOSSbase v1.01的實驗中,網(wǎng)絡(luò)對自適應(yīng)隱寫算法S-UNIWARD在負載為0.1 BPP、0.2 BPP、0.3 BPP、0.4 BPP下的像素檢測準確度均大于0.98,特異度還有一定的提升空間,但是網(wǎng)絡(luò)一旦檢測出隱寫圖像的部分隱寫像素就完成了被動隱寫分析的任務(wù),即能判斷圖像是否經(jīng)過隱寫。本文為解決正負樣本不均衡問題,從目標函數(shù)角度提出解決方法,并用實驗驗證了該方法對于精度的提升起到的效用,最后通過與相關(guān)研究的對比仿真的可視對比中,驗證網(wǎng)絡(luò)同時適用于非內(nèi)容自適應(yīng)隱寫術(shù)LSB matching的隱寫信息定位。
本文網(wǎng)絡(luò)的關(guān)鍵是有監(jiān)督方式利用掩碼圖像對嵌入前后異同的學(xué)習(xí),使網(wǎng)絡(luò)可以遷移至檢測經(jīng)非內(nèi)容自適應(yīng)隱寫術(shù)LSB matching嵌入的圖像,掩碼圖像的利用是有監(jiān)督學(xué)習(xí)局部隱寫像素對于隱寫前后統(tǒng)計特性改變的關(guān)鍵,本文的主要工作是為隱寫分析定位問題提供一種策略,在圖像分割領(lǐng)域亦有相似策略,掩碼圖像為網(wǎng)絡(luò)提供了更多學(xué)習(xí)信息的同時,給內(nèi)存負載帶來了一定的開銷,且隱寫定位研究中仍然存在基于深度學(xué)習(xí)的被動隱寫分析研究中存在的載體失配問題,因為靜態(tài)的訓(xùn)練集中的數(shù)據(jù)始終不能覆蓋所有的數(shù)據(jù)源,一些學(xué)者的觀點是不同源數(shù)據(jù)需分開訓(xùn)練后再進行檢測,或者通過增加訓(xùn)練集中的數(shù)據(jù)源和數(shù)量來緩減該問題,且本文的研究距離真正準確有效地定位出任意圖像的隱寫像素還有一定差距,未來的工作中將進一步研究以提升檢測精度和增強實用性。