張 艷,葉學義,汪云路,魯國鵬
(杭州電子科技大學模式識別與信息安全實驗室,杭州 310018)
隱寫技術(shù)是一種利用載體(如圖像、視頻等)進行信息隱藏從而實現(xiàn)秘密信息傳輸?shù)碾[蔽通信技術(shù),是信息安全的一個重要分支。隱寫分析技術(shù)則是針對隱寫術(shù)的攻擊技術(shù),其目的是檢測秘密信息的存在與否,進而采取應對措施來阻止非法隱蔽通信。隱寫分析是解決非法使用隱寫術(shù)問題的關(guān)鍵技術(shù),也是衡量隱寫安全性的一個重要手段[1]。
LSB 隱寫算法在圖像空域隱寫算法中較為流行且應用廣泛[2-3]。簡單LSB 替換算法雖然僅對載體圖像進行微小的修改,但仍會因在最低位平面產(chǎn)生某些異常特性如成對灰度值的像素數(shù)趨于相等而容易被識別出來[4]。避免這種統(tǒng)計異常性的最簡單方法就是LSB 匹配算法(LSB Matching algorithm,LSBM):當嵌入的比特與像素值最低位相同時,像素值不變;不同時隨機選擇+1 或-1。在達到最大嵌入率時,LSB 替換、LSBM 的像素改變率均為0.5 比特/像素。文獻[5]提出LSB 匹配改進算法(LSB Matching Revisited algorithm,LSBMR),該算法將像素對作為一個嵌入單元進行秘密信息嵌入,像素對中的第一個像素的LSB 攜帶一個比特秘密信息,2 個像素之間的函數(shù)關(guān)系(奇偶)攜帶另一比特秘密信息。在達到最大嵌入率時,LSBMR 的像素改變率為0.375 比特/像素。LSBMR 既能克服LSB 替換引起的不對稱現(xiàn)象,在相同嵌入率條件下對載體的改動也較小,安全性也較高。
同時,可以發(fā)現(xiàn)這些隱寫算法在嵌入信息的過程中,通常認為圖像最低有效位是0 和1 均勻隨機分布的,且載體圖像中秘密信息嵌入位置的選擇主要依靠偽隨機序列發(fā)生器決定而不考慮圖像本身內(nèi)容和嵌入信息的長度[2]。然而,圖像最低有效位并不總是0 和1 均勻隨機分布,特別是在像素值相等或像素值差值較小的區(qū)域,在這些圖像平坦區(qū)域圖像最低有效位呈現(xiàn)與內(nèi)容相關(guān)的結(jié)構(gòu),隨機地選擇嵌入位置隱寫會破壞這種結(jié)構(gòu)[4]。針對該問題,文獻[2]提出了基于LSBMR 的邊緣自適應圖像隱寫算法,結(jié)合LSBMR 和自適應隱寫術(shù)的優(yōu)點,根據(jù)所要求嵌入的秘密信息的長度和嵌入單元中像素差值的大小來選擇秘密信息的嵌入位置。在嵌入率低時,僅對像素對中差值較大(圖像邊緣區(qū)域)的像素對做隱寫處理,而圖像平坦區(qū)域未被破壞,在一定程度上提高了隱寫的安全性。
自適應隱寫具有良好的感官不可覺察性和難檢測性,開展相應的檢測和分析技術(shù)研究具有重要的理論價值和現(xiàn)實意義[6]。在自適應隱寫方法中,隱寫盡量不在平坦區(qū)域嵌入,優(yōu)先在圖像紋理復雜區(qū)域進行信息的嵌入,從而引入了信息嵌入過程與載體間的相關(guān)性[6],這種相關(guān)性的引入打破了很多隱寫分析算法的前提假設(shè),使得自適應隱寫算法具有較強的抗檢測能力。針對EALSBMR 隱寫算法其秘密信息嵌入位置的選擇僅由某個方向上的像素對的差值決定,而沒有考慮該像素與其鄰域內(nèi)其他像素的差值變化的特點,以及對隱寫前后圖像的八方向差分直方圖[7]的分析比較,本文提出一種能有效檢測EALSBMR 隱寫的分析算法。該算法首先計算圖像的八方向絕對差分直方圖,選取絕對差分值在0~10 范圍內(nèi)的頻數(shù)來構(gòu)建出11 維特征向量,輸入SVM 以完成隱寫檢測。實驗利用Bossbase[8]圖像庫,針對EALSBMR 較低嵌入率(≤0.5 bpp)下進行檢測,并將本文算法與目前典的型隱寫分析算法[9-10]進行比較。
多數(shù)隱寫算法通常認為,自然圖像的LSB 位平面是隨機分布的。但這種假設(shè)并不是都成立的,特別是對于有很多平坦區(qū)域的圖像[2],如圖1 所示。
圖1 原圖和LSB 位平面
與平坦區(qū)域相比,位于邊緣區(qū)域的像素LSB 隨機性強,且邊緣區(qū)域與圖像自身內(nèi)容相關(guān),在這些區(qū)域進行信息的嵌入更加不容易被檢測。EALSBMR 將2 個相鄰像素值的絕對差分作為選擇嵌入?yún)^(qū)域的標準,使隱寫優(yōu)先發(fā)生在圖像的邊緣區(qū)域。
根據(jù)嵌入秘密信息的長度和圖像內(nèi)容自適應地調(diào)節(jié)閾值T ,具體的嵌入算法如下:
步驟1 將m×n的載體圖像分成Bz×Bz的非重疊的像素塊,對于每個小塊隨機地旋轉(zhuǎn)0,90,180,2 70}°,將處理后的圖像排成一行得到行向量V。然后將V 分成非重疊的嵌入單元(xi,xi+1)。
步驟2 EU (t)記為像素差值大于等于參數(shù)t 的像素對的集合,如式(1)所示。對于LSBMR 來說,每個嵌入單元嵌入2 bit 信息。那么對于給定的秘密信息M,閾值T 可以通過式(2)計算得到。
其中,| M| 為秘密信息M 的長度;|EU (t)| 為集合EU (t)中元素的總數(shù)。當T=0 時,邊緣自適應LSBMR 與常規(guī)的LSBMR 一樣。
步驟3 在滿足上述閾值條件的像素對中采用LSBMR隱寫算法進行信息隱藏。信息嵌入后,對于超出[0,255]的像素以及嵌入后像素差值小于等于T 的像素對,在保證改變量最小的條件下,對像素進行重新調(diào)整。
步驟4 嵌入完成后,按照步驟1 反向調(diào)整圖像。將參數(shù)(T,Bz)嵌入到預先設(shè)置的區(qū)域。
在文獻[2]中,Bz隨機地從{1,4,8,12}中選取。對圖2(a)采用EALSBMR 嵌入0.1 bpp 秘密信息后生成隱秘圖像(圖2(b)),圖2(c)為載體圖像與隱秘圖像的差值圖像,其中白色像素為隱寫后改動的像素。從圖2(c)中可以看出,EALSBMR 對載體圖像的改動發(fā)生在邊緣區(qū)域,也就是像素差值較大的地方。而對于天空那部分平坦的區(qū)域,隱寫后并未發(fā)生變化。
圖2 載體圖像嵌入前后及其差值圖像
EALSBMR 結(jié)合了LSBMR 和自適應隱寫術(shù)的優(yōu)點,其在嵌入時對圖像的改動并不完全與圖像獨立,而是選擇圖像中邊緣豐富、銳利的區(qū)域進行嵌入,從而引入了信息嵌入過程與載體間的相關(guān)性,這種相關(guān)性的引入打破了很多隱寫分析算法的前提假設(shè),使得EALSBMR 具有較強的抗檢測能力。這一點可以從上述分析和文獻[2]中的實驗以及本文第4 節(jié)中的對比實驗得到驗證。
與常規(guī) LSBMR 隨機選擇嵌入位置不同的是,EALSBMR 由圖像自身內(nèi)容和所要求嵌入的秘密信息的長度決定信息的嵌入位置。具體的選擇標準是嵌入單元像素對中像素的絕對差值大小 |xij-xi,j+1|。值得注意的是,這里的差分僅考慮到像素與某個方向(預處理中對圖像做了旋轉(zhuǎn)操作,所以這里不一定是水平方向或者垂直方向)相鄰像素的絕對差分,而沒有考慮像素與其鄰域上其他像素的關(guān)系,如圖3 所示。
圖3 像素與其鄰域內(nèi)像素關(guān)系
可以看出,在考慮嵌入單元像素對是否適合嵌入時,僅考慮了|xij-xi,j+1|,也就是說忽略了 xij與其鄰域周圍剩下7 個像素的關(guān)系。對于具體的m×n的圖像X ,第i 行第j 列的像素值為 xij,定義八方向差分直方圖中的頻數(shù)hd(d =-2 55,-2 54,…,255)為圖像在如圖3 所示8 個方向上所有相鄰像素差值等于d 的總的像素對數(shù),如式(3)所示:
從Bossbase 圖像庫中隨機挑選一張圖像(22.pgm),采用EALSBMR 嵌入0.4 bpp 秘密信息,嵌入前后圖像八方向差分直方圖如圖4 所示,其中,stego 為信息嵌入后的隱秘圖像;cover 為原始載體圖像。可以看出,信息嵌入前后圖像的八方向差分直方圖有明顯不同,特別是在差值為0 的附近;位于0 左右兩邊的頻數(shù)隱寫前后的變化接近對稱;大于10 左右和小于-10 左右,載體圖像和隱秘圖像的直方圖的分布幾乎吻合。但是,對于均勻紋理圖像實驗,上述分析不成立。在隱寫中由于均勻紋理圖像的特殊性,很少選用均勻紋理圖像作為載體圖像。
圖4 圖像嵌入0.4 bpp 信息前后的八方向差分直方圖
為說明對于一般自然圖像(均勻紋理圖像除外)上述分析的普遍性以及在更低嵌入率時的有效性,對Bossbase 圖像庫中的所有圖像隱寫前后求八方向差分平均直方圖,此時嵌入0.4 bpp 信息,嵌入前后圖像庫的直方圖如圖5 所示。
圖5 信息嵌入前后的八方向差分平均直方圖
從圖5 中可以看出信息嵌入前后圖像直方圖變化的對稱性,即可以直接從圖像的八方向絕對差分直方圖來分析隱寫前后變化。這里定義?dh (0,1,,255 d =… )為圖像X 在如圖3 所示8 個方向上所有相鄰像素絕對差值等于d 的總的像素對數(shù),如式(4)所示。
分別對0.4 bpp、0.3 bpp、0.2 bpp、0.1 bpp 嵌入率下的Bossbase 圖像庫進行分析,如圖6、圖7 所示。圖7 中隱秘圖像和載體圖像的八方向絕對差分平均直方圖雖然在變化強度上不及圖6 明顯(嵌入率越低,對載體圖像的改動越少),但是依然能反映出隱寫前后圖像的變化,可以得出:嵌入前后圖像的八方向絕對差分直方圖在0、1 處頻數(shù)明顯不同,嵌入后圖像的頻數(shù)減小;而大于2 后,嵌入前圖像的頻數(shù)小于嵌入后;大于10 左右后嵌入前后圖像的統(tǒng)計分布幾乎吻合。EALSBMR 選擇某個方向上像素差值較大的區(qū)域進行嵌入,盡量保持了差分直方圖中差值較小的統(tǒng)計分布,但是由于這里考慮的是八方向的差值變化,相當于放大了隱寫產(chǎn)生的變化。EALSBMR 會在一定程度上改變圖像的?dh 直方圖分布,差值較小處的頻數(shù)減少,差值較大的頻數(shù)增加,且在0~10 范圍內(nèi)變化明顯。
圖6 信息嵌入前后的八方向絕對差分平均直方圖
圖7 0.1 bpp 嵌入前后圖像庫的八方向絕對差分平均直方圖
其中,i=1,2,…,11,d= 0,…10且i = d+ 1。得出11 維特征向量,輸入SVM 以完成隱寫檢測。
在實驗中,對EALSBMR,特別是低嵌入率(≤0.5 bpp)時進行檢測,并將檢測結(jié)果與目前典型的隱寫分析算法進行比較。在Bossbase 圖像庫中,分別對嵌入率為0.1 bpp、0.2 bpp、0.3 bpp、0.4 bpp、0.5 bpp 的EALSBMR 進行檢測,對于每一種嵌入率,作用于實驗數(shù)據(jù)庫后均生成同樣數(shù)目的隱秘圖片(stego),于是產(chǎn)生9074 對圖像(嵌入秘密信息前、后)。每次隨機地從9074 對圖像中選取其中的50%用作訓練,剩下的50%用作測試。特征集的檢測效果通過測試集上得到的準確率來評價,這里采用隱秘圖像檢測為隱秘圖像的正確率(TP)、原始載體圖像檢測為原始載體圖像的正確率(TN)和TN 和TP 的平均值(AR)。
考慮到文獻[9-10]是最近出現(xiàn)的且均是利用SVM 實現(xiàn)檢測,將本文算法的檢測結(jié)果與文獻[9]中的NIP 616d 特征、文獻[10]SPAM 686d 隱寫分析算法進行比較,采用Libsvm[11]工具箱、RBF 核函數(shù)構(gòu)建分類器,檢測結(jié)果如表1 所示。圖8 為不同嵌入率下3 種檢測算法的平均檢測率曲線。
表1 對EALSBMR 的檢測結(jié)果
圖8 不同嵌入率下3 種檢測算法的平均檢測率曲線
對于上述對比實驗的結(jié)果分析如下:
(1)上述的任一種隱寫分析算法在隱寫算法嵌入率越高的時候檢測效果越好。嵌入率越高,對圖像的改動越大,也就越容易檢測;反之,在低嵌入率條件下,檢測率都會降低。
(2)從圖像八方向差分直方圖提取出的特征對于EALSBMR 的檢測效果優(yōu)于SPAM 特征以及2011 年提出的NIP 特征。在嵌入率為0.5 bpp 時,八方向直方圖的特征檢測率可以達到97.12365%。這有可能是由于在NIP 以及SPAM 特征的提取過程中都存在閾值的操作,將差值限定在一個很小的范圍內(nèi)。而EALSBMR 首先選取差值較大的區(qū)域進行嵌入。所以,NIP、SPAM 這2 種隱寫分析算法在檢測EALSBMR 時效果不理想。
(3)在0.1 bpp 嵌入率條件下,3 種隱寫分析算法均未達到較好的檢測效果。因此,極低嵌入率時的隱寫對于隱寫分析來說仍是挑戰(zhàn)。
本文提出一種能有效地檢測EALSBMR 隱寫的分析算法。該算法首先計算圖像的八方向絕對差分直方圖,然后提取直方圖中隱寫前后變化較為明顯的頻數(shù)用來構(gòu)建特征向量,最后使用支持向量機完成檢測。該算法提取用于分析的特征維數(shù)少,計算復雜度低;并且對較低嵌入率下(≤0.5 bpp)的EALSBMR 隱寫圖像進行檢測,和目前典型的隱寫分析算法對比,實驗數(shù)據(jù)結(jié)果表明了該算法的檢測優(yōu)勢。
[1]楊曉元,趙世為,潘曉中. 基于像素相關(guān)性的數(shù)字圖像隱寫分析[J]. 計算機應用研究,2011,28(6): 2221-2223.
[2]Luo Weiqi,Huang Fangjun,Huang Jiwu. Edge Adaptive Image Steganography Based on LSB Matching Revisited[J].IEEE Transactions on Information Forensics and Security,2010,5(2): 201-214.
[3]秦姣華,孫星明,程小艷. 基于相鄰像素統(tǒng)計特性的LSB隱寫分析技術(shù)[J]. 系統(tǒng)仿真學報,2007,19(24): 5856-5860.
[4]王朔中,張新鵬,張衛(wèi)明. 以數(shù)字圖像為載體的隱寫分析研究進展[J]. 計算機學報,2009,32(7): 1247-1263.
[5]Mielikainen J. LSB Matching Revisited[J]. IEEE Signal Processing Letters,2006,13(5): 285-287.
[6]羅向陽,劉粉林,楊春芳,等. 一類自適應隱寫的更改比率估計[J]. 中國科學: 信息科學,2011,41(3): 297- 310.
[7]Kodovsky J,Fridrich J. On Dangers of Overtraining Steganography to Incomplete Cover Model[C]//Proceedings of the 13th ACM Multimedia Workshop on Multimedia and Security.New York,USA: [s. n.],2011.
[8]BOSSbase[EB/OL]. (2011-05-10). http://boss.gipsa-lab.grenobleinp.fr/.
[9]Guan Qingxiao,Dong Jing,Tan Tieniu. An Effective Image Steganalysis Method Based on Neighborhood Information of Pixels[C]//Proc. of the 18th IEEE International Conference on Image Processing. Brussels,Belgium: [s. n.],2011: 2721-2724.
[10] Pevny T,Bas P,Fridrich J. Steganalysis by Subtractive Pixel Adjacency Matrix[J]. IEEE Transactions on Information Forensics and Security,2010,5(2): 215-224.
[11] Lin Chih-Jen. LIBSVM Tools[EB/OL]. (2011-09-10). http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/.