王陳晨 李 哲 紀永泓 趙日軒 王海旭 趙晨光
(沈陽航空航天大學電子信息工程學院,遼寧 沈陽 110000)
圖像隱寫是一種將加密信息隱藏在載體圖像中,從而實現加密或隱藏通信的通信技術,在如今學科發(fā)展高度交互的背景下,隱寫技術在很多方面都發(fā)揮著重要且不可替代的作用,為信息的安全傳輸與解讀提供支持。目前的隱寫技術分析手段主要可分為專用隱寫分析和通用隱寫分析兩大類。在實際應用中,專用隱寫分析在檢測分析過程中的限制性較大,無法對不同種隱寫算法進行有效支持,不能真正實現盲檢測,導致無法進行廣泛性的應用。因此,通用隱寫分析的通用性研究顯得尤為重要,其分析技術也是一大研究熱點。目前國內外已有的隱寫檢測技術算法主要分為視覺檢測,特征碼檢測,統計檢測和通用盲檢測等[1],本文從經典隱寫算法入手,對不同隱寫算法及隱寫檢測方法做了介紹,并通過實驗進一步提高特征向量對隱秘信息的敏感度,改善檢測效果。
LSB隱寫因其操作簡單性和大容量從而受到了廣泛的應用。其中,LSB置換算法是一種常見的隱寫算法,它是通過對圖像LSB置換,實現對信息的加密和隱藏,并達到圖像隱寫目的的一種方法,經常被應用于無損圖像格的處理上。根據不同的置換方式和手段,置換法還可細分為貫序法和偽隨機間隔法。目前,常用的隱寫工具如StegoDos、S-tool、Hide&Seek、EZStego等,它們的工作機制均是利用置換法機制達到圖像隱寫目的。
卡方統計攻擊是對隱寫圖像的統計直方圖特征進行處理從而檢測圖像中是否含有加密信息。在對無損格式圖像進行處理分析時,往往通過替換圖像LSB來達到隱藏信息的目的,但這一分析方法將會使載體圖像的統計直方圖發(fā)生較大的變化。WestFeld根據這一特點,針對像素值對(PoVs)提出了隱寫分析算法。像素值對是指在信息嵌入時互換的兩個值,只有LSB位不同,其它位相同的兩個值才能構成像素值對。
首先對預加密的信息進行處理,并生成二值數據圖象,每一位數據都控制二值數據圖象的一個8*8的圖象塊的顏色值。再將所要加密或隱藏的數據圖象嵌入進算法生成的二值數據圖象中,最后按一定算法將其嵌入到載體圖象中,所生成的既是通過隱寫技術加密的含加密數據的圖象。
該算法的主要原理是使用JPEG圖像量化后的DCT系數的最低比特位來承載秘密信息,為了使算法有更強的安全性,要求不可以修改原始數值為1或者0的系數。
其算法步驟如下:
(1)選擇載體圖像,并且將載體圖像劃分為連續(xù)的8×8的子塊。對每個子塊使用離散余弦變換之后,用相應的質量因數的量化表量化,得到對應的8×8量化DCT子塊。
(2)將需要隱藏的信息編碼為二進制數據流,對DCT子塊系數進行Z字形掃描,并且使用秘密信息的二進制流替換非0和非1的DCT系數的最低比特位。
(3)進行熵編碼等,產生JPEG隱密圖像。嵌入流程如圖1。
圖1 JPEG圖像的秘密信息嵌入流程
設計方案中可以包括多個圖片集,通過JPHide工具、F5工具、Outguess工具、Invisible Secrets、Jsteg-shell等工具對目標圖片進行隱寫構成該圖片分析系統的樣本集,用于分類器數據的產生。
采用基于Fisher準則的線性分類器。還可以選擇基于支持向量機分類器[3]。圖像的通用隱寫分析一般包括圖像中進行數據獲取、進行預處理、特征向量提取、分類決策及分類器設計五個步驟。整個過程的關鍵是選取合理有效的特征向量作為分類依據,從而判斷圖像中是否含有隱寫信息。
圖像預處理:去除圖像的無效部分,恢復圖像的有效部分從而提高識別的準確率,為下一步的圖像特征提取部分降低難度。預處理的過程主要包括剪切、幾何變換、基于頻域與空域的圖像增強、小波變換、將彩色圖像轉換為灰度圖像等。
特征向量提?。菏紫纫_定圖像的信息隱藏域,先從圖像的信息隱藏域中提取特征向量,可以得到隱藏數據后改變了的載體統計特性的統計量。進一步分析圖像的空間域特征與變換域特征。其次是特征的計算,對待測試圖像進行3級Harr小波分解,將其分為若干子帶,進行離散傅里葉變換,分為高頻和低頻兩個頻帶,選擇每個頻帶的前3階統計矩作為特征,在眾多的特征的計算方法中具有較好的代表性。
分類器的設計:特征提取和分類器分類構成了隱寫分析的基本模型。因此,分類器的選擇與設計在隱寫分析中起到了重要作用,分類器的選擇會影響最終的分類正確率和計算的復雜度。Fisher線性判別分類器、支持向量機分類器、集成分類器等都是典型的分類器實例。在基于大數據的背景下,可以使分類器通過龐大的樣本訓練,提高其對圖片的分類能力,以達到更優(yōu)的圖像的隱寫分析效果。
不同的圖像隱寫系統會根據應用場景的不同側重于某一種或多種特性,而一個理想的信息隱寫系統,往往會考慮到近乎所有的特性,致力于達到一個均衡的狀態(tài)。以下是圖像隱寫系統的一般特性:
4.1 不可察覺性(Imperceptibility),即圖像嵌入隱寫信息后失真極小,無法直接被感知出來。統計不可知性指的是圖像隱寫前后數學統計噪聲分布等特性差異小,很難被統計相關的隱寫分析檢測出來。
4.2 信息嵌入量(Capability),信息嵌入量是載體嵌入隱寫信息的能力,即可隱寫信息容量。正常來說,載體隱寫信息的能力當然是越強越好,嵌入的隱寫信息當然是越多越好。
4.3 魯棒性(Robustness),提高魯棒性是抵抗信息丟失的核心手段。只要魯棒性足夠高,那么即使圖像經過再多處理,仍能保證隱寫信息不被破壞。
由表1可知,經DWT處理后的隱寫圖形的ER最大,LSB處理后的隱寫圖形的ER最小。嵌入率ER為原始圖片經隱寫后變化子像素(sub pixel)與所有子像素的比值,故ER越大,隱寫信息越多。在DWT算法編寫時有意的加入了自制的干擾信息,使得隱寫信息更加安全。經DWT處理后的隱寫圖形的嵌入率相對較大,故其嵌入效果更佳(圖2)。
表1 嵌入性評價指標
本文主要針對圖片的隱寫和隱寫分析,提出了不同的隱寫算法對圖片的隱寫嵌入與隱寫提取,并利用SRNet網絡來進行隱寫分析,主要包括以下兩個方面:
5.1 設計了LSB替換、DCT、DWT和Jsteg四種不同算法,針對圖片進行隱寫處理,其中包括隱寫的嵌入和提取,通過計算MSE和PSNR指數,判斷處理后的圖片失真度。
5.2 設計了SRNet神經網絡進行隱寫分析,主要卷積神經網絡進行特征的提取,通過訓練對圖片是否經過圖片隱寫處理的準確率很高。