關晴驍, 朱 杰, 趙險峰, 于海波, 劉長軍1中國科學院信息工程研究所信息安全國家重點實驗室, 北京 中國 100093 中國科學院大學網(wǎng)絡空間安全學院, 北京 中國 100093
隱寫術(Steganography)[1]是一種將信息隱藏至數(shù)字媒體文件中的技術, 該類技術對數(shù)字媒體文件的內容數(shù)據(jù)進行少量的極其輕微的修改, 從而可以將任意的計算機文件或信息嵌入到媒體文件內容的數(shù)據(jù)中, 同時不改變該媒體文件的格式信息、視覺外觀、媒體可理解的內容等因素, 具有不可見性。因此, 隱寫術是一種可對信息進行偽裝的信息隱藏技術。
與其他信息隱藏技術相比, 例如應用于版權保護或內容認證的信息隱藏技術相比, 例如數(shù)字水印[2]、可逆隱藏[3]等, 隱寫術主要注重抗檢測性及嵌入容量, 即在嵌入一定量的信息條件下, 盡可能地提升媒體文件的抗檢測性。因此, 隱寫術在嵌入信息時,盡可能減少對媒體文件內容數(shù)據(jù)的修改次數(shù)或統(tǒng)計特性的擾動, 并可以嵌入相對較長的信息。
隱寫術與傳統(tǒng)的加密方法相比, 也具有較大的差別。加密方法盡管能夠保護信息的內容不被他人獲取, 但加密后的數(shù)據(jù)具有異于常規(guī)明文數(shù)據(jù)的特性, 該類數(shù)據(jù)在傳輸過程中, 將暴露信息傳遞者發(fā)送加密數(shù)據(jù)這一行為,因此難以避免地會引起監(jiān)視方的懷疑和警覺。而隱寫術可使用正常媒體文件傳輸隱秘信息, 因此可使得數(shù)據(jù)的發(fā)送者以正常用戶的行為傳輸數(shù)據(jù), 不被引起懷疑, 可同時保護信息和信息傳輸?shù)男袨?。值得一提的? 隱寫和加密技術是并存關系, 傳輸者可使用任意加密方法將信息加密后嵌入至隱寫媒體, 接受者提取密文后進行相應的解密即可得到明文。
數(shù)字圖像是當前互聯(lián)網(wǎng)流傳最為廣泛的媒體信息載體之一, 大量的網(wǎng)站、社交平臺等用戶使用數(shù)量巨大的數(shù)字圖像傳遞信息, 普通的電子郵件中也有為數(shù)較多的圖像文件附件。互聯(lián)網(wǎng)上的圖像在傳遞信息的同時, 也可能被不法分子、敵對勢力等利用,進行失泄密、傳遞不法信息等。使用隱寫術在網(wǎng)絡空間傳遞隱寫圖像具有較高的隱蔽性, 信息傳遞雙方無需建立聯(lián)通關系, 接收方以普通用戶身份在公開的數(shù)據(jù)分享平臺下載含有隱秘信息的隱寫圖像,即完成信息的獲取。當前, 已經(jīng)有一些國內外使用隱寫術傳遞情報、進行犯罪活動的報道。例如在美國被捕獲的俄羅斯間諜安娜查普曼, 采用隱寫將情報信息隱藏在圖像中, 并發(fā)布在俄羅斯的某社交網(wǎng)站,以此傳遞情報信息, 為使用隱寫進行隱秘通信的典型案例。
為應對隱寫術可能帶來的危害, 隱寫分析(Steganalysis)方法應用而生, 另一方面, 進行隱寫術的研究也依賴于隱寫分析方法對其進行安全性驗證,因此不少的研究機構都開展相應的工作。近些年來,針對數(shù)字圖像的隱寫方法層出不窮, 因此本文主要論述的隱寫分析方法主要針對數(shù)字圖像進行隱寫檢測。一般而言, 針對數(shù)字圖像的隱寫分析方法具有以下幾方面的難點:
1) 隱寫嵌入的低擾動性。隱寫嵌入引起的修改對圖像擾動極小, 不僅不會破壞圖像的視覺內容,其修改幅度甚至低于某些圖像在成像時的噪聲幅度。
2) 圖像內容的掩蓋。數(shù)字圖像本身的內容相對隱寫嵌入引入的修改較強, 且圖像的拍攝內容、場景環(huán)境、光照的條件等都具有極大的復雜性、多樣性和不可控性, 無法用特定模型精確描述, 因此給隱寫檢測帶來較大的不確定性。
3) 數(shù)字圖像內容的部分隨機性。自然圖像多個像素值的最低比特位組成的比特串本身具有較強的隨機性, 即使在已知嵌入方法和嵌入?yún)?shù)的條件下,也無法通過從圖像中主動提取可能存在的隱寫信息來判別該圖像是否為隱寫圖像。
由于以上幾點原因, 隱寫分析通常采用統(tǒng)計判別的方法進行, 即采用從圖像中計算統(tǒng)計信息, 并據(jù)其進行判決該圖像是否為隱寫圖像。采用統(tǒng)計判別方法檢測隱寫圖像的基本前提為: 盡管隱寫嵌入信息在圖像視覺層面和局部信息不會造成可察覺的擾動, 但在一定程度上將破壞圖像數(shù)據(jù)的全局統(tǒng)計特性, 即對統(tǒng)計特性造成擾動, 因此可據(jù)此進行檢測。
根據(jù)適用范圍不同, 圖像隱寫分析可分為兩種,即針對特定隱寫術的分析方法和針對多種隱寫術的通用型分析方法。兩者具有較大的區(qū)別, 前者針對特定性隱寫術嵌入的分析方法在針對該隱寫術的特點進行設計, 能夠較為精確地進行檢測, 且該類方法一般提取的統(tǒng)計信息較少, 通常不需要采用分類器等方法, 直接以閾值進行判別。而后者不針對特定隱寫術方法設計, 而是在圖像中提取多個統(tǒng)計特征進行分析, 因此可針對廣泛類型的隱寫術進行檢測。由于通用型方法采用多個統(tǒng)計特征, 且無法顯式地對隱寫樣本和正常樣本兩類特征分布建模, 因此必須借助于分類器將特征映射至決策結果。分類器模型通過兩類樣本訓練得到, 即通過輸入大量正常圖像樣本和隱寫嵌入后圖像樣本的特征, 根據(jù)分類器訓練的方法訓練。因此通用型分析方法在訓練階段, 需要人為準備大量的訓練樣本。
在現(xiàn)實應用環(huán)境中, 所面臨的隱寫使用者可以動態(tài)選用多種不同的隱寫方法, 因此對于待測圖像,一般而言通常無法獲取其相關的隱寫術方法先驗知識, 即無法具體得知被檢測的圖像所使用的隱寫術種類, 因此通常只能采用通用型方法進行檢測。本文主要討論通用型圖像隱寫分析方法。
由于通用型隱寫分析方法通常采用特征和分類器進行, 因此其訓練分類器的過程至關重要, 其訓練過程中使用特征的有效性、維度等方面的因素均對隱寫分析的精度具有較大影響。針對當前主流的通用型隱寫分析方法特征維度高, 冗余特征多等問題, 本文提出一種特征選擇方法進行改進, 該方法主要基于線性規(guī)劃的特征選擇, 能夠較好地與當前基于高維隱寫分析特征使用的分類器方法進行結合,將基于線性規(guī)劃的特征選擇引入集成分類器的子分類器訓練中。該方法在減少子分類器所使用的特征維度, 提升其性能精度的同時, 也將每個子分類器的相互差異考慮在內。通過特征選擇模型的參數(shù), 均衡各個子分類器最終選用特征的差異程度。實驗證明該方法能夠有效提升通用型隱寫分析的性能。
本文的以下章節(jié)內容按照以下組織: 第二章主要介紹通用型隱寫分析方法的一般性流程, 并回顧了隱寫分析特征和分類器的相關工作。第三章主要介紹本文方法涉及到的兩種高維特征以及用于隱寫分析的集成分類器。第四章是本文主要章節(jié), 回顧了針對于通用型隱寫分析方法的特征選擇方法, 并提出基于線性規(guī)劃的隱寫分析特征選擇方法及其與集成分類器結合的方法。第五章是實驗部分, 主要對比了采用特征選擇策略前后的檢測性能。第六章是結論, 總結了本文的工作并展望未來的工作。
通用型隱寫分析主要依賴與特征和分類器, 因此隱寫分析特征和分類器的設計是通用型隱寫分析的核心問題。本章的以下小節(jié)介紹相關的工作。
隱寫分析特征是通用型隱寫分析所以來的基本信息。分析隱寫特征通常是從圖像中計算得到的一組數(shù)據(jù), 因此可視為一個包含多個數(shù)值的向量。由于圖像本身內容的復雜性和多樣性對隱寫特征概率分布具有影響, 理想的隱寫分析特征是能夠表達隱寫圖像和正常圖像的差距, 即正常圖像集與隱寫圖像集提取的特征分布差異盡可能較大。為此, 隱寫分析的特征需要對隱寫引入的修改較為敏感。
當前, 已經(jīng)有一些隱寫分析特征, 根據(jù)其針對的圖像格式不同, 可分為兩種, 即針對空域圖像的特征和針對JPEG圖像的特征。從技術路線的方式劃分, 特征可分為早期的低維特征和近期的高維特征。以下分別對具有典型性的特征進行介紹。
1) 空域圖像包含BMP、PNG、PGM等格式, 該類格式圖像直接存儲像素的灰度值。自然空域圖像的相鄰像素之間具有一定的相關性, 因此針對空域圖像隱寫分析特征主要通過表達像素間相關性被隱寫破壞的情況, 對隱寫嵌入進行表達。針對空域圖像的特征早期采用信號分解的方式, 如利用小波分解等, 在各個頻帶提取峰度、偏度、方差等作為特征[4]。隨后, 以馬爾可夫轉移模型為代表的特征成為主流,該類方法將圖像相鄰像素的變化建模為馬爾可夫過程, 在差分圖像上統(tǒng)計馬爾可夫概率轉移矩陣作為特征, 馬爾可夫類特征以SPAM特征[5]較為具備代表性。SPAM特征在差分圖像上統(tǒng)計二階馬爾可夫轉移矩陣。空域圖像的特征隨后被擴展至高維特征, 與低維特征使用單一的差分方法濾波相比, 高維特征使用更多的濾波器并計算高階共生矩陣, 得到多組特征并進行組合, 該類特征以SRM[6]和PSRM[7]為代表。高維特征在檢測性能方面相比之前的特征具有較大的提高。
2) JPEG圖像是一種常見的壓縮格式圖像, 其存儲的基本信息為JPEG分塊DCT變換并經(jīng)過量化后的DCT系數(shù)。JPEG隱寫分析特征隨著JPEG圖像隱寫術的發(fā)展而出現(xiàn)。早期的JPEG在JPEG圖像存儲的DCT系數(shù)中提取統(tǒng)計特征, 與空域特征有一定的類似性, 如Chen等人提出的JPEG馬爾可夫特征[8],將塊內相鄰的 DCT系數(shù)變化建模成馬爾可夫過程?;贘PEG圖像分塊DCT變換的特點, Pevny等人提出了一組著名的 JPEG隱寫分析特征 PEV274[9], 該特征共 274維, 由多種統(tǒng)計量組成, 包括DCT系數(shù)的全局直方圖和某些頻段的直方圖、多種DCT系數(shù)的共生矩陣、塊間的差分統(tǒng)計值、馬爾可夫轉移矩陣等, 此外, 該特征還采用了校正技術(Calibration),即將JPEG圖像解壓縮至空域后, 切除左邊四列和上方的四行, 然后重新壓縮成為JPEG圖像, 得到校正圖像。該特征分別在原圖像和校正圖像提取特征, 然后相減得到校正后的特征。實驗表明校正過程有利于增強特征對隱寫嵌入的敏感性。該特征隨后還被推廣至PEV548特征[10], 采用拼接代替相減, 使其維度增加一倍。校正的方法在隨后也出現(xiàn)的多種JPEG高維隱寫分析特征方面有所體現(xiàn), 如 CC-JRM[11]、DCTR[12]、GFR[13]等, 均可以視為采用了校正及其擴展的技術, 該類特征在檢測隱寫術方面精度也有較多的提升。
在本文的工作中, 主要使用了空域圖像的 SRM特征和JPEG圖像的DCTR特征, 因此在第3章中將介紹這兩種特征的計算方法。
通用性隱寫分析利用多個統(tǒng)計特征表達隱寫術擾動情況, 與專用型隱寫分析方法使用簡單的統(tǒng)計量相比, 其工作原理難以直接顯式地表達出來, 因此需要借助訓練得到分類器模型。通用型隱寫分析在這方面的工作主要以借鑒和應用在統(tǒng)計學習領域中的分類器工作為主要途徑。早期的隱寫分析特征維度較低, 一般不超過 1000維, 對此使用的分類器有支持向量機、神經(jīng)網(wǎng)絡等。其中以使用高斯核和多項式核的支持向量機較為普遍, 成為通用型隱寫分析的主流分類器。隨著新型的高安全性隱寫術出現(xiàn), 傳統(tǒng)的特征難以對圖像進行有效表達, 因此出現(xiàn)了高維特征。高維特征的維度較傳統(tǒng)特征具有大幅增加, 因此支持向量機難以勝任。因此, 出現(xiàn)了集成FLD分類器的方法[14], 該方法利用多個子分類器進行投票決策, 每個子分類器只使用部分特征, 因此克復了對高維特征容易過學習的問題, 此外還具有較高的訓練速度, 可處理大量的數(shù)據(jù)。本文的第3章將對集成分類器進行詳細介紹。
當前, 高維特征和集成分類器已經(jīng)成為主流的通用型隱寫分析方法, 該種方法不僅對傳統(tǒng)的隱寫術具有更高的檢測性能, 對于多種新型的隱寫術,其檢測性能也大幅度超越傳統(tǒng)的方法。本文論述的方法主要基于高維特征和集成分類器, 因此該方法是本文論述的方法的基礎, 為此, 本章對高維特征和集成分類器進行詳細介紹, 其中, 高維特征包含針對空域圖像的 SRM 特征以及針對 JPEG圖像的DCTR特征。
SRM(Spatial Rich Model)特征集由 Kodovsky等人提出, 是當前針對空域圖像隱寫分析特征中最為成功的特征集之一。SRM特征較之傳統(tǒng)的空域隱寫分析特征, 如686維的SPAM特征等, 均都具有較大的檢測性能優(yōu)勢。SRM 具有以下幾個特點: 使用了多種濾波器、多種量化因子提取特征并進行組合, 因此維度較高, 高達 32000維。在計算特征的過程中,SRM 采用了四階共生矩陣作為統(tǒng)計量, 在多個方向上計算四階共生矩陣, 并根據(jù)多種對稱性合并準則合并共生矩陣元素多個元素。
SRM特征包含了多種統(tǒng)計像素鄰域的特征子集,因此SRM特征能夠檢測更多的隱寫嵌入算法。SRM每種特征子集的計算過程都遵循相同的計算模型,即空域圖像濾波后的經(jīng)過量化(Quantization)、截斷(Truncation), 最后統(tǒng)計共生矩陣并對其進行縮并和合并后得到。以下介紹分別SRM的濾波、量化和截斷及其統(tǒng)計共生矩陣的過程。
3.1.1 SRM的濾波過程
SRM 特征具有較多的特征子集, 能夠對各類內容復雜的圖像進行表達, 以反映其被隱寫術嵌入的情況。SRM特征的豐富性和多樣性主要由多種類型的濾波器產(chǎn)生。其濾波器包括兩種, 第一種是線性濾波器, 包括一階和高階差分、特定的濾波核濾波等,另外一種是非線性濾波器, 主要采用最大和最小濾波, 其濾波方式是首先采用同類型不同方向的多個線性濾波核進行濾波, 然后取多個濾波值的最大或者最小值。
3.1.2 SRM的量化與截斷
SRM 對濾波后的圖像進行量化和截斷, 量化和截斷操作主要是使濾波后的圖像更加適用于高階共生矩陣計算, 即使用截斷操作控制濾波后像素值的取值范圍, 以控制高階共生矩陣的維度, 使用量化以使得不同的變化程度的濾波值都能反應在特征中。
SRM 對于同一張濾波后的圖像, 采用多個量化因子, 得到多張量化后的圖像, 分別進行截斷操作后計算共生矩陣, 在增加特征豐富程度的同時控制特征總體維度。SRM采用的量化因子q與濾波器階數(shù)c有關, 例如采用一階差分濾波及其構造的最大最小濾波器。對于不同的濾波器, SRM采用三種量化因子, 即取濾波器階數(shù)的1倍、1.5倍、2倍。因此, 對于每一種濾波器, SRM可均提取三組特征。
截斷操作是指對量化后的濾波圖像中的像素值,進行閾值截斷操作。SRM的截斷操作為雙邊截斷操作, 其截斷函數(shù)把大于閾值?的像素值置為?, 小于??的像素值置為??, 因此在截斷操作完成后, 截斷后濾波圖像的像素值取值范圍為???,??之間的2??1個整數(shù)。截斷操作控制了像素值取值范圍, 能夠在后續(xù)計算共生矩陣過程中控制共生矩陣的規(guī)模,從而控制整體特征的維度。
3.1.3 SRM的共生矩陣計算
SRM通過計算濾波后圖像的四階共生矩陣來表達像素之間的依賴性和相關性, 從而反應隱寫術對圖像的擾動。共生矩陣反映的是由像素組成的結構元類型在圖像中出現(xiàn)的頻率。SRM中的四階共生矩陣的計算在截斷后的濾波圖像上進行, 其基本結構元為截斷后濾波圖像中的四個相鄰的像素, 按照結構元像素排列的方向, 共生矩陣分為水平方向和垂直方向兩種。由于濾波后圖像的像素值經(jīng)過截斷后取值為???,??, 因此SRM中四階共生矩陣結構元共有?2??1??種類型。本文以下以結構元包含的四個像素的像素值???,??,??,???表示結構元的類型, 其中??,??,??,??∈???,??。SRM統(tǒng)計每一種結構元在截斷后的濾波圖像中出現(xiàn)的頻次, 組成四階共生矩陣, 并將其歸一化, 用C???,??,??,???表示結構元???,??,??,???在共生矩陣中對應的數(shù)值。
SRM 在得到各個濾波后圖像的共生矩陣以后,對每個共生矩陣均進行對稱化合并。合并共生矩陣的方式主要包含兩個操作步驟:
第一個步驟是沿對稱方向合并, 把從左至右(從上到下)和從右至左(從下到上)出現(xiàn)的四個元素相同的結構元視為同一類, 將其在共生矩陣中對應的元素合并, 得到新的共生矩陣, 第二步驟是按照符號對稱合并, 即對共生矩陣中, 將其對應的結構元只存在符號相差的元素進行合并。SRM通過合并共生矩陣中的一些元素, 縮減了特征維度, 使得在同樣的維度下, 可容納更多的特征子集, 增強特征的豐富程度。另一方面, 統(tǒng)計特征通過大量的統(tǒng)計量來反映圖像被隱寫術修改的狀況, 因此統(tǒng)計量的單元數(shù)目越多, 特征越能夠穩(wěn)定地反應隱寫修改的情況。
DCTR(Discrete Cosine Transform Residual)特征集是一種針對JPEG圖像進行隱寫分析的新型特征, 該特征也屬于高維特征。對當前包括新型自適應隱寫術在內的多種隱寫術, 該特征均具有較好的檢測性能。DCTR特征由64個濾波后圖像上的直方圖統(tǒng)計得到。濾波圖像分別由64個DCT卷積核對JPEG圖像解壓縮后的空域圖像卷積所得。隨后對濾波后的圖像的數(shù)據(jù)還進行了量化、取整、截斷操作。與之前的JPEG高維特征CC-JRM[6]相比, DCTR特征的計算復雜度和特征維數(shù)均更低, 總共 8000維, 但是隱寫分析準確率并沒有下降, 且針對某些隱寫嵌入算法時, DCTR特征的隱寫分析準確率要高于CC-JRM, 因此是當前較為先進的 JPEG高維隱寫分析特征。
DCTR特征從JPEG圖像Y通道的空域數(shù)據(jù)中提取, 使用多個 2維 DCT濾波器獲取濾波后的圖像,隨后進行量化和截斷, 并進行降采樣, 最后并計算降采樣圖像的直方圖并合并。具體過程如以下小節(jié)所示。
3.2.1 DCTR的濾波過程
濾波時 DCTR特征計算過程的第一個步驟。由于濾波是在空域的亮度通道(Y通道)進行, 因此需要先將JPEG圖像解壓到空域, 即首先根據(jù)圖像的量化表將圖像的Y通道每個8×8分塊的DCT系數(shù)進行反量化, 隨后反變換為空域像素灰度值。與普通的JPEG圖像解壓縮過程不同, 在此處的DCT逆變換后,對像素灰度值不進行取整, 仍然保持為浮點數(shù)。對圖像Y通道數(shù)據(jù), 分別使用64個二維8×8的2維DCT變換基進行濾波, 得到64張濾波后的圖像。
3.2.2 DCTR的量化和截斷過程
濾波完成后, 對濾波后的圖像的像素取絕對值,隨后采用一個量化因子對其進行量化。量化因子根據(jù)該JPEG圖像量化表對應的品質因子決定。
對量化后的濾波圖像中各個像素進行截斷操作。截斷操作如下所示, 當像素的數(shù)值大于閾值?時, 將其設為?。截斷操作如下所示:
其中, ??,?為濾波后圖像在??,??位置像素的像素值, ?為截斷閾值。在DCTR中, ??4, 由于濾波后的圖像像素數(shù)值做了取絕對值操作, 因此濾波圖像各個像素數(shù)值在截斷后取值范圍為?0,??。
3.2.3 DCTR的直方圖統(tǒng)計
對截斷后的濾波圖像, 進行直方圖計算。直方圖計算不直接計算全圖的直方圖, 而是進行以 8為間隔降采樣后進行。對于降采樣, 由于可以在縱向和橫向各偏移不同個數(shù)的像素后進行降采樣, 因此根據(jù)偏移不同, 以8為間隔的降采樣具有64種方式, 即每個濾波圖像都有64個降采樣圖像。對每個降采樣圖像都計算直方圖, 并對直方圖進行歸一化。
對于每個濾波后圖像提取的64直方圖, 按照一定的規(guī)則進行合并。注意到對于濾波后圖像中任意一個像素的數(shù)值, 是通過8×8的DCT基與原圖像中一個8×8塊的像素計算得來, 該8×8塊像素塊相對于JPEG本身的8×8分塊的相對位置呈現(xiàn)一定的關系。對于任意一個降采樣的圖像, 其像素數(shù)值計算過程中涉及到的8×8塊像素塊與JPEG的8×8分塊的相對關系呈周期性出現(xiàn)。另一方面, 對于??,"?偏移的降采樣圖像, 另外三張(某些位置為一張或者兩張)降采樣圖像?8?x,y?, ?x,8?y?, (8?x,8?y)的數(shù)值計算涉及到的8#8塊像素塊與 JPEG的 8×8分塊的相對關系與??,"?相同。因此將??,"?,?8??,"?,??,8?"?,?8??,8?"?四張圖像計算得到的直方圖進行合并。由此將64個直方圖合并后得到共25個直方圖。
隱寫分析依賴于分類器根據(jù)特征進行檢測, 分類器是隱寫分析重要的組成部分。傳統(tǒng)的隱寫分析采用核支持向量機(Kernel Support Vector Machine,KSVM)[9]等作為分類器, 隨著特征維度的增大, 單獨使用支持向量機已經(jīng)難以應對, 會出現(xiàn)訓練困難、過學習等問題。為適應高維特征, 當前基于高維特征的隱寫分析一般采用FLD集成分類器, FLD集成分類器[10]采用 Fisher線性判決分類器(Fisher Linear Discriminant, FLD)作為子分類器, 多個子分類器分別預測后, 對結果進行投票融合, 得到最終的預測結果。集成分類器中的每個子分類器只使用隨機抽取的部分特征, 因此避免了過學習的問題。在訓練階段, 每個投票融合階段, 所有的子分類器的判決結果聯(lián)合預測, 增強了判決的精度, 如圖1所示。
集成分類器依次訓練多個子分類器, 即每次隨機選擇使用部分特征, 將訓練樣本的該部分特征抽出, 訓練子分類器。由于每個子分類器使用的特征均是隨機從高維特征中隨機抽取的不同子集, 因此訓練多個子分類器后, 高維特征中所有的特征均被使用。集成分類器一般具有兩個參數(shù), 即子分類器所使用的特征子集的維度?以及子分類器的個數(shù)$。?和$的取值主要由搜索得到, 搜索的依據(jù)主要是訓練樣本的錯誤率, 使用訓練樣本錯誤率最小時的參數(shù)。?取合適的值時, 能夠充分地利用高維特征同時避免過學習, ?的最優(yōu)值隨特征不同而不同, 一般而言,最優(yōu)值取值范圍為600~1200。對于?的某個取值,當$增大到一定程度時分類器性能指標趨向于穩(wěn)定, 選取此時的$作為當前?取值下的最優(yōu)$參數(shù), 隨后繼續(xù)搜索計算?不同的取值。
圖1 集成分類器檢測過程示意圖Figure 1 Steganographic detection with ensemble classifier
當前的隱寫分析特征一般采用高維特征, 增加特征豐富程度是增強檢測精度的有效方法。但另一方面, 在增加特征數(shù)量的同時, 也不可避免地增加一些無效特征、或是具有冗余信息的特征, 這些特征在分類器訓練階段, 將對其造成一定的影響, 如訓練的分類器模型精度降低、分類器容易過學習等。為此, 需要從原始的特征集合中進行特征選擇, 將有效性高、冗余性小的特征子集選擇出來。盡管當前已有一些特征選擇的工作在隱寫分析方面得到應用[15], 但該類工作基本集中于針對傳統(tǒng)的低維特征進行, 無法應用于當前的高維特征。文獻[16]中的方法是為數(shù)不多的針對高維隱寫分析特征的方法, 但該方法較少的考慮了特征之間的冗余性, 且沒有針對集成分類器進行優(yōu)化。針對高維特征和集成分類器的特征選擇具有以下幾個難點:
1) 特征選擇方法一般采用監(jiān)督學習方法進行,因此在樣本數(shù)量有限的條件下, 采用該類方法直接從高維特征中選擇特征子集難以避免高維特征帶來的過學習的問題。
2) 難以與集成分類器結合。由于集成分類器進行檢測時通過多個子分類器的檢測結果投票決定,因此根據(jù)集成學習的理論, 子分類器在保證精度的同時, 還需要使得多個子分類器對不同的樣本檢測結果具有多樣性。因此傳統(tǒng)的特征選擇方法只考慮選擇特征的有效性, 不考慮多個子分類器使用的特征多樣性和有效性, 也沒有對集成分類器方法進行設計。
為解決以上兩個問題, 本文針對高維特征的特征選擇方法進行研究, 主要采用線性規(guī)劃方法對集成分類器中的各個子分類器所使用的特征集進行特征選擇, 通過調節(jié)每次特征選擇的參數(shù)更新保證不同子分類器選擇的特征的有效性和多樣性。本章以兩小節(jié)將介紹線性規(guī)劃特征選擇模型及其與集成分類器和結合方法。
本章4.2~4.3節(jié)論述線性規(guī)劃特征選擇模型及其計算方法, 4.4節(jié)論述該特征選擇模型與集成分類器的多個子分類器訓練結合的方法。
基于線性規(guī)劃方法的特征選擇方法通過兩類樣本構建具有一定意義的選擇模型進行特征選擇, 其選擇的過程為求解特征選擇模型的優(yōu)化問題, 求解模型后得到每個特征對應的權值參數(shù), 隨后據(jù)此進行特征選擇。該方法的選擇模型問題如下:
由以上模型可以觀察到, 該模型的目標由兩部分組成, 即分類誤差項和特征選擇懲罰項λ??|)|, 通過約束條件可知, 分類誤差項是在分類加權參數(shù))對兩類樣本特征進行投影后偏離分界面界限4或5的距離誤差, λ??|)|對)中元素的數(shù)值進行懲罰, 由于?中的元素大于等于0且λ 3 0, 因此該項對目標函數(shù)的影響由三方面決定, 其中, λ決定該項對目標函數(shù)的整體影響, ?中的元素數(shù)值越大則)中相應的元素影響越大, 該兩項為設定的參數(shù), 而)為求解的結果, |)|表示絕對值越大的元素對目標函數(shù)影響越大。通過以上的模型可以看出, 增加λ值,則模型求解的)中的元素趨向于 0, 因此調節(jié)λ至不同程度可使得求解的結果中)具有不同數(shù)量的元素等于 0, 據(jù)此模型進行特征選擇, 即將)中不為零的系數(shù)所對應的特征作為特征選擇的結果。
需要說明的是, 類似于支持向量機的原理, 盡管在模型(1)中邊界值為設定的數(shù)值–1和 1, 但對該邊界值任意進行縮放或平移并不影響選擇結果, 因為使用值平移邊界值時, 因為模型中偏置值/的存在,在求解的過程中, 求解得到的模型最優(yōu)解中的/值會自行進行相應的平移補償。由于該模型選擇的特征的個數(shù)通過調節(jié)λ并求解模型得到, 因此當邊界值按照某個尺度縮放后, 只要將λ按照同樣的因子縮放,模型在求解后選擇的特征與之相同, 該過程論述如下, 考慮將問題(1)邊界值1和–1替換成6和?6, 則問題(1)修改為以下模型問題(1)*:
注意到6大于0, 問題(1)*可寫為
即與原問題(1)相同。
該特征選擇的模型的目標函數(shù)中, 采用)的絕對值加權和, 這種方法對于特征選擇具有較好的稀疏特性, 盡管也有其他的方法使得)中不為0的系數(shù)對目標將函數(shù)產(chǎn)生懲罰項的影響, 例如使用加權的平方和λ??‖)‖?,‖)‖???,…,, 盡管使用加權的平方和作為懲罰項在求解時具有便利性,但當)中的元素小于 1時, 取平方后的該數(shù)值較小,對目標函數(shù)產(chǎn)生的懲罰影響較小, 因此使用二次方作為懲罰項時, 求解的)中多個元素難以趨向于 0,即加權的平方和懲罰項不具備較好的特征選擇特性。
本節(jié)主要介紹 4.2節(jié)中(1)式描述的特征選擇模型求解方法。由于(1)中具有λ??|)|項的存在, 因此該問題的目標函數(shù)不具備高階光滑性。為此, 本文的方法中采用線性規(guī)劃方法求解, 即將該問題轉換為一個對偶的線性規(guī)劃求解的問題, 通過一定的方法構造線性規(guī)劃問題的目標函數(shù)和線性約束條件, 保證該線性規(guī)劃問題的解與原特征選擇問題(1)的解一致。觀察(1)式, 其主要困難在于目標函數(shù)中對)的元素取絕對值, 因此, 對原問題的)中的每個元素分解為兩個非負變量的相減, 并構建對偶的問題求解。為此,引入2?個輔助變量令并構建以下線性規(guī)劃問題:
注意到, 在以上線性規(guī)劃問題(2)中, 需要求解的變量)?,)?,/,+關于目標函數(shù)和約束條件均為線性關系或線性不等式關系, 因此可以使用線性規(guī)劃的方法求解, 求解得到以上問題(2)的最優(yōu)解)?和)?后, 令)?)??)?既是原特征選擇問題(1)的最優(yōu)解。本小節(jié)以下部分對該結論進行證明。
首先證明以下結論: 如果)??,)??,+??,+??是問題(2)的最優(yōu)解, 則對任意的1≤<≤?,和中不可能同時大于0。假設在)??和)??中存在3 0且3 0, 則可據(jù)此構建另一個符合問題(2)約束條件但使其目標函數(shù)取值更小的可行解其構建方法如下所示:
以上與)??,)??,+??,+??是問題(2)的最優(yōu)解矛盾,因此結論得證。
通過將問題(1)的求解轉換為線性規(guī)劃問題避免了求解過程中的困難, 使其可使用標準的線性規(guī)劃方法求得精確解, 保證了求解的精度和效率。
基于高維特征的隱寫分析方法均需要使用集成分類器, 因此本文論述的特征選擇方法需要與訓練集成分類器的過程進行結合。在特征選擇的過程中,可采用有兩種特征選擇方案:
1) 從高維特征中選擇一個特征子集, 作為集成分類器使用的特征, 集成分類器在訓練時, 每個子分類器僅在該特征子集中隨機抽取部分特征使用。
2) 集成分類器在訓練時, 對于每個子分類器,均在高維特征中隨機抽取部分特征后, 再經(jīng)過特征選擇留下部分特征中的一個子集使用。
以上兩種方法中, 第一種方法在特征選擇時需要使用高維特征包含的所有特征, 因此容易引起過學習等問題, 且無法控制每個子分類器選擇特征的差異性。因此本文采用第二種方法, 在第二種方法中,由于會經(jīng)過特征選擇過程, 因此集成分類器的子分類器在此之前抽取的高維特征的部分特征維度相對較大, 以保證其抽取的特征子集中具有足夠多的有效且多樣的特征供特征選擇。
根據(jù)集成學習的理論, 集成分類器的精度不僅取決于子分類器的決策精度, 還依賴于不同子分類器決策結果的多樣性, 增加多樣性可以顯著提升檢測精度。在高維特征隱寫分析的集成分類器中, 子分類器的多樣性程度主要與其抽取的特征子集大小有關。在未使用特征選擇時, 子分類器抽取的特征子集越大, 則可利用的特征越多, 但與此同時, 不同的子分類器使用的特征子集相互重疊的特征也較多, 從而導致其多樣性降低。因此子分類器在使用具有較好檢測精度的特征的同時, 還需要保證不同子分類器所選擇的特征的差異性。
本文的特征選擇方法主要適應集成分類器在訓練子分類器時的多樣性和精度要求, 利用選擇模型的誤差項和懲罰項分別保證子分類器的檢測精度和不同子分類選擇特征的多樣性。如圖2所示, 結合了本文提出的特征選擇方法的集成分類器在訓練時,仍然依次訓練多個子分類器, 且每個子分類器仍從高維特征中隨機抽取部分特征集, 但子分類器在訓練前, 先進行特征選擇, 即從抽取的特征中選擇特征使用。利用模型懲罰項的中的特征選擇權值?控制每個子分類器選擇的特征的多樣性, 當高維特征中某個特征被子分類器選擇后, 其懲罰權值將增高,因此該特征在隨后的子分類器訓練時, 如果被抽中,則在其隨后的子分類特征選擇中被選擇的可能性將降低。本文的方法中, 采用一個權值增長比例因子α 3 1進行控制, 當某個特征被選中后, 該特征的權值將會乘以α, 因此當該特征被下一個分類器在訓練時被抽選到時, 在其特征選擇階段, 被選擇的可能性將降低。
在算法1中, α的數(shù)值決定各個子分類器特征選擇的差異性, 該參數(shù)越大, 則差異性越大, 反之越小。以上的參數(shù)中, Seed可任意選擇, 對分類器最終訓練的結果影響較小。由于存在特征選擇步驟, 因此在子分類器訓練時, 一般將初次抽取的特征子集維度設置較大。在算法1中, 子分類器的個數(shù)、子分類器抽取的特征維數(shù)?、以及子分類器最終選擇的特征子集維度??為輸入?yún)?shù), 該參數(shù)也可使用自動搜尋獲取,根據(jù)文獻[14]中描述的方法, 在每次訓練子分類器時均采用bootstrap策略以抽取放回的方式抽取部分樣本訓練子分類器, 留下未使用的樣本評估其錯誤率,將錯誤率達到最小且穩(wěn)定時的參數(shù)作為最優(yōu)參數(shù)。
算法 1:基于線性規(guī)劃的集成分類器特征選擇方法
子分類器抽取的特征維度?, 最終選擇的特征維度??
輸出: 集成分類器, 多個子分類器特征選擇結果權值向量)???1,2,…,M
For ??1 to M
1. 根據(jù)seed?抽取第?個分類器所使用的?維特征 子 集 , 從抽 取1,2,…,1,在I?中取出特征子集所對應的權值組成??。
3. 根據(jù)特征選擇結果)?選擇特征子集中的部分特征, 訓練第?個子分類器。
4. 更新權值, 將最終被選擇的特征在I?中對應的權值乘以增長因子α, 得到
end
圖2 子分類器訓練中特征選擇權值更新示意圖Figure 2 Renewing weight for feature selection in base classifier training
本章主要論述對本文提出方法的試驗結果, 包含對實驗環(huán)境和數(shù)據(jù)的說明、實驗評價指標、對比試驗數(shù)據(jù)等, 以驗證本文方法的有效性。
本文實驗采用標準的圖像數(shù)據(jù)庫BOSS V1.02[17]
進行。BOSS V1.02數(shù)據(jù)庫是當前隱寫術和隱寫分析研究中評價算法性能的標準實驗圖像數(shù)據(jù)庫, 該數(shù)據(jù)庫包含 10000張未經(jīng)壓縮的正常灰度圖像, 格式為存儲灰度空域圖像的專用格式PGM。BOSS圖像數(shù)據(jù)庫中的圖像由 6款相機拍攝, 拍攝后通過統(tǒng)一的算法和裁剪處理成為統(tǒng)一尺寸為512#512。BOSS圖像數(shù)據(jù)庫包含廣泛題材的圖像內容, 包含不同光照條件和地點的室內室外場景、建筑、動物、人物等。在本章實驗中, 分別驗證本文方法針對空域圖像和JPEG圖像進行隱寫分析的性能, 因此需要準備空域格式和JPEG格式的正常圖像。其中, 空域格式的正常圖像直接使用 BOSS圖像數(shù)據(jù)庫所包含的圖像, JPEG格式的正常圖像由BOSS圖像數(shù)據(jù)庫圖像通過JPEG壓縮得到, 壓縮質量因子分別取95和85, 以驗證本文的方法對不同品質因子的JPEG圖像的隱寫分析性能。因此, 正常樣本一共有三組, 即空域圖像、品質因子分別為95和85的JPEG圖像。以上三組每組均包含10000張圖像。
本文實驗所涉及隱寫方法包含 5種, 分別是針對空域圖像的 WOW[18]、S-Uniward[19]、HILL[20]以及針對JPEG圖像的UED[21]、J-Uniward[19]。以上5中隱寫方法均為當前先進的自適應隱寫方法中的代表性方法, 其安全程度較高。為生成實驗使用的隱寫圖像樣本, 分別采用以上5種方法, 對空域正常圖像和JPEG正常圖像進行嵌入, 并得到隱寫圖像。在嵌入的過程中, 對每一種算法均生成不同嵌入率的隱寫圖像, 以測試本文方法在不同嵌入率時的。嵌入率代表嵌入的消息的相對長度, 本文實驗中, 嵌入率取值均為0.1、0.2、0.3三種??沼驁D像的嵌入率表示嵌入的信息比特數(shù)與圖像尺寸之比, JPEG圖像的嵌入率表示嵌入的信息比特數(shù)與 JPEG圖像亮度通道非零交流系數(shù)個數(shù)之比。因此, 本文實驗中包含的隱寫圖像共有 21組, 即空域圖像共 9組(3種算法、3種嵌入率), JPEG圖像共12組(2種算法、3種嵌入率、2種品質因子)。
本文的對比試驗包括兩種方法, 分別為僅使用集成分類器的方法, 以及本文提出的使用了特征選擇集成分類器的方法。在同一組實驗中, 兩種方法采用的特征相同, 針對空域圖像, 采用的特征均為32000維的SRM特征, 針對JPEG圖像, 采用的特征均為8000維的DCTR特征。
由于分類器模型需要通過訓練得到, 因此對于隱寫樣本和正常樣本, 需要劃分為訓練樣本和測試樣本兩個不相交的樣本集, 測試樣本用于測試隱寫檢測方法的精度。本文的實驗中, 每一組實驗均采用從樣本集中隨機抽取的正常樣本和隱寫樣本各 5000張, 剩余的正常樣本和隱寫樣本各5000張作為測試樣本。
實驗的評價指標為檢測正確率, 正確率越高即表示檢測精度越好, 算法性能越高。正確率計算方法為對隱寫和正常兩類樣本檢測的正確率的平均值。每類樣本的正確率即為該類測試樣本中被正確檢測樣本個數(shù)的占比, 例如, 在用于測試的樣本中, 共有正常樣本和隱寫樣本各5000個, 其中正常樣本中有4800個檢測結果為正常樣本, 隱寫樣本中有4500個被檢測為隱寫樣本, 則對與正常樣本和隱寫樣本的正確率分別為96%、90%, 該算法的正確率為93%。
在本方法中, 涉及控制不同子分類器特征選擇模型中??更新的參數(shù)α, 如 4.4節(jié)所示。參數(shù)α越大,則越傾向于增加不同子分類器特征選擇的多樣性。為研究該參數(shù)的影響, 本實驗測試對比不同α參數(shù)下的性能。
本節(jié)實驗結果分為兩部分, 第一部分為本算法與普通時用集成分類器的算法的對比, 對比試驗結果如下表 1所示, 表中最后兩行分別為本文方法機器對比方法的檢測準確率:
表1 對比試驗結果Table 1 Comparison experimental results
第二部分為本文方法在不同的參數(shù)α時的性能對比, 如表2所示:
從實驗結果可知, 對于以上多種算法和圖像格式的隱寫分析中, 采用本文方法比不使用特征選擇方法性能具有一定的提升, 因此驗證了本文提出的特征選擇方法的有效性, 在實驗過程中, 子分類器抽取的特征子集維度以及從中進行特征選擇后留下的特征集維度是關鍵參數(shù), 該參數(shù)可以使用參數(shù)搜索的方法進行選擇, 即根據(jù)文獻[14]中所論述的方法,每次在訓練子分類器使用bootstrap策略以放回的方式抽取部分訓練樣本訓練子分類器, 并利用余下的訓練樣本評估丟包錯誤率(Out-of-bag error), 取丟包錯誤率最低時候的參數(shù)。對于本文的實驗中涉及到的兩種檢測方法, 在沒有特征選擇的原方法中, 特征抽取子集的維度和子分類器個數(shù)的最優(yōu)參數(shù)由搜索得到, 在本文方法中, 特征抽取子集的維度??設定為原集成分類器方法搜索?最優(yōu)值的50%, 即特征選擇后余下的特征維度為抽取子集的維度的一半,采用該策略盡管并非為最優(yōu)結果, 但節(jié)約了特征選擇的時間, 且實驗結果證明該策略能夠較好地提升性能, 因此也充分表明了該特征選擇方法的合理性。
在訓練階段的耗時方面, 與不使用特征選擇的集成分類器的隱寫分析方法相比, 本文提出的方法訓練時間較長, 其主要原因是求解過程中多次使用不同的參數(shù)進行特征選擇以使得最終留下的特征為設定的維度。但在隱寫檢測過程中, 本文方法最終訓練的集成分類器在形式上仍然是多個線性分類器的組合, 因此在實際應用過程中其效率與原方法相同,具有較高的實時性。
表2 不同?參數(shù)檢測性能Table 2 Detection performance with different settings of parameter ?
本文針對當前使用高維特征和集成分類器的隱寫分析方法, 提出了一種特征選擇方法, 提升了對多種圖像格式、多種隱寫術的隱寫檢測精度。本文的主要貢獻主要為以下兩點:
1) 針對集成分類器提出了特征選擇的模型, 同時考慮了集成分類器訓練子分類器的精度和多樣性,并將其融合在特征選擇模型中。
2) 采用了高效的求解方法, 將選擇模型轉化為線性規(guī)劃問題求解, 并在多個子分類器的特征選擇過程中, 提出了權值更新的策略, 控制多個子分類器特征選擇的多樣性程度。
當前, 隱寫分析仍然面臨一些挑戰(zhàn), 如失配問題(Miss-matching)等, 因此該方面未來的工作將各方面多種問題考慮在內, 提升隱寫分析的通用性。此外,探索不同的特征選擇準則也是發(fā)展方向之一。
致謝 本文工作得到國家自然科學基金(U1536105,U1636102), 國家重點研發(fā)計劃(2016QY15Z2500,2016QY15Z2500)資助
[1]Y. J. Chanu, T. Tuithung and K. Manglem Singh, “A short survey on image steganography and steganalysis techniques,” Emerging Trends and Applications in Computer Science (NCETACS), 2012 3rd National Conference on, Shillong, pp. 52-55,2012.
[2]U. H. Panchal and R. Srivastava, “A Comprehensive Survey on Digital Image Watermarking Techniques,” Communication Systems and Network Technologies (CSNT), 2015 Fifth International Conference on,Gwalior, pp. 591-595, 2015.
[3]Y. Q. Shi; X. Li; X. Zhang; H. Wu; B. Ma, “Reversible Data Hiding:Advances in the Past Two Decades,” in IEEE Access , vol.PP, no.99,pp.1-1.
[4]H. Farid and S. Lyu, “Higher-order Wavelet Statistics and their Application to Digital Forensics,” Computer Vision and Pattern Recognition Workshop, 2003. CVPRW′03. Conference on, Madison, Wisconsin,USA, pp. 94-94, 2003.
[5]T. Pevny, P. Bas and J. Fridrich, “Steganalysis by Subtractive Pixel Adjacency Matrix,” in IEEE Transactions on Information Forensics and Security, vol. 5, no. 2, pp. 215-224, June 2010.
[6]J. Fridrich and J. Kodovsky, “Rich Models for Steganalysis of Digital Images,” in IEEE Transactions on Information Forensics and Security,vol. 7, no. 3, pp. 868-882, June 2012.
[7]V. Holub and J. Fridrich, “Random Projections of Residuals for Digital Image Steganalysis,” in IEEE Transactions on Information Forensics and Security, vol. 8, no. 12, pp. 1996-2006, Dec. 2013.
[8]Y. Shi, C. Chen, and W. Chen. “A markov process based approach to effective attacking jpeg steganography,” Information Hiding: 8th International Workshop, IH 2006, pp.249–264, 2007.
[9]T. Pevny and J. Fridrich. “Merging Markov and DCT Features for Multi-Class JPEG Steganalysis,” in Proc. SPIE Electronic Imaging,Photonics West, pp. 03-04 January 2007.
[10]J. Kodovsky and J. Fridrich. “Calibration revisited,” in Proceedings of the 11th ACM workshop on Multimedia and security (MM&Sec '09).ACM, New York, NY, USA, pp.63-74. 2009.
[11]J. Kodovsky and J. Fridrich. “Steganalysis of JPEG Images Using Rich Models,” in Proc. SPIE, Electronic Imaging, Media Watermarking,Security, and Forensics XIV, vol. 8303, San Francisco, CA, January 22-26, pp. 0A 1-13, 2012.
[12]V. Hulob and J. Fridrich. “Low-Complexity Features for JPEG Steganalysis Using Undecimated DCT,” Information Forensics and Security,IEEE Transactions on, vol.10, no.2, pp.219-228, Feb. 2015.
[13]Xiaofeng Song, Fenlin Liu, Chunfang Yang, Xiangyang Luo, and Yi Zhang. “Steganalysis of Adaptive JPEG Steganography Using 2D Gabor Filters,” in Proceedings of the 3rd ACM Workshop on Information Hiding and Multimedia Security (IH&MMSec’15). ACM, New York,NY, USA, pp.15-23, 2015.
[14]J. Kodovsky, J. Fridrich, and V. Holub. “Ensemble classifiers for steganalysis of digital media,” Information Forensics and Security,IEEE Transactions on, 7(2):432–444, April 2012.
[15]J. Dong, X. Chen, L. Guo and T. Tan, “Fusion Based Blind Image Steganalysis by Boosting Feature Selection,” Digital Watermarking:6th International Workshop, IWDW 2007 Guangzhou, China, December 3-5, pp.87-98, 2008.
[16]Y. Tan and F. Huang and J. Huang, “Feature Selection for High Dimensional Steganalysis,” Digital-Forensics and Watermarking: 14th International Workshop, IWDW 2015, Tokyo, Japan, October 7-10, pp.134-144, 2016.
[17]J. Fridrich, J. Kodovsky, Holub. Vojtch and M. Goljan, “Breaking HUGO -- The Process Discovery” Information Hiding: 13th International Conference, IH 2011, Prague, Czech Republic, May pp.18-20,2011.
[18]V. Holub and J. Fridrich, “Designing Steganographic Distortion Using Directional Filters,” IEEE Workshop on Information Forensic and Security, Tenerife, Canary Islands, December 2–5, 2012.
[19]V. Holub and J. Fridrich, “Digital image steganography using universal distortion,” in Proceedings of the first ACM workshop on Information hiding and multimedia security (IH&MMSec’13). ACM, New York,NY, USA, pp.59-68, 2013.
[20]B. Li, M. Wang, and J. Huang. “A new cost function for spatial image steganography,” in Proceedings IEEE, International Conference on Image Processing, ICIP, Paris, France, October 27–30, 2014.
[21]L. Guo, J. Ni and Y. Shi, “An efficient JPEG steganographic scheme using uniform embedding,” 2012 IEEE International Workshop on Information Forensics and Security (WIFS), Tenerife, pp. 169-174, 2012.