妥永強, 巫朝霞
(新疆財經大學 統計與數據科學學院, 烏魯木齊 830012)
21 世紀以來,信息成為日趨重要的生產要素?;ヂ摼W具有無窮的信息獲取與簡易的信息交換機能,網絡的全球化也使得信息的索取、傳遞與交換更加便捷。 如今,網絡化信息已滲透于社會生活的方方面面,在經濟、政治、藝術和科學等領域應用廣泛。于此同時,人們對信息隱私安全也提出了更高的要求,信息隱私安全受到了嚴峻的挑戰(zhàn)。 傳統的加密技術只適用于文本加密,不適用于數據量大、冗余度高的音頻加密,所以尋求高質量的音頻加密技術具有重大的研究意義。
近年來,由于混沌系統表現出優(yōu)良的初值敏感性、遍歷性以及不確定性,國內外許多學者將其廣泛運用于圖像加密以及音頻加密領域。 如:文獻[2]中將Arnold 映射擴展至維空間后得到高維混沌映射,從而構建了混沌查找表,使用密碼區(qū)塊鏈模式將其應用于音頻加密。 但該算法實現難度較高,具有一定的局限性。 文獻[3]利用Logistic 混沌映射構建映射關系進行音頻的置亂加密。 該算法雖然降低了復雜性,但秘鑰空間較小,抵抗統計攻擊性能較差,易被破解。 針對上述問題,文獻[4]中設計了基于多渦卷混沌系統的音頻加密算法。 該算法的初始秘鑰同時取決于音頻的Hash 值和外部密鑰,在增加秘鑰空間的同時,有效提高了選擇明文攻擊與統計攻擊的難度。 文獻[5]利用隨機矩陣對音頻信號進行擴充后,通過Logistic 混沌映射,分別在時域、小波域、時域對音頻進行加密。 文獻[6]利用細胞神經網絡混沌與Logistic 混沌映射構造出多級秘鑰后,通過Logistic 混沌映射對音頻進行加密。
本文在上述研究的基礎上,提出了一種將改進的3D-Hénon 混沌映射與離散化超混沌系統相結合的多混沌音頻加密算法,并給出了仿真實驗結果以及安全性能分析。
超混沌Chen 系統
4 維超混沌Chen 系統,其定義如式(1):
其中,10;83;38;是一個01 之間的參數。
本文選取0.02,此時系統的4 個Lyapunov指數分別為:0.969,0.042,-12.67,0。 其中有兩個正指數,說明該系統是超混沌系統。 使用四階Runge-Kutta 算法對式(1)離散化(時間間隔0.02),得到超混沌Chen 系統部分相圖如圖1 所示。
圖1 超混沌Chen 系統吸引子相位圖Fig. 1 Attractor phase diagram of hyperchaotic Chen system
改進的3D-Hénon 映射混沌系統
1976 年,法蘭西數學家Hénon 受Pomeau 關于洛倫茲系統數值結果的啟發(fā),通過對(,) 平面自身的3 個映射鏈來模擬,并調節(jié)參數得出的二維映射,作為一種簡單的高維混沌映射,具有優(yōu)良的非線性動力學特征,其定義如式(2):
其中,、為二維Hénon 混沌映射的控制參數。
圖2 為參數03,初始值為015,0.25時的Hénon 混沌映射混沌軌道圖及分岔圖。 通過分岔圖可得出:當參數106122 或127129 或131142 范圍內時,其處于混沌狀態(tài),系統有正的最大Lyapunov 指數。
圖2 Hénon 映射的序列軌道圖與分岔圖(a =1.4)Fig. 2 Sequence track and bifurcation diagrams of Hénon mapping
通過對式(2)進行調整及改進,添加變量及控制參數、, 得到改進的3D-Hénon 映射。 其定義如式(3):
其中,、、、為3D-Hénon 映射的控制參數(03,01,2)。 圖3 為初始值為02,01,0.3 時改進的3D-Hénon 混沌映射混沌軌道及三維分岔圖。同樣,當參數106122或127129 或131142 范圍內時,處于混沌狀態(tài),系統有正的最大Lyapunov 指數。
圖3 改進3D-Hénon 映射的序列軌道圖與三維分岔圖Fig. 3 Improved 3D Hénon map sequence orbit diagram and 3D bifurcation diagram
Lyapunov 指數是利用數值方法描述非線性動力學系統穩(wěn)定性的一種重要方法,是衡量非線性動力學系統在其相空間中沿某方向運動過程中各軌道之間相互靠近與遠離的一種指數級度量,提供了混沌系統動力學行為的定性和定量特征。 當非線性動力學系統為離散映射系統時,若最大Lyapunov 指數為正時,其具有混沌行為。 圖4 為改進的3D-Hénon映射在控制參數、變化時,01,2,初始值02,01,0.3 時的Lyapunov 指數圖。
圖4 改進3D-Hénon 映射當參數變化的Lyapunov 指數圖Fig. 4 Lyapunov exponent plot for improved 3D-Hénon mapping when parametersa andb vary
由圖4 可以看出, 當參數106122 或127129 或1311.42 范圍內時,其最大Lyapunov 指數大于0,系統處于混沌狀態(tài)。 當參數14,026503 時,最大Lyapunov 指數恒為正,其對參數具有魯棒性,該混沌系統適合產生用于音頻加密的隨機數。
取時長秒的音頻進行采樣率為(Hz) 的采樣后得到() (1,2,…,),作為明文音頻的音頻數據。 對音頻信號進行分塊處理步長為,超出部分用0 填充,則原始音頻信號被分為或1塊。 設(),(1,2,…,) 為原始音頻信號分塊中的一塊, 分離左右聲道a() 與a()。 將音頻信號振幅放大后,進行坐標系偏移, 取整得到增強后的信號序列α(),α()。
(1)用戶任意選取3 個0~1 之間的數值作為初始密鑰0(,,) ;
(2)將初始密鑰0 作為初始值輸入改進的3D-Hénon 映射,預迭代系統次,以消除其暫態(tài)效應,增強系統初值敏感性。 繼續(xù)迭代次生成隨機序列:mod()為取余函數;為足夠大的正整數。
表1 為偽隨機序列的NIST sp800_22 隨機性測試結果。 可以看出,待測試序列的_值均大于0.01全部通過測試。 可以認為文中序列是隨機序列,適合作為后續(xù)加密過程的加密密碼。
表1 NIST sp800_22 隨機性測試結果Tab. 1 Randomness test results of NIST SP800 22
將序列F(1,2) 中的每個序列對3、7 取余,分別提取余數為0 的序列和剩余序列,按照“先升序后降序”的規(guī)則進行排序,得到6 條索引序列In,(1,…,6)。 將6 個索引序列進行分組,定義如下規(guī)則,得到新索引序列:index=[εβδ]。
(,) 表示行列的全1 矩陣。
分別對序列α()、α() 進行置亂。 置亂時每個元素依次循環(huán)索引序列的初始位置、1/3 位置、2/3 位置處置亂。 置亂規(guī)則,是將() 元素與(index()) (1,2,…,) 元素調換位置。 分別對所有序列置亂后,得到置亂音頻序列α()、α()。
對置亂后的序列進行向前擴散與向后擴散。 擴散規(guī)則如下:
4)警報聲:當本系統進行實時監(jiān)控的時候,如果視頻中出現火點,該系統會向正在監(jiān)控的工作人員發(fā)出報警聲,畢竟人的精力是有限的,有時難免會出現一些錯誤,但該系統就很好地彌補了這一點,使森林出現火災的時候能夠第一時間讓工作人員了解這一信息,迅速地將火勢控制住。
通過式(7)對置亂音頻擴散得到加密音頻序列C、C,合并后得到加密后的音頻。 音頻加密流程如圖5 所示:
圖5 音頻加密流程圖Fig. 5 Flow chart of Audio encryption
實驗仿真采用雙聲道音頻“Audio1.wav”,分別截取其中一塊進行實驗仿真。 實驗參數分別設置為:2,30 000,8 000,0(0141 592 6,0653 589),1(0969 015,0409 086, 0622 289,0640 965)。
圖6(a)~6(c)分別為原始音頻波形圖、加密音頻波形圖、解密音頻波形圖。 可以看出,加密后的音頻波形圖呈現無規(guī)則雜亂狀,已與原始音頻無任何關聯,經解密后的音頻波形圖與原始音頻波形圖完全相同。
圖6 音頻加密仿真實驗結果Fig. 6 Audio encryption simulation results
相對于原始秘鑰,一個細微差別的密鑰,其解密后的差別也非常大。 測試中, 在原始秘鑰中選取0 中一個值增加10,即0(0141 592 610,0653 589) 對加密音頻進行解密。 解密后的音頻時域波形圖雜亂無章,得到完全錯誤的解密音頻,無法識別出原始音頻的信息,如圖7 所示。 對于一個安全的加密算法,其密鑰空間大小至少超過2才算是安全有效的加密算法。 本文加密算法中共有2 組7 個秘鑰,密鑰空間為 (10)22,密鑰空間足夠抵御窮舉攻擊。
圖7 錯誤秘鑰解密音頻時域波形圖Fig. 7 Wrong key decryption audio time domain waveform
3.3.1 語譜圖分析
音頻的語譜圖將整個音頻范圍用不同的顏色記錄,這些顏色表示特定時間、特定頻率與能量之間的關系。 圖8(a)、(b)分別顯示了原始音頻與加密音頻的語譜圖。 表2 為原始音頻與加密音頻能量分布描述統計,原始音頻能量均值為-102.488 4 dB/Hz,其標準差較大,變異度為81.25%,分布離散,原始音頻信號語譜圖中能量分布不均勻,其包含較多信息量。 而加密音頻能量的均值為-50.764 5 dB/Hz,標準差不大,變異度為11.24%,表明加密音頻能量均勻分布在-50.764 5 dB/Hz 附近,幾乎不包含原始音頻信息,音頻整體平均能量分布也被拉高,接近噪聲,可以抵御基于音頻語譜圖的統計攻擊。
3.3.2 信息熵分析
一條信息所包含信息量的大小取決于信息的不確定程度,而其不確定程度與復雜度由信息熵來量化。 信息熵數學定義為:
信息熵越大,則信息的不確定程度與復雜度越大。 加密后的音頻數據信息熵越接近8,加密效果越好,音頻越接近于噪聲,攻擊者獲取的信息越少。
圖8 原始音頻聲與加密音頻聲譜圖Fig. 8 Original audio encrypted audio spectrogram
表2 音頻能量分布描述統計表(dB/Hz)Tab. 2 Description of audio magnitude distribution
表3 信息熵對比表Tab. 3 Comparison table of information entropy
加密音頻數據整體在區(qū)間內概率分布越均勻,加密音頻的抗統計攻擊性能越優(yōu)。 直方圖橫軸為分布區(qū)間,縱軸為對應的頻數或頻率。 圖9 分別為原始音頻與加密音頻頻數分布直方圖。
圖9 原始音頻與加密音頻直方圖Fig. 9 Histograms of raw and encrypted aud
由圖9 中可以直觀的看出,原始音頻的頻數分布近似正態(tài)分布,而加密音頻的頻數分布均勻,很好的隱藏了原始音頻的統計特性,攻擊者不易通過分析密文直方圖獲得信息,從而能夠抵抗基于直方圖的統計攻擊。
3.3.3 相關性分析
加密音頻相鄰采樣數據之間相關系數越小,說明數據的混亂與復雜程度越大,因而加密安全性更高。 音頻相鄰幅值間相關系數計算公式如下:
其中存儲向量[] 和[] 表示第對相鄰音頻信號值,為總對數。 隨機選取10 000 對相鄰音頻數據進行測度。 圖10 為明文音頻與加密音頻相鄰幅值散點圖,圖中可以看出明文音頻左右聲道相鄰音頻信號值之間呈現出明顯相關關系,而加密音頻相鄰音頻信號值之間無相關關系,表4 為相鄰音頻信號相關性對比表,表中明文音頻左右聲道相鄰信號值相關性為正相關關系數值分別為0.994 3 與0.997 2,而加密音頻左右聲道相鄰信號值相關系數分別為0.000 7 與-0.000 3 接近于0 表明其無相關關系,通過與其他文獻對比文中加密算法加密后的音頻混亂與復雜程度大,攻擊者不易通過分析相關性操作得到明文音頻信息. 表明加密算法能夠很好的抵御基于相關性的統計攻擊。
圖10 明文音頻與加密音頻相鄰幅值散點圖Fig. 10 Adjacent amplitude scatter plot of plain-text audio and encrypted audio
表4 相鄰音頻信號相關性對比表Tab. 4 Correlation comparison table of adjacent audio signals
3.3.4 峰值信噪比分析()
峰值信噪比為音頻信號最大功率與噪聲音頻信號功率的比值。 峰值信噪比常用作確定信號壓縮質量,數值越大,信號壓縮質量越高,越接近原始音頻。若加密音頻與明文音頻峰值信噪比越低,則加密音頻與原始音頻差異越大,加密后的音頻越接近噪聲。峰值信噪比通過均方誤差() 來定義,均方誤差反映了兩組信號之間的差異程度。 均方誤差與峰值信噪比的計算如下:
其中,() 為原始音頻序列,() 為加密音頻序列。
表5 中列出了隨機選取的5 段加密音頻測試結果。 可以看出,加密后的音頻在不同長度下左右聲道的峰值信噪比都較低,加密音頻與原始音頻差別較大,加密后的音頻很好的隱藏了原始音頻的信息,表明該加密算法能夠很好的抵御基于峰值信噪比的統計攻擊。
表5 加密音頻PSNR 測試結果表Tab. 5 Test results of encrypted audioPSNR
3.4.1 抵抗差分攻擊性能分析
攻擊者通過對原始音頻進行細微差別的改變,分析加密音頻之間映射出的差異情況,這種類型的攻擊稱為差分攻擊。
在數據加密中對差分攻擊的抵抗性能一般通過樣本數變化率() 和統一平均變化強度() 進行分析。
是對加密算法質量的魯棒性檢驗,測試目的是原始音頻和對應加密音頻間不同樣本數量在樣本總數中所占比例的比較。 計算公式如式(12):
其中,() 為未改變原始音頻的加密音頻序列;() 為隨機改變一個原始音頻采樣數據的加密音頻序列;() 為符號函數。
是記錄原始音頻與加密音頻相應位置差值與最大差值間比值的平均值,計算公式如式(13):
當音頻信號為8 bit 時,加密算法抗差分攻擊的和的最優(yōu)值分別為100和33333。
表6 為隨機測試30 000段加密音頻的和平均值對比。 通過與其它文獻對比分析表明:本文音頻加密算法得到的與更加接近理想值,加密算法的抵抗差分攻擊性能較強。
表6 隨機測試NSCR 和UACI 平均值對比Tab. 6 Comparison of average values ofNSCR andUACI in random tests %
3.4.2 抗噪聲性能分析
當攻擊者進行主動攻擊時,對密文加入噪聲,解密信息質量會大幅度下降。 加密算法的抗噪聲性能越好,在密文受到噪聲攻擊時,解密后還原出原始音頻的信息越多。 在密文傳輸中,當攻擊者對密文進行剪切攻擊時,魯棒性較差的算法在受到攻擊后,密文解密后明文的關鍵信息會丟失,導致信息無法成功傳輸。 優(yōu)秀的算法在受到剪切攻擊,密文解密后可解析的信息應盡可能多,而能夠保留明文的關鍵信息。 圖11 為加入5%的椒鹽噪聲解密后的音頻時域波形圖。
圖11 加入5%椒鹽噪聲的解密音頻時域波形圖Fig. 11 Decoded audio time domain waveform with 5% salt and pepper noise
由圖中可以看出,在加入5%椒鹽噪聲的情況下,解密后的音頻時域波形質量較高,可以輕松被人耳所識別,解密后的音頻依然能夠恢復大部分信息。計算加入椒鹽噪聲后,解密音頻與明文音頻的峰值信噪比可以以數值形式量化音頻加密算法的抗噪聲性能,計算得到左右聲道的均方誤差分別為:7.911 0E-04、6.595 3E-04。 解密音頻左右聲道峰值信噪比分別為:25.944 0、25.246 8。 計算得到的均方誤差較低,解密后音頻質量較高,加密算法具有良好的抗噪聲性能。
本文通過對二維Hénon 混沌映射進行升維與改進得到改進的3D-Hénon 混沌映射,并將其與離散化的超混沌Chen 系統相結合,生成的偽隨機序列用于音頻加密。 預處理過程將原始音頻信號進行分塊處理提升了運行效率,利用生成的偽隨機序列進行循環(huán)排序置亂以及向前向后擴散完成加密。 其中秘鑰與明文音頻互相關聯,實現了“一次一密”,降低了選擇明文攻擊的可能性。 通過仿真與分析結果表明,提出的音頻加密算法具有較強的秘鑰敏感性和足夠大的秘鑰空間,加密后的音頻能量分布均勻,相鄰振幅間相關性較低,與明文音頻的峰值信噪比較低,加密算法具有良好的抗統計攻擊性以及魯棒性。