韓高峰,鐘元權(quán)
(安徽文達(dá)信息工程學(xué)院 計(jì)算機(jī)工程學(xué)院,安徽 合肥 230000)
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,采用通信技術(shù)進(jìn)行組網(wǎng)學(xué)習(xí),提高數(shù)據(jù)實(shí)時(shí)轉(zhuǎn)發(fā)和控制能力,在進(jìn)行網(wǎng)絡(luò)組網(wǎng)設(shè)計(jì)中,大量的數(shù)據(jù)比特序列流通過網(wǎng)絡(luò)進(jìn)行傳輸和收發(fā)控制,由于網(wǎng)絡(luò)組網(wǎng)的開放性以及節(jié)點(diǎn)分布的隨機(jī)性,導(dǎo)致網(wǎng)絡(luò)通信容易受到入侵,使得網(wǎng)絡(luò)的安全性受到威脅[1].需要對(duì)網(wǎng)絡(luò)的數(shù)據(jù)安全風(fēng)險(xiǎn)進(jìn)行有效預(yù)測(cè),結(jié)合大數(shù)據(jù)挖掘和信息融合技術(shù),實(shí)現(xiàn)網(wǎng)絡(luò)的安全風(fēng)險(xiǎn)預(yù)測(cè),提高網(wǎng)絡(luò)的抗攻擊能力.研究網(wǎng)絡(luò)的數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè)方法受到人們的極大關(guān)注[2].
對(duì)網(wǎng)絡(luò)數(shù)據(jù)安全預(yù)測(cè)研究是建立在對(duì)網(wǎng)絡(luò)數(shù)據(jù)的特征提取和異常性分析基礎(chǔ)上,采用譜分析和大數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘技術(shù),進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)的風(fēng)險(xiǎn)異常特征提取,其中,文獻(xiàn)[3]提出一種基于CMA調(diào)制的移動(dòng)傳感網(wǎng)絡(luò)數(shù)據(jù)傳輸安全優(yōu)化控制技術(shù),采用波特間隔均衡控制方法,進(jìn)行無線網(wǎng)絡(luò)的輸出信道均衡設(shè)計(jì),采用小波降噪方法進(jìn)行信道碼間干擾抑制,實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)安全預(yù)測(cè),提高輸出的均衡性和抗干擾能力,但該方法的實(shí)時(shí)性不好,對(duì)多徑干擾的抗干擾性不強(qiáng).文獻(xiàn)[4]中提出一種基于非線性失真單周控制無線通信網(wǎng)絡(luò)大數(shù)據(jù)風(fēng)險(xiǎn)預(yù)測(cè)算法,通過最優(yōu)分集均衡配置方法進(jìn)行信道輸出尋優(yōu)控制,提高大數(shù)據(jù)傳輸和調(diào)度的安全性和風(fēng)險(xiǎn)預(yù)測(cè)能力,但該方法的計(jì)算復(fù)雜度較高.針對(duì)上述問題,本文提出一種基于改進(jìn)機(jī)器學(xué)習(xí)算法的網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè)算法.首先構(gòu)建網(wǎng)絡(luò)的數(shù)據(jù)傳輸信道分布模型,提取網(wǎng)絡(luò)傳輸碼元比特流的安全風(fēng)險(xiǎn)數(shù)據(jù)統(tǒng)計(jì)特征量,然后結(jié)合關(guān)聯(lián)特征挖掘方法進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)的安全風(fēng)險(xiǎn)指向性預(yù)測(cè),采用機(jī)器學(xué)習(xí)算法進(jìn)行網(wǎng)絡(luò)安全風(fēng)險(xiǎn)預(yù)測(cè)中的收斂性控制,實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè).最后進(jìn)行仿真實(shí)驗(yàn)分析,得出有效性結(jié)論.
為了實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè),需要首先進(jìn)行網(wǎng)絡(luò)傳輸大數(shù)據(jù)的統(tǒng)計(jì)特征分析,對(duì)進(jìn)行網(wǎng)絡(luò)傳輸比特序列數(shù)據(jù)的統(tǒng)計(jì)分析[5],采用一個(gè)多元統(tǒng)計(jì)特征方程描述網(wǎng)絡(luò)傳輸比特序列數(shù)據(jù)的高維空間存儲(chǔ)狀態(tài)模型為:
其中,0 ≤p(ai)≤1(i= 0,1,2,…,m)且表示網(wǎng)絡(luò)傳輸比特序列數(shù)據(jù)的關(guān)聯(lián)規(guī)則特征分布,通過數(shù)據(jù)的離散解析化處理,得到網(wǎng)絡(luò)傳輸比特序列數(shù)據(jù)的分布特征信息熵為:
對(duì)于一個(gè)連續(xù)的網(wǎng)絡(luò)傳輸比特序列數(shù)據(jù)隨機(jī)采樣序列,每個(gè)空間解向量對(duì)應(yīng)網(wǎng)絡(luò)傳輸比特序列數(shù)據(jù)的特征訓(xùn)練子集Si(i= 1,2,…,L),令xn+1=μxn(1-xn)是一個(gè)網(wǎng)絡(luò)傳輸比特序列數(shù)據(jù)隨機(jī)采樣序列的統(tǒng)計(jì)學(xué)模型的共軛解,滿足初始值特征分解條件,其中k= 1,2,…,L.對(duì)于一組多元變量的網(wǎng)絡(luò)傳輸比特序列數(shù)據(jù)統(tǒng)計(jì)序列x(n),由此構(gòu)建網(wǎng)絡(luò)傳輸比特序列數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)模型如圖1所示.
對(duì)高維重構(gòu)后的網(wǎng)絡(luò)傳輸比特序列數(shù)據(jù)信息流通過關(guān)聯(lián)規(guī)則挖掘方法提取數(shù)據(jù)的標(biāo)簽屬性特征量,采用自適應(yīng)學(xué)習(xí)方法,進(jìn)行數(shù)據(jù)聚類過程中的聚類中心調(diào)節(jié)[6],得到數(shù)據(jù)分類的聚類中心調(diào)節(jié)函數(shù)為:
其中,xj(t)表示網(wǎng)絡(luò)傳輸比特序列數(shù)據(jù)先驗(yàn)信息在第t代的第j個(gè)聚類中心的輸出標(biāo)簽屬性,lj(t)表示第t代學(xué)習(xí)后在第j個(gè)聚類中心的輸出標(biāo)簽屬性,由此構(gòu)建網(wǎng)絡(luò)的數(shù)據(jù)傳輸信道分布模型,提取網(wǎng)絡(luò)傳輸碼元比特流的安全風(fēng)險(xiǎn)數(shù)據(jù)統(tǒng)計(jì)特征量.
在進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)的統(tǒng)計(jì)分析的基礎(chǔ)上,進(jìn)行特征提取分析,根據(jù)風(fēng)險(xiǎn)統(tǒng)計(jì)分布特征提取結(jié)果進(jìn)行融合聚類處理,假設(shè)高維相空間重構(gòu)模型中極限學(xué)習(xí)機(jī)的迭代次數(shù)為N,其中第i代極限學(xué)習(xí)機(jī)學(xué)習(xí)的初始聚類中心位置(xi,yi),對(duì)應(yīng)的網(wǎng)絡(luò)數(shù)據(jù)的分類決策函數(shù)為f((xi,yi)),根據(jù)慣性權(quán)重優(yōu)化控制方法,采用神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)的主特征提取和分類識(shí)別,神經(jīng)網(wǎng)絡(luò)分類器的輸入層的權(quán)重為,隱含層的自適應(yīng)加權(quán)權(quán)重為,采用聯(lián)合特征識(shí)別方法,對(duì)網(wǎng)絡(luò)數(shù)據(jù)分類的主特征量進(jìn)行極限學(xué)習(xí)和自適應(yīng)加權(quán),記它們的權(quán)值為,復(fù)制高權(quán)值的神經(jīng)元集,在網(wǎng)絡(luò)的傳輸信道中進(jìn)行網(wǎng)絡(luò)流量采集,構(gòu)建網(wǎng)絡(luò)入侵的傳輸信道模型,得到網(wǎng)絡(luò)風(fēng)險(xiǎn)入侵特征信息:
已知a(t) ≥|s(t)|,表示a(t)在網(wǎng)絡(luò)風(fēng)險(xiǎn)入侵檢測(cè)的包絡(luò)幅值,當(dāng)最大包絡(luò)幅值為|s(t)|,選取曲率為a(t)的曲線進(jìn)行定量回歸分析,構(gòu)建4P× 4P矩陣進(jìn)行網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)的結(jié)構(gòu)重組:
式 中,E=[e1,e2,…e4P] 為 衰 減 系 數(shù),在 傳 輸 鏈 路(a,bm) 上 構(gòu) 建 酉 矩 陣,當(dāng) 統(tǒng) 計(jì) 特 征 量∑=diag[σ1,σ2,…,σ4P]滿足得到網(wǎng)絡(luò)數(shù)據(jù)安全預(yù)測(cè)的特征提取結(jié)果為:
網(wǎng)絡(luò)數(shù)據(jù)的傳輸系數(shù)a=1s,相對(duì)時(shí)延為b=τ,根據(jù)風(fēng)險(xiǎn)統(tǒng)計(jì)分布特征提取結(jié)果進(jìn)行融合聚類處理,構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè)的量化回歸分析模型.
在上述建網(wǎng)絡(luò)的數(shù)據(jù)傳輸信道分布模型,提取網(wǎng)絡(luò)傳輸碼元比特流的安全風(fēng)險(xiǎn)數(shù)據(jù)統(tǒng)計(jì)特征量的基礎(chǔ)上,進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)的安全風(fēng)險(xiǎn)預(yù)測(cè)處理,本文提出一種基于改進(jìn)機(jī)器學(xué)習(xí)算法的網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè)算法.根據(jù)風(fēng)險(xiǎn)統(tǒng)計(jì)分布特征提取結(jié)果進(jìn)行融合聚類處理[7],構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè)的量化回歸分析模型,為:
其中X~1(k),X~2(k)分別是X1(k),X2(k)前N/2+ 1 項(xiàng)組成網(wǎng)絡(luò)入侵特征分布序列,在網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)分布結(jié)構(gòu)模型下,以β為邊界條件,得到網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)整合的拓展外延Mβ:
其中:
根據(jù)上述分析,得到網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)融合聚類輸出為x(t),t= 0,1,···,n- 1,結(jié)合關(guān)聯(lián)特征分析方法,構(gòu)建入侵信息的整合有限集合為:
其中:i= 1,2,[Cmin,Cmax]是學(xué)習(xí)因子,由此實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)數(shù)據(jù)的融合聚類處理.
在大數(shù)據(jù)處理環(huán)境下,對(duì)整個(gè)網(wǎng)絡(luò)安全風(fēng)險(xiǎn)預(yù)測(cè)資源庫的統(tǒng)計(jì)分布序列開始逐幀處理,在模糊聚類中心,分析網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)的統(tǒng)計(jì)測(cè)量誤差[8],通過權(quán)重更新方法,得到模糊跟蹤項(xiàng)滿足||C(l) -C(l-1)||<ξ,得到網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)的生成式模型為:
設(shè)(sk,ak)和(sl,al)為網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)整合節(jié)點(diǎn)之間的模糊貼近度函數(shù),用xn-i表示網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)屬性集的模糊分布自相關(guān)量特征量,入侵碼元形式為:
其中,Φk為資源調(diào)度特征分布集,ζ(n)為單個(gè)矩形脈沖,pk為網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)的量化特征分布集,對(duì)不同輻射源的風(fēng)險(xiǎn)入侵包絡(luò)特征進(jìn)行關(guān)聯(lián)規(guī)則挖掘,得到特征估計(jì)式為:
在信息化條件下進(jìn)行網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)配置,網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)配置統(tǒng)計(jì)面板數(shù)據(jù)定義為vm,m∈[1,n],構(gòu)建網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)配置集合G(其元素為gωm,ω?{G,T,W,L},m∈[1,n]),采用機(jī)器學(xué)習(xí)算法進(jìn)行網(wǎng)絡(luò)安全風(fēng)險(xiǎn)預(yù)測(cè)中的收斂性控制,機(jī)器學(xué)習(xí)的迭代過程描述為:
綜上分析,采用改進(jìn)的機(jī)器學(xué)習(xí)算法進(jìn)行網(wǎng)絡(luò)安全風(fēng)險(xiǎn)預(yù)測(cè)[9],機(jī)器學(xué)習(xí)的實(shí)現(xiàn)過程如圖2所示.
為了驗(yàn)證本文方法在實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用性能,在Matlab 環(huán)境中進(jìn)行仿真實(shí)驗(yàn)分析,實(shí)驗(yàn)中構(gòu)造一個(gè)INVITE資源數(shù)據(jù)庫作為網(wǎng)絡(luò)數(shù)據(jù)發(fā)送包,網(wǎng)絡(luò)數(shù)據(jù)傳輸樣本集包括1 200組測(cè)試樣本和100組訓(xùn)練集,對(duì)網(wǎng)絡(luò)數(shù)據(jù)采樣的單組樣本長(zhǎng)度為1 024,相關(guān)性特征分布見表1.
表1 網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)預(yù)測(cè)的相關(guān)性特征分布Tab.1 Correlation characteristic distribution of network risk data prediction
根據(jù)上述仿真環(huán)境和參數(shù)設(shè)定,進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè)仿真實(shí)驗(yàn),得到網(wǎng)絡(luò)數(shù)據(jù)的風(fēng)險(xiǎn)特征采樣樣本集如圖3所示.
以圖3的數(shù)據(jù)為輸入,構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè)的量化回歸分析模型,結(jié)合關(guān)聯(lián)特征挖掘方法進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)的安全風(fēng)險(xiǎn)指向性預(yù)測(cè),得到風(fēng)險(xiǎn)數(shù)據(jù)的預(yù)測(cè)輸出如圖4所示.
分析圖4得知,采用本文方法能有效實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)數(shù)據(jù)的安全風(fēng)險(xiǎn)預(yù)測(cè),對(duì)風(fēng)險(xiǎn)數(shù)據(jù)的聚類性較好,測(cè)試不同方法進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè)的準(zhǔn)確性,得到對(duì)比結(jié)果如圖5所示,分析得知,本文方法進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè)的準(zhǔn)確性較高.
本文提出一種基于改進(jìn)機(jī)器學(xué)習(xí)算法的網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè)算法.采用自適應(yīng)學(xué)習(xí)方法,進(jìn)行數(shù)據(jù)聚類過程中的聚類中心調(diào)節(jié),采用神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)的主特征提取和分類識(shí)別,根據(jù)風(fēng)險(xiǎn)統(tǒng)計(jì)分布特征提取結(jié)果進(jìn)行融合聚類處理,構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè)的量化回歸分析模型,在信息化條件下進(jìn)行網(wǎng)絡(luò)風(fēng)險(xiǎn)數(shù)據(jù)配置,采用改進(jìn)的機(jī)器學(xué)習(xí)算法進(jìn)行網(wǎng)絡(luò)安全風(fēng)險(xiǎn)預(yù)測(cè),機(jī)器學(xué)習(xí)算法的逐步改進(jìn)會(huì)更加優(yōu)化網(wǎng)絡(luò)環(huán)境以面對(duì)各種未知的攻擊[10].研究得知,采用本文方法進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性較高,抗干擾性較好.