雷宇
(航空工業(yè)成都飛機工業(yè)(集團)有限責(zé)任公司,四川 成都610091)
軍工單位的保密風(fēng)險管理主要集中在建立適用于本單位保密風(fēng)險管理體系,梳理單位各個作業(yè)面的風(fēng)險點并進(jìn)行風(fēng)險評估,制定相應(yīng)的風(fēng)險控制措施,實現(xiàn)優(yōu)化保密業(yè)務(wù)管理,以最小成本將失泄密風(fēng)險控制在單位業(yè)務(wù)工作可以接受的水平,以此獲得最大的信息安全防護。
全面進(jìn)行保密系統(tǒng)的風(fēng)險評估的首要關(guān)鍵問題建立健全的指標(biāo)體系并量化計算。當(dāng)評估指標(biāo)數(shù)量不太多的時候,傳統(tǒng)的數(shù)學(xué)模型能夠在定量分析上取得較合理的評估結(jié)果,例如采用定性和定量相結(jié)合的保密管理風(fēng)險評估方法,計算出年度保密風(fēng)險的分布狀態(tài)[1];采用歸一化、標(biāo)準(zhǔn)化及層次分析法等方法對模型指標(biāo)進(jìn)行求解,建立了保密工作風(fēng)險評估模型[2]。但是當(dāng)指標(biāo)數(shù)量較多時,由于模型本身的局限性, 難以處理隨機干擾因素對風(fēng)險評估數(shù)據(jù)的影響,因而很難正確反映風(fēng)險評估數(shù)據(jù)或者風(fēng)險指數(shù)本身的高度不確定性與非線性,導(dǎo)致在風(fēng)險評估及風(fēng)險指數(shù)預(yù)測方面產(chǎn)生較大的誤差。因此,本文從單位保密實際工作出發(fā),對定期獲得的保密風(fēng)險指數(shù),采用K-means 聚類分析方法,識別出保密風(fēng)險評估指標(biāo)體系高風(fēng)險指標(biāo)集,將識別出來的高風(fēng)險指標(biāo)作為當(dāng)前保密工作的防控重點;同時為了加強保密工作的風(fēng)險預(yù)警,結(jié)合風(fēng)險指數(shù)的歷史評估數(shù)據(jù),采用Elman 神經(jīng)網(wǎng)絡(luò),預(yù)測各個指標(biāo)在下一個時間段的風(fēng)險指數(shù)值,并對預(yù)測為高風(fēng)險的指標(biāo)或者風(fēng)險點采取主動預(yù)警防范措施,提高單位保密風(fēng)險管理水平。
結(jié)合保密風(fēng)險發(fā)生可能性大小、影響程度和管理改進(jìn)迫切性三個維度[3],根據(jù)數(shù)學(xué)模型可以計算出單位的保密風(fēng)險指數(shù),并確定該單位的風(fēng)險等級[4]。
表1 風(fēng)險水平等級確定與排序列表
為了便于問題描述,本文假設(shè)風(fēng)險評估指標(biāo)數(shù)量為n,對于每個指標(biāo)統(tǒng)計了第 1,2, ...,T個月的風(fēng)險指數(shù)值
Xij, i =1,2,..., n, j =1,2,...,T 。
K-means 聚類算法基本思想是: 以空間中k 個點為形心進(jìn)行聚類,以數(shù)據(jù)點到形心的歐式距離作為優(yōu)化函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整規(guī)則[5]。通過迭代的方法,逐次更新各類的形心值,直至得到最好的聚類結(jié)果。結(jié)合保密風(fēng)險水平數(shù)據(jù),K-means 聚類的一般步驟可以歸納為:
(2)在第j 次迭代中,對任意一個樣本點 pt(t =1,2,..., n),求其到k 個形心的歐氏距離
(3) 將該樣本歸類到與其距離最小的形心所在的類。
(4) 采用均值更新各類的形心值
式中 ni表示類別序號。
(5) 重復(fù)步驟(2) - (4) , 直到各類的形心值不再變化。
針對保密風(fēng)險指數(shù)具有非線性動態(tài)變化的特點,本文采用具有“記憶”功能的Elman 神經(jīng)網(wǎng)絡(luò)預(yù)測模型。這種連接方式使得Elman 神經(jīng)網(wǎng)絡(luò)相較于其他神經(jīng)網(wǎng)絡(luò)相比,具有自聯(lián)性和記憶功能,有助于增強對于動態(tài)數(shù)據(jù)的處理能力,以及建立動態(tài)模型[6]。Elman 神經(jīng)網(wǎng)絡(luò)是一種計算能力很強的反饋性神經(jīng)網(wǎng)絡(luò),其具體的網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。
Elman 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)一般分為四層:輸入層、隱含層、上下文層和輸出層。輸入層單元起信號傳輸作用,輸出層單元起線性加權(quán)作用,隱含層單元的傳遞函數(shù)可采用線性或非線性函數(shù),上下文層則從隱含層接收反饋信號,其神經(jīng)元輸出被前向傳輸至隱含層。
圖1 Elman 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
在Elman 神經(jīng)網(wǎng)絡(luò)中,設(shè)上下文層的輸出為 yc( k),隱含層的輸出為 o ( k ),網(wǎng)絡(luò)在外部輸入時間序列 x ( k)作用下的網(wǎng)絡(luò)輸出序列為 y ( k),則有
其中,k 表示時刻;w1為輸入層與隱含層間的連接權(quán)值;w2為上下文層與隱含層間的連接權(quán)值;w3為隱含層與輸出層間的連接權(quán)值;g (·)為輸出層傳遞函數(shù),是隱含層輸出的線性組合;f (·)為隱含層傳遞函數(shù),一般采用Sigmoid 激活函數(shù):
f ( x) = 1/(1 +e-λx)。
網(wǎng)絡(luò)學(xué)習(xí)過程是一個不斷調(diào)整權(quán)值的過程,而Elman 神經(jīng)網(wǎng)絡(luò)使用BP 算法來修正權(quán)值。設(shè)K 時刻的系統(tǒng)實際輸出值為Y(k),則Elman 神經(jīng)網(wǎng)絡(luò)的目標(biāo)函數(shù)為:通過調(diào)整w1、w2和w3的值,使得誤差E 最小,從而確定權(quán)值。
3.2.1 輸入數(shù)據(jù)的處理
由于給定某個指標(biāo)的歷史風(fēng)險指數(shù)值本質(zhì)上可以看成一個時間序列,作為Elman 神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)是多維的,因此需要將時間序列數(shù)據(jù)截取為多維向量組作為網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)輸入,不防假設(shè)第i 個指標(biāo)的歷史風(fēng)險指數(shù)序列為:
Xi=( xi1, xi2, xi3,..., xiT),
設(shè)截取維數(shù)為l,如 ( xi1, xi2,..., xi,l-1, xil)就是一組訓(xùn)練集,表示通過 xi1, xi2,...,xi,l-1共 l-1個數(shù)據(jù)可以預(yù)測到第l個數(shù)據(jù)xij,這樣Xi就可以轉(zhuǎn)化為T-l+1 個訓(xùn)練數(shù)據(jù)
( xi1, xi2,..., xi,l-1, xil),...,( xi,T-l+1, xi2,..., xi,T-1, xiT)。
同時,由于該數(shù)據(jù)是已知數(shù)據(jù),根據(jù)保密風(fēng)險指數(shù)計算方法,所有的保密風(fēng)險指數(shù)值均介于0-5 之間,因此無須對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化或者歸一化處理。
3.2.2 網(wǎng)絡(luò)參數(shù)的選擇
神經(jīng)網(wǎng)絡(luò)中隱含層的層數(shù)是非常重要的參數(shù)。在選取過程中,若選取的隱含層層數(shù)較小,則會導(dǎo)致產(chǎn)生的連接權(quán)組合數(shù)無法滿足樣本的學(xué)習(xí),學(xué)習(xí)能力和處理信息能力降低。若選取的隱含層層數(shù)較大,則網(wǎng)絡(luò)學(xué)習(xí)的泛化能力較差,而且容易在計算過程中錯過最小值,因此選取合適的隱含層個數(shù)就成為一個重要的問題。通常隱含層層數(shù)的確定通過如下三個經(jīng)驗公式確定,得出最大值和最小值,確定隱含層個數(shù)的范圍,然后在Elman 神經(jīng)網(wǎng)絡(luò)模型中依次代入訓(xùn)練,選擇最小值[6],
其中m 為隱含層結(jié)點數(shù),n 為輸入層節(jié)點數(shù),l 為輸出層節(jié)點數(shù),α 為介于1-10 內(nèi)的常數(shù)。
3.2.3 預(yù)測數(shù)據(jù)的后處理
將待預(yù)測的數(shù)據(jù)帶入訓(xùn)練好的Elman 網(wǎng)絡(luò)即可得到預(yù)測結(jié)果,但是預(yù)測后的某些數(shù)據(jù)會超出風(fēng)險指數(shù)值介于0-5 之間的約束條件。如果發(fā)生這種情況,還需要將數(shù)據(jù)校正,以便用于下一步的預(yù)測。本文采用最簡單的截斷處理方式,即如果風(fēng)險指數(shù)值大于5,則該風(fēng)險指數(shù)修正為上限值5;如果出現(xiàn)預(yù)測風(fēng)險指數(shù)值小于0,則將其值校正為風(fēng)險指數(shù)值的下限值0。
風(fēng)險評估指標(biāo)數(shù)量為 n= 100,歷史數(shù)據(jù)為24 個月( T=24)的風(fēng)險指數(shù)值。本文數(shù)據(jù)利用計算機隨機生成,得到相應(yīng)的風(fēng)險指數(shù)矩陣為 X100×24。
在對保密風(fēng)險指數(shù)的評估分類中,不需要考慮歷史數(shù)據(jù),所以只選取最后一個月的風(fēng)險指數(shù)值進(jìn)行K-means 聚類,并計算每個類別的風(fēng)險指數(shù)均值進(jìn)行風(fēng)險等價劃分。此處給出第24個月的100 個指標(biāo)的風(fēng)險指數(shù)值,如表2 所示。
利用K-means 聚類對該表的風(fēng)險指數(shù)聚類,100 個指標(biāo)的具體風(fēng)險等級分類結(jié)果見表3。
根據(jù)表3 的結(jié)果,保密管理部門可以加強對屬于重大風(fēng)險和高風(fēng)險的指標(biāo)實時重點監(jiān)控,督促改進(jìn)保密措施,降低保密風(fēng)險水平。
對于歷史風(fēng)險指數(shù)數(shù)據(jù),取l=4,也就是相鄰4 個數(shù)據(jù)作為一個樣本,其中前3 個設(shè)為已知的風(fēng)險指數(shù)值,第4 個月為預(yù)測的風(fēng)險指數(shù)值,以此類推,每個指標(biāo)的24 個月的風(fēng)險指標(biāo)觀測數(shù)據(jù)最終可被分為21 個樣本。選擇前80%的數(shù)據(jù)作為訓(xùn)練樣本,后20%的數(shù)據(jù)作為測試樣本。
表2 100 個指標(biāo)第24 月的風(fēng)險指數(shù)
表3 第24 月風(fēng)險指數(shù)分類結(jié)果
圖2 選取5 個具有代表性指標(biāo)的預(yù)測結(jié)果
從圖2 可以看出,Elman 神經(jīng)網(wǎng)絡(luò)預(yù)測效果較理想,預(yù)測結(jié)果表現(xiàn)出歷史數(shù)據(jù)的波動性和周期性特點。
對Elman 神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果,利用K-means 聚類對第25月的風(fēng)險指數(shù)再次進(jìn)行聚類評估,100 個評價指標(biāo)的風(fēng)險指數(shù)值在預(yù)測后的風(fēng)險等級詳細(xì)分類結(jié)果見表4:
表4 第25 月風(fēng)險指數(shù)分類結(jié)果
根據(jù)表4 中的結(jié)果,保密管理部門必須對重大風(fēng)險和高風(fēng)險指標(biāo)發(fā)出風(fēng)險預(yù)警,加強這些指標(biāo)所對應(yīng)的工作部門的風(fēng)險管控。
對保密管理工作中的大量風(fēng)險評估指標(biāo)以及保密風(fēng)險指數(shù)數(shù)據(jù),利用K-means 聚類算法對評估指標(biāo)進(jìn)行自動分類并確定風(fēng)險等級,采用Elman 神經(jīng)網(wǎng)絡(luò)進(jìn)行保密風(fēng)險指數(shù)的動態(tài)時序預(yù)測,所建立的模型能有效地應(yīng)用到單位保密工作的信息化管理中。