何衛(wèi)華 王宏
摘 ?要: 為了獲得理想的光纖通信系統(tǒng)安全態(tài)勢預(yù)測效果,針對光纖通信系統(tǒng)安全態(tài)勢預(yù)測建模過程中存在的一些問題,設(shè)計基于大數(shù)據(jù)分析技術(shù)的光纖通信系統(tǒng)安全態(tài)勢預(yù)測方法。首先,搭建光纖通信系統(tǒng)安全態(tài)勢預(yù)測的Hadoop分布式數(shù)據(jù)處理平臺;然后,收集光纖通信系統(tǒng)安全態(tài)勢變化的歷史樣本,并采用多個極限學(xué)習機并行對光纖通信系統(tǒng)安全態(tài)勢數(shù)據(jù)進行訓(xùn)練,構(gòu)建光纖通信系統(tǒng)安全態(tài)勢預(yù)測模型;最后,采用Matlab 2017編程實現(xiàn)光纖通信系統(tǒng)安全態(tài)勢預(yù)測仿真對照測試。結(jié)果表明,大數(shù)據(jù)分析技術(shù)的光纖通信系統(tǒng)安全態(tài)勢預(yù)測精度超過95%,預(yù)測誤差遠遠小于對照方法,降低了預(yù)測建模的時間復(fù)雜度,光纖通信系統(tǒng)安全態(tài)勢預(yù)測效率得到了明顯提升,具有更優(yōu)的實際應(yīng)用價值。
關(guān)鍵詞: 光纖通信系統(tǒng); 安全態(tài)勢; 分布式數(shù)據(jù)處理技術(shù); Hadoop平臺; 預(yù)測模型; 仿真測試
中圖分類號: TN911?34; TP391 ? ? ? ? ? ? ? ? ? ?文獻標識碼: A ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)07?0006?04
Optical fiber communication systems′ security situational prediction
based on big data analysis technology
HE Weihua1, 2, WANG Hong2
(1. College of Computer Science, Sichuan University, Chengdu 610065, China;
2. Sichuan Electromechanical Institute of Vocation and Technology, Panzhihua 617000, China)
Abstract: In order to obtain an ideal security situation prediction effect of optical fiber communication system, an optical fiber communication systems′ security situation prediction method based on big data analysis technology is designed to solve some problems existing in the process of security situation prediction modeling of optical fiber communication system. Firstly, the Hadoop distributed data processing platform for security situation prediction of optical fiber communication system is built. Then, the historical samples of security situation change of optical fiber communication system are collected, and the security situation data of optical fiber communication system are trained simultaneously in parallel by using multiple extreme learning machines to construct the security situation prediction model of optical fiber communication system. Finally, Matlab 2017 is used to realize the simulation and contrast testing of the security situation prediction of optical fiber communication system. The results indicate that the precision of optical fiber communication systems′ security situation prediction based on big data analysis technology is more than 95%, and the prediction error is much less than that of the contrast methods, which reduces the time complexity of prediction modeling. The efficiency of security situation prediction of optical fiber communication system has been significantly improved, which has an excellent practical application value.
Keywords: optical fiber communication system; security situation; distributed data processing technology; Hadoop platform; prediction model; simulation testing
0 ?引 ?言
光纖作為一種常用通信介質(zhì),具有抗干擾能力強、數(shù)據(jù)傳輸速度快、數(shù)據(jù)發(fā)送可靠性高等優(yōu)點,同時,微電子技術(shù)、移動技術(shù)的不斷融合,使光纖通信技術(shù)得到了前所未有的發(fā)展,光纖通信成為企業(yè)、單位以及家庭的主要組網(wǎng)方式,出現(xiàn)許多性能優(yōu)異的光纖通信系統(tǒng)[1?3]。在光纖通信系統(tǒng)的數(shù)據(jù)傳輸過程中,一些人通過非法途徑對重要的數(shù)據(jù)進行竊取、篡改,導(dǎo)致一些重要信息被泄露出來,帶來了一定的經(jīng)濟損失,同時給人們生活帶來一定的困擾,光纖通信系統(tǒng)面臨著巨大的安全問題[4]。
當前光纖通信系統(tǒng)安全防范措施有兩種類型:一種是被動方式的防范措施;另一種是主動的防范措施。被動防范措施主要包括數(shù)據(jù)加密、防火墻等,它們的安全性差,無法有效保證光纖通信系統(tǒng)的安全[5]。主動的防范措施包括異常入侵檢測、安全態(tài)勢預(yù)測等,其中,安全態(tài)勢預(yù)測可以對將來一段時間的光纖通信系統(tǒng)安全狀態(tài)進行描述,實際應(yīng)用價值更高,成為當前一個重要的研究方向[6]。針對光纖通信系統(tǒng)安全態(tài)勢預(yù)測問題,全世界各地的學(xué)者投入了大量的時間進行了深入研究,傳統(tǒng)方法主要有:模糊C?均值聚類的安全態(tài)勢評估模型[7]、基于時間序列分析的網(wǎng)絡(luò)安全態(tài)勢預(yù)測方法[8],它們假設(shè)光纖通信系統(tǒng)安全態(tài)勢變化簡單,簡化了光纖通信系統(tǒng)安全態(tài)勢預(yù)測問題,導(dǎo)致光纖通信系統(tǒng)安全態(tài)勢預(yù)測結(jié)果與實際不相符[9]?,F(xiàn)代方法主要包括:BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)[10?11]、支持向量機等[12],它們可以比較全面地描述光纖通信系統(tǒng)安全態(tài)勢變化特點,預(yù)測效果要優(yōu)于傳統(tǒng)方法。然而,神經(jīng)網(wǎng)絡(luò)和支持向量機自身也存在一些無法克服的難題,如神經(jīng)網(wǎng)絡(luò)存在“過擬合”現(xiàn)象,支持向量機訓(xùn)練耗時長[13]。極限學(xué)習機(Extreme Learning Machine,ELM)是一種訓(xùn)練速度快、沒有迭代過程、參數(shù)設(shè)置簡單的前饋型神經(jīng)網(wǎng)絡(luò),不僅具有支持向量機良好的泛化能力,同時具有神經(jīng)網(wǎng)絡(luò)收斂速度快的優(yōu)點,為此,本文將其引入到光纖通信系統(tǒng)安全態(tài)勢預(yù)測的建模中[14]。由于光纖通信系統(tǒng)安全態(tài)勢數(shù)據(jù)朝大數(shù)據(jù)方向發(fā)展,傳統(tǒng)單節(jié)點處理模式已經(jīng)無法滿足光纖通信系統(tǒng)安全態(tài)勢在線預(yù)測要求。Hadoop分布式數(shù)據(jù)處理平臺可以對一個大任務(wù)進行有效分解、并行處理,提高了數(shù)據(jù)處理的速度。
為了提高光纖通信系統(tǒng)安全態(tài)勢預(yù)測精度,本文設(shè)計了大數(shù)據(jù)分析技術(shù)的光纖通信系統(tǒng)安全態(tài)勢預(yù)測方法,并采用仿真實驗驗證了本文光纖通信系統(tǒng)安全態(tài)勢預(yù)測方法的可行性和優(yōu)越性。
1 ?安全態(tài)勢預(yù)測方法
1.1 ?Hadoop分布式數(shù)據(jù)處理平臺
Hadoop分布式數(shù)據(jù)處理平臺采用并行計算技術(shù)解決大型問題,常采用Map/Reduce機制,并行計算被抽象為Map和Reduce函數(shù),執(zhí)行過程如圖1所示[15]。
Map/Reduce具體描述為:
1) Map階段:將一個大任務(wù)劃分為多個片,每個片稱為Job,一個Job分配給一個節(jié)點處理,并將處理結(jié)果反饋給主節(jié)點。
2) Reduce階段:主要匯聚Map階段各節(jié)點的處理結(jié)果,并將最終結(jié)果輸出。
1.2 ?安全態(tài)勢預(yù)測思路
大數(shù)據(jù)分析技術(shù)的光纖通信系統(tǒng)安全態(tài)勢預(yù)測思路為:
1) 收集光纖通信系統(tǒng)安全態(tài)勢預(yù)測歷史數(shù)據(jù),并對數(shù)據(jù)進行分片處理;
2) 采用大數(shù)據(jù)分析技術(shù)——Hadoop分布式數(shù)據(jù)處理平臺將分片數(shù)據(jù)分配到不同節(jié)點上進行建模,每一個節(jié)點采用ELM建立光纖通信系統(tǒng)安全態(tài)勢預(yù)測模型,具體如圖2所示。
1.3 ?ELM算法
ELM首先隨機設(shè)置輸入層和隱含層間的參數(shù),然后采用最小二乘算法算出輸出層權(quán)值矩陣,非線性處理能力強。設(shè)訓(xùn)練樣本集為[{X,Y}={xi,yi}Ni=1],其中,[xi=[xi1,xi2,…,xip]∈Rp]表示輸入向量,[yi=][[yi1,yi2,…,yiq]∈Rq],[p]和[q]分別表示輸入和輸出向量的維數(shù),隱含層節(jié)點數(shù)為[m],ELM的輸出函數(shù)為:
式中:[αj=[αj1,αj2,…,αjp]T]表示第[j]個隱含層節(jié)點和輸入節(jié)點的連接權(quán)值;[bj]表示第[j]個隱含層節(jié)點的閾值;[βj=[βj1,βj2,…,βjp]T]表示輸出節(jié)點與第[j]個隱節(jié)點的連接權(quán)值;[g()]表示激活函數(shù)。
式(1)采用矩陣方式描述,具體為:
式中:[Y]表示期望輸出;[β=[β1,β2,…,βm]Tm×q];[H]表示隱含層的輸出矩陣,具體為:
[β]可通過最小二乘解獲得,具體為:
[β=H+T] (4)
式中[H+]為[H]的廣義逆。
1.4 ?ELM的光纖通信系統(tǒng)安全態(tài)勢預(yù)測步驟
ELM的光纖通信系統(tǒng)安全態(tài)勢預(yù)測步驟如下:
1) 將光纖通信系統(tǒng)安全態(tài)勢等級劃分為5種,分別為:優(yōu)、良、中、差、危。
2) 對一個光纖通信系統(tǒng)收集一段時間安全態(tài)勢的歷史數(shù)據(jù)。
3) 從歷史數(shù)據(jù)中隨機選擇一部分樣本組成訓(xùn)練樣本集,余下的樣本組成測試樣本。
4) 為了提高ELM的收斂效率,對光纖通信系統(tǒng)安全態(tài)勢等級的值進行如下歸一化處理:
[y=(y-ymin)(ymax-ymin)] (5)
式中:[ymax]和[ymin]分別表示光纖通信系統(tǒng)安全態(tài)勢等級的最大和最小值。
5) 設(shè)置ELM的參數(shù),并采用ELM對光纖通信系統(tǒng)安全態(tài)勢訓(xùn)練樣本集進行學(xué)習,建立預(yù)測模型。
6) 采用測試樣本對光纖通信系統(tǒng)安全態(tài)勢預(yù)測模型的性能進行分析。
ELM的光纖通信系統(tǒng)安全態(tài)勢預(yù)測流程如圖3所示。
2 ?光纖通信系統(tǒng)安全態(tài)勢預(yù)測效果測試
2.1 ?測試環(huán)境
為了測試本文提出的光纖通信系統(tǒng)安全態(tài)勢預(yù)測方法的性能,首先構(gòu)建一個Hadoop分布式數(shù)據(jù)處理平臺,其包括5個節(jié)點,每一個節(jié)點的參數(shù)如表1所示,然后進行仿真模擬實驗。為了使本文方法的光纖通信系統(tǒng)安全態(tài)勢預(yù)測結(jié)果具有對比性,選擇RBF神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)在相同環(huán)境下進行對照實驗。
2.2 ?光纖通信系統(tǒng)安全態(tài)勢實驗數(shù)據(jù)
為了增強仿真實驗結(jié)果的說服力,體現(xiàn)實驗的公平性,采用5個光纖通信系統(tǒng)作為測試對象,其安全態(tài)勢樣本數(shù)量如表2所示。
2.3 ?結(jié)果與分析
2.3.1 ?安全態(tài)勢的預(yù)測精度對比
采用RBF神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、ELM分別對表1的光纖通信系統(tǒng)安全態(tài)勢數(shù)據(jù)進行建模,預(yù)測精度如圖4所示。
分析圖4的光纖通信系統(tǒng)安全態(tài)勢預(yù)測結(jié)果可知:
1) RBF神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)光纖通信系統(tǒng)安全態(tài)勢預(yù)測精度低,預(yù)測結(jié)果的偏差大,因為它們的光纖通信系統(tǒng)安全態(tài)勢預(yù)測結(jié)果極不穩(wěn)定,出現(xiàn)了許多過擬合的光纖通信系統(tǒng)安全態(tài)勢預(yù)測結(jié)果。
2) ELM的光纖通信系統(tǒng)安全態(tài)勢預(yù)測精度要高于RBF神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò),這是因為ELM能夠克服神經(jīng)網(wǎng)絡(luò)過擬合的缺陷,更好地描述了光纖通信系統(tǒng)安全態(tài)勢的變化特點,光纖通信系統(tǒng)安全態(tài)勢預(yù)測誤差得到了降低,對照實驗結(jié)果驗證了ELM用于光纖通信系統(tǒng)安全態(tài)勢預(yù)測建模的優(yōu)越性。
2.3.2 ?光纖通信系統(tǒng)安全態(tài)勢預(yù)測效率對比
分別計算RBF神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、ELM的訓(xùn)練時間和測試時間,如圖5所示。從圖5可以發(fā)現(xiàn),RBF神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、ELM的測試時間相差無幾,而RBF神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、ELM的光纖通信系統(tǒng)安全態(tài)勢建模訓(xùn)練時間差異很大,其中,BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間最長,RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間次之,ELM的訓(xùn)練時間最短,總體上,ELM縮短了光纖通信系統(tǒng)安全態(tài)勢預(yù)測建模時間,提升了光纖通信系統(tǒng)安全態(tài)勢預(yù)測效率。
2.3.3 ?Hadoop分布式數(shù)據(jù)處理平臺的優(yōu)越性測試
為了分析Hadoop分布式數(shù)據(jù)處理平臺的優(yōu)越性,選擇傳統(tǒng)單節(jié)點數(shù)據(jù)處理平臺進行對比測試,建模方法均采用ELM,不同數(shù)據(jù)集下,訓(xùn)練樣本和測試樣本根據(jù)5[∶]1進行劃分,光纖通信系統(tǒng)安全態(tài)勢建模時間如圖6所示。從圖6可以看出,當前數(shù)據(jù)集規(guī)模較小時,Hadoop分布式數(shù)據(jù)處理平臺的建模時間還長于單節(jié)點數(shù)據(jù)處理平臺,這主要是因為各節(jié)點之間的協(xié)調(diào)需要一定的時間,隨著光纖通信系統(tǒng)安全態(tài)勢預(yù)測數(shù)據(jù)集規(guī)模不斷增加,Hadoop分布式數(shù)據(jù)處理平臺和單節(jié)點數(shù)據(jù)處理平臺的建模時間不斷增加,但是Hadoop分布式數(shù)據(jù)處理平臺增幅小,單節(jié)點數(shù)據(jù)處理平臺的建模時間急劇上升,而且數(shù)據(jù)數(shù)量越大,Hadoop分布式數(shù)據(jù)處理平臺優(yōu)勢就更加明顯,驗證了本文選擇Hadoop分布式數(shù)據(jù)處理平臺進行光纖通信系統(tǒng)安全態(tài)勢預(yù)測的優(yōu)越性。
3 ?結(jié) ?語
針對光纖通信系統(tǒng)安全態(tài)勢預(yù)測建模過程中精度低、實時性差等不足,本文提出了基于大數(shù)據(jù)分析技術(shù)的光纖通信系統(tǒng)安全態(tài)勢預(yù)測方法。采用Hadoop分布式數(shù)據(jù)處理平臺對光纖通信系統(tǒng)安全態(tài)勢進行并行處理,采用ELM作為光纖通信系統(tǒng)安全態(tài)勢預(yù)測算法,測試結(jié)果表明,本文方法提升了光纖通信系統(tǒng)安全態(tài)勢預(yù)測精度,改善了光纖通信系統(tǒng)安全態(tài)勢建模效率,相對于其他光纖通信系統(tǒng)安全態(tài)勢預(yù)測方法,具有更高的實際應(yīng)用價值。
參考文獻
[1] 陶源,黃濤,張墨涵,等.網(wǎng)絡(luò)安全態(tài)勢感知關(guān)鍵技術(shù)研究及發(fā)展趨勢分析[J].信息網(wǎng)絡(luò)安全,2018(8):79?85.
[2] 王健,李可,趙國生.面向感知質(zhì)量保障的安全態(tài)勢預(yù)測優(yōu)化模型[J].華中科技大學(xué)學(xué)報(自然科學(xué)版),2018,46(1):22?25.
[3] 劉世文,司成,張紅旗.一種細粒度的網(wǎng)絡(luò)威脅態(tài)勢評估方法[J].計算機工程與應(yīng)用,2018,54(10):149?153.
[4] 郭毅,段海新,張連成,等.基于特征融合相似度的域間路由系統(tǒng)安全威脅感知方法[J].中國科學(xué):信息科學(xué),2017,47(7):878?890.
[5] 文志誠,陳志剛,鄧曉衡,等.基于多源多層次信息融合的網(wǎng)絡(luò)安全態(tài)勢感知方法[J].上海交通大學(xué)學(xué)報,2015,49(8):1144?1152.
[6] 王法玉,張曉洪.多源事件融合的網(wǎng)絡(luò)安全態(tài)勢評估方法[J].計算機工程與設(shè)計,2016,37(6):1440?1444.
[7] 張瑞芝,唐湘滟,程杰仁.基于改進模糊C?均值聚類的DDoS攻擊安全態(tài)勢評估模型[J].計算機工程與科學(xué),2018,40(11):1957?1966.
[8] 文志誠,陳志剛,唐軍.基于時間序列分析的網(wǎng)絡(luò)安全態(tài)勢預(yù)測[J].華南理工大學(xué)學(xué)報(自然科學(xué)版),2016,44(5):137?143.
[9] 李璽,盧昱,劉森,劉鋒.基于Markov game模型的裝備保障信息網(wǎng)絡(luò)安全態(tài)勢感知方法研究[J].計算機應(yīng)用研究,2017,34(11):3441?3445.
[10] 陳維鵬,敖志剛,郭杰,等.基于改進的BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)空間態(tài)勢感知系統(tǒng)安全評估[J].計算機科學(xué),2018,45(z2):335?337.
[11] 江洋,李成海,魏曉輝,等.改進PSO優(yōu)化RBF的網(wǎng)絡(luò)安全態(tài)勢預(yù)測研究[J].測控技術(shù),2018,37(5):56?60.
[12] 孫衛(wèi)喜.用于網(wǎng)絡(luò)安全態(tài)勢預(yù)測的粒子群與支持向量機算法研究[J].計算機應(yīng)用與軟件,2019,36(6):308?316.
[13] 李曉賓,李淑珍.模糊動態(tài)貝葉斯網(wǎng)絡(luò)防御態(tài)勢感知模型[J].探測與控制學(xué)報,2017,39(3):124?129.
[14] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications [J]. Neurocomputing, 2006, 70(1): 489?501.
[15] 王倩,譚永杰,秦杰,等.基于Hadoop分布式平臺的海量圖像檢索[J].南京理工大學(xué)學(xué)報,2017,41(4):442?447.
[16] 湯永利,李偉杰,于金霞,等.基于改進D?S證據(jù)理論的網(wǎng)絡(luò)安全態(tài)勢評估方法[J].南京理工大學(xué)學(xué)報,2015,39(4):405?411.
[17] 楊豪璞,邱輝,王坤.面向多步攻擊的網(wǎng)絡(luò)安全態(tài)勢評估方法[J].通信學(xué)報,2017,38(1):187?198.