摘 "要: 傳統(tǒng)的計算機(jī)網(wǎng)絡(luò)穩(wěn)定性分析模型受制于大數(shù)據(jù)環(huán)境下的隨機(jī)性、突發(fā)性、有限性等弊端,分析結(jié)果偏差較大。提出基于模糊層次以及主元分析的大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)穩(wěn)定性測量模型,通過構(gòu)建符合大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)穩(wěn)定性評價指標(biāo)體系,采用主元分析法塑造大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)穩(wěn)定性檢測模型以及性能評估模型,以用戶行為為源數(shù)據(jù)模型,在用戶行為大數(shù)據(jù)環(huán)境下對網(wǎng)絡(luò)穩(wěn)定性進(jìn)行測量。實驗以大型電子商務(wù)網(wǎng)絡(luò)為例進(jìn)行分析,測試網(wǎng)絡(luò)魯棒性結(jié)果顯示,該方法能夠較好地完成大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)魯棒性測試。
關(guān)鍵詞: 大數(shù)據(jù); 網(wǎng)絡(luò); 穩(wěn)定度; 主元分析
中圖分類號: TP391.9 " " " " " " " " " " "文獻(xiàn)標(biāo)識碼: A " " " " " " " " " " " " " "文章編號: 1004?373X(2015)06?0001?03
Research on network stability testing model under the environment of Big data communication
GONG Wei?zhi1, XU Jian?hong1, LIU Zeng?liang2
(1. School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing 100083, China;
2. Teaching and Research Department of Information Command and fight, National Defense University PLA China, Beijing 100091, China)
Abstract: Traditional model for analyzing the stability of the computer network is subject to the big data communication under the environment of the randomness, sudden and finiteness, so the analysis deviation is bigger. The network stability measurement model based on fuzzy hierarchy and principal component analysis in large data environment is put forward. By building a network stability evaluation index system conforming to the big data environment, the principal component analysis method to establish network stability testing model and performance evaluation model under the environment of big data, which takes user behavior as the source data model, measures the network stability under the condition of big data in the user behavior. By taking large?scale e?commerce network as an example for experimental analysis, the network robustness was tested. The result indicates that the method can better accomplish robustness testing of the big data communication network.
Keywords: big data; network; stability; principal component analysis
0 "引 "言
隨著計算機(jī)技術(shù)的發(fā)展以及智能化程度的不斷增加,當(dāng)前計算機(jī)行業(yè)對網(wǎng)絡(luò)發(fā)展的貢獻(xiàn)作用逐漸增強,相關(guān)行業(yè)的網(wǎng)絡(luò)化發(fā)展促進(jìn)了該地區(qū)經(jīng)濟(jì)的增長。而不斷發(fā)生的網(wǎng)絡(luò)安全事件、入侵事件和不同網(wǎng)絡(luò)事故爆發(fā)的頻率明顯增加。這就對相應(yīng)的計算機(jī)網(wǎng)絡(luò)的穩(wěn)定性提出了更高的要求。在用戶行為大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò),需要具備快速通信能力、應(yīng)急反應(yīng)能力、對破壞的網(wǎng)絡(luò)進(jìn)行快速修復(fù)的能力。因為,在大數(shù)據(jù)的通信環(huán)境下,網(wǎng)絡(luò)突發(fā)事件往往具有不確定性,不同的數(shù)據(jù)流量對網(wǎng)絡(luò)的穩(wěn)定性要求也不同,因此需要準(zhǔn)確了解在用戶行為大數(shù)據(jù)環(huán)境下的通信網(wǎng)絡(luò)的穩(wěn)定性,確保計算機(jī)安全得到最大化的保護(hù)[1?2]。傳統(tǒng)的計算機(jī)網(wǎng)絡(luò)的穩(wěn)定性分析模型無法適應(yīng)大數(shù)據(jù)環(huán)境下入侵事件的隨機(jī)性、突發(fā)性、有限性等特征,對當(dāng)?shù)赜嬎銠C(jī)網(wǎng)絡(luò)穩(wěn)定性測量結(jié)果偏差較大,具有一定的局限性[3?6]。
1 "大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)穩(wěn)定性評價體系
網(wǎng)絡(luò)穩(wěn)定性是指發(fā)生網(wǎng)絡(luò)入侵等突發(fā)性危機(jī)的過程中,計算機(jī)網(wǎng)絡(luò)抗干擾、抗毀性能力的大小。穩(wěn)定的計算機(jī)網(wǎng)絡(luò)能夠為大規(guī)模數(shù)據(jù)通信中的突發(fā)性事件提供幫助,確保時間效益最大化以及網(wǎng)絡(luò)損失最小化。對這種在用戶行為大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)穩(wěn)定性的評價需要從評價指標(biāo)、穩(wěn)定度等兩方面進(jìn)行分析。
1.1 "基于模糊層次的網(wǎng)絡(luò)評價指標(biāo)穩(wěn)定度計算
大數(shù)據(jù)通信下的網(wǎng)絡(luò)穩(wěn)定性評價指標(biāo)較多,一般采取相互直接關(guān)聯(lián)性較為有效。采用模糊層次分析方法得到不同指標(biāo)下的評價權(quán)重,采集的指標(biāo)中呈現(xiàn)了大數(shù)據(jù)通信下的網(wǎng)絡(luò)穩(wěn)定性分析層次性,同時大量檢測指標(biāo)又具有模糊性,可通過模糊層次分析法能夠得到不同指標(biāo)的權(quán)重:
[Y=WTX] " " " " " " " " " (1)
式中:[Y=y1,y2,…,yn]用于描述衡量在用戶行為大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)衡量指標(biāo)的權(quán)重集;[X=x1,x2,…,xn]表示專家對不同指標(biāo)的打分評價集,該集合可通過經(jīng)驗得出;W用于描述模糊互補矩陣,且有[i=1nwi=1]。
之后,Y中不同數(shù)據(jù)量下,網(wǎng)絡(luò)穩(wěn)定度測試指標(biāo)的權(quán)重需要和達(dá)標(biāo)評估系數(shù)逐次相乘,求和獲取單個不同指標(biāo)的穩(wěn)定度:
[Ri=j=1nyjwj] " " " " " " "(2)
其中:[Ri]表示在用戶行為大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)單個指標(biāo)的穩(wěn)定度。
1.2 "網(wǎng)絡(luò)在多指標(biāo)下的關(guān)聯(lián)結(jié)構(gòu)分析
第1.1節(jié)敘述單個指標(biāo)下在用戶行為大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)單個指標(biāo)的穩(wěn)定度計算過程。在多指標(biāo)大數(shù)據(jù)通信下的網(wǎng)絡(luò)穩(wěn)定性評價體系下,多指標(biāo)結(jié)構(gòu)評估是一個串聯(lián)同并聯(lián)融合的混合指標(biāo)評估過程,這種結(jié)構(gòu)的穩(wěn)定度用圖1所示。
lt;E:\a06\15年06期\Image\36T1.tifgt;
圖1 多指標(biāo)結(jié)構(gòu)下網(wǎng)絡(luò)穩(wěn)定度結(jié)構(gòu)圖
多指標(biāo)通信網(wǎng)絡(luò)通常由大數(shù)據(jù)通信子系統(tǒng)、數(shù)據(jù)協(xié)調(diào)通信系統(tǒng)以及漏洞修補子系統(tǒng)三個并聯(lián)系統(tǒng)以及一個串聯(lián)系統(tǒng)構(gòu)成,不同的子系統(tǒng)都包含多個評價指標(biāo),可得計算機(jī)網(wǎng)絡(luò)總體指標(biāo)的穩(wěn)定度的運算公式為:
[R=j=131-i=1m(1-Ri)] " " (3)
通過上述分析的方法能夠?qū)υ谟脩粜袨榇髷?shù)據(jù)環(huán)境下的計算機(jī)網(wǎng)絡(luò)的穩(wěn)定性進(jìn)行計算,確保對其實時的穩(wěn)定程度有較好的了解。
1.3 "計算機(jī)網(wǎng)絡(luò)穩(wěn)定性計算過程
為了分析該方法對于在用戶行為大數(shù)據(jù)環(huán)境下的計算機(jī)網(wǎng)絡(luò)穩(wěn)定性分析的作用,應(yīng)構(gòu)建相應(yīng)的區(qū)域評估模型進(jìn)行測試。本文采用6個反映高風(fēng)險大數(shù)據(jù)通信下網(wǎng)絡(luò)發(fā)展特征的主要指標(biāo),塑造計算機(jī)網(wǎng)絡(luò)性能評估指標(biāo)體系,指標(biāo)分別為:信道寬度[x1],緊急檢測[x2],安全檢測人員比例[x3],可承載的數(shù)據(jù)量[x4],信道可承載量[x5],調(diào)度能力[x6],這些指標(biāo)描述了大數(shù)據(jù)的通信環(huán)境中計算機(jī)網(wǎng)絡(luò)的評價指標(biāo),可通過主成分分析法進(jìn)行簡化。
假設(shè)存在n個年度,假設(shè)n=10,p個評估指標(biāo),其中p=6。
(1) 塑造計算機(jī)網(wǎng)絡(luò)性能評估指標(biāo)體系的原始數(shù)據(jù)矩陣:
[X=X11X12...X1pX21X22...X2p? " " " "? " ? " "?Xn1Xn2...Xnp] " " " (4)
(2) 運算相關(guān)系數(shù)矩陣:
[R=k11k12…k1pk21k22…k2p ? " " ? " ? " ?kp1kp2…kpp] " " "(5)
在式(5)中,[kij(i,j=1,2,…,p)]是原始變量[xi]以及[xj]的相關(guān)系數(shù),其運算公式為:
[kij=k=1n(Xki-Xi)(Xkj-Xj)k=1n(Xki-Xi)2(Xkj-Xj)2] " (6)
如果對稱矩陣[rij=rji],則只運算其上三角元素以及下三角元素即可。
(3)運算特征值和特征向量,解特征方法[λ-R=0],獲取特征值[λi(i=1,2,…,p)]并確保其按照從大到小的順序進(jìn)行排列,則有[λ1≥λ2≥…≥λt≥0];再分別獲取對應(yīng)于特征值[λi]的特征向量[ei(i=1,2,…,p)]。
(4) 運算主成分貢獻(xiàn)率[Zi]:[rik=1prki(i=1,2,…,p)];累計貢獻(xiàn)率[k=1γkk=2γi],通常設(shè)在累計貢獻(xiàn)率為85%~95%的特征值[λ1,λ2,…,λm]對應(yīng)為第一,第二,…,第[m(m≤p)]個主成分。
運算主成分載荷為e,[ei=γkeki(i=1,2,…,p)。]
最后將不同主成分的方差貢獻(xiàn)率當(dāng)成權(quán)重,線性加權(quán)求和獲取綜合評價函數(shù):
[Zi=j=1meiyj] (7)
式中:[Zi]用于描述第i個數(shù)據(jù)流的計算機(jī)通信網(wǎng)絡(luò)的穩(wěn)定性,該值越高,表明第i個數(shù)據(jù)區(qū)域網(wǎng)絡(luò)穩(wěn)定性越強,反之越弱。
2 "實驗分析
實驗采用具有高危險性的云計算環(huán)境下的大數(shù)據(jù)通信網(wǎng)絡(luò)作為分析的對象,對本文模型控制下的計算機(jī)網(wǎng)絡(luò)的穩(wěn)定性能進(jìn)行評估,采用計算機(jī)仿真進(jìn)行數(shù)據(jù)處理。選取的指標(biāo)為第1節(jié)中的6個指標(biāo)。根據(jù)6個指標(biāo)計算公式計算的綜合得分能力,見表1。
表1 計算機(jī)網(wǎng)絡(luò)穩(wěn)定能力的綜合得分
分析表1可得,從第一次實驗開始,采用本文模型計算下的計算機(jī)網(wǎng)絡(luò)的穩(wěn)定性綜合得分呈現(xiàn)逐次遞增趨勢,說明該區(qū)域的計算機(jī)網(wǎng)絡(luò)的通信能力逐漸增強,這符合當(dāng)?shù)氐囊粋€網(wǎng)絡(luò)逐漸穩(wěn)定加強的基本情況,說明本文模型是有效的。
為了突出本文模型的優(yōu)勢,選擇傳統(tǒng)的單指標(biāo)疊加的方法對以上數(shù)據(jù)中,在用戶行為大數(shù)據(jù)環(huán)境下的計算機(jī)網(wǎng)絡(luò)穩(wěn)定性進(jìn)行測試,不同方法下獲取的網(wǎng)絡(luò)穩(wěn)定性能綜合分析值,并與真實數(shù)據(jù)進(jìn)行對比,統(tǒng)計誤差,如圖2所述。
分析圖2可得,從第一次2002年開始,本文模型計算出的結(jié)果誤差與傳統(tǒng)的單指標(biāo)疊加的方法相比較,誤差明顯較小。
lt;E:\a06\15年06期\Image\36T2.tifgt;
圖2 兩種模型下網(wǎng)絡(luò)穩(wěn)定性計算誤差
3 "結(jié) "語
本文提出基于模糊層次以及主元分析的計算機(jī)網(wǎng)絡(luò)穩(wěn)定性測量模型,并應(yīng)用用戶行為大數(shù)據(jù)環(huán)境下的計算機(jī)網(wǎng)絡(luò)中。通過模糊層次方法構(gòu)建計算機(jī)網(wǎng)絡(luò)穩(wěn)定性評價指標(biāo)體系,采用主元分析法塑造計算機(jī)穩(wěn)定分析模型以及性能評估模型,對云計算環(huán)境下的計算機(jī)網(wǎng)絡(luò)穩(wěn)定性進(jìn)行測量。實驗以具體網(wǎng)絡(luò)為例進(jìn)行分析,對網(wǎng)絡(luò)的穩(wěn)定性能的時間序列數(shù)據(jù)進(jìn)行綜合分析和評估。
參考文獻(xiàn)
[1] 白曜銘,蔣建中,孫有銘,等.采用FFT方法的抗階數(shù)過估計信道盲辨識算法[J].信號處理,2014,30(1):65?71.
[2] BOUARFA L, DANKELMAN J. Workflow mining and outlier detection from clinical activity logs [J]. Journal of Biomedical Informatics, 2012, 45(6): 1185?1190.
[3] 張萌,張滬寅,葉剛.延遲時間和嵌入維數(shù)聯(lián)合優(yōu)化的網(wǎng)絡(luò)流量預(yù)測[J].計算機(jī)工程與應(yīng)用,2014,50(4):103?109.
[4] 徐曉斌,張光衛(wèi),孫其博,等.一種誤差可控傳輸均衡的 WSN 數(shù)據(jù)融合算法[J].電子學(xué)報,2014,42(6):1205?1209.
[5] WANG J, LI M, CHEN J, et al. A fast hierarchical clustering algorithm for functional modules discovery in protein interaction networks [J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2011, 8(3): 607?620.
[6] NEPUSZ T, YU H, PACCANARO A. Detecting overlapping protein complexes in protein?protein interaction networks [J]. Nature Methods, 2012, 9(5): 471?475.