亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        探究大數(shù)據(jù)下的K-means聚類算法在網(wǎng)絡(luò)安全檢測(cè)中的應(yīng)用

        2017-04-17 01:27:13林慶新
        關(guān)鍵詞:網(wǎng)絡(luò)安全檢測(cè)

        ◆林慶新

        ?

        探究大數(shù)據(jù)下的K-means聚類算法在網(wǎng)絡(luò)安全檢測(cè)中的應(yīng)用

        ◆林慶新

        (福州大學(xué)至誠(chéng)學(xué)院 福建 350002)

        隨著我國(guó)計(jì)算機(jī)應(yīng)用領(lǐng)域的不斷發(fā)展,網(wǎng)絡(luò)通信逐漸開始改變?nèi)藗兊膶W(xué)習(xí)與生活。因此,面對(duì)發(fā)展中的網(wǎng)絡(luò)技術(shù),必須認(rèn)識(shí)到網(wǎng)絡(luò)安全檢測(cè)問(wèn)題的重要性。同時(shí),在網(wǎng)絡(luò)安全檢測(cè)作業(yè)中,突破傳統(tǒng)防火墻技術(shù)、數(shù)據(jù)加密技術(shù)等靜態(tài)安全防御技術(shù)的應(yīng)用,引入新型的安全保障技術(shù)。但在新型安全保障技術(shù)引入過(guò)程中,為了避免入侵攻擊危害系統(tǒng)、網(wǎng)絡(luò)安全,必須運(yùn)用改進(jìn)過(guò)后的K-means聚類算法,最終由此提高網(wǎng)絡(luò)安全檢測(cè)性能。

        大數(shù)據(jù);K-means聚類算法;網(wǎng)絡(luò)安全

        0 引言

        基于互聯(lián)網(wǎng)信息時(shí)代沖擊背景下,網(wǎng)絡(luò)信息獲取、交流溝通、商務(wù)交易等應(yīng)用領(lǐng)域的使用越發(fā)頻繁。同時(shí),據(jù)CNNIC統(tǒng)計(jì)數(shù)據(jù)顯示,我國(guó)域名總數(shù)已經(jīng)達(dá)到了1470萬(wàn)個(gè)左右。但為了更好地發(fā)揮互聯(lián)網(wǎng)信息獲取功能,必須在互聯(lián)網(wǎng)操控過(guò)程中做好網(wǎng)絡(luò)安全檢測(cè)工作。即在大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境中引入K-means聚類算法,繼而有效控制軟件漏洞增長(zhǎng)和惡意程序泛濫等問(wèn)題。以下就是對(duì)K-means聚類算法在網(wǎng)絡(luò)安全檢測(cè)中應(yīng)用難點(diǎn)等相關(guān)問(wèn)題的詳細(xì)闡述。

        1 大數(shù)據(jù)環(huán)境下的K-means聚類算法概述

        聚類,即表示按照對(duì)象間的相似程度,將一組物理對(duì)象分為不定數(shù)目的組。其中,同一組數(shù)據(jù)對(duì)象間具備一定的相似性,而把相似程度較高的數(shù)據(jù)對(duì)象分為一組的行為就是聚類分析過(guò)程。就目前來(lái)看,聚類分析已經(jīng)被逐漸應(yīng)用于商業(yè)、生物學(xué)、萬(wàn)維網(wǎng)、地理研究等領(lǐng)域中。但大數(shù)據(jù)環(huán)境中的K-means聚類算法,可更好地滿足數(shù)據(jù)龐大且數(shù)據(jù)結(jié)構(gòu)復(fù)雜的網(wǎng)絡(luò)數(shù)據(jù)處理需求。同時(shí),K-means聚類算法作為一種以群分析的數(shù)據(jù)挖掘算法,可將數(shù)據(jù)集按照一定的要求,劃分為若干個(gè)子集。其中,同一子集數(shù)據(jù)具備較高的相似性,而不同子集間屬性差異較為明顯。此外,從K-means聚類算法思想層面角度來(lái)看,K-means聚類算法也注重強(qiáng)調(diào)以層次的方式,對(duì)數(shù)據(jù)進(jìn)行分類,并保證每一類數(shù)據(jù)具備一定的相似性,最終獲取k個(gè)聚類[1]。另外,從K-means聚類算法工作過(guò)程角度來(lái)看,如若在網(wǎng)絡(luò)安全檢測(cè)工作中應(yīng)用K-means聚類算法。同時(shí),網(wǎng)絡(luò)環(huán)境中數(shù)據(jù)多且結(jié)構(gòu)復(fù)雜,那么應(yīng)在網(wǎng)絡(luò)大數(shù)據(jù)對(duì)象為n個(gè)的基礎(chǔ)上,隨機(jī)選擇k個(gè)對(duì)象作為初始聚類中心,待初始聚類中心確定后,依據(jù)各個(gè)對(duì)象屬性,進(jìn)行類別劃分。同時(shí),以k個(gè)對(duì)象的距離為劃分標(biāo)準(zhǔn),將k個(gè)對(duì)象分配至最為相似的聚類。其次,待k個(gè)對(duì)象聚類分析處理后,計(jì)算新聚類中所有對(duì)象均值,并反復(fù)多次重復(fù)此計(jì)算過(guò)程,直至標(biāo)準(zhǔn)測(cè)度函數(shù)開始出現(xiàn)收斂。即大數(shù)據(jù)環(huán)境下K-means聚類算法與傳統(tǒng)K-means算法相比,能更好的滿足網(wǎng)絡(luò)安全檢測(cè)需求。為此,應(yīng)提高對(duì)其的重視程度。

        2 基于大數(shù)據(jù)下的K-means聚類算法改進(jìn)

        在網(wǎng)絡(luò)安全檢測(cè)工作開展過(guò)程中,為了達(dá)到最佳的K-means聚類算法應(yīng)用效果,應(yīng)做好數(shù)據(jù)預(yù)處理、初始中心選取、K值確定等工作。即:

        (1)數(shù)據(jù)預(yù)處理。即由于網(wǎng)絡(luò)數(shù)據(jù)共有2種:連續(xù)型、離散型。因而,為了更好的實(shí)現(xiàn)數(shù)據(jù)挖掘處理,需在數(shù)據(jù)預(yù)處理作業(yè)中,將離散型數(shù)據(jù)經(jīng)預(yù)處理后,轉(zhuǎn)換為數(shù)值型,由此達(dá)到最佳的數(shù)據(jù)預(yù)處理效果。但在離散型數(shù)據(jù)向數(shù)值型數(shù)據(jù)轉(zhuǎn)換期間,需定義,如下:

        定義1,D,是報(bào)警數(shù)據(jù)庫(kù),其擁有n個(gè)警告記錄集,而警告記錄集可用T={T1,T2,……,Tn}進(jìn)行表示,其中,n≥1。同時(shí),X是警告記錄集的屬性集,由m個(gè)特征屬性構(gòu)成。而其具體的屬性集可用X={X1,X2,……,Xm}進(jìn)行表示。此外,以對(duì)象間距離來(lái)表示對(duì)象間相似程度[2]。

        定義2,如若警告記錄中任意兩條用Ti和Tj表示,那么Ti與Tj間相似程度可用Sim(Ti,Tj)=Simc(Ti,Tj)+Simd(Ti,Tj)(i≠j)。

        定義3,設(shè)定C={Ci}(i=1,2,……,K)用來(lái)表示聚類集。

        定義4,假定,若所處理的聚類是Ci,那么聚類中心則是mi,而mi=mid+mic。

        (2)確定初始聚類中心。即當(dāng)數(shù)據(jù)轉(zhuǎn)換完成后,可從龐大的數(shù)據(jù)中選擇符合類中心的樣本點(diǎn)密度較高的聚類。同時(shí),在聚類確定過(guò)程中,綜合考慮密度、相似距離等因素對(duì)初始聚類中心的影響,而后,從D中隨機(jī)抽取q個(gè)子集,并設(shè)定所抽取的子集為D1,D2,……Dq,且各個(gè)子集中擁有n條記錄,繼而待各項(xiàng)內(nèi)容確定完畢后,由函數(shù)FindM處理子集,獲取3個(gè)初始聚類中心。即m1、m2、m3[3]。

        (3)確定K值。即當(dāng)初始聚類中心確定后,應(yīng)采取多次重復(fù)的計(jì)算方法,計(jì)算各個(gè)類間相似度距離最大值與最小值,且在聚類分析過(guò)程中,通過(guò)動(dòng)態(tài)化處理方式,不斷調(diào)整K值,最終達(dá)到歸類目的。

        3 K-means聚類算法網(wǎng)絡(luò)安全檢測(cè)模型設(shè)計(jì)

        在網(wǎng)絡(luò)安全檢測(cè)過(guò)程中,為了利用K-means聚類算法提高大數(shù)據(jù)環(huán)境中算法效率,應(yīng)設(shè)計(jì)K-means聚類算法網(wǎng)絡(luò)安全檢測(cè)模型。首先,在K-means聚類算法下網(wǎng)絡(luò)安全檢測(cè)模型設(shè)計(jì)過(guò)程中,應(yīng)將其分為訓(xùn)練階段和檢測(cè)階段。其中,訓(xùn)練階段包括網(wǎng)絡(luò)大數(shù)據(jù)、Hash函數(shù)、構(gòu)建樹形數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)訓(xùn)練等內(nèi)容。而檢測(cè)階段包括Hash函數(shù)、網(wǎng)絡(luò)數(shù)據(jù)基準(zhǔn)庫(kù)、待檢測(cè)網(wǎng)絡(luò)數(shù)據(jù)抓取、Hash函數(shù)處理網(wǎng)絡(luò)數(shù)據(jù)、找出K的臨近對(duì)象、直推式異常檢測(cè)等內(nèi)容。即訓(xùn)練階段負(fù)責(zé)對(duì)正常數(shù)據(jù)進(jìn)行提取,然后,將所采集的數(shù)據(jù)通過(guò)Hash函數(shù)處理方式,進(jìn)行數(shù)據(jù)預(yù)處理。同時(shí),將特征數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)模型,以便于利用K-means聚類算法對(duì)數(shù)據(jù)進(jìn)行分類,且構(gòu)建樹形結(jié)構(gòu)。此外,檢測(cè)階段主要負(fù)責(zé)對(duì)待檢網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行Hash函數(shù)處理。然后,利用K-means聚類算法,對(duì)數(shù)據(jù)進(jìn)行分類。同時(shí),探索樹形結(jié)構(gòu)中K臨近對(duì)象,最終經(jīng)直推式異常檢測(cè),判斷數(shù)據(jù)是否存在異?,F(xiàn)象,就此達(dá)到網(wǎng)絡(luò)安全隱患檢測(cè)目的[4]。

        4 網(wǎng)絡(luò)安全檢測(cè)模型應(yīng)用測(cè)試

        為了更好的掌握到K-means聚類算法在網(wǎng)絡(luò)安全檢測(cè)中的應(yīng)用效果,可在網(wǎng)絡(luò)安全檢測(cè)模型設(shè)計(jì)完成后,以KDD Cup99為模型數(shù)據(jù)采集參考,進(jìn)行網(wǎng)絡(luò)安全檢測(cè)模型應(yīng)用測(cè)試工作。而在實(shí)際應(yīng)用測(cè)試作業(yè)中,可將DoS、Probe、R2L、U2R作為攻擊類型[5]。同時(shí),模型中所記錄的屬性值共有34個(gè),字符屬性是7個(gè)。但在所有字符屬性中,正常數(shù)據(jù)占據(jù)總體的18.69%,異常數(shù)據(jù)占據(jù)總體的81.34%。而后,待數(shù)據(jù)確定后,進(jìn)行安全模型應(yīng)用測(cè)試。同時(shí),在具體的性能評(píng)估工作開展期間,從這些數(shù)據(jù)中選擇3組,用于樣本分析。其中,這3組子集中每個(gè)子集都有1000記錄,而記錄中1.8%-2.0%是已知異常數(shù)據(jù)。即具體的樣本數(shù)據(jù)如下:

        表 1 樣本

        待樣本處理處理后發(fā)現(xiàn),改進(jìn)后的K-means算法優(yōu)于傳統(tǒng)K-means算法。即試驗(yàn)結(jié)果如下:

        表 2 檢測(cè)結(jié)果比對(duì)

        從表2中即可看出,在傳統(tǒng)K-means聚類算法與改進(jìn)過(guò)后的K-means聚類算對(duì)比中即可看出,改進(jìn)過(guò)后的算法與傳統(tǒng)算法相比,檢測(cè)率提高約,而誤檢率約降低,檢測(cè)時(shí)間相對(duì)節(jié)省。因而,在大數(shù)據(jù)背景下,應(yīng)將改進(jìn)過(guò)的K-means聚類算法應(yīng)用于網(wǎng)絡(luò)安全檢測(cè)作業(yè)中。此外,從對(duì)不同攻擊類型檢測(cè)的效率角度來(lái)看,傳統(tǒng)K-means聚類算法與改進(jìn)過(guò)后的聚類算法檢測(cè)效率如下:

        表 3 對(duì)不同攻擊類型檢測(cè)的效率

        從表3中即可看出,在U2R、R2L、DoS、Probe等不同攻擊類型檢測(cè)中,改進(jìn)過(guò)后的K-means算法檢測(cè)效果更優(yōu)。因而,在大數(shù)據(jù)背景下,應(yīng)注重將K-means聚類算法應(yīng)用于網(wǎng)絡(luò)安全檢測(cè)作業(yè)中,就此打造一個(gè)良好的網(wǎng)絡(luò)通信環(huán)境。同時(shí),符合商務(wù)交易、交流溝通等領(lǐng)域中互聯(lián)網(wǎng)應(yīng)用需求,且能避免因病毒侵襲等威脅網(wǎng)絡(luò)運(yùn)行安全的情況。

        5 結(jié)論

        綜上可知,在大數(shù)據(jù)環(huán)境的沖擊下,網(wǎng)絡(luò)安全檢測(cè)問(wèn)題逐漸引起了人們關(guān)注。而由于傳統(tǒng)的防火墻技術(shù)等檢測(cè)方法已經(jīng)無(wú)法滿足用戶需求,為了保證網(wǎng)絡(luò)交易、交流溝通等的安全性,應(yīng)在網(wǎng)絡(luò)數(shù)據(jù)量大且結(jié)構(gòu)復(fù)雜的環(huán)境中,改進(jìn)網(wǎng)絡(luò)安全檢測(cè)方法。即運(yùn)用改進(jìn)過(guò)的K-means聚類算法,對(duì)冗余的數(shù)據(jù)進(jìn)行分類,之后,經(jīng)數(shù)據(jù)的預(yù)處理,提取關(guān)鍵數(shù)據(jù)進(jìn)行運(yùn)算,并在運(yùn)算過(guò)程中,提高網(wǎng)絡(luò)安全檢測(cè)效率,避免因數(shù)據(jù)冗余所造成的算法效率低等現(xiàn)象。

        [1]鳳祥云.基于K-Means聚類算法入侵檢測(cè)系統(tǒng)研究[J].電腦知識(shí)與技術(shù),2016.

        [2]淡軍.基于并行二分K-means算法在異常檢測(cè)中的應(yīng)用[J].福建電腦,2016.

        [3]王勝利.基于大數(shù)據(jù)聚類算法在網(wǎng)絡(luò)安全中的應(yīng)用[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2016.

        [4]王茜,劉勝會(huì).改進(jìn)K-means算法在入侵檢測(cè)中的應(yīng)用研究[J].計(jì)算機(jī)工程與應(yīng)用,2015.

        [5]劉長(zhǎng)騫.K均值算法改進(jìn)及在網(wǎng)絡(luò)入侵檢測(cè)中的應(yīng)用[J].計(jì)算機(jī)仿真,2011.

        猜你喜歡
        網(wǎng)絡(luò)安全檢測(cè)
        網(wǎng)絡(luò)安全知多少?
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        “幾何圖形”檢測(cè)題
        “角”檢測(cè)題
        網(wǎng)絡(luò)安全
        網(wǎng)絡(luò)安全人才培養(yǎng)應(yīng)“實(shí)戰(zhàn)化”
        上網(wǎng)時(shí)如何注意網(wǎng)絡(luò)安全?
        小波變換在PCB缺陷檢測(cè)中的應(yīng)用
        亚洲人成色777777老人头| 国产精品一区二区久久久av| 国产精品一区二区三久久不卡| 天天躁日日躁狠狠躁欧美老妇| 精品无码国产污污污免费网站| 亚洲成精品动漫久久精久| 国产亚洲日本精品二区| 亚洲国产精品久久精品 | 又白又嫩毛又多15p| 亚洲AV无码精品一区二区三区l| 最新亚洲视频一区二区| 久久精品国产成人午夜福利| 狠狠噜天天噜日日噜视频麻豆| 精品少妇大屁股白浆无码| 精品日本免费观看一区二区三区| 色狠狠一区二区三区中文| 国产成人精品一区二区不卡| 中文字幕在线日韩| 一区二区三区日本久久| 色偷偷色噜噜狠狠网站30根| 国产99久久久久久免费看| 一区二区三区放荡人妻| 国产精品毛片毛片av一区二区| 久久中文骚妇内射| 亚洲精品无码久久久久sm| 亚洲乱码一区AV春药高潮| 99久久婷婷国产一区| 亚洲av无码专区亚洲av伊甸园| 国产黄三级三·级三级| 国产成人高清精品亚洲一区| 日出白浆视频在线播放| 久久久精品456亚洲影院| 在线观看一区二区女同| 少妇被猛烈进入中文字幕 | 纯肉无遮挡H肉动漫在线观看国产| 亚洲国产综合精品中文| 精品无码一区二区三区爱欲| 国产熟女高潮视频| 精品国产自拍在线视频| 日本中文字幕婷婷在线| 天天弄天天模|