龍穎 袁明蘭 胡雪
摘要:針對正常上網(wǎng)所產(chǎn)生的網(wǎng)絡(luò)流量遠遠大于攻擊、入侵等非正常手段產(chǎn)生的異常流量的特點,通過對傳統(tǒng)FCM算法進行改進,引入新的聚類中心矩陣計算方法來計算落入平均半徑范圍內(nèi)的流量數(shù)據(jù)的對象數(shù)量,根據(jù)該數(shù)量更新聚類中心矩陣,對流量數(shù)據(jù)進行聚類,并識別出網(wǎng)絡(luò)異常流量。對改進FCM算法、傳統(tǒng)FCM、HCM的效果進行比較分析發(fā)現(xiàn),改進FCM雖然處理時間較HCM長,但對噪聲抑制較好,錯分率較低。
關(guān)鍵詞:FCM;流量檢測;聚類
隨著網(wǎng)絡(luò)帶寬逐漸增加、存儲介質(zhì)的容量逐漸增大、服務(wù)器計算能力逐漸增強,促使了數(shù)據(jù)產(chǎn)生的成本越來越低,從而造成網(wǎng)絡(luò)數(shù)據(jù)急劇膨脹。如何快速、準確對網(wǎng)絡(luò)流量進行識別和分類是網(wǎng)絡(luò)入侵檢測中亟待解決的問題。基于模糊集的FCM算法作為一種無監(jiān)督的分類方法,表現(xiàn)了樣本與樣本之間的聯(lián)系,建立了數(shù)據(jù)樣本對類別的不確定性描述,已廣泛應(yīng)用于機器學(xué)習(xí)、數(shù)據(jù)挖掘、圖像分割、海量數(shù)據(jù)分析等領(lǐng)域。在網(wǎng)絡(luò)流量檢測中,往往基于以下假設(shè),即網(wǎng)絡(luò)正常流量的數(shù)量遠遠大于異常流量,異常流量在數(shù)據(jù)中將會呈現(xiàn)出比較特殊的性質(zhì),F(xiàn)CM能通過識別正常類別比例來確定異常的類別。
因傳統(tǒng)FCM對初始數(shù)據(jù)敏感,對于含噪數(shù)據(jù)的識別效果不佳,迭代次數(shù)增加后算法處理時間迅速增加,錯分率有所上升。HCM算法運行速度快,但錯分率較高。本文算法聚類中心矩陣是通過多次迭代生成的,在對噪聲的抑制上比傳統(tǒng)FCM和HCM表現(xiàn)好。
通過理論分析和實驗發(fā)現(xiàn),在模擬實驗環(huán)境下,基于改進FCM算法的網(wǎng)絡(luò)異常流量檢測具有聚類速度較快,分類好的特點,算法魯棒性較好,能正確、及時發(fā)現(xiàn)網(wǎng)絡(luò)異常流量,為網(wǎng)絡(luò)異常流量實時檢測提供技術(shù)支持。
參考文獻:
[1]劉麗珍,宋瀚濤,陸玉昌.無標記訓(xùn)練樣本的Web文本分類方法[J].計算機科學(xué),2006(03):200-201+211.
[2]宋國權(quán),李金鋒.基于聚類算法的腦部MR圖像分割[J].中國醫(yī)療設(shè)備,2017,32(01):26-29.
(作者單位:1.重慶應(yīng)用技術(shù)職業(yè)學(xué)院,2.重慶商務(wù)職業(yè)學(xué)院,3.山東省醫(yī)學(xué)科學(xué)院附屬醫(yī)院)