摘要 傳統(tǒng)Kmeans算法在初始聚類中心選擇時具有較大隨機(jī)性,是影響聚類分析結(jié)果的關(guān)鍵因素。利用信息熵輔助選取聚類中心,提出一種信息熵與Kmeans融合算法,并以此為基礎(chǔ)構(gòu)建一種網(wǎng)絡(luò)入侵檢測模型,除完成異常入侵檢測外,可使聚類中心隨網(wǎng)絡(luò)變化而動態(tài)更新,提高入侵檢測效果。通過對比試驗(yàn),證明了該方法的可行性及有效性。
關(guān)鍵詞 信息熵;Kmeans算法;入侵檢測
中圖分類號 S126;TP393.0 文獻(xiàn)標(biāo)識碼 A 文章編號 0517-6611(2014)17-05671-02
Abstract Traditional Kmeans algorithm had randomness in selecting initial cluster center, which was the key factor that influenced the clustering results. Using information entropy to auxiliary select the cluster center, an algorithm combining information entropy with Kmeans was put forward, and a network intrusion detection model based on the algorithm was constructed, this model can detect the abnormal intrusion and make the cluster center change along with the network changes dynamically, which can improve the intrusion detection effect. Experiment results show that this model is feasible and effective.
Key words Information entropy; Kmeans algorithm; Intrusion detection
網(wǎng)絡(luò)入侵檢測是一個從網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)收集與網(wǎng)絡(luò)狀況及網(wǎng)絡(luò)行為相關(guān)的數(shù)據(jù),對其進(jìn)行分析以從中發(fā)現(xiàn)異常行為特征并提供預(yù)警的過程[1-2],以此達(dá)到監(jiān)控網(wǎng)絡(luò)行為和防御網(wǎng)絡(luò)入侵的目的。由于入侵行為往往具有較大的不確定性,因此利用聚類分析技術(shù)提取數(shù)據(jù)中隱藏的信息,對識別未知入侵行為具有重要意義。李文華研究了基于模糊C均值FCM聚類的網(wǎng)絡(luò)入侵檢測模型[3];張國鎖等針對FCM在處理大數(shù)據(jù)集時的局限性,提出了改進(jìn)的FCM聚類算法并將其應(yīng)用于入侵檢測[4];羅敏等研究了基于Kmeans聚類算法的無監(jiān)督入侵檢測模型[5];李賀玲針對數(shù)據(jù)分布不均勻的問題,提出了改進(jìn)的Kmeans算法并進(jìn)行了試驗(yàn)分析[6]。上述方法均針對算法在可處理數(shù)據(jù)大小上進(jìn)行研究改進(jìn),未涉及算法核心部分。為此,筆者針對Kmeans聚類算法,考慮到數(shù)據(jù)初始簇中心的選取是影響該算法聚類結(jié)果的主要因素,研究利用信息熵輔助確定聚類中心,并建立一種基于信息熵與Kmeans融合算法(IEKmeans)的網(wǎng)絡(luò)入侵檢測模型,結(jié)果表明,基于此改進(jìn)算法的入侵檢測模型具有良好的入侵檢測率。
4 結(jié)論
該研究基于網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)的特征和現(xiàn)有入侵檢測研究存在的問題,提出了一種基于信息熵與Kmeans融合算法的網(wǎng)絡(luò)入侵檢測模型,結(jié)果表明,該模型可行,且較傳統(tǒng)Kmeans算法而言,提高了入侵檢測的檢測率,降低了誤警率。但該算法及模型的實(shí)現(xiàn),尚未考慮算法的執(zhí)行效率問題,下一步應(yīng)研究在盡可能短的時間內(nèi)完成入侵檢測的實(shí)現(xiàn)方法。
參考文獻(xiàn)
[1] 陳小輝.基于數(shù)據(jù)挖掘算法的入侵檢測方法[J].計算機(jī)工程,2010,36(17):72-76.
[2] 李洋.Kmeans聚類算法在入侵檢測中的應(yīng)用[J].計算機(jī)工程,2007,33(14):154-156.
[3] 李文華.基于聚類分析的網(wǎng)絡(luò)入侵檢測模型[J].計算機(jī)工程,2011,37(17):96-98.
[4] 張國鎖,周創(chuàng)明,雷英杰.改進(jìn)FCM聚類算法及其在入侵檢測中的應(yīng)用[J].計算機(jī)應(yīng)用,2009,29(5):1336-1338.
[5] 羅敏,王麗娜,張煥國.基于無監(jiān)督類的入侵檢測方法[J].電子學(xué)報,2003,31(11):1714-1716.
[6] 李賀玲.數(shù)據(jù)挖掘在網(wǎng)絡(luò)入侵檢測中的應(yīng)用研究[D].長春:吉林大學(xué),2013:26-30.
[7] 杜強(qiáng),孫敏.基于改進(jìn)聚類分析算法的入侵檢測系統(tǒng)研究[J].計算機(jī)工程與應(yīng)用,2011,47(11):106-108.