符保龍
(柳州職業(yè)技術學院,廣西 柳州 545006)
隨著網(wǎng)絡的發(fā)展,網(wǎng)絡安全受到廣泛的關注,對網(wǎng)絡入侵的研究已經(jīng)成為數(shù)據(jù)挖掘的一個熱點問題。很多學者都對網(wǎng)絡入侵檢測進行了大量研究,周飛菲[1]根據(jù)向量機的特點,結合決策集合理論,提出了一種向量機和決策理論相融合的入侵檢測模型,有效解決了數(shù)據(jù)高維度的問題。劉其琛等[2]利用粗糙集對樣本屬性進行約簡,利用稀疏化算法優(yōu)化對最小支持向量機進行優(yōu)化,解決網(wǎng)絡入侵數(shù)據(jù)高維度、大數(shù)據(jù)量的問題。王雪松等[3]利用高斯函數(shù)對蟻群進行優(yōu)化,克服蟻群易于陷入早熟的問題,并利用優(yōu)化的蟻群算法對支持向量機的參數(shù)進行尋優(yōu),提升支持向量機的分類效果。
筆者針對網(wǎng)絡入侵數(shù)據(jù)高維度、數(shù)量大的特點,利用最小支持向量機(Least Squares Support Vector Machine,簡稱LSSVM)[4]對網(wǎng)絡入侵數(shù)據(jù)進行檢測。在檢測過程中,引入混沌猴群算法(Chaotic Monkey Algorithm,簡稱CMA)[5]對LSSVM的核函數(shù)系數(shù)以及函數(shù)的調(diào)節(jié)系數(shù)進行優(yōu)化,構建一個基于混沌猴群優(yōu)化的最小支持向量機Web文本分類模型(Text Classification Model of Least Squares Support Vector Machine Based on Chaotic Monkey Optimization Algorithm,簡稱CMA-LSSVM)。實驗結果表明,CMA-LSSVM模型對網(wǎng)絡入侵數(shù)據(jù)具有良好的檢測速度和精度,具有一定的應用前景。
LSSVM算法是針對標準SVM算法存在不等式約束過多、影響算法效率等問題,用等式約束替換不等式約束,從而用最小二乘法的線性方程組對拉格朗日乘子進行求解,提升算法的運算速度。LSSVM算法可以較好地解決大樣本、高維度和局部極值問題,其基本原理為[4-6]:
圖1 三種模型平均入侵檢測率
圖2 三種模型平均誤檢測率
圖1 和圖2顯示,相比LSSVM算法,MA-LSSVM和CMA-LSSVM這兩個算法都具有較高的檢測率和較低的誤檢率,MA-LSSVM和CMA-LSSVM算法相對更高一點。這是因為利用MA和CMA全局尋優(yōu)算法對LSSVM的參數(shù)進行優(yōu)化,從而有利于提升LSSVM的分類精度。特別是CMA-LSSVM算法優(yōu)勢明顯,該模型針對標準MA算法中的無序初始化操作問題,利用混沌算子進行優(yōu)化,從而獲得分布均勻的初始化值,避免MA算法易于陷入早熟問題,有利于算法快速尋到全局最優(yōu)值,從而提升入侵檢測效果,降低了誤檢率。
將混沌尋優(yōu)理論用于確定MA算法的初始值,并利用改進后的MA算法對LSSVM調(diào)節(jié)系數(shù)γ和核函數(shù)參數(shù)σ進行優(yōu)化,提升LSSVM模型的分類精度。仿真結果顯示,構造的CMA-LSSVM網(wǎng)絡入侵檢測模型具有較好的泛化能力和較高的檢測精度,是一種性能優(yōu)良的入侵檢測算法。