□文/齊耀龍
(河北大學(xué)計(jì)算中心 河北·保定)
當(dāng)前,網(wǎng)絡(luò)安全的日益惡化對(duì)信息安全造成了嚴(yán)重威脅,網(wǎng)絡(luò)安全已經(jīng)成為關(guān)系到國(guó)家穩(wěn)定和社會(huì)發(fā)展的重大課題。數(shù)據(jù)庫(kù)系統(tǒng)安全作為網(wǎng)絡(luò)安全的重要分支,有著顯著的研究意義。
數(shù)據(jù)庫(kù)安全評(píng)價(jià)的核心在于決策信息的制定。在傳統(tǒng)的決策制定過(guò)程中,人們?cè)噲D從特定的標(biāo)準(zhǔn)化思維模型入手。然而,在實(shí)現(xiàn)過(guò)程中,如何最小化主觀隨機(jī)性,以及對(duì)主觀因素模糊理解的不確定性一直困擾著人們。本研究將模糊集和粗糙集理論結(jié)合起來(lái),提出了一個(gè)基于模糊粗糙集的數(shù)據(jù)庫(kù)安全評(píng)價(jià)模型。首先,使用模糊集理論對(duì)目標(biāo)信息系統(tǒng)進(jìn)行模糊離散化,然后為了使用特定的信度挖掘數(shù)據(jù)庫(kù)安全決策信息,利用粗糙集理論的連接度對(duì)數(shù)據(jù)庫(kù)安全決策信息進(jìn)行屬性約減。
(一)數(shù)據(jù)預(yù)處理。在這個(gè)階段,使用模糊集對(duì)原始數(shù)據(jù)進(jìn)行處理。原始數(shù)據(jù)主要包括布爾型數(shù)據(jù)、數(shù)值型數(shù)據(jù)、類(lèi)屬性和空數(shù)據(jù)。這四類(lèi)數(shù)據(jù)必須離散化,才能用于進(jìn)一步的聚集處理。
1、空數(shù)據(jù)成員函數(shù)
2、數(shù)值型數(shù)據(jù)成員函數(shù)
3、類(lèi)屬性成員函數(shù)
4、布爾型數(shù)據(jù)成員函數(shù)
(二)數(shù)據(jù)聚類(lèi)。首先把數(shù)據(jù)對(duì)象分成若干個(gè)類(lèi)別,然后將他們應(yīng)用于不同類(lèi)型的挖掘規(guī)則。在這個(gè)階段,規(guī)則的準(zhǔn)確性可以得到提高,并且算法的時(shí)間復(fù)雜度也將會(huì)降低。對(duì)數(shù)據(jù)庫(kù)安全評(píng)價(jià)信息進(jìn)行數(shù)據(jù)聚類(lèi)的步驟定義如下:
1、在域U的元素之間建立模糊相似關(guān)系R。矩陣R的0元素rij:
2、從 R 開(kāi)始,得到映射 G=(V,E),導(dǎo)出最大生成樹(shù)T=(V,TE)。
3、根據(jù)實(shí)際問(wèn)題需要,引入集合λ∈[0,1],T(e)是分支 e 的重量值,T(e)<λ。
聚類(lèi)分析之后,對(duì)單一類(lèi)別進(jìn)行分析,以過(guò)濾那些含有較少元素的類(lèi)別,將元素?cái)?shù)量低于閾值的類(lèi)別刪除。
(三)屬性約簡(jiǎn)。對(duì)原始數(shù)據(jù)進(jìn)行聚類(lèi)之后,就可以對(duì)分類(lèi)數(shù)據(jù)對(duì)象進(jìn)行屬性約簡(jiǎn)和強(qiáng)規(guī)則提取了。其具體實(shí)現(xiàn)步驟如下:
1、首先,分離系統(tǒng)屬性以建立相關(guān)的條件屬性和決策屬性。
2、然后,使用區(qū)分矩陣和分明函數(shù),得到屬性的約簡(jiǎn)集。對(duì)區(qū)分矩陣定義如下:
3、通過(guò)使用約簡(jiǎn)屬性派生規(guī)則集,可以從分明函數(shù)的最小析取范例得到屬性約簡(jiǎn)集。
4、刪除頻度小于給定閾值μ0的奇異規(guī)則。
5、保留達(dá)到最小支持度μs和最小信任度μc的規(guī)則,將其作為強(qiáng)規(guī)則。
為了測(cè)試數(shù)據(jù)庫(kù)安全評(píng)價(jià)模型的能力,課題組基于局域網(wǎng)建立了一個(gè)實(shí)驗(yàn)環(huán)境。為了提供更復(fù)雜的網(wǎng)絡(luò)攻擊數(shù)據(jù),使用各種網(wǎng)絡(luò)程序在同一時(shí)間對(duì)數(shù)據(jù)庫(kù)服務(wù)器實(shí)施攻擊行為。
(一)對(duì)評(píng)估樣本數(shù)據(jù)進(jìn)行預(yù)處理。為了借助網(wǎng)絡(luò)程序?qū)?shù)據(jù)庫(kù)系統(tǒng)實(shí)施攻擊,課題組選用了典型的網(wǎng)絡(luò)攻擊手段作為安全因子。安全因子集定義為:
表1 數(shù)據(jù)庫(kù)安全評(píng)價(jià)決策表
Ti表示對(duì)數(shù)據(jù)庫(kù)實(shí)施的第i次攻擊,F(xiàn)表示來(lái)自局域網(wǎng)的一組攻擊。F中每個(gè)元素的取值為0或1,其中0表示攻擊不存在,1表示攻擊存在。根據(jù)上文所述,首先進(jìn)行數(shù)據(jù)預(yù)處理。然后,將選出的樣本進(jìn)行數(shù)據(jù)聚類(lèi)。在本實(shí)驗(yàn)中,課題組選出了一段時(shí)間內(nèi)的64個(gè)樣本,經(jīng)過(guò)數(shù)據(jù)聚類(lèi),這些樣本被分成8組,其中一組如表1所示。使用H、N、L表示風(fēng)險(xiǎn)程度,其含義相應(yīng)為高風(fēng)險(xiǎn)、正常風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)。(表1)
(二)決策表約簡(jiǎn)和規(guī)則提取。接下來(lái)對(duì)上一步驟中得到的決策表實(shí)施約簡(jiǎn)。屬性約簡(jiǎn)之后,就可以從決策表中提取數(shù)據(jù)庫(kù)安全評(píng)價(jià)規(guī)則了,如表2所示??梢栽谶@個(gè)表中清楚地看到數(shù)據(jù)庫(kù)安全評(píng)價(jià)規(guī)則,同時(shí)也可以集中精力關(guān)注那些高風(fēng)險(xiǎn)攻擊事件。(表2)
表2 屬性約簡(jiǎn)后的決策表
本論文提出了一個(gè)基于模糊粗糙集的數(shù)據(jù)庫(kù)安全評(píng)價(jià)模型。通過(guò)首先執(zhí)行數(shù)據(jù)預(yù)處理和數(shù)據(jù)聚集的方法,然后提取出評(píng)價(jià)規(guī)則。這個(gè)方法不僅能減小數(shù)據(jù)量,還能減小數(shù)據(jù)干擾項(xiàng)。數(shù)據(jù)聚集之后,就可以得到樣本分類(lèi)知識(shí),并且進(jìn)行規(guī)則提取。在規(guī)則提取過(guò)程中,通過(guò)分析奇異規(guī)則、客量度和規(guī)則約束來(lái)提高規(guī)則的提取效率和精確度。實(shí)驗(yàn)結(jié)果表明,本文提出的數(shù)據(jù)庫(kù)安全評(píng)價(jià)模型是切實(shí)有效的。
[1]S.B.Batsell,N.S.Rao,M.Shankar,Distributed Intrusion Detection and Attack Containment for Organizational Cyber Security,http://www.io-c.ornl.gov/projects/docume nts/containment.pdf.
[2]T.Bass,Intrusion Detection System and Multisensor Data Fusion[J].Communicationsofthe ACM,Vol.43,No.4,2000.
[3]J.Shifflet,A Technique Independent Fusion Model for Network Intrusion Detection,Proceedings of the Midstates Conference on Undergraduate Research in Computer Science and Mathemat-ics,2008.
[4]M.Qiao,Research on Knowledge Discovery and Reasoning Methods Based on Rough Set and Database Technology,Tianjin University,2006.
[5]W.J.Liu,Y.D.Gu,J.Y.Wang,Rough-fuzzy Ideals in Semigroups[J].Fuzzy Systems and Mathematics,2004.3.
[6]K.Chakrabarty,R.Biswas,S.Nanda,F(xiàn)uzziness in rough sets[J].Fuzzy Sets and Systems,2000.