趙男男,李 佳
(廣東海洋大學(xué)寸金學(xué)院,廣東 湛江 524094)
云計(jì)算在近幾年來(lái)一直作為新興領(lǐng)域得以應(yīng)用,該計(jì)算模式的關(guān)注熱度逐年增加,云計(jì)算屬于可配置計(jì)算,利用存儲(chǔ)資源以及計(jì)算外包完成信息的交換、存儲(chǔ)以及計(jì)算等操作,實(shí)現(xiàn)資源中心化。但是隨著網(wǎng)絡(luò)的日益發(fā)展,網(wǎng)絡(luò)安全漏洞的事件發(fā)生數(shù)量也日益增多,一方面如果網(wǎng)絡(luò)蠕蟲(chóng) 爆發(fā)、DDoS攻擊等大規(guī)模的網(wǎng)絡(luò)安全事件將占用大量的網(wǎng)絡(luò)資源以及計(jì)算資源[1,2];另外一方面突發(fā)訪(fǎng)問(wèn)以及網(wǎng)絡(luò)故障等非惡意行為也會(huì)導(dǎo)致流量發(fā)生突變,影響網(wǎng)絡(luò)正常使用。云計(jì)算下多屬性信息交換安全漏洞主要會(huì)影響到網(wǎng)絡(luò)流量,而網(wǎng)絡(luò)流量是保證網(wǎng)絡(luò)正常運(yùn)行的重要手段。信息交換安全漏洞識(shí)別是組建在網(wǎng)絡(luò)流量的正常行為模式輪廓之上,假設(shè)得到網(wǎng)絡(luò)流量信息輪廓值與正常值的差異超過(guò)設(shè)定范圍,則進(jìn)行入侵報(bào)警[3]。
現(xiàn)階段信息安全越來(lái)越受到大家的廣泛關(guān)注,現(xiàn)階段對(duì)于安全的研究不僅僅出現(xiàn)在軍事以及外交上,其中商業(yè)的發(fā)展也滲透著信息安全。對(duì)于信息交換安全漏洞識(shí)別是當(dāng)前需要研究的熱點(diǎn)話(huà)題,要想真正意義上提升整個(gè)系統(tǒng)的安全性能,需要對(duì)其展開(kāi)具體的研究,目前在該研究領(lǐng)域也出現(xiàn)了一些研究成果。
文獻(xiàn)[4]提出了一種基于有限狀態(tài)機(jī)的多屬性信息交換安全漏洞識(shí)別。提取多屬性信息交換下的安全漏洞特征,以安全漏洞特征為遷移條件構(gòu)建識(shí)別模型,并將模型狀態(tài)轉(zhuǎn)移過(guò)程抽象為多維向量,再利用余弦相似度公式進(jìn)行相似度計(jì)算,結(jié)合設(shè)定的閾值,實(shí)現(xiàn)多屬性信息交換安全漏洞識(shí)別,但是該方法在應(yīng)用過(guò)程中存在識(shí)別準(zhǔn)確度低的問(wèn)題。文獻(xiàn)[5]提出一種基于非線(xiàn)性規(guī)劃的多屬性信息交換安全漏洞識(shí)別方法,采用最優(yōu)加權(quán)系數(shù)法構(gòu)造目標(biāo)函數(shù),以及約束條件下的最小化目標(biāo)函數(shù),利用非線(xiàn)性規(guī)劃法求出加權(quán)系數(shù),構(gòu)建多屬性信息交換安全漏洞識(shí)別模型,實(shí)現(xiàn)多屬性信息交換安全漏洞識(shí)別。該方法可以使單項(xiàng)識(shí)別優(yōu)勢(shì)互補(bǔ),進(jìn)而提高評(píng)估精度,但實(shí)際應(yīng)用效果較差,所需時(shí)間較長(zhǎng)。
針對(duì)傳統(tǒng)方法存在的問(wèn)題,提出云計(jì)算下多屬性信息交換安全漏洞識(shí)別方法。仿真結(jié)果表明,所提方法能夠準(zhǔn)確識(shí)別信息交換過(guò)程中產(chǎn)生的安全漏洞,確保系統(tǒng)的穩(wěn)定運(yùn)行。
相關(guān)數(shù)據(jù)主要是由41個(gè)標(biāo)記在連接儀器的特征與1個(gè)標(biāo)記正常與否的標(biāo)志所組成,所以利用X(t)={x1(t),x2(t),…,xn(t)}代表t時(shí)刻的一個(gè)連接,則有
(1)
相似度計(jì)算公式為
(2)
其中:
(3)
在上述基礎(chǔ)上,則能夠計(jì)算特征對(duì)于(xi(t),xj(t))的相似度,即
(4)
假設(shè)兩個(gè)特征中的相似度閾值高于任意閾值,則需要?jiǎng)h除其中的一個(gè)特征。
SVM主要適合處理利用一定數(shù)量的支持向量決定的超平面來(lái)進(jìn)行數(shù)據(jù)分類(lèi),支持向量本質(zhì)上就是一個(gè)訓(xùn)練數(shù)據(jù)的子集,該子集被設(shè)定為用于定義二類(lèi)數(shù)據(jù)的邊界。在無(wú)法利用SVM分類(lèi)問(wèn)題的情況下,通過(guò)核函數(shù)在高維特征空間中劃分解決上述的分類(lèi)問(wèn)題。在高維特征空間中,能夠利用線(xiàn)性超平面進(jìn)行分離。
其中,線(xiàn)性邊界能夠表示為
ωTx+b=0
(5)
式中,b為邊界校正參數(shù),ωT為線(xiàn)性分量,x為邊界變量。
線(xiàn)性邊界主要通過(guò)訓(xùn)練數(shù)據(jù)進(jìn)行函數(shù)值估計(jì)。假設(shè)訓(xùn)練數(shù)據(jù)是線(xiàn)性可分的,則存在一對(duì)(ω,b)∈Rn×R使得
ωTx+b≥+1,(x∈A)
(6)
ωTx+b≤-1,(x∈B)
(7)
A,B均為線(xiàn)性訓(xùn)練數(shù)據(jù)集合。
利用下式給出決策函數(shù)的表達(dá)式
fw,b(x)=sign(ωTx+g)
(8)
式中,ω代表權(quán)重向量;g代表偏離值。將式(6)和式(7)進(jìn)行合并,則有
y(ωTx+b)≥1,(x∈A∪B)
(9)
將上述問(wèn)題轉(zhuǎn)化為優(yōu)化問(wèn)題,則有
minΦ(ω)=‖ω‖2/2
(10)
s.t.y(ωTx+b)≥1
(11)
在支持向量機(jī)算法中正規(guī)化參數(shù)與核寬度是兩個(gè)能夠調(diào)整的參數(shù),其中參數(shù)的取值不同,分類(lèi)器所對(duì)應(yīng)的的泛化能力也就不同。在上述基礎(chǔ)上,組建支持向量機(jī)模型:
(12)
云計(jì)算的應(yīng)用環(huán)境以及技術(shù)類(lèi)型決定了其數(shù)據(jù)交換過(guò)程問(wèn)題主要為數(shù)據(jù)安全、可靠以及效率幾個(gè)方面。這其中,在云計(jì)算具有開(kāi)放性的前提條件下,數(shù)據(jù)交換會(huì)面臨非法存儲(chǔ)、下載以及訪(fǎng)問(wèn)等不安全問(wèn)題,這導(dǎo)致用戶(hù)無(wú)法將核心數(shù)據(jù)的交換和處理托付給云計(jì)算平臺(tái)。下面利用具體方法識(shí)別云計(jì)算下多屬性信息交換安全漏洞。
設(shè)定云平臺(tái)未識(shí)別序列為X={x1,x2,…,xn},其中該序列中的一部分?jǐn)?shù)據(jù)為正常數(shù)據(jù)。
信息交換安全漏洞識(shí)別方法主要是組建正常的數(shù)據(jù)模型,通過(guò)云平臺(tái)所組建的模型識(shí)別信息交互過(guò)程中出現(xiàn)的安全漏洞。
首先尋找正常數(shù)據(jù)的最優(yōu)評(píng)價(jià)函數(shù)f:X→Y,針對(duì)設(shè)定的xi∈X,能夠獲取與之對(duì)應(yīng)的輸出yi∈Y。通過(guò)經(jīng)驗(yàn)最小化原則[6],能夠?qū)⑸鲜鰞?yōu)化問(wèn)題描述為
(13)
式中,L代表?yè)p失函數(shù);Ω代表函數(shù)f的取值范圍;η代表調(diào)和參數(shù)。初始數(shù)據(jù)在經(jīng)過(guò)轉(zhuǎn)換后,需要將獲取的最新特征映射到新的特征空間中[7]。其中設(shè)定c代表中心,R代表球面的半徑,通過(guò)計(jì)算球面半徑與球心在特征空間的長(zhǎng)度獲取數(shù)據(jù)樣本的異常程度,則有
f(x)=‖φ(x)-c‖2-R2
(14)
如果實(shí)例在超平面內(nèi),則對(duì)應(yīng)的評(píng)價(jià)函數(shù)值為f(x)<0,認(rèn)定該點(diǎn)為正常點(diǎn);如果實(shí)例在超平面外,則對(duì)應(yīng)的評(píng)價(jià)函數(shù)為f(x)>0,認(rèn)定該點(diǎn)為異常點(diǎn),也就說(shuō)明在進(jìn)行信息交換的過(guò)程中存在異常數(shù)據(jù)以及惡意攻擊。為了能夠更好的抑制模型的過(guò)度擬合[8],需要在算法中加入ξi>0,并且樣本需要滿(mǎn)足以下的約束條件
‖φ(x)-c‖2≤R2+ξi
(15)
利用下式給出目標(biāo)函數(shù)的表達(dá)式
(16)
式中,C代表平衡超平面半徑以及松弛變量參數(shù)。將以上問(wèn)題轉(zhuǎn)化成優(yōu)化問(wèn)題,通過(guò)拉格朗日乘子方法對(duì)該問(wèn)題進(jìn)行求解,則有
(R2+ξi-‖φ(x)-c‖2)
(17)
式中,αi≥0,βi≥0;在上述基礎(chǔ)上,分別對(duì)R、c、ξi進(jìn)行求導(dǎo),則能夠獲取
(18)
將式(17)分別代入式(18)中,則有
(19)
(20)
通過(guò)αi的取值能夠樣本劃分成三類(lèi),如果αi=0,則說(shuō)明樣本在球體的內(nèi)部,該樣本為正常數(shù)據(jù)樣例;如果0<αi 在模型獲取標(biāo)記數(shù)據(jù)后,通過(guò)半監(jiān)督的學(xué)習(xí)方式實(shí)現(xiàn)模型的優(yōu)化以及拓展[9-10],其中數(shù)據(jù)的標(biāo)記方式選用主動(dòng)學(xué)習(xí)方式。半監(jiān)督學(xué)習(xí)方式對(duì)應(yīng)的數(shù)據(jù)模型如下,其中給定數(shù)據(jù)集為 X=(x1,x2,…,xn,xn+1,…,xn+m) (21) 式中,前n個(gè)數(shù)據(jù)代表沒(méi)有進(jìn)行標(biāo)記的數(shù)據(jù),后面m個(gè)代表標(biāo)記數(shù)據(jù),其中標(biāo)記類(lèi)別表示為 Y={+1,-1} (22) 式中,+1代表正常數(shù)據(jù),-1代表異常數(shù)據(jù)。如果其中含有m1個(gè)正例,m2個(gè)負(fù)例,且滿(mǎn)足m1+m2=m=n,則優(yōu)化目標(biāo)函數(shù)為 (23) 式中,γ≥0代表二類(lèi)標(biāo)記數(shù)據(jù)邊緣之間的長(zhǎng)度;C1代表沒(méi)有進(jìn)行標(biāo)記的數(shù)據(jù)權(quán)衡參數(shù);C2代表正例數(shù)據(jù)的權(quán)衡參數(shù);C3代表負(fù)例數(shù)據(jù)的權(quán)重參數(shù);ξi、ξj、ξk分別代表不同的松弛變量,實(shí)質(zhì)就是距離球心較遠(yuǎn)的樣本被錯(cuò)誤分類(lèi)的機(jī)率較大。其中C1、C2、C3取值的大小會(huì)影響模型的構(gòu)建速度。C1全面說(shuō)明了未標(biāo)記數(shù)據(jù)的約束作用[11];C2、C3全面說(shuō)明已經(jīng)進(jìn)行標(biāo)記數(shù)據(jù)的引導(dǎo)作用。在上述基礎(chǔ)上,將以上問(wèn)題轉(zhuǎn)化成無(wú)約束最優(yōu)化問(wèn)題,則有 ξi=1(R2-‖φ(xi)-c‖2) (24) ξj=1(R2-‖φ(xj)-c‖2-γ) (25) ξk=1(R2-‖φ(xk)-c‖2-R2-γ) (26) 如果風(fēng)險(xiǎn)函數(shù)的取值為I(t)=max(-t,0),則有 (T-‖φ(xi)‖2+2φ(xi)′c) (27) 在上式的基礎(chǔ)上,設(shè)定樣本類(lèi)型的取值為+1或者-1,則有 (28) 通過(guò)式(28)可知,球心c的大小是通過(guò)以上兩種不同的數(shù)據(jù)共同決定的,根據(jù)其能夠得到分類(lèi)精度更高的分類(lèi)模型。以下需要引入損失函數(shù)進(jìn)行求解,則有 (29) 利用下式對(duì)不同的變量進(jìn)行求導(dǎo),則有 (30) 通過(guò)求導(dǎo)鏈?zhǔn)椒▌t并且結(jié)合相關(guān)理論,能夠獲取λi和λj的偏微分,則有 (31) (32) 在上述基礎(chǔ)上,對(duì)其中的部分?jǐn)?shù)據(jù)進(jìn)行識(shí)別標(biāo)記,得到多屬性信息交換安全漏洞識(shí)別公式 (33) 在以上分析的基礎(chǔ)上,選取系統(tǒng)中的部分?jǐn)?shù)據(jù)進(jìn)行標(biāo)記,并且通過(guò)半監(jiān)督的方式對(duì)最新標(biāo)記的數(shù)據(jù)進(jìn)行二次優(yōu)化[12]。針對(duì)本文的性能指標(biāo)而言,通常情況下有檢測(cè)性能以及變化程度兩種指標(biāo),本文選用半監(jiān)督的的形式,綜上需要將兩種指標(biāo)相結(jié)合獲取終止條件,則有 con=b1MSE(f(x,y)+b2var(f(x,y))) (34) 其中,公式的前部分代表模型對(duì)于標(biāo)記樣本的預(yù)測(cè)值和真實(shí)值之間的誤差,取值為前部標(biāo)記樣本的預(yù)測(cè)分類(lèi)以及實(shí)際分類(lèi)結(jié)果之間的差異;后部分的取值為全部沒(méi)有進(jìn)行標(biāo)記樣本預(yù)測(cè)分類(lèi)差異程度。如果上述模型符合約束條件,則終止條件,反之則繼續(xù)進(jìn)行主動(dòng)學(xué)習(xí)。 綜上所述,完成了云計(jì)算下多屬性信息交換安全漏洞識(shí)別。 為了驗(yàn)證所提云計(jì)算下多屬性信息交換安全漏洞識(shí)別方法的有效性,需要進(jìn)行一次全面仿真。實(shí)驗(yàn)環(huán)境為:DELL臺(tái)式機(jī),Windows XP系統(tǒng),1G內(nèi)存,3.2GHz Pentium(R)4處理器,Matlab R2008b集成環(huán)境,Mysql5.1數(shù)據(jù)庫(kù)。 1)識(shí)別效率(%)對(duì)比 在本次實(shí)驗(yàn)中,主要針對(duì)不同方法的識(shí)別效率(%)進(jìn)行對(duì)比,其中選取文獻(xiàn)[4]方法、文獻(xiàn)[5]方法作為對(duì)比方法進(jìn)行仿真,具體的對(duì)比結(jié)果如圖1所示。 圖1 不同方法識(shí)別效率對(duì)比結(jié)果 分析上述可知,不同識(shí)別方法的識(shí)別效率隨著實(shí)驗(yàn)次數(shù)的變化而變化。在實(shí)驗(yàn)初期,各個(gè)識(shí)別方法的識(shí)別效率都呈直線(xiàn)上升趨勢(shì),當(dāng)實(shí)驗(yàn)次數(shù)為5次時(shí),文獻(xiàn)[4]方法的識(shí)別效率開(kāi)始呈下降趨勢(shì),但是其它兩種方法的識(shí)別效率呈穩(wěn)定趨勢(shì)。通過(guò)具體的實(shí)驗(yàn)數(shù)據(jù)分析可知,所提方法的識(shí)別效率相比傳統(tǒng)方法有了明顯的提升,充分驗(yàn)證了所提方法的優(yōu)越性。 2)識(shí)別效果全面對(duì)比 為了更加全面驗(yàn)證所提方法的優(yōu)越性, 以下分別對(duì)比不同方法的識(shí)別率(%)、誤檢率(%)以及漏檢率(%),具體的對(duì)比結(jié)果如下表所示。 分析表1可知,不同方法的識(shí)別率隨著樣本數(shù)量的變化而變化,所提方法的識(shí)別率最高為100%,這說(shuō)明所提方法能夠更為準(zhǔn)確識(shí)別信息交換過(guò)程的安全漏洞,其它兩種方法的識(shí)別效率明顯低于所提方法,說(shuō)明其它兩種方法還需要進(jìn)一步進(jìn)行完善。 表1 不同方法識(shí)別率對(duì)比結(jié)果 分析表2可知,所提方法的誤檢率在3種方法中為最低,文獻(xiàn)[4]方法次之,文獻(xiàn)[5]方法的誤檢率最高。在樣本數(shù)量為400個(gè)時(shí),所提方法的誤檢率為0%,其它兩種方法的誤檢率分別為0.6%、1.0%。其它兩種方法相比方法高出了很多,由此可見(jiàn),所提方法能夠準(zhǔn)確識(shí)別信息交互過(guò)程中的安全漏洞,確保網(wǎng)絡(luò)的正常運(yùn)行。 表2 不同方法誤檢率對(duì)比結(jié)果 分析表3可知,所提方法的漏檢率明顯低于其它兩種方法,所提方法最低漏檢率為0%,而文獻(xiàn)[4]方法的最低漏檢率為0.4%,文獻(xiàn)[5]方法的最低漏檢率為0.5%,由此可見(jiàn),所提方法的漏檢率相比傳統(tǒng)方法有了明顯的下降,且所提方法的漏檢率可以一直維持在較低數(shù)值,這也更加充分驗(yàn)證了所提方法的綜合有效性。 表3 不同方法漏檢率對(duì)比結(jié)果 綜上可知,所提方法各個(gè)方面的性能都明顯優(yōu)于其它兩種識(shí)別方法,其中最為主要的原因在所提方法引用SVM方法對(duì)數(shù)據(jù)進(jìn)行分類(lèi),這促使所提方法能夠更加準(zhǔn)確的識(shí)別信息交互過(guò)程中產(chǎn)生的安全漏洞,提升所提方法的穩(wěn)定性,相比傳統(tǒng)方法所提方法的綜合性能也得到了一定程度的提升。 針對(duì)傳統(tǒng)的信息交換安全漏洞識(shí)別方法存在的缺陷,本文提出云計(jì)算下多屬性信息交換安全漏洞識(shí)別方法。通過(guò)仿真,充分驗(yàn)證了所提方法的綜合有效性。目前針對(duì)安全漏洞識(shí)別方面的研究較多,但是具體針對(duì)云計(jì)算下多屬性信息交換安全漏洞識(shí)別方面的研究需要進(jìn)一步的完善以及發(fā)展,雖然所提方法獲取了一定的成就,但是需要進(jìn)一步研究的內(nèi)容還有很多,具體如下: 1)未來(lái)階段需要對(duì)識(shí)別的應(yīng)用特征數(shù)據(jù)集進(jìn)行進(jìn)一步完善,例如數(shù)據(jù)的擴(kuò)充等。 2)進(jìn)一步提升支持向量機(jī)的抗噪性以及泛化性,它是提升識(shí)別算法準(zhǔn)確性的重要因素。 3)所提方法的識(shí)別率、誤檢率、漏檢率仍然存在進(jìn)一步完善的空間,未來(lái)階段也將深入研究,進(jìn)一步提升識(shí)別準(zhǔn)確性。3 仿真研究
4 結(jié)束語(yǔ)