陳鵬崗, 方健軍, 王科
(1.西安交通大學(xué)第二附屬醫(yī)院,陜西,西安 710000;2.煙臺市中醫(yī)醫(yī)院,山東,煙臺 264000;3.山東理工大學(xué),計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,山東,淄博 255000)
伴隨著網(wǎng)絡(luò)基礎(chǔ)設(shè)施的建設(shè)與通信行業(yè)的快速發(fā)展,信息化在各行各業(yè)得到了廣泛的應(yīng)用,促進(jìn)了社會的進(jìn)步與經(jīng)濟(jì)的快速發(fā)展。與此同時(shí),網(wǎng)絡(luò)安全問題也成為了各行各業(yè)都必須面對的問題,木馬病毒、黑客攻擊使得網(wǎng)絡(luò)安全面臨新的挑戰(zhàn)[1]。醫(yī)院網(wǎng)絡(luò)化建設(shè)對提升醫(yī)院的就診效率、患者滿意度發(fā)揮著至關(guān)重要的作用,確保醫(yī)院網(wǎng)絡(luò)安全對維護(hù)醫(yī)院正常運(yùn)轉(zhuǎn)具有至關(guān)重要的意義。
傳統(tǒng)的網(wǎng)絡(luò)安全評估可以分為定量評估和定性評估2類,伴隨著人工智能技術(shù)的快速發(fā)展,出現(xiàn)了智能化的網(wǎng)絡(luò)安全評估方法。模糊法、德爾菲法、歷史比較法是最為常見的定性評估方法,回歸分析法、聚類算法、決策樹模型、因子分析法是最為常見的定量評估方法。不論是定量評估法還是定性評估法,在對網(wǎng)絡(luò)安全的評估中受到主觀因素影響比較大,這導(dǎo)致網(wǎng)絡(luò)安全評估的科學(xué)性與嚴(yán)謹(jǐn)性不足?;谌斯ぶ悄芗夹g(shù)的智能化網(wǎng)絡(luò)安全評估方法,能有效地解決網(wǎng)絡(luò)安全評估科學(xué)性與嚴(yán)謹(jǐn)性不足的問題,使得網(wǎng)絡(luò)安全評估結(jié)果更加客觀、合理[2]。相關(guān)向量機(jī)(Relevance Vector Machine,RVM)是一種新的監(jiān)督學(xué)習(xí)算法,在網(wǎng)絡(luò)安全評估中具有廣泛的應(yīng)用,但核函數(shù)的寬度對網(wǎng)絡(luò)安全評估的性能影響比較大[3]。本文采用蝙蝠算法(Bat Algorithm,BA)優(yōu)化RVM模型,并將其應(yīng)用于醫(yī)院網(wǎng)絡(luò)安全量化評估中。將醫(yī)院網(wǎng)絡(luò)安全量化評估結(jié)果和傳統(tǒng)RVM模型對比,驗(yàn)證所提出BA-RVM網(wǎng)絡(luò)安全量化評估的有效性,這為醫(yī)院開展網(wǎng)絡(luò)安全量化評估提供了新的思路。
為了更好地維護(hù)網(wǎng)絡(luò)安全,國家制定了相關(guān)的標(biāo)準(zhǔn)與技術(shù)要求,有效地確保網(wǎng)絡(luò)傳輸信息的準(zhǔn)確性、完整性、可用性,同時(shí)避免非法訪問。建立網(wǎng)絡(luò)安全評估模型就是要在此基礎(chǔ)上,按照科學(xué)、公開、合理的原則開展網(wǎng)絡(luò)安全評價(jià)。對網(wǎng)絡(luò)安全評估的重點(diǎn)是網(wǎng)絡(luò)安全事件的影響范圍與危害程度,包含系統(tǒng)風(fēng)險(xiǎn)、資金風(fēng)險(xiǎn)、設(shè)備風(fēng)險(xiǎn)等多個(gè)方面的內(nèi)容,具體計(jì)算式為
網(wǎng)絡(luò)安全級別=R(L(T,V),R(Ia,Va))
(1)
式中,R為網(wǎng)絡(luò)安全風(fēng)險(xiǎn)計(jì)算函數(shù),L為網(wǎng)絡(luò)安全出現(xiàn)的預(yù)測值,T為網(wǎng)絡(luò)安全威脅,V為網(wǎng)絡(luò)安全可靠度,Ia為網(wǎng)絡(luò)安全出現(xiàn)風(fēng)險(xiǎn)后業(yè)務(wù)應(yīng)用情況,Va為網(wǎng)絡(luò)安全出現(xiàn)風(fēng)險(xiǎn)后設(shè)備資產(chǎn)本身的可抵抗程度。
文獻(xiàn)[4]從資產(chǎn)、脆弱性、威脅等3個(gè)角度建立醫(yī)院網(wǎng)絡(luò)安全評估模型,具體如圖1所示。
圖1 網(wǎng)絡(luò)安全評估模型
醫(yī)院網(wǎng)絡(luò)安全水平的量化評估預(yù)測和評價(jià)指標(biāo)的選擇之間具有十分密切的關(guān)系,科學(xué)選擇評價(jià)指標(biāo)有助于提高醫(yī)院網(wǎng)絡(luò)安全水平量化評估的準(zhǔn)確度。如果評價(jià)指標(biāo)選擇比較多,那么信息就會產(chǎn)生冗余和干擾,同時(shí)量化評估的效率也比較低;如果評價(jià)指標(biāo)選擇比較少,那么就會導(dǎo)致不能獲取足夠的信息,影響量化評估的精度。本文采用層次分析法建立醫(yī)院網(wǎng)絡(luò)安全量化評估的評價(jià)指標(biāo),具體如圖2所示。
圖2 醫(yī)院網(wǎng)絡(luò)安全評價(jià)指標(biāo)體系
(2)
式中,N為樣本數(shù)據(jù)個(gè)數(shù),wi為設(shè)置權(quán)重值,w0為偏置,K(x,xi)為核函數(shù)。
建立RVM模型要求目標(biāo)函數(shù)必須是相對獨(dú)立的,同時(shí)目標(biāo)函數(shù)本身包含噪聲,即
yn=f(xn,w)+εn
(3)
式中,εn為噪聲。
對應(yīng)似然函數(shù)計(jì)算式為
(4)
式中,y=[y1,y2,…,yN]T,w=[w1,w2,…,wN]T,φ=[φ(x1),φ(x2),…,φ(xN)]T,φ(xN)=[1,K(xn,x1),K(xn,x2),…,K(xn,xN)]T。
傳統(tǒng)方法是采用最大似然法來求解最優(yōu)權(quán)值,但是往往會出現(xiàn)過度擬合的情況。為了避免在求解最優(yōu)權(quán)值的過程中過度擬合,本文采用稀疏貝葉斯(Spare Bayesian)公式計(jì)算權(quán)重w所對應(yīng)的先驗(yàn)概率的條件分布,即
(5)
利用貝葉斯公式來計(jì)算未知參數(shù)對應(yīng)的后驗(yàn)概率,即
(6)
聯(lián)合以上各式,權(quán)重w所對應(yīng)的后驗(yàn)概率計(jì)算式為
(7)
其中,Σ=(δ-2φTφ+A)-1,A=diag(α0,α1,…,αN),μ=δ-2ΣφTy。
利用delta函數(shù)計(jì)算樣本數(shù)據(jù)的相似性,通過樣本數(shù)據(jù)的相似計(jì)算來有效解決相關(guān)聯(lián)向量向超參數(shù)進(jìn)行學(xué)習(xí)轉(zhuǎn)化和后驗(yàn)概率存在的模式化問題,確保參數(shù)α取得最大值的計(jì)算式為
(8)
進(jìn)行循環(huán)迭代估計(jì),得到
(9)
式中,μi為第i個(gè)平均后驗(yàn)權(quán)重,Σij為第i個(gè)相對角的具體元素。
采用RVM模型對醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測的性能與核函數(shù)寬度g之間具有密切的關(guān)系,為了更好地提高RVM模型對醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測的性能,采用BA算法對核函數(shù)寬度g進(jìn)行優(yōu)化。定義目標(biāo)函數(shù)為
s.t.g∈[gmin,gmax]
(10)
BA是依據(jù)蝙蝠借助回聲實(shí)施定位的生物學(xué)原理提出的群體智能優(yōu)化算法,提出BA群體智能優(yōu)化算法基于以下3個(gè)方面的假設(shè)[6]。
假設(shè)1:蝙蝠群體內(nèi)所有的個(gè)體均通過回聲定位來進(jìn)行距離的感知。
假設(shè)2:蝙蝠群體內(nèi)個(gè)體的行動(dòng)軌跡過程為個(gè)體在Xi位置,以Vi速度進(jìn)行隨機(jī)無目的的飛行,在整個(gè)飛行過程中采用固定頻率fmin、可變波長λ和響應(yīng)A0進(jìn)行獵物的搜索,同時(shí)蝙蝠個(gè)體在飛行的過程中會自動(dòng)地發(fā)射出脈沖頻率以及進(jìn)行波長調(diào)整。脈沖波長的調(diào)整依賴于蝙蝠個(gè)體和獵物之間的距離,頻度r在區(qū)間[0,1]范圍內(nèi)調(diào)整。
假設(shè)3:在使用BA智能優(yōu)化算法之前預(yù)先設(shè)定獵物回聲的上限值A(chǔ)max和下限值A(chǔ)min。
設(shè)定目標(biāo)函數(shù)minf(X),X=(x1,x2,…,xd)T,采用BA求解的步驟[7]如下。
步驟1:參數(shù)初始化
初始化蝙蝠種群規(guī)模NP,標(biāo)識蝙蝠種群每一個(gè)個(gè)體的初始位置Xi(i=1,2,…,NP),設(shè)置搜索脈沖對應(yīng)頻率范圍[fmin,fmax],脈沖速率r0,最大聲音值A(chǔ)0,脈沖速率增強(qiáng)系數(shù)γ和聲音響應(yīng)衰減系數(shù)α。
步驟2:脈沖頻率、速度以及蝙蝠位置更新
對脈沖頻率、速度以及蝙蝠位置進(jìn)行實(shí)時(shí)動(dòng)態(tài)更新,即
(11)
式中,t為循環(huán)迭代次數(shù),β為區(qū)間[0,1]上的隨機(jī)向量,X*為當(dāng)前全局最優(yōu)解的坐標(biāo)位置。
步驟3:獲得最新解
由隨機(jī)函數(shù)生成隨機(jī)數(shù)rand,如果隨機(jī)數(shù)rand>ri,那么選擇最優(yōu)解集中的任意值,同時(shí)在最優(yōu)解附近生產(chǎn)局部最優(yōu)解,同時(shí)結(jié)合隨機(jī)擾動(dòng)方程獲得最新解,即
Xnew=Xold+εAt
(12)
式中,Xnew為最新解,Xold為原始解,ε為區(qū)間(-1,1)上的隨機(jī)數(shù),At為完成t次迭代運(yùn)算相應(yīng)結(jié)果的平均值,即平均響應(yīng)值。
步驟4:脈沖響應(yīng)與頻率更新
如果滿足rand (13) 步驟5:算法終止條件判斷 判斷是否滿足BA的終止條件:如果滿足算法終止條件,那么輸出解即為最優(yōu)解;如果不滿足算法終止條件,那么返回步驟2。 采用BA智能優(yōu)化算法對RVM參數(shù)進(jìn)行優(yōu)化,得到用于醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測的BA-RVM模型。具體流程如下。 (1)對BA智能優(yōu)化算法初始化,同時(shí)將醫(yī)院網(wǎng)絡(luò)安全量化數(shù)據(jù)樣本按照4∶1的比例分為訓(xùn)練樣本和測試樣本,采用訓(xùn)練樣本對BA-RVM模型進(jìn)行訓(xùn)練,采用測試樣本求證BA-RVM模型的有效性。 (2)計(jì)算目標(biāo)函數(shù)適應(yīng)參數(shù)值,采用式(10)計(jì)算蝙蝠種群每一個(gè)蝙蝠個(gè)體的個(gè)體適應(yīng)度值。 (3)判斷是否滿足BA設(shè)定的終止條件。如果滿足BA設(shè)定的終止條件,那么輸出的解作為核函數(shù)的最優(yōu)寬度g*,得到優(yōu)化后的RVM模型,采用訓(xùn)練樣本完成對醫(yī)院網(wǎng)絡(luò)安全的量化評估;如果不滿足BA算法設(shè)定的終止條件,那么跳轉(zhuǎn)到第(4)步。 (4)采用頻率調(diào)整公式獲得最新解以及所對應(yīng)的蝙蝠速度與位置坐標(biāo)。 (5)對接受新解與否進(jìn)行邏輯判斷。如果接受新解,則執(zhí)行步驟(6);如果不接受新解,則執(zhí)行步驟(4)。 (6)更新蝙蝠響應(yīng)和發(fā)射頻率,跳轉(zhuǎn)到步驟(2)。 基于BA-RVM模型的醫(yī)院網(wǎng)絡(luò)安全量化評估流程[8-9]如圖3所示。 圖3 基于BA-RVM的醫(yī)院網(wǎng)絡(luò)安全量化評估算法流程圖 實(shí)驗(yàn)數(shù)據(jù)來源于某三甲醫(yī)院2011—2020年網(wǎng)絡(luò)安全量化評價(jià)數(shù)據(jù),對數(shù)據(jù)進(jìn)行歸一化處理,同時(shí)過濾噪聲,網(wǎng)絡(luò)安全評價(jià)指標(biāo)得分如表1所示,網(wǎng)絡(luò)安全最終得分如表2所示。 表1 2011—2020年網(wǎng)絡(luò)安全評價(jià)指標(biāo)得分 表2 2011—2020年網(wǎng)絡(luò)安全最終得分 為了更好地評價(jià)算法的性能,采用均方根誤差(Root Mean Square Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE)作為衡量指標(biāo),RMSE和MAE計(jì)算式為 (14) (15) RMSE反映了模型預(yù)測值和實(shí)際值的離散程度,MAE反映了模型的誤差。RMSE和MAE值越小,那么模型的預(yù)測精度越高、性能越穩(wěn)定。 當(dāng)滿足醫(yī)院網(wǎng)絡(luò)安全評價(jià)指標(biāo)的實(shí)際值和預(yù)測值相等時(shí),將醫(yī)院網(wǎng)絡(luò)安全評價(jià)結(jié)果設(shè)置為1,該結(jié)果值是識別醫(yī)院網(wǎng)絡(luò)安全是否在高風(fēng)險(xiǎn)區(qū)的極限值之內(nèi)。本文設(shè)定的醫(yī)院網(wǎng)絡(luò)安全級別評價(jià)標(biāo)準(zhǔn)如表3所示。 表3 網(wǎng)絡(luò)安全評判標(biāo)準(zhǔn) 將由網(wǎng)絡(luò)安全專家打分獲得的11組數(shù)據(jù)樣本進(jìn)行劃分,前7組數(shù)據(jù)樣本為訓(xùn)練樣本,后4組數(shù)據(jù)樣本為測試樣本。設(shè)定BA的種群規(guī)律為10,最大迭代次數(shù)為100,脈沖速率為0.5,搜索脈沖范圍為0-2,聲音最大響應(yīng)值為0.25,響應(yīng)衰減系數(shù)值為0.9,所對應(yīng)的脈沖速率增強(qiáng)系數(shù)為0.05。分別采用RVM模型和BA-RVM進(jìn)行醫(yī)院安全量化評估預(yù)測,評價(jià)結(jié)果如圖4所示,評價(jià)相對誤差如圖5所示,同時(shí)給出2種模型的RMSE和MAE,如表4所示。 表4 不同算法結(jié)果對比 (a)RVM 由圖4可知:不論是采用RVM模型還是BA-RVM模型,第1組和第2組的實(shí)際得分和預(yù)測得分相差均比較小,而第3組和第4組的實(shí)際得分和預(yù)測得分相差均比較大;采用BA-RVM模型的預(yù)測得分和實(shí)際得分相差比較小,而采用BA-RVM模型的預(yù)測得分和實(shí)際得分相差比較大。 由圖5可知,通過得分相對誤差可以非常直觀地看出采用BA-RVM模型的預(yù)測得分和實(shí)際得分相對誤差明顯小于采用RVM模型的預(yù)測得分和實(shí)際得分相對誤差。 (a)RVM 由表4可知,BA-RVM算法的RMSE和MAE值均小于RVM算法,即BA-RVM模型相對于RVM模型,其預(yù)測精度更高、性能更穩(wěn)定,即基于BA-RVM模型的醫(yī)院網(wǎng)絡(luò)安全量化評價(jià)預(yù)測具有更高的精度和穩(wěn)定性,為醫(yī)院網(wǎng)絡(luò)安全量化評估提供了新的方法。 醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測對提升網(wǎng)絡(luò)安全性具有至關(guān)重要的意義,本文提出了一種基于BA-RVM模型的醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測方法,從資產(chǎn)、脆弱性、威脅等3個(gè)角度建立了醫(yī)院網(wǎng)絡(luò)安全量化評價(jià)指標(biāo)體系,同時(shí)采用BA對RVM模型核函數(shù)寬度進(jìn)行優(yōu)化,并將優(yōu)化后的RVM模型應(yīng)用于山東省某三甲醫(yī)院的網(wǎng)絡(luò)安全量化評估預(yù)測中。將預(yù)測結(jié)果和傳統(tǒng)RVM模型的預(yù)測結(jié)果進(jìn)行對比,指出BA-RVM模型對醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測精度更高,模型性能更穩(wěn)定,是醫(yī)院網(wǎng)絡(luò)安全量化評價(jià)的一種新方法。3.3 BA-RVM流程
4 實(shí)證分析
4.1 數(shù)據(jù)來源
4.2 評價(jià)指標(biāo)
4.3 結(jié)果分析
5 總結(jié)