亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隱馬爾科夫模型的用戶行為異常檢測方法

        2011-08-13 06:33:58賴英旭王一沛
        電子技術(shù)應(yīng)用 2011年7期
        關(guān)鍵詞:命令參考文獻(xiàn)狀態(tài)

        賴英旭,劉 靜,王一沛

        (北京工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,北京 100124)

        由于當(dāng)前計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,入侵檢測技術(shù)得到了研究者的廣泛重視,F(xiàn)orrest[1]等人在1996年首次提出以進(jìn)程正常運(yùn)行時產(chǎn)生的一定長度的系統(tǒng)調(diào)用短序列作為模型來表現(xiàn)進(jìn)程正常運(yùn)行時的狀態(tài)。Lee[2]等人則用RIPPER從系統(tǒng)調(diào)用序列中挖掘正常和異常模式,以規(guī)則的形式來描述系統(tǒng)的運(yùn)行狀態(tài),建立了一個更簡潔有效的系統(tǒng)正常模型。美國新墨西哥大學(xué)的Warrender[3]以系統(tǒng)調(diào)用為審計(jì)數(shù)據(jù),進(jìn)行了基于隱馬爾可夫模型HMM(Hidden Markov Model)的程序行為異常檢測研究。美國普渡大學(xué)的Lane[4]及其團(tuán)隊(duì)則利用了Unix用戶的shell命令作為審計(jì)數(shù)據(jù),進(jìn)行了基于HMM的用戶行為異常檢測研究和實(shí)驗(yàn)。西安交通大學(xué)的周星[5]提出一種利用進(jìn)程堆棧中的函數(shù)返回地址鏈信息來提取不定長模式的方法,并基于系統(tǒng)調(diào)用序列及其對應(yīng)的不定長模式序列構(gòu)建了一個兩層的HMM來檢測異常行為,取得了更低的誤報率和漏報率。

        在以上檢測方法的基礎(chǔ)上,本文提出一種新的基于HMM的用戶行為異常檢測方法,與參考文獻(xiàn)[6]中提出的基于HMM的檢測方法相比,檢測效率和實(shí)時性相對較高,在檢測準(zhǔn)確率方面也有較大優(yōu)勢。

        1 隱馬爾科夫模型

        HMM包含了兩個隨機(jī)過程,一個是狀態(tài)間的相互轉(zhuǎn)換,另一個是狀態(tài)與隨機(jī)過程間的相互對應(yīng)關(guān)系,馬爾可夫鏈按照轉(zhuǎn)移概率矩陣改變狀態(tài)。λ=(π,Ωo,Ωq,A,B)可以確定一個隱馬爾科夫模型,其中:Ωq=(q1,q2,…,qn)是HMM隱藏狀態(tài)的有限集合,n為HMM中隱藏狀態(tài)的總數(shù);Ωo=(o1,o2,…,om)是 HMM觀測值的有限集合,m為所有出現(xiàn)的觀測值總數(shù);A={aij,i,j=1,2,…,n}為狀態(tài)轉(zhuǎn)移概率矩陣 (這里只考慮一階 HMM),aij=P(Xt+1=qj|Xt=qi),表示t時刻HMM模型由狀態(tài)qi轉(zhuǎn)移到qj的概率;B={bjk},B 為觀測值概率矩陣;π=(π1,π2,…,πn)為 HMM 的初始狀態(tài)分布,即在t=0時刻模型中各狀態(tài)的分布概率。

        本文用一種不同的方法來建立和訓(xùn)練HMM模型,降低不必要的系統(tǒng)占用,并得到一個較好的正常行為模式與異常行為模式的區(qū)分效果。

        2 基于HMM的用戶行為異常檢測方法

        2.1 數(shù)據(jù)預(yù)處理

        本文所采用的原始數(shù)據(jù)來自普渡大學(xué)的Lane團(tuán)隊(duì),他們花費(fèi)了很長時間去跟蹤了9個Unix用戶在2年內(nèi)的活動記錄,以保證這些記錄的真實(shí)性。

        [4]對這些數(shù)據(jù)記錄進(jìn)行了預(yù)處理,將每次的命令運(yùn)用相同的起始、終止符隔開,將各命令中所出現(xiàn)的地址均用統(tǒng)一標(biāo)識方法代替,所涉及的文件也用相同的標(biāo)識方法代替,這樣的預(yù)處理使得原始數(shù)據(jù)更加整齊且易于分析。在此基礎(chǔ)上,本文又作了進(jìn)一步處理,對于命令行中所有出現(xiàn)的參數(shù)進(jìn)行處理,即將命令中的附加參數(shù)與命令本身結(jié)合設(shè)定為命令序列中的一條命令,而對于地址、網(wǎng)絡(luò)等記錄則直接從命令序列流中刪除。表1中左欄的數(shù)據(jù)流經(jīng)過本文二次處理后,該命令流序列如右欄所示,左欄中的14條記錄經(jīng)過處理后,減少為右欄中的8條記錄,減少了近50%。

        表1 User2的命令數(shù)據(jù)流片段

        采用本文方法進(jìn)行數(shù)據(jù)預(yù)處理的依據(jù)是:(1)在實(shí)際訓(xùn)練及檢測中,地址等參數(shù)并沒有實(shí)際意義。無論是按照shell命令序列長度,還是按照各命令本身出現(xiàn)頻率作為劃分狀態(tài)標(biāo)準(zhǔn),都并不需要此類命令內(nèi)容;(2)當(dāng)利用大數(shù)量的shell命令序列進(jìn)行建模和檢測時,進(jìn)行這樣的二次處理可以降低對系統(tǒng)存儲空間的需求。

        2.2 HMM建模

        本文所建立的HMM模型的目的是為了描述一個正常用戶行為,用W代表合法用戶正常行為模式的總類數(shù),而相對應(yīng)的shell命令集合則如 C=(L(1),L(2),…,L(W+1)),其中 L(j)為包含若干個長度為 l(j)的 shell命令序列。W的值越大意味著對于命令集合分類得越精細(xì),所需要的系統(tǒng)資源也就越多。本文針對兩種不同的shell命令集合分類方法進(jìn)行了對比實(shí)驗(yàn),方法一是參考文獻(xiàn)[6]中使用的方法;方法二是本文提出的改進(jìn)隱馬爾科夫方法。

        2.2.1 參考文獻(xiàn)[6]方法建模

        設(shè)正常用戶的訓(xùn)練數(shù)據(jù)為 R=(R1,R2,…,Rn)該數(shù)據(jù)從Unix用戶所審計(jì)命令中截取,參考文獻(xiàn)[6]對 shell命令需要有兩個步驟:

        (1)根據(jù)訓(xùn)練數(shù)據(jù)R,生成W個序列長度分別為l(1),l(2),…,l(W)的 shell命令序列流,表示為 S1,S2…,Sw,每個 Si中,包括長度為 l(j)的所有命令序列,中,又包含該位置的 shell命令序列

        (2)設(shè)定W個序列 出現(xiàn)頻 率門 限,記為 η1,η2,η3,…,ηw,該門限的作用是判定每個是否可以成為正常用戶行為觀測值,低于門限值的即舍去。

        在C中的L(W+1)用來記錄未知和異常模式記錄的值,對于 L(W+1)下 shell命令記錄的判定方法為:當(dāng) l(W)=1時,附加狀態(tài)W+1對應(yīng)的觀測值集合L(W+1)是由長度為1、且在Sw中出現(xiàn)頻率小于門限值 ηw的 shell命令序列構(gòu)成,而當(dāng)l(W)≠1時,則 L(W+1)由所有長度為1的shell命令序列構(gòu)成。

        2.2.2 改進(jìn)HMM方法

        用戶對于日常操作都有一套自己的命令使用頻率,本文依據(jù)用戶與用戶之間的命令使用頻率差別作為行為分類依據(jù)。本文方法中的C表示方法與參考文獻(xiàn)[6]中一致 ,C=(L(1),L(2),…,L(W+1)),W 的值增大,則出現(xiàn)頻率的分類更細(xì)化,也會增加系統(tǒng)存儲和處理量,但與參考文獻(xiàn)[6]的狀態(tài)分類方法相比要小很多。假設(shè)正常用戶的訓(xùn)練數(shù)據(jù)為 R=(R1,R2,…,Rn),此時的用戶正常行為觀測值集合建立起來就相對簡單,根據(jù)訓(xùn)練數(shù)據(jù)R,生成W個出現(xiàn)頻率分別為 l(1),l(2),…,l(W)的 shell命令序列流,表示為S1,S2…,Sw,每個Si中包含了所有出現(xiàn)在頻率區(qū)域的shell命令記錄。同樣,劃分在附加狀態(tài)W+1下的shell命令序列,也就是未知和異常行為模式的值。

        上述兩個建模方法各有利弊,對于參考文獻(xiàn)[6]的方法,在利用命令序列長度建模時,其優(yōu)點(diǎn)是思路清晰,不同的狀態(tài)之間不會發(fā)生重疊,適用性強(qiáng)。缺點(diǎn)是由于每個狀態(tài)中Si都將存儲超過門限值的所有shell命令序列,這將是一個很大的存儲量(尤其是當(dāng)W達(dá)到一定值時。而本文方法的,優(yōu)點(diǎn)是利用命令的出現(xiàn)頻率分類,由于命令種類(即便加上了參數(shù))的局限性,所需要的存儲量將會少得多,運(yùn)算起來更快,也更為容易理解。缺點(diǎn)則是對于每個狀態(tài)對應(yīng)的頻率區(qū)域的劃分將更多地依賴歷史記錄和經(jīng)驗(yàn)。

        2.3 HMM的訓(xùn)練

        訓(xùn)練過程也就是參數(shù)估計(jì)過程,這個過程在研究中是極其重要的,傳統(tǒng)的思路是利用Baum-Welch算法實(shí)現(xiàn),而實(shí)際上該算法并不是唯一的,也不是最好的算法。本文采用參考文獻(xiàn)[3]提出的改進(jìn)算法來實(shí)現(xiàn)對該HMM模型的訓(xùn)練。

        2.4 HMM的檢測

        檢測階段的主要工作是對被監(jiān)測用戶在被監(jiān)測時間內(nèi)執(zhí)行的shell命令行進(jìn)行處理,并利用在訓(xùn)練中已產(chǎn)生的HMM模型,計(jì)算相應(yīng)的判決值,進(jìn)而對該用戶的行為類別進(jìn)行判別。

        假設(shè)在所需的檢測時間內(nèi)記錄該時間段內(nèi)用戶的命令流,記為 R=(R1,R2,…,Rn)。 其中,Ri為第 i個獨(dú)立的shell命令序列,n為shell命令記錄的總量,此時的命令序列R中的值是按照時間順序依次得到的。

        利用訓(xùn)練中的參數(shù)匹配方法,對于命令序列R進(jìn)行操作,得到狀態(tài)轉(zhuǎn)移序列 q=(q1,q2,…,qx),其中,x 為狀態(tài)轉(zhuǎn)移序列內(nèi)狀態(tài)的總數(shù),qi代表R中按時間排序的第i個狀態(tài)。HMM檢測流程如下:

        (1)根據(jù)訓(xùn)練數(shù)據(jù)R生成 w個shell命令序列流S1,S2…,Sw,設(shè)定初始 m:=1,j:=1,n:=0。

        (2)如果 m≤r-l(1)+1,則將 Seqmj與 L(j)進(jìn)行比較,然后執(zhí)行步驟(3);否則,n:=n+1,qn:=i。

        (3)如果 Seqmj∈L(j),且 m=1,則 m:=m+l(j),i:=j,j:=1,并返回執(zhí)行步驟(2);如果 Seqmj∈L(j),且 m>1,則 n:=n+1,qn:=i,m:=m+l(j),j:=j,i:=1,并返回執(zhí)行步驟(2);如果Seqmj?L(j),則 j:=j+1,然后執(zhí)行步驟(4)。

        (4)如果 j≠W+1,則返回執(zhí)行步驟(2);如果 j=W+1(此 時 Seqmj∈L(W+1)),且 m=1,則 m:≡m+1,l:=j,j:=1,則返回執(zhí)行步驟(2);如果 j=W+1,且 m>1,則 n:=n+1,qn:=i,m:=m+1,l:=j,j:=1并返回執(zhí)行步驟(2)。

        (5)由步驟(3)得到 P(Sq1|λ),P(Sq2|λ|),…,P(SqL-W+1|λ|,對 于第n個活動窗口計(jì)算其中a為須固定的概率門限參數(shù)。

        3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

        在本文的實(shí)驗(yàn)中,利用其中 4個用戶 userl、user2、user3、user4的數(shù)據(jù)進(jìn)行實(shí)驗(yàn),并設(shè)合法用戶為user2,將余下的 user1、user3、user4視為非法或未知用戶。在該4個用戶的數(shù)據(jù)記錄中皆有超過15 000條命令行記錄。對于正常用戶,實(shí)驗(yàn)中將利用其中的前5 000條命令進(jìn)行正常行為模式的訓(xùn)練,得到HMM觀測值集合并確定HMM參數(shù),后5 000條命令作為正常行為的檢測。對于非法用戶,將分別用其中的5 000條命令進(jìn)行異常檢測的測試。在HMM模型建立及訓(xùn)練階段的參數(shù)設(shè)置為W=3,C={3,2,1}。 在 HMM 模型建立過程中,從正常用戶user2的前5 000個shell命令中得到C(1),C(2),C(3)所對應(yīng)的命令序列個數(shù)如表2所示。

        表2 兩種方法的比較結(jié)果

        參考文獻(xiàn)[6]方法的異常檢測結(jié)果如圖1所示,上方曲線為合法用戶user2的正常行為測試數(shù)據(jù)對應(yīng)的判決值曲線,下方的3條曲線為非法用戶的異常行為測試數(shù)據(jù)對應(yīng)的判決值曲線(以下同)。

        圖1 參考文獻(xiàn)[6]方法得到的結(jié)果

        改進(jìn)的HMM方法得到的異常檢測測試結(jié)果如圖2所示??梢钥闯觯鄬τ趗ser2,三組非法用戶的值更加靠近于3,表明權(quán)值為2和1的命令序列所表示的合法用戶的正常行為模式在3個非法用戶行為序列中較少出現(xiàn),從圖1、圖2中可以看出,改進(jìn)的HMM方法使得正常行為和異常行為測試數(shù)據(jù)對應(yīng)的判決值曲線具有良好的可分性。

        圖2 改進(jìn)HMM方法得到的結(jié)果

        參考文獻(xiàn)[6]方法用于建模的命令序列有1 140個,而改進(jìn)的HMM方法只有136個,大大節(jié)約了系統(tǒng)存儲空間,所以,改進(jìn)HMM的方法具有較好的檢測準(zhǔn)確度,本文在運(yùn)算成本和計(jì)算效率之間取得了權(quán)衡,在實(shí)驗(yàn)中取得了一個很好的效果。

        本文提出一種基于隱馬爾可夫模型的用戶行為異常檢測新方法,并通過實(shí)驗(yàn)對該方法的性能進(jìn)行了測試。實(shí)驗(yàn)表明,該方法具有很高的檢測準(zhǔn)確率和較強(qiáng)的可操作性。但需要指出的是,該方法中的一些檢測思想雖然適用于以系統(tǒng)調(diào)用為審計(jì)數(shù)據(jù)的程序行為異常檢測,但具體的操作方式及檢測性能還有待分析和驗(yàn)證。

        參考文獻(xiàn)

        [1]FORREST S,HOFMEYR S A,SOMAYAJIA.A sense of self for UNIX processes[C].Proceedings of IEEE Symposium on Security and Privacy,Los Alamos,California,1996.

        [2]LEE W,STOLFO S J.Data mining approaches for intrusion detection[C].Proceedings of the 7th US ENIX Security Symposium,San Antonio,Texas,1998.

        [3]WARRENDER C,FORREST S,PEARLMUTTER B.Detecting intrusions using system calls:alternative data models[C].Proceedings of the IEEE Symposium on Security and Privacy,Oakland,CA,USA,1999:133-145.

        [4]LANE T.Machine learning techniques for the computer security domain of anomaly detection[D].Purdue University 2000.

        [5]周星,彭勤科,王靜波.基于兩層隱馬爾可夫模型的入侵檢測方法[J].計(jì)算機(jī)應(yīng)用研究,2008,25(3):911-914.

        [6]鄔書躍,田新廣.基于隱馬爾科夫模型的用戶行為異常檢測新方法[J].通信學(xué)報,2007,28(4):38-43.

        猜你喜歡
        命令參考文獻(xiàn)狀態(tài)
        只聽主人的命令
        The Muted Lover and the Singing Poet:Ekphrasis and Gender in the Canzoniere*
        狀態(tài)聯(lián)想
        移防命令下達(dá)后
        生命的另一種狀態(tài)
        Study on the physiological function and application of γ—aminobutyric acid and its receptors
        東方教育(2016年4期)2016-12-14 13:52:48
        熱圖
        家庭百事通(2016年3期)2016-03-14 08:07:17
        堅(jiān)持是成功前的狀態(tài)
        山東青年(2016年3期)2016-02-28 14:25:52
        這是人民的命令
        The Review of the Studies of Trilingual Education in inghai
        中文字幕一区在线观看视频| 国产av一区二区三区在线播放| 视频一区二区免费在线观看| 三年片在线观看免费大全电影| 久久久久亚洲av无码专区桃色| 日韩av无码成人无码免费| 久久道精品一区二区三区| 亚洲色拍拍噜噜噜最新网站| 无码伊人久久大香线蕉| 国产美女亚洲精品一区| 熟女丝袜美腿亚洲一区二区三区 | 亚洲毛片αv无线播放一区| 真人新婚之夜破苞第一次视频| 少妇人妻偷人精品无码视频| 精品无码AV无码免费专区| 亚洲中文字幕巨乳人妻| 日韩精品高清不卡一区二区三区| 亚洲成人av在线播放不卡| 成人高清在线播放视频| 国产在线一区二区av| 手机在线观看免费av网站| 日本免费视频| 欧美日韩在线视频一区| 各种少妇正面着bbw撒尿视频| 无码乱人伦一区二区亚洲一| 玩弄放荡人妻少妇系列| 国产免费久久精品99re丫y| 精品久久杨幂国产杨幂| 日本一区二区三本视频在线观看| 日韩色久悠悠婷婷综合| 亚洲av成人波多野一区二区| 国产精品自产拍在线18禁| 男女边摸边吃奶边做视频韩国| 国产av无码专区亚洲精品| 把女的下面扒开添视频| 激情航班h版在线观看| 乱码精品一区二区三区| 亚洲国产麻豆综合一区| 精品国产乱码久久免费看| 国产成人大片在线播放| 国产乱子伦精品无码专区|