亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于規(guī)則過濾的樸素貝葉斯模型流程實例日志分析

        2021-07-02 01:56:58陳浩韓萌萌
        現(xiàn)代計算機 2021年13期
        關(guān)鍵詞:分析模型

        陳浩,韓萌萌

        (武漢船用電力推進(jìn)裝置研究所,武漢430000)

        0 引言

        在傳統(tǒng)的應(yīng)用中,通常是由專家基于流程執(zhí)行過程中的日志信息來識別系統(tǒng)漏洞[1]。事實證明,收集流程執(zhí)行過程中的日志數(shù)據(jù)并加以分析對于系統(tǒng)問題的診斷和異常檢測非常有效。在這種情況下,我們關(guān)注由業(yè)務(wù)流程執(zhí)行產(chǎn)生的日志數(shù)據(jù)[2],通過分析這些日志數(shù)據(jù)來檢測“不安全”流程實例導(dǎo)致的安全漏洞(例如攻擊、欺詐等)。我們提出使用關(guān)聯(lián)規(guī)則和樸素貝葉斯方法進(jìn)行流程日志分析的框架,利用“低級”事件而不是“高級”事件完成和流程活動完全無關(guān)的面向安全的分類[3-4]。這種混合框架可用作決定過程跟蹤的“安全性”的替代方法,可以充當(dāng)一種“超級專家”的分類工具,其準(zhǔn)確性和效率使其稱為實施面向安全性流程分析的有效工具。

        1 介紹

        根據(jù)系統(tǒng)的行為日志解釋、預(yù)測、修復(fù)和監(jiān)控系統(tǒng)的運行是當(dāng)前大多數(shù)系統(tǒng)的重要舉措之一[5]。在這一方面對于流程引擎(BPM)的業(yè)務(wù)日志分析研究是業(yè)界非常關(guān)注的解決方案,這些解決方案可以幫助或者代替人類專家對業(yè)務(wù)流程日志進(jìn)行安全性分析。通過監(jiān)控業(yè)務(wù)流程實例的日志,分析不同類型的安全漏洞,例如欺詐、攻擊、濫用等問題。事實上,不安全的流程實例可能會對組織或者企業(yè)造成嚴(yán)重?fù)p害,從而可能導(dǎo)致企業(yè)的形象和聲譽受到嚴(yán)重?fù)p失。這是最近采用數(shù)據(jù)挖掘技術(shù)對業(yè)務(wù)過程日志進(jìn)行安全性分析的主要原因(Accorsi&Stocker,2012;Accorsi,Stocker,&Muller,2013),尤其是作為審核應(yīng)用程序是否存在風(fēng)險的核心。

        文獻(xiàn)中關(guān)于分類的方法,根據(jù)相應(yīng)日志跟蹤中的內(nèi)容,將流程實例識別為“安全”或“不安全”的問題,可以分為以下兩種模型類別:第一種為示例驅(qū)動方法(Bose&van der Aalst,2013;Cuzzocrea,Folino,Guaras?cio,&Pontieri,2016b;Leontjeva,Conforti,Di Francesco?marino,Dumas,&Maggi,2015;Nguyen,Dumas,Rosa,Maggi,&Suriadi,2014):這些方法模型需要一組帶注釋的流程蹤跡樣例ΔAET,注解說明了是否發(fā)生已知的某些安全漏洞,然后利用帶注釋的流程示例構(gòu)建分類模型用于新的流程蹤跡日志分析,可以確定相應(yīng)的流程示例是否存在安全漏洞風(fēng)險。第二種為模型驅(qū)動的方法(Fazzinga,Flesca,Furfaro,&Pontieri,2018a):這些方法模型是基于安全漏洞模型,即對已知的行為描述信息進(jìn)行分析判斷安全風(fēng)險(或者根據(jù)由Accorsi&Stocker,2012;中提出的模型),將流程實例分類為“安全”或“不安全”。

        與以上介紹的方法不同,我們的方法首先是對流程日志數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析過濾,將處理之后的數(shù)據(jù)作為樸素貝葉斯模型[6-7]的輸入,計算該流程執(zhí)行過程中存在的安全風(fēng)險的概率。

        2 流程日志模型分析

        2.1 規(guī)則過濾

        在系統(tǒng)使用過程中,流程的執(zhí)行可以獲得基礎(chǔ)的流程日志數(shù)據(jù)、軌跡、流程信息、活動以及事件信息等內(nèi)容,會產(chǎn)生大量的日志數(shù)據(jù),其中有很多與安全配置無關(guān)的噪音數(shù)據(jù)產(chǎn)生,這些數(shù)據(jù)不包含任何信息。噪音的存在會極大程度降低模型分析的準(zhǔn)確率。由于日志數(shù)據(jù)量巨大,我們通過滑動時間窗口的方式獲取部分日志數(shù)據(jù)用于模型實驗。這里我們假設(shè)流程實例w由一系列高級事件組成a11…an。相應(yīng)的每個活動實例ai生成一個低級事件ei。我們假設(shè)存在一個跟蹤系統(tǒng)記錄每個事件的執(zhí)行情況,將按照順序記錄實例w的執(zhí)行情況,記為φ=e1…en,φ為軌跡信息,流程軌跡追蹤系統(tǒng)中所有的軌跡集合L稱之為日志。

        第一步我們在給定的數(shù)據(jù)集中創(chuàng)建事件類型的概率分布(FD)[8]。FD的大小等于唯一事件類型的大小,其中每個元素對應(yīng)于特定事件類型的總條目數(shù)。下面顯示實時系統(tǒng)中的FD示例:

        在此我們作出一個假設(shè):比其他事件發(fā)生更多次數(shù)的事件是例行事件。該假設(shè)是基于常用幾個事件日志數(shù)據(jù)集的經(jīng)驗觀察得到的。因此,通過此假設(shè)可以輕松得到事件類型,例如FD的第三(345)和第五(323)是常規(guī)事件。它們發(fā)生的概率比其他事件更高。我們使用一個標(biāo)準(zhǔn)偏差用于確定一組元素與平均值的偏差[9-10]。低s表示元素更接近均值(μ),而較高的s值表明元素分散,更具有價值。計算公式如下:

        其中N表示元素的個數(shù),xi表示第i個元素,xˉ是FD的平均值。由于處理之后的數(shù)據(jù)集是連續(xù)事件流的一部分,因此建議的解決方案是使用樣本標(biāo)準(zhǔn)差來形成較大的總體估計并輸出廣義的結(jié)果。

        2.2 樸素貝葉斯算法

        樸素貝葉斯法是基于貝葉斯定理與特征條件獨立假設(shè)的分類方法[11]。設(shè)輸入空間X?Rn為n維向量的集合,輸出空間為類標(biāo)記集合y={c1,c2,…,ck},輸入為特征向量x∈X,輸出為類標(biāo)記y∈Y。X是定義在輸入空間X上的隨機向量。數(shù)據(jù)集為:

        3 仿真測試與分析

        由于現(xiàn)有的日志類型眾多,本文主要以某生產(chǎn)企業(yè)的辦公流程日志數(shù)據(jù)進(jìn)行仿真實驗,仿真環(huán)境為:編輯器PyCharm,Python版本為Python 2.7,計算機配置為64位Windows 10系統(tǒng),四核2.67GHz、運行內(nèi)存16G。我們選擇4種不同業(yè)務(wù)流程的日志數(shù)據(jù),包括:財務(wù)報銷業(yè)務(wù)流程、公文審批業(yè)務(wù)流程、人員信息變更業(yè)務(wù)流程,每組使用40個流程日志數(shù)據(jù)作為實驗的基礎(chǔ)數(shù)據(jù)。我們首先使用規(guī)則過濾的方法處理日志數(shù)據(jù),過濾噪音。數(shù)據(jù)處理的流程為:日志數(shù)據(jù)收集[14]、數(shù)據(jù)特征提取、規(guī)則過濾、模型預(yù)測分析[15]。數(shù)據(jù)維度對數(shù)據(jù)預(yù)測的準(zhǔn)確度的影響對例如圖1。

        圖1

        從實驗圖表中可以看出,隨著樣本維度的增加,模型的分辨率隨之提高,通過數(shù)據(jù)預(yù)處理過濾部分噪音數(shù)據(jù)模型的正確率得到明顯提升,充分說明了樸素貝葉斯算法在流程日志分析方面有良好的效果。

        4 結(jié)語

        本文提出使用樸素貝葉斯算法模型在無需任何人工干預(yù)的情況下對流程日志數(shù)據(jù)進(jìn)行分析。該解決方案的主要目的是使用非專家的方式對可能的風(fēng)險進(jìn)行專家分析,而無需花費大量的時間和經(jīng)歷來獲取安全知識。這種方式完全采取自動化的方式識別,可有效提高風(fēng)險分析的效率,保證系統(tǒng)運行的安全性。

        猜你喜歡
        分析模型
        一半模型
        隱蔽失效適航要求符合性驗證分析
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        中西醫(yī)結(jié)合治療抑郁癥100例分析
        在線教育與MOOC的比較分析
        日本一区二区三区视频免费在线 | 久久婷婷人人澡人人爽人人爱| 狠狠躁夜夜躁人人爽天天天天97| 色综合久久精品中文字幕| 中文字幕日本韩国精品免费观看| 亚洲av一区二区三区蜜桃| 人人妻一区二区三区| 久久久窝窝午夜精品| 久久久婷婷综合亚洲av| 国产一级一片内射视频播放| 亚洲中文字幕成人无码| 91国视频| 丝袜美腿av免费在线观看| 男女av一区二区三区| 亚洲av无码av制服另类专区 | 免费网站看v片在线18禁无码| 久久精品波多野结衣中文字幕| 狼人av在线免费观看| 一本色道久久88加勒比一| 一区二区三区在线 | 欧| 日韩中文在线视频| 女同亚洲一区二区三区精品久久| 亚洲色大成网站www永久| 亚洲精品无码mv在线观看| 91热视频在线观看| 国产精品自产拍在线18禁 | 免费人妖一区二区三区| 久久无码人妻一区二区三区午夜| 久久精品夜夜夜夜夜久久| 两个人免费视频大全毛片| 精品在线观看一区二区视频| 人妻夜夜爽天天爽| 乱伦一区二| 视频一区二区三区国产| 色综合久久无码五十路人妻| 成在人线av无码免费| 亚洲av乱码一区二区三区女同| 人妻av有码中文字幕| 一本色道久久综合亚洲精品不卡| 无码av免费一区二区三区试看| 国产精品天堂avav在线|