亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于切片GRU的日志異常檢測(cè)研究

        2019-09-24 02:00:29王易東王彬
        電腦知識(shí)與技術(shù) 2019年19期
        關(guān)鍵詞:深度學(xué)習(xí)

        王易東 王彬

        摘要:深度學(xué)習(xí)應(yīng)用在日志異常檢測(cè)領(lǐng)域中,取得了較好的準(zhǔn)確率。日志異常檢測(cè)對(duì)實(shí)時(shí)性的要求很高,這對(duì)異常檢測(cè)模型的運(yùn)行速度提出了巨大挑戰(zhàn),目前基于循環(huán)神經(jīng)網(wǎng)絡(luò)的檢測(cè)算因其固有的循環(huán)結(jié)構(gòu)導(dǎo)致并行計(jì)算難以實(shí)現(xiàn),這極大限制了模型的計(jì)算速度。為提高日志異常檢測(cè)效率,設(shè)計(jì)了基于切片GRU日志異常檢測(cè)模型,提出了一種基于最小質(zhì)因數(shù)切片的日志異常檢測(cè)算法。構(gòu)建的切片GRU模型主要對(duì)隱藏層做了改進(jìn),輸入序列在進(jìn)入隱藏層之前進(jìn)行了切片,每一層的GRU塊按照切片數(shù)量進(jìn)行分組,組與組之間并行計(jì)算,層與層之間串行計(jì)算,多個(gè)隱藏層共同處理輸入序列,切片GRU模型的這種層次結(jié)構(gòu)加快了模型的運(yùn)行速度,在不影響檢測(cè)精度的前提下,算法在不同長(zhǎng)度的日志序列上均有不效率提升,且輸入序列越長(zhǎng),提升的幅度越大。

        關(guān)鍵詞:日志異常檢測(cè);深度學(xué)習(xí);循環(huán)神經(jīng)網(wǎng)絡(luò);GRU網(wǎng)絡(luò);切片算法

        中圖分類號(hào):TP319? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

        文章編號(hào):1009-3044(2019)19-0059-02

        1 引言

        日志異常檢測(cè)可以看作一種自然語(yǔ)言序列預(yù)測(cè)任務(wù),通過(guò)對(duì)比預(yù)測(cè)值與實(shí)際值來(lái)判定異常。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network ,RNN)通過(guò)一個(gè)循環(huán)結(jié)構(gòu),將上一種狀態(tài)的輸出作為當(dāng)前的輸入,從而追蹤歷史,做出預(yù)測(cè),可以用于自然語(yǔ)言序列預(yù)測(cè)任務(wù)。由于梯度消失/梯度爆炸的問(wèn)題,傳統(tǒng)RNN在實(shí)際中很難處理長(zhǎng)期依賴,而長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)和門控循環(huán)單元(Gated Recurrent Unit,GRU)則解決了這個(gè)問(wèn)題,可以從語(yǔ)料中學(xué)習(xí)到長(zhǎng)期依賴關(guān)系。Du M[1]等將系統(tǒng)日志建模為自然語(yǔ)言序列,提出了一種基于LSTM的深度神經(jīng)網(wǎng)絡(luò)模型——DeepLog,在多個(gè)大型數(shù)據(jù)集上取得了較高的檢測(cè)精度。

        然而日志異常檢測(cè)對(duì)實(shí)時(shí)性的要求很高,這對(duì)異常檢測(cè)模型的運(yùn)行速度提出了巨大挑戰(zhàn)。LSTM和GRU作為 RNN的變種,其固有的循環(huán)結(jié)構(gòu)導(dǎo)致并行計(jì)算難以實(shí)現(xiàn),切片循環(huán)神經(jīng)網(wǎng)絡(luò)[2](Sliced Recurrent Neural Networks,SRNN)從結(jié)構(gòu)上對(duì)RNN進(jìn)行改進(jìn),通過(guò)將輸入序列切分為多個(gè)子序列實(shí)現(xiàn)并行計(jì)算。本文參照Du M等[1]提出的Deeplog模型構(gòu)造日志異常檢測(cè)模型,用GRU網(wǎng)絡(luò)替換Deeplog中的LSTM,將SRNN的思路應(yīng)用到日志異常檢測(cè)模型中,提出了一種基于最小質(zhì)因數(shù)切片的日志異常檢測(cè)算法,基于該算法改進(jìn)異常檢測(cè)模型,并結(jié)合日志序列的特點(diǎn),調(diào)整模型參數(shù),本文的最后將改進(jìn)后的切片模型與原始GRU模型做對(duì)比,從性能和速度兩方面來(lái)評(píng)價(jià)模型的提升。

        2 基于GRU的日志異常檢測(cè)模型介紹

        在系統(tǒng)日志中,所有相似日志條目中的公共常量消息叫作log key,可以用來(lái)表示日志消息類型。N元語(yǔ)法(N-gram)是NLP領(lǐng)域中一種常用的概率語(yǔ)言模型,可以通過(guò)極大似然估計(jì)從長(zhǎng)度為N的已知log key序列中計(jì)算出下一個(gè)log key出現(xiàn)的條件概率。本文基于N-gram語(yǔ)言模型,參考了文獻(xiàn)[1]中的設(shè)計(jì)思路,構(gòu)建了一種基于GRU的日志異常檢測(cè)模型。

        模型總體上可分為輸入層(input layer)、嵌入層(embedding layer)、隱藏層(hidden layer)和輸出層(output layer),信息沿各層依次傳遞。圖1給出了基于GRU的日志異常檢測(cè)模型的結(jié)構(gòu)示意圖,該模型的運(yùn)算速度相比于DeepLog約提升了16.7%,同時(shí)該模型也是本文切片GRU日志異常檢測(cè)模型的基礎(chǔ),結(jié)合下文中的切片算法,可以進(jìn)一步大幅提高日志異常檢測(cè)效率。

        3 基于最小切片因子的切片算法

        相比于標(biāo)準(zhǔn)GRU模型,本文構(gòu)建的切片GRU模型主要對(duì)隱藏層做了改進(jìn)。改進(jìn)模型與原模型的不同之處在于:輸入序列在進(jìn)入隱藏層之前進(jìn)行了切片[3],每一層的GRU塊按照切片數(shù)量進(jìn)行分組,組與組之間并行計(jì)算,層與層之間串行計(jì)算,多個(gè)隱藏層共同處理輸入序列,切片GRU模型的這種層次結(jié)構(gòu)[4]加快了模型的運(yùn)行速度。

        本文對(duì)文獻(xiàn)[2]中的切片方法做了改進(jìn),提出一種基于最小切片因子切片算法,和文獻(xiàn)[2]中的方法相比,本文算法細(xì)化了切片過(guò)程,改進(jìn)了切片方式,具有更強(qiáng)的合理性。算法的核心思想是對(duì)輸入序列進(jìn)行多次切片,每次切片數(shù)都等于切片序列(子序列)的最小切片因子,直到最小子序列的長(zhǎng)度也等于最小切片因子為止。最小切片因子的取值為2、3、5,對(duì)于長(zhǎng)度等于最小切片因子的序列,無(wú)法通過(guò)切片加快其計(jì)算速度。

        假設(shè)模型的輸入是一個(gè)長(zhǎng)度為n的log key序列X={[x1,x2,…xh}],若n是最小切片因子的倍數(shù),直接對(duì)序列進(jìn)行切片,得到[m1m1∈{2,3,5}]個(gè)子序列;若不是,則在序列最后加入一個(gè)元素后再切片,該元素僅用來(lái)輔助切片,不參與序列中記憶傳遞。

        4 實(shí)驗(yàn)及結(jié)果分析

        為評(píng)估切片算法的速度與性能,本節(jié)在大型日志數(shù)據(jù)集上進(jìn)行了對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)環(huán)境實(shí)驗(yàn)環(huán)境在個(gè)人筆記本上配置,處理器為Intel Core i7-6700HQ(2.60GHz),NVIDIA GeForce GTX 965M GPU(2GB),16GB RAM(2133MHz),操作系統(tǒng)為Ubuntu 16.04(64位)。GRU網(wǎng)絡(luò)的搭建和訓(xùn)練基于深度學(xué)習(xí)框架keras,tensorflow作為后端,編程環(huán)境為Python3.6.5。對(duì)比實(shí)驗(yàn)分別從速度和精度兩方面對(duì)切片模型的優(yōu)越性進(jìn)行驗(yàn)證。

        首先驗(yàn)證切片模型的速度提升,選取包含11175629條數(shù)據(jù)的亞馬遜大型HDFS日志[5]作為實(shí)驗(yàn)數(shù)據(jù)集,其中前1%日志數(shù)據(jù)中的正常會(huì)話作為訓(xùn)練集訓(xùn)練模型,整個(gè)數(shù)據(jù)集用來(lái)測(cè)試模型性能。對(duì)比實(shí)驗(yàn)共分為3組,分別選取長(zhǎng)度(h)為6、9、12的log key序列作為輸入,對(duì)比兩個(gè)模型的運(yùn)行速度、檢測(cè)精度。

        表1給出了不同輸入長(zhǎng)度下兩種模型的運(yùn)行速度對(duì)比,從表中可以看出,不同序列長(zhǎng)度下的切片GRU模型相較于原模型的速度提升均達(dá)到了切片模型速度提升的預(yù)期值。觀察長(zhǎng)度為6和12的序列在不同切片方式下的運(yùn)行速度,發(fā)現(xiàn)不同結(jié)構(gòu)下檢測(cè)每條日志花費(fèi)的時(shí)間相當(dāng),從而證明了序列的不同切片方式并不會(huì)影響模型的運(yùn)算速度。對(duì)比不同序列長(zhǎng)度下的性能提升幅度,可以看到序列長(zhǎng)度越長(zhǎng),切片GRU模型相較于原模型速度提升越大。

        5 結(jié)語(yǔ)

        當(dāng)前基于深度學(xué)習(xí)的日志異常檢測(cè)領(lǐng)域中,涉及提升運(yùn)算速度的研究相對(duì)較少,且大都通過(guò)改進(jìn)循環(huán)單元來(lái)提升速度,提升幅度較低。本文研究基于并行計(jì)算的思想,提出了切片GRU模型,使用分解質(zhì)因數(shù)的思想對(duì)GRU模型的輸入序列進(jìn)行切片,多次切片形成了多個(gè)隱藏層,每個(gè)隱藏層中的切片序列之間并行計(jì)算,各隱藏層之間串行計(jì)算。在大型日志數(shù)據(jù)集上進(jìn)行的切片GRU模型與普通GRU模型的對(duì)比實(shí)驗(yàn)表明,切片算法對(duì)GRU模型的異常檢測(cè)效率提升顯著,在處理較長(zhǎng)輸入序列時(shí)提升尤為明顯。本文研究為今后相關(guān)工作提供了算法參考和模型構(gòu)建基準(zhǔn),具有一定理論指導(dǎo)意義。

        參考文獻(xiàn):

        [1] Du M, Li F, Zheng G, et al. Deeplog: Anomaly detection and diagnosis from system logs through deep learning[C].Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security.ACM,2017:1285-1298.

        [2] Yu Z, Liu G.Sliced Recurrent Neural Networks[J].2018.

        [3] Oord A, Dieleman S, Zen H, et al. Wavenet: A generative model for raw audio[J].arXiv preprint arXiv,2016.

        [4] Yang Z,Yang D,Dyer C,et al.Hierarchical attention networks for document classification[C].Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies.2016:1480-1489.

        [5] Xu W,Huang L,F(xiàn)ox A,et al.Detecting large-scale system problems by mining console logs[C]. Proceedings of the ACM SIGOPS 22nd symposium on Operating systems principles.ACM,2009: 117-132.

        【通聯(lián)編輯:朱寶貴】

        猜你喜歡
        深度學(xué)習(xí)
        從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
        面向大數(shù)據(jù)遠(yuǎn)程開(kāi)放實(shí)驗(yàn)平臺(tái)構(gòu)建研究
        基于自動(dòng)智能分類器的圖書館亂架圖書檢測(cè)
        搭建深度學(xué)習(xí)的三級(jí)階梯
        有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
        電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
        利用網(wǎng)絡(luò)技術(shù)促進(jìn)學(xué)生深度學(xué)習(xí)的幾大策略
        考試周刊(2016年94期)2016-12-12 12:15:04
        MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
        大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
        深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
        欧洲-级毛片内射| 亚洲av综合av一区| 成人一区二区免费中文字幕视频| 日出水了特别黄的视频| 中文字幕在线日韩| 亚洲成人激情在线影院| 24小时在线免费av| 国产一区内射最近更新| 精品久久久久久久久久久aⅴ| 亚洲av福利天堂在线观看| 日产一区日产2区日产| 性无码专区无码| 乱码一二区在线亚洲| 伊人影院在线观看不卡| 久久精品国产色蜜蜜麻豆国语版| 亚洲国产精品毛片av不卡在线| 精品国产自产久久久| 国产特黄1区2区3区4区| 国产精品人成在线观看免费| 亚洲av日韩综合一区在线观看| 亚洲午夜成人片| 日本在线观看三级视频| 国产av夜夜欢一区二区三区| 国产丰满老熟女重口对白| 国产优质女主播在线观看| 久草视频在线手机免费看| 久久精品噜噜噜成人| 人伦片无码中文字幕| 在线高清亚洲精品二区| 亚洲av永久无码精品一福利| 宝贝把腿张开我要添你下边动态图| 日本人妻少妇精品视频专区| 国产av剧情刺激对白| 中文亚洲欧美日韩无线码| 狠狠色狠狠色综合网老熟女| 久久一区二区视频在线观看| 天天躁夜夜躁狠狠躁2021a2| 亚洲人成影院在线无码观看| 高清少妇一区二区三区| 中文字幕有码无码人妻av蜜桃| 免费做爰猛烈吃奶摸视频在线观看 |