亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于在線學(xué)習(xí)的分布式流量實(shí)時(shí)分析系統(tǒng)設(shè)計(jì)

        2022-03-24 08:29:26陳紀(jì)龍張鴻宇張聰益宋子康
        技術(shù)與市場 2022年3期
        關(guān)鍵詞:加密預(yù)處理卷積

        陳紀(jì)龍,張鴻宇,張聰益,宋子康,涂 然

        (西南石油大學(xué)計(jì)算機(jī)科學(xué)學(xué)院,四川 成都 610500)

        0 引言

        已知的主要流量類型為正常業(yè)務(wù)流量、網(wǎng)絡(luò)攻擊流量與病毒流量。這些流量分為加密流量與未加密流量。已有的研究重點(diǎn)關(guān)注流量的某些局部特征,然而忽視了特征之間的交叉和時(shí)序關(guān)系,并且對加密流量是不適用的。魯剛等利用手工特征工程對流量進(jìn)行特征提取,描述特征之間的關(guān)系[1]。張偉等設(shè)計(jì)了一個(gè)惡意流量實(shí)時(shí)識別引擎,然而其識別范圍僅限于傳輸層,具有較大的限制,且依賴于部分種類流量的專有特征,不利于推廣使用[2]。 駱子銘等對加密流量和非加密流量進(jìn)行了識別,但忽視了流量特征域之間的交叉和時(shí)序關(guān)系,且不利于處理高維稀疏特征[3]。

        針對以上研究現(xiàn)狀和啟發(fā),提出在系統(tǒng)中使用 CNN+LSTM 時(shí)空神經(jīng)網(wǎng)絡(luò),結(jié)合在線學(xué)習(xí)技術(shù)和虛擬化,保證模型的實(shí)時(shí)推斷性能和隔離容錯(cuò)性。這樣的模型能夠在準(zhǔn)確地對流量進(jìn)行分類和識別的同時(shí),根據(jù)線上流量特性自行進(jìn)行動(dòng)態(tài)調(diào)整,確保模型的及時(shí)更新。

        1 系統(tǒng)分析

        1.1 數(shù)據(jù)采集與特征選取

        數(shù)據(jù)集通過CyberFlood工具生成 TLS 加密與非加密的正常業(yè)務(wù)流量與網(wǎng)絡(luò)攻擊行為流量,再使用 Python 對指定的網(wǎng)絡(luò)端口抓取流量。對于非加密流量為了使用模型精度達(dá)到最大化,直接匹配其 URL 字段用于模型訓(xùn)練。對于 TLS 加密流量,本系統(tǒng)考慮在不解密加密流量的情況下,通過獲取數(shù)據(jù)流中的元數(shù)據(jù)特征,并將其導(dǎo)入至機(jī)器學(xué)習(xí)模型中進(jìn)行識別。

        1.2 數(shù)據(jù)預(yù)處理

        對于加密流量,利用Python的Pandas庫進(jìn)一步進(jìn)行處理,如對離散型特征進(jìn)行one-hot編碼來對每一個(gè)特征的多個(gè)可能值進(jìn)行處理轉(zhuǎn)變?yōu)槎鄠€(gè)二元特征,并對特征進(jìn)行歸一化、數(shù)值化等。

        對于非加密流量,由于流量特征為URL文本格式,讀取后得到的是一個(gè)文本數(shù)據(jù),設(shè)使用正則表達(dá)式解析預(yù)處理和分詞之后的流量數(shù)據(jù)為單詞-文本矩陣,m條流量的URL數(shù)據(jù)對應(yīng)m條文本,每條文本的向量空間為單詞向量空間(word vector space),即對每一條流量 URL 文本,用一個(gè)向量表示該文本的“語義”,向量的每一維對一個(gè)單詞,其數(shù)值為該單詞在該文本中出現(xiàn)的權(quán)值[4]。數(shù)據(jù)預(yù)處理流程如圖1所示。

        圖1 數(shù)據(jù)預(yù)處理流程

        1.3 模型訓(xùn)練

        將流量信息建模為行向量作為特征取值,列向量為不同流量的矩陣。使用CNN+LSTM時(shí)空神經(jīng)網(wǎng)絡(luò)模型[5]。CNN神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)流量的空間信息,LSTM神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)流量在時(shí)間方向的信息。

        在將文本用TF-IDF表示后可以獲得m×n矩陣,(m為流量條數(shù),n為當(dāng)前單詞表示所在的向量空間維度)。對每一個(gè)n維流量向量,都定義一個(gè)從Rn到Rp的線性映射:x→Tx,完成了詞嵌入。

        完成詞嵌入后,定義k為卷積核的大小,向量M∈Rk×p是卷積操作的卷積核,然后使M卷積核對窗口張量W(k-grams)的每一個(gè)位置j進(jìn)行卷積,產(chǎn)生多張?zhí)卣鲌Dcj∈Rm-k+1。對每一個(gè)Wj,可以將其重新以不同特征表示,即Wj=[c1c2…cq],q為卷積核個(gè)數(shù)。接著每一個(gè)Wj會(huì)被輸入LSTM模型,如圖2所示。

        圖2 CNN特征取示意圖

        這里采用標(biāo)準(zhǔn)LSTM架構(gòu)。在每一步中,模塊的輸出由一系列做為舊的隱藏層的ht-1和當(dāng)前時(shí)間輸入xt的共同控制。模型還包括遺忘門ft,輸入門it,輸出門ot。這些門共同決定如何更新當(dāng)前的記憶單元ct以及當(dāng)前的隱藏狀態(tài)ht。本文選擇在CNN之上增加LSTM學(xué)習(xí)更高特征序列中的時(shí)序依賴。

        將LSTM最后一步的最后一個(gè)隱藏狀態(tài)輸出視為流量的新的表示,添加一個(gè)softmax層,最終獲得不同分類標(biāo)簽的預(yù)測概率值。以最小化交叉熵?fù)p失的形式訓(xùn)練整個(gè)模型,并使用隨機(jī)梯度下降法(SGD)來學(xué)習(xí)模型參數(shù)。

        采用2種手段dropout和L2權(quán)重正則化來防止模型過擬合。在模型中,將流量序列輸入卷積層之前以及在將LSTM的輸出傳入softmax層之前,對流量向量使用dropout。L2正則化作用于softmax層的權(quán)值。

        2 實(shí)驗(yàn)結(jié)果

        2.1 評價(jià)指標(biāo)

        因?yàn)樵趯?shí)際線上環(huán)境中正常流量要遠(yuǎn)遠(yuǎn)多于惡意流量,故這是一個(gè)類別不平衡問題,評價(jià)分類器的標(biāo)準(zhǔn)包括AUC、查準(zhǔn)率(P)、查全率(R)和綜合評價(jià)(F1)。其中,查準(zhǔn)率、查全率和綜合評價(jià)代表分類器對每種類別的識別能力,AUC能反應(yīng)模型對樣本的排序的能力。

        2.2 評測結(jié)果

        從表1可以看出,模型在線下同時(shí)包括加密和非加密的流量驗(yàn)證集上的AUC為93.4%,查準(zhǔn)率為91.55%,查全率為92.25%,綜合評價(jià)得分為91.70%。

        表1 模型在不同數(shù)據(jù)集上的效果 單位:%

        3 結(jié)語

        本文運(yùn)用數(shù)據(jù)并行處理技術(shù),采用Hive分布式數(shù)據(jù)庫對原始流量數(shù)據(jù)進(jìn)行存儲(chǔ)。同時(shí)使用Spark批處理機(jī)制與Flink流式處理機(jī)制對流量數(shù)據(jù)進(jìn)行并行處理。在模型上,使用CNN+LSTM時(shí)空神經(jīng)網(wǎng),其中采用CNN對流量空間特征進(jìn)行提取,LSTM對流量時(shí)序特征進(jìn)行提取,能完成不同種類流量的準(zhǔn)確分類。最后在工程上結(jié)合在線學(xué)習(xí)與虛擬化技術(shù),既能滿足高實(shí)時(shí)性,同時(shí)具有高隔離性與容錯(cuò)性,在工業(yè)界有較高的應(yīng)用價(jià)值。

        猜你喜歡
        加密預(yù)處理卷積
        基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
        一種基于熵的混沌加密小波變換水印算法
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        基于預(yù)處理MUSIC算法的分布式陣列DOA估計(jì)
        淺談PLC在預(yù)處理生產(chǎn)線自動(dòng)化改造中的應(yīng)用
        認(rèn)證加密的研究進(jìn)展
        絡(luò)合萃取法預(yù)處理H酸廢水
        基于自適應(yīng)預(yù)處理的改進(jìn)CPF-GMRES算法
        基于ECC加密的電子商務(wù)系統(tǒng)
        大ji巴好深好爽又大又粗视频| 无码 免费 国产在线观看91| 国产在线观看网址不卡一区| 麻豆国产精品久久天堂| 亚洲人妻调教中文字幕| av狠狠色丁香婷婷综合久久| 亚洲av综合色区无码一二三区| 欧美精品aaa久久久影院| av资源吧首页在线观看| 人妻少妇中文字幕,久久精品 | 视频女同久久久一区二区| 亚洲国产婷婷六月丁香| 区二区三区玖玖玖| 亚洲成av人片天堂网九九| 国产粉嫩嫩00在线正在播放| 国产91在线播放九色快色| 黑人大群体交免费视频| 精品少妇人妻av无码久久| 男人j进女人p免费视频| 亚洲一区二区三区偷拍自拍| 日产一区日产2区日产| 在线观看的网站| 一本一道波多野结衣一区| 国产精品反差婊在线观看| 精品人妻日韩中文字幕| 极品少妇被黑人白浆直流| 亚洲av无码专区在线播放中文 | 伊人久久综合精品无码av专区| 国产美女被遭强高潮露开双腿| 国产av一啪一区二区| 秋霞在线视频| 人妻少妇av中文字幕乱码| 久久精品国产只有精品96| 日本女同视频一区二区三区 | 久久不见久久见免费影院| 成人免费网站视频www| 激情人妻网址| 最近更新中文字幕一区二区 | 国产麻豆放荡av激情演绎| 中文字幕丰满人妻av| 日本高清视频永久网站www|