亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于加密流量分析的移動(dòng)應(yīng)用程序識(shí)別研究

        2022-01-20 13:29:26李雨泰王洋陳紫兒柳瑞春尚智婕
        電子制作 2021年24期

        李雨泰,王洋,陳紫兒,柳瑞春,尚智婕

        (國(guó)家電網(wǎng)有限公司信息通信分公司,北京,100000)

        0 引言

        截至2017年,我國(guó)的移動(dòng)網(wǎng)絡(luò)用戶規(guī)模已經(jīng)增長(zhǎng)值8.64億,這導(dǎo)致移動(dòng)網(wǎng)絡(luò)的環(huán)境逐漸變得越來(lái)越復(fù)雜。為了保證網(wǎng)絡(luò)用戶的信息和數(shù)據(jù)安全,相關(guān)的研究人員設(shè)計(jì)了一種針對(duì)移動(dòng)應(yīng)用程序的識(shí)別算法?,F(xiàn)有的很多文獻(xiàn)對(duì)該算法進(jìn)行了研究,文獻(xiàn)[1]通過(guò)LSTM-TNN結(jié)構(gòu),在池化層中進(jìn)行了部分特征屬性的關(guān)聯(lián),并將LSA模型引入了對(duì)程序的識(shí)別算法中,增強(qiáng)了局部與整體之間的聯(lián)系。該方法著重于提高應(yīng)用程序核心與局部之間的關(guān)聯(lián)性,在特征信息的分類準(zhǔn)確度提高中效果不明顯。文獻(xiàn)[2]在移動(dòng)設(shè)備中設(shè)計(jì)了一種通過(guò)SSL協(xié)議加強(qiáng)數(shù)據(jù)純度的方法,以密度聚類與隨機(jī)森林算法為核心,建立了數(shù)據(jù)過(guò)濾模型,又將加密數(shù)據(jù)流傳輸給了捕捉裝置,提高了數(shù)據(jù)的利用效率,增強(qiáng)了識(shí)別程序的準(zhǔn)確度。該方法雖然有效地完成了數(shù)據(jù)的建模,但是在樣本的干擾和誤判中卻沒(méi)有進(jìn)行有效設(shè)計(jì)。為解決以上問(wèn)題,提升程序識(shí)別精度,本文基于加密流量分析算法,設(shè)計(jì)了一種新的移動(dòng)應(yīng)用程序識(shí)別方法。首先提取加密數(shù)據(jù)流量特征,再計(jì)算信息增益值與信息增益率,獲得偏移矩陣激活函數(shù),精確提取加密數(shù)據(jù)流量特征;最后設(shè)計(jì)移動(dòng)應(yīng)用程序識(shí)別算法,計(jì)算聚類信息簇,從而實(shí)現(xiàn)以增強(qiáng)程序識(shí)別的精度為目標(biāo),對(duì)算法進(jìn)行優(yōu)化的目的。

        1 基于加密流量分析設(shè)計(jì)移動(dòng)應(yīng)用程序識(shí)別方法

        ■1.1 提取加密數(shù)據(jù)流量特征

        在加密流量協(xié)議的初始階段,主要包括握手、共享以及加密傳輸這三個(gè)主要的步驟。此時(shí)需要通過(guò)密度聚類算法提高共享速度,提升初始化握手對(duì)流量特征分析的效果。基于此,設(shè)樣本集中共含有n個(gè)無(wú)標(biāo)記的初始樣本,此時(shí)可以建立一個(gè)具備x維度的向量此時(shí)的鄰域參數(shù)可以通過(guò)樣本集合來(lái)計(jì)算[3]。在核心中根據(jù)密度可達(dá)定律建立一個(gè)聚類函數(shù),將所有可以達(dá)到的距離全部包含在樣本中。當(dāng)屬性節(jié)點(diǎn)中的純度盡可能達(dá)到最大時(shí),可以將信息的增益公式設(shè)置為:

        式(1)中,Dn表示所有樣本組成的樣本集;iw表示任意一個(gè)離散的屬性節(jié)點(diǎn);Dm表示被標(biāo)記的第m個(gè)樣本。將公式(1)作為數(shù)據(jù)的純度劃分公式,可以直接計(jì)算出信息增益的幅度,以此計(jì)算信息增益率,可以得到公式:

        式(2)中,?v(x)表示數(shù)據(jù)信息在固有屬性中的增益值。當(dāng)該類參數(shù)的固定值越高時(shí),屬性的增益幅度越大。此時(shí)可以得到一種反向傳播的算法結(jié)構(gòu),用于多層參數(shù)的迭代與學(xué)習(xí)。在其中一層神經(jīng)網(wǎng)絡(luò)到達(dá)偏移向量的中心節(jié)點(diǎn)時(shí),可以將輸入的向量作為權(quán)重矩陣,將輸出的向量作為偏移矩陣,在此基礎(chǔ)上得到傳播的激活函數(shù)為:

        式(3)中,hp表示第p層的神經(jīng)元反向傳播權(quán)重;?表示本次線性變換的激活函數(shù);gi表示第i層神經(jīng)元的隱含層信息輸出權(quán)重。將以上數(shù)據(jù)包的所有序列作為特征矩陣,就可以得到數(shù)據(jù)流的時(shí)間單位,并以此提取加密數(shù)據(jù)的流量特性。

        至此,完成加密數(shù)據(jù)流量特征的提取,在此基礎(chǔ)上繼續(xù)設(shè)計(jì)移動(dòng)應(yīng)用程序識(shí)別算法。

        ■1.2 設(shè)計(jì)移動(dòng)應(yīng)用程序識(shí)別算法

        在上文提出的加密數(shù)據(jù)流量特征分析中,可以直接計(jì)算出密度可達(dá)原則的最小聚類對(duì)象,依據(jù)生成的密度可達(dá)原則的最小聚類對(duì)象,生成可信度較高的聚類簇,作為度量的指標(biāo)信息[4]。再將數(shù)據(jù)集中的樣本集中在集合中,分別標(biāo)記樣本類型,并計(jì)算該樣本在數(shù)據(jù)集中出現(xiàn)的概率。其中隨機(jī)變量可以將樣本的標(biāo)簽設(shè)置為且i= 1 ,2,… ,L。則此時(shí)的信息熵計(jì)算公式為:

        式(4)中,En表示不同類型的樣本;uk表示在第i個(gè)樣本集合中的第u個(gè)標(biāo)簽;g(uk)表示聚類簇的純度計(jì)算值。

        在移動(dòng)終端的交互中,可以直接分為交互式與非交互式。在干擾樣本中,可以通過(guò)輸入隨機(jī)數(shù)據(jù),獲取分類的特征值。特征值計(jì)算公式為:

        式(5)中,c為隨機(jī)樣本數(shù)據(jù)。而決策樹(shù)的節(jié)點(diǎn)集合則需要以最優(yōu)的屬性為核心,獲取捕捉數(shù)據(jù)。在網(wǎng)絡(luò)流量的程序識(shí)別中,很多企業(yè)或用戶都使用應(yīng)用程序產(chǎn)生的流量進(jìn)入瀏覽器,這種網(wǎng)絡(luò)流量的協(xié)議難以堆疊編碼裝置,會(huì)直接導(dǎo)致負(fù)載節(jié)點(diǎn)訓(xùn)練精度的下降。因此可以通過(guò)連接二分類檢測(cè)的方法建立會(huì)話的識(shí)別算法[5],識(shí)別算法如下所示。

        至此,完成基于加密流量分析的移動(dòng)應(yīng)用程序識(shí)別方法設(shè)計(jì)。但在此過(guò)程中有一點(diǎn)極為關(guān)鍵,會(huì)對(duì)移動(dòng)應(yīng)用程序識(shí)別精度產(chǎn)生重要影響。即每一次ios系統(tǒng)在連接互聯(lián)網(wǎng)時(shí),都需要IP位置作為最終標(biāo)簽,以無(wú)顧慮的字符作為下載加密包的節(jié)點(diǎn),集合通道輸出端口識(shí)別裝置。通過(guò)以上方法,可以直接得到精度更高的移動(dòng)應(yīng)用程序識(shí)別算法,進(jìn)一步提升移動(dòng)應(yīng)用程序識(shí)別精度。

        2 實(shí)驗(yàn)設(shè)計(jì)

        上文設(shè)計(jì)了一種基于加密流量分析的移動(dòng)應(yīng)用程序識(shí)別方法,為檢測(cè)設(shè)計(jì)方法判斷結(jié)果的準(zhǔn)確性,設(shè)計(jì)如下實(shí)驗(yàn),將其與現(xiàn)有的LSA模型以及密度聚類和隨機(jī)森林算法(即文獻(xiàn)[1]、文獻(xiàn)[2]算法)相對(duì)比,通過(guò)對(duì)比三種算法的精度,測(cè)試該識(shí)別方法是否實(shí)現(xiàn)了優(yōu)化。

        ■2.1 實(shí)驗(yàn)數(shù)據(jù)

        實(shí)驗(yàn)使用的計(jì)算機(jī)設(shè)備使用的處理器為Intel(R)Pentium(R) Gold G5420 CPU @ 3.80GHz 3.79 GHz,機(jī)帶內(nèi)存為16.00GB,算法的開(kāi)發(fā)環(huán)境為python,并通過(guò)scikitlearn建立迭代模型。將應(yīng)用大廳中下載量前10的移動(dòng)應(yīng)用程序作為實(shí)驗(yàn)對(duì)象,并收集152634條數(shù)據(jù)流,保證數(shù)據(jù)流在各項(xiàng)算法中的適應(yīng)性。使用聚類簇純度分析的方法對(duì)以上數(shù)據(jù)流進(jìn)行聚類處理,統(tǒng)計(jì)樣本間距,設(shè)算法的εminpt參數(shù)為0.74,可以得到樣本與其最近樣本間距的分布如表1所示。

        表1 樣本分布參數(shù)

        0.15 4 0.21 5 0.23 6 0.22 7 0.19 8 0.18 9 0.17 10 0.22 3 0.16%0.17%0.15%0.23%0.24%0.27%0.26%0.22%

        通過(guò)以上樣本分布,可以得到聚類后不同測(cè)試樣本的信息熵如圖1所示。

        圖1 信息熵分布示意圖

        將圖1中的信息熵作為自變量,可以計(jì)算學(xué)習(xí)迭代過(guò)程中的Accuracy、Recall和Precision,計(jì)算公式為:

        式(7)、式(8)、式(9)中,Aη表示三種算法識(shí)別移動(dòng)應(yīng)用程序的準(zhǔn)確率,即Accuracy;Rη表示算法識(shí)別移動(dòng)應(yīng)用程序的召回率,即Recall;Pη表示算法識(shí)別移動(dòng)應(yīng)用程序的精確率,即Precision;ntp表示在算法識(shí)別程序的過(guò)程中將正確的樣本識(shí)別為正確結(jié)果的樣本數(shù)量;ntn表示將正確樣本識(shí)別為錯(cuò)誤樣本的樣本數(shù)量;nfn表示將錯(cuò)誤樣本識(shí)別為正確樣本的樣本數(shù)量;nfp表示將錯(cuò)誤樣本識(shí)別為錯(cuò)誤樣本的樣本數(shù)量。綜合以上三種數(shù)據(jù),分析三種算法在移動(dòng)應(yīng)用程序識(shí)別過(guò)程中的精度。

        ■2.2 精度測(cè)試

        將信息熵作為自變量,當(dāng)信息熵逐步增加時(shí),可以得到如表2-表4所示的數(shù)據(jù)結(jié)果。

        如表2-表4所示,在三種不同算法的精度計(jì)算中,信息熵的變化會(huì)導(dǎo)致移動(dòng)應(yīng)用程序識(shí)別精度的變化,且隨著信息熵由0.5增長(zhǎng)到5.0,三種算法的精度都在逐漸降低,由此可見(jiàn)Accuracy、Recall和Precision三個(gè)精度指標(biāo)與信息熵呈現(xiàn)反比關(guān)系。在算法的對(duì)比中,可以清晰地看出,本文設(shè)計(jì)的加密流量分析算法比Unreal Engine算法、密度聚類+隨機(jī)森林算法的精度指標(biāo)更高,精度最高分別可達(dá)到99.25%、93.89%以及98.85%。由此可見(jiàn),文中設(shè)計(jì)的移動(dòng)應(yīng)用程序識(shí)別方法確實(shí)得到了優(yōu)化。

        表2 Accuracy數(shù)據(jù)

        表3 Recall數(shù)據(jù)

        表4 Precision數(shù)據(jù)

        3.5 88.23% 83.69% 82.17%4.0 86.28% 82.96% 81.45%4.5 84.54% 78.82% 78.72%5.0 83.86% 75.51% 77.93%

        3 結(jié)束語(yǔ)

        在移動(dòng)互聯(lián)網(wǎng)逐漸成為人們生活中必不可少的一部分之后,對(duì)移動(dòng)應(yīng)用程序的各類管理與監(jiān)控也在不斷完善,為更準(zhǔn)確地完成對(duì)程序的識(shí)別工作,進(jìn)一步完善網(wǎng)絡(luò)流量的配置與管理,上文設(shè)計(jì)了一種基于加密流量分析的移動(dòng)應(yīng)用程序識(shí)別算法。首先提取加密數(shù)據(jù)流量特征,再計(jì)算信息增益值與信息增益率,獲得偏移矩陣激活函數(shù),精確提取加密數(shù)據(jù)流量特征;最后設(shè)計(jì)移動(dòng)應(yīng)用程序識(shí)別算法,計(jì)算聚類信息簇,完成移動(dòng)應(yīng)用程序識(shí)別。然而,在前置的學(xué)習(xí)訓(xùn)練中,本文設(shè)計(jì)的算法所需時(shí)間過(guò)長(zhǎng),需要進(jìn)一步地完善與優(yōu)化,在接下來(lái)的研究過(guò)程中,將對(duì)其進(jìn)行深入研究,以更好地提升移動(dòng)應(yīng)用程序識(shí)別精度。

        成年毛片18成年毛片| 老熟女重囗味hdxx70星空| 体验区试看120秒啪啪免费| 久久久久亚洲av无码专区喷水 | 美女无遮挡免费视频网站| 午夜不卡久久精品无码免费| 热の国产AV| 亚洲自拍愉拍| 精品黑人一区二区三区| 国产精品视频一区二区久久| 青青草中文字幕在线播放| 在线免费观看一区二区| 熟妇丰满多毛的大隂户| 激情97综合亚洲色婷婷五| 国产桃色精品网站| 日本一区二区精品色超碰| 亚洲长腿丝袜中文字幕| 国产情侣自拍在线视频| 精品国品一二三产品区别在线观看| 国产女人水真多18毛片18精品| 国产尤物AV尤物在线看| 依依成人影视国产精品| 蜜臀av人妻一区二区三区| 亚洲精品国产熟女久久久| 婷婷伊人久久大香线蕉av| 色老头在线一区二区三区| 91精品国产综合成人| 国产特黄1区2区3区4区| 久久老熟女一区二区三区福利| 国产动作大片中文字幕| 亚洲精品综合一区二区| 亚洲∧v久久久无码精品| 成年人免费黄色h网| 国产av一区二区制服丝袜美腿| 风流老太婆大bbwbbwhd视频| 99久久人妻精品免费二区| 免费的毛片视频| 一本色道亚州综合久久精品| 亚洲精品无码av人在线观看国产| 97久久超碰国产精品旧版| 国产精品免费久久久久影院|