亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)的P2P視頻流識別技術(shù)

        2021-08-16 10:22:35邢剛付榮宋利
        中國新通信 2021年11期
        關(guān)鍵詞:機(jī)器學(xué)習(xí)特征分析

        邢剛 付榮 宋利

        【摘要】? ? 當(dāng)前因特網(wǎng)多媒體視頻流業(yè)務(wù)增長迅速,有效識別網(wǎng)絡(luò)流量P2P(Peer to Peer)視頻流服務(wù)是一項(xiàng)重要挑戰(zhàn)。本文提出一種基于機(jī)器學(xué)習(xí)的P2P視頻流識別技術(shù)。該技術(shù)中視頻流特征分析系統(tǒng)包括數(shù)據(jù)報(bào)采集、處理、分流和屬性特征計(jì)算模塊。其次,提出了基于統(tǒng)計(jì)方法的P2P視頻流數(shù)據(jù)報(bào)特征挖掘方法。仿真實(shí)驗(yàn)驗(yàn)證了所提出方法的高效性和準(zhǔn)確性,能夠較好的滿足P2P視頻流識別。

        【關(guān)鍵詞】? ? P2P視頻流? ? 流量識別? ? 特征分析? ? 機(jī)器學(xué)習(xí)

        引言:

        當(dāng)前,伴隨多媒體技術(shù)與P2P(Peer to Peer)網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,基于P2P的視頻流應(yīng)用已成為網(wǎng)絡(luò)用戶流量數(shù)據(jù)中的關(guān)鍵組成部分[1]?;诜植际降腜2P技術(shù)具有傳統(tǒng)客戶端/服務(wù)器架構(gòu)技術(shù)所不具備的特點(diǎn)與優(yōu)勢。采用P2P技術(shù)實(shí)現(xiàn)多媒體流服務(wù),讓用戶從分布式環(huán)境獲取流媒體資源,這樣能夠有效地降低終端用戶對服務(wù)器性能的需求,降低網(wǎng)絡(luò)通信開銷和帶寬資源,有效地提高流媒體的服務(wù)質(zhì)量。研究人員為解決P2P視頻流服務(wù)中的安全問題,針對P2P技術(shù)的視頻流進(jìn)行有效識別,是實(shí)現(xiàn)網(wǎng)絡(luò)可管理、可控制的關(guān)鍵技術(shù)。

        目前,基于P2P的視頻流識別技術(shù)分為三類,分別是基于端口的P2P流媒體識別技術(shù)、基于流量特征的P2P流媒體識別技術(shù)和基于深層數(shù)據(jù)報(bào)檢測的P2P流媒體識別技術(shù)。

        基于端口的P2P流媒體識別技術(shù), 該技術(shù)通過識別P2P流量中數(shù)據(jù)報(bào)的端口字段,所識別出的字段能夠準(zhǔn)確檢測出流量所屬P2P協(xié)議,亦能夠排除其他端口的非P2P應(yīng)用。該字段再用于特定端口號匹配,這樣的方式能夠發(fā)現(xiàn)潛在的特定P2P流媒體。該類技術(shù)通過基于端口的識別技術(shù)不易受數(shù)據(jù)包丟失、亂序影響,具有較好的魯棒性等特征。

        基于流量特征的P2P流媒體識別技術(shù),它能夠解析其網(wǎng)絡(luò)數(shù)據(jù)報(bào)的傳輸層所展現(xiàn)出的流量特征,實(shí)現(xiàn)基于特征匹配的流媒體識別。常見的流量特征包含:節(jié)點(diǎn)角色分析、流量統(tǒng)計(jì)、網(wǎng)絡(luò)直徑計(jì)算法[2-3]。

        基于深層數(shù)據(jù)報(bào)檢測的P2P流媒體識別,該方法需要訪問數(shù)據(jù)包內(nèi)部有效載荷,挖掘終端用戶的應(yīng)用層數(shù)據(jù),基于協(xié)議與還原技術(shù)檢測數(shù)據(jù)報(bào)中是否含有特定協(xié)議字符串,以此來判斷數(shù)據(jù)報(bào)是否屬于P2P流媒體[4-5]。此類方法具有優(yōu)越的擴(kuò)展性,對已知協(xié)議的P2P應(yīng)用具有準(zhǔn)確的識別率。

        現(xiàn)有P2P視頻流識別技術(shù),均建立在傳統(tǒng)P2P應(yīng)用流量識別技術(shù)之上,為了提升基于P2P的視頻流識別方法的有效性和準(zhǔn)確率,本文提出基于統(tǒng)計(jì)特征與機(jī)器學(xué)習(xí)的視頻流識別方法。該方法采用機(jī)器學(xué)習(xí)中分類與聚類對P2P視頻流的流量特征進(jìn)行統(tǒng)計(jì),從而能夠有效識別。

        一、P2P視頻流特征分析

        1.1 P2P視頻流特征分析系統(tǒng)

        P2P視頻流特征分析系統(tǒng):通過采集網(wǎng)絡(luò)數(shù)據(jù)報(bào)作為系統(tǒng)輸入項(xiàng),經(jīng)過各模塊的挖掘處理,最終獲取P2P視頻流的統(tǒng)計(jì)特征。為了實(shí)現(xiàn)特定P2P視頻流統(tǒng)計(jì)特征分析,通常在采集數(shù)據(jù)報(bào)時(shí),需要屏蔽其他P2P視頻流服務(wù)。數(shù)據(jù)報(bào)分流能夠?qū)崿F(xiàn)預(yù)處理,將數(shù)據(jù)以流形式存儲在流隊(duì)列中。針對流量分析統(tǒng)計(jì),采用模塊類包,包括數(shù)據(jù)報(bào)的采集與挖掘、數(shù)據(jù)報(bào)的分流處理、特征屬性值統(tǒng)計(jì)與計(jì)算。

        1.2 P2P視頻流特征分析模塊

        本文所提出的,視頻流量特征分析系統(tǒng)包含有四個(gè)功能模塊:數(shù)據(jù)報(bào)采集模塊、數(shù)據(jù)報(bào)處理模塊、數(shù)據(jù)報(bào)分流模塊和特征屬性計(jì)算模塊。下面針對系統(tǒng)內(nèi)的四個(gè)功能模塊詳細(xì)解析:

        在前期階段,系統(tǒng)需要感知數(shù)據(jù),數(shù)據(jù)報(bào)采集模塊能夠?qū)崿F(xiàn)從互聯(lián)網(wǎng)絡(luò)抓取特定P2P視頻流數(shù)據(jù)樣本,采用開源軟件包、爬蟲技術(shù)實(shí)現(xiàn)采集純凈的網(wǎng)絡(luò)數(shù)據(jù)報(bào)。

        針對所采集到的數(shù)據(jù),數(shù)據(jù)報(bào)處理模塊能夠?qū)Σ杉臉颖緮?shù)據(jù)報(bào)進(jìn)行標(biāo)注和預(yù)處理,獲取數(shù)據(jù)報(bào)五元組信息,目的是便于后續(xù)的分流工作;處理過程中還需要挖掘出一些特征信息,如數(shù)據(jù)報(bào)大小、數(shù)據(jù)報(bào)到達(dá)時(shí)間、TTL(Time To Live)取值,這些提供給特征屬性計(jì)算模塊完成統(tǒng)計(jì)。

        數(shù)據(jù)報(bào)分流模塊可以實(shí)現(xiàn)流層面P2P視頻流特征的統(tǒng)計(jì)分析。首先,分流模塊將具有相同五元組信息(源IP、目的IP、源端口、目的端口、TCP/UDP協(xié)議)的數(shù)據(jù)報(bào)視作同一條流;再將擁有相同五元組信息的數(shù)據(jù)報(bào)劃分至同一條矩陣列表流,存儲于流隊(duì)列中。

        最終,特征屬性計(jì)算模塊實(shí)現(xiàn)對流隊(duì)列的挖掘與處理。該模塊對每一條流完成統(tǒng)計(jì),遍歷流中所有數(shù)據(jù)報(bào)信息完成集合與計(jì)算,獲取每一條流的特征屬性值,最后計(jì)算出所有流的屬性值。

        二、基于機(jī)器學(xué)習(xí)的P2P視頻流識別方案

        基于機(jī)器學(xué)習(xí)的P2P視頻流識別方案結(jié)構(gòu)如圖1所示。在視頻流學(xué)習(xí)之前,需要對每條視頻流量完成分流處理,提取相應(yīng)的流屬性特征,采用分類學(xué)習(xí)算法挖掘此實(shí)例所屬的流量類別。運(yùn)用Wireshark開源軟件進(jìn)行數(shù)據(jù)報(bào)的采集,將樣本數(shù)據(jù)分為訓(xùn)練集和檢測集。將訓(xùn)練集樣本數(shù)據(jù)導(dǎo)入流量特征分析系統(tǒng),最終實(shí)現(xiàn)分類處理。該方案中采用有監(jiān)督的機(jī)器學(xué)習(xí)方法標(biāo)注流的類別作為數(shù)據(jù)報(bào)的預(yù)處理,分類器與流量分類均在Weka開源數(shù)據(jù)挖掘軟件中實(shí)現(xiàn)。

        三、實(shí)驗(yàn)仿真與結(jié)果分析

        驗(yàn)證本文所提出的基于機(jī)器學(xué)習(xí)的P2P視頻流識別技術(shù),構(gòu)建實(shí)驗(yàn)仿真平臺,通過局域網(wǎng)采集P2P視頻流數(shù)據(jù)報(bào),針對PPLive、PPS和QQLive三種P2P視頻流服務(wù)分別進(jìn)行流量特征選擇。實(shí)驗(yàn)采用Weka開源數(shù)據(jù)挖掘平臺實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法,通過界面操作進(jìn)行算法參數(shù)配置,針對訓(xùn)練數(shù)據(jù)集樣本采用十字交叉法對構(gòu)建模型進(jìn)行評估。仿真實(shí)驗(yàn)選取機(jī)器學(xué)習(xí)算法中典型的分類算法:貝葉斯網(wǎng)絡(luò)(BayesNet)、K最近鄰法(KNN)和RandomTree進(jìn)行P2P視頻流識別。算法評價(jià)指標(biāo)為測試時(shí)間與準(zhǔn)確率,用來評估所提出方法性能。

        實(shí)驗(yàn)組一:算法評估測試時(shí)間指分類算法對測試樣本識別執(zhí)行時(shí)間,將視頻流訓(xùn)練樣本數(shù)據(jù)建模,再對樣本數(shù)據(jù)進(jìn)行流量識別。仿真實(shí)驗(yàn)所得結(jié)果表示為:選擇的機(jī)器學(xué)習(xí)分類算法時(shí)間開銷最短為RandomTree等于26.35秒,BayesNet測試時(shí)間次之為81.62秒,KNN測試時(shí)間為312.74秒不能夠滿足實(shí)際應(yīng)用。算法測試時(shí)間越長則表明算法的效率越差。

        實(shí)驗(yàn)組二:在該實(shí)驗(yàn)組中,TTL值作為視頻流隊(duì)列中的基本屬性之一,作為特征變量進(jìn)行P2P視頻流的識別,選取三組不同實(shí)驗(yàn)數(shù)據(jù)集,仿真結(jié)果如圖2所示。圖2(1)中為包含TTL值的識別準(zhǔn)確率,圖2(2)表示為樣本數(shù)據(jù)中不含TTL值識別結(jié)果。由圖可知,不含TTL值的流屬性在識別過程中的正確率明顯下降,含有TTL值的流隊(duì)列識別正確率較高。

        實(shí)驗(yàn)組準(zhǔn)確率表示為特定P2P視頻流媒體(PPTV、PPS、QQlive)的識別正確率,其中基于BayesNet的識別率為92.34%、92.38% 、91.75%;基于KNN的識別率93.27%、90.47%、93.51%;基于RandomTree的識別率為92.17%、93.74%、90.41%。通過以上數(shù)據(jù)顯著看出不同分類算法在不同類型的P2P視頻流識別上準(zhǔn)確性差異較小。實(shí)驗(yàn)結(jié)果表明該算法和流量屬性的選擇在一定情況下,數(shù)據(jù)源中各流量類型的組成比例對流量識別的正確率影響不大。

        四、結(jié)束語

        P2P視頻流的識別是實(shí)現(xiàn)網(wǎng)絡(luò)流量安全管理的關(guān)鍵機(jī)制。本文提出一種基于機(jī)器學(xué)習(xí)的P2P視頻流識別技術(shù),基于流隊(duì)列構(gòu)建出視頻流特征分析系統(tǒng),系統(tǒng)包括數(shù)據(jù)報(bào)采集模塊、數(shù)據(jù)報(bào)處理模塊、數(shù)據(jù)報(bào)分流模塊和特征屬性計(jì)算模塊;該識別技術(shù)采用統(tǒng)計(jì)方法進(jìn)行特征選擇,挖掘P2P視頻流的數(shù)據(jù)報(bào)數(shù)量特征、數(shù)據(jù)報(bào)長度特征、流持續(xù)時(shí)間和TTL分布特征。仿真實(shí)驗(yàn)采用Weka開源數(shù)據(jù)挖掘平臺對所提出方法進(jìn)行驗(yàn)證,仿真結(jié)果表明所提出的P2P視頻流識別技術(shù)是有效的,具有較高準(zhǔn)確率和較低計(jì)算時(shí)間開銷。

        參? 考? 文? 獻(xiàn)

        [1]賀文華,劉浩,賀勁松.P2P網(wǎng)絡(luò)現(xiàn)狀與發(fā)展研究[J].軟件工程,2019,22(4):1-5.

        [2]龍軍,王宇樓,袁鑫攀,張華超.P2P流媒體網(wǎng)絡(luò)的關(guān)鍵節(jié)點(diǎn)識別算法[J].計(jì)算機(jī)工程與科學(xué),2019,41(1):56-64.

        [3]魏赟,韓少恒.基于帶寬預(yù)測的流媒體超級節(jié)點(diǎn)選擇算法[J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(8):179-182.

        [4]楊戈,劉智鵬.面向流媒體基于蟻群的副本選擇算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2019,28(2):190-195.

        [5]潘向輝,陳亞軍,吳學(xué)毅. 基于節(jié)點(diǎn)能力度的P2P流媒體資源調(diào)度算法[J]. 計(jì)算機(jī)工程, 2019, 45(5): 226-231.

        猜你喜歡
        機(jī)器學(xué)習(xí)特征分析
        泡罩包裝揮發(fā)性有機(jī)物排放特征分析
        2012 年南海夏季風(fēng)特征分析
        基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
        基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
        前綴字母為特征在維吾爾語文本情感分類中的研究
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
        基于PowerPC的脈內(nèi)特征分析算法的工程實(shí)現(xiàn)
        腎康注射液不良反應(yīng)特征分析
        99久久国内精品成人免费| 曰本人做爰又黄又粗视频| 国产成人免费一区二区三区 | 亚洲综合AV在线在线播放| 久久HEZYO色综合| 91久久精品国产性色tv| 99久久精品国产91| 日本中文字幕婷婷在线| av狠狠色丁香婷婷综合久久| 国产又黄又爽又色的免费| 久久精品女人天堂av| 不卡高清av手机在线观看| 亚洲午夜看片无码| 日韩av在线不卡观看| 国产91精品自拍视频| 国产精品国产亚洲精品看不卡| 国产精品亚洲综合色区| 国产在线精品欧美日韩电影| 国产精品二区在线观看| 亚洲高清有码在线观看| 国产女主播在线免费观看| 亚洲一区二区三区偷拍视频| 中文字日产幕码三区的做法步| 亚洲av久久久噜噜噜噜 | av天堂一区二区三区| av在线天堂国产一区| 国产成人喷潮在线观看| 91日本精品国产免| 国产精品国产三级国产一地 | 亚洲码欧美码一区二区三区| 性猛交╳xxx乱大交| 久久免费网国产AⅤ| 国产一区二区三区四区色| 国产91精品高潮白浆喷水| 国内揄拍国内精品少妇| 亚洲av成人无码网站大全| 日韩无码无播放器视频| 91精品综合久久久久m3u8| 亚洲国产av午夜福利精品一区| 中文字幕一区在线直播| 免费欧洲毛片a级视频老妇女|