江蘇電力信息技術(shù)有限公司 孫凌卿 傅啟明 陸 宇 周志云
引言:隨著社會的不斷發(fā)展,互聯(lián)網(wǎng)技術(shù)已經(jīng)廣泛的應(yīng)用與我們的生活中,越來越多的新型網(wǎng)絡(luò),包括網(wǎng)絡(luò)直播、互聯(lián)網(wǎng)電話、視頻點(diǎn)播以及網(wǎng)絡(luò)游戲等都出現(xiàn)了很好的發(fā)展趨勢。不論是在有線以太網(wǎng)絡(luò)還是無線網(wǎng)絡(luò)中,流媒體內(nèi)容都占據(jù)著非常重要的比例,同時(shí)隨著計(jì)算機(jī)各個(gè)設(shè)備性能的增加,對于網(wǎng)絡(luò)方面的要求越來越高,網(wǎng)絡(luò)流媒體也成為了未來發(fā)展的主要趨勢,需要重點(diǎn)加強(qiáng)對其的研究?;诖吮疚姆治隽肆髅襟w傳輸協(xié)議分析關(guān)鍵技術(shù)。
如今,作為全球化內(nèi)容和服務(wù)分享媒介的互聯(lián)網(wǎng)和移動(dòng)網(wǎng)絡(luò)快速發(fā)展,同時(shí)將其進(jìn)行有效的融和在未來是主要的發(fā)展趨勢,因此也延伸了很多網(wǎng)絡(luò)流媒體的應(yīng)用。網(wǎng)絡(luò)流媒體應(yīng)用不僅能夠?yàn)橛脩籼峁┖芎玫挠耙晩蕵?,同時(shí)也能夠消耗很大的網(wǎng)絡(luò)寬帶,因此網(wǎng)絡(luò)運(yùn)營商必須要有效的解決這些問題。對于很多的網(wǎng)絡(luò)流媒體數(shù)據(jù),會有很多的非法信息或者是垃圾信息需要對其進(jìn)行有效處理。對于網(wǎng)絡(luò)傳輸控制機(jī)制器在整個(gè)網(wǎng)絡(luò)流量中是非常重要的組成部分,占據(jù)著非常重要的位置,因此需要不斷加強(qiáng)流媒體傳輸協(xié)議方面的識別,從而能夠確保整體的質(zhì)量。在實(shí)際應(yīng)用過程中需要加強(qiáng)網(wǎng)絡(luò)分析,同時(shí)重點(diǎn)進(jìn)行監(jiān)督開工資呢,方便有效的進(jìn)行過程識別,更好的滿足各個(gè)方面的需求。
一流媒體屬于應(yīng)用程序協(xié)議,因此缺乏很多標(biāo)準(zhǔn),而且大部分為私有協(xié)議,進(jìn)行分析中存在很多問題。二因?yàn)榱髅襟w數(shù)據(jù)量非常大,同時(shí)具有很高的傳輸速度,不容易進(jìn)行節(jié)點(diǎn)動(dòng)態(tài)性控制,因此對于血液的分析和識別方面的要求非常高。三流媒體協(xié)議非常的多樣化,同時(shí)更新也非常快,因此必須要有效的構(gòu)建相關(guān)框架,從而能夠更好的進(jìn)行協(xié)議更新。
3.1.1 基于端口匹配的協(xié)議識別技術(shù)
對于早期的網(wǎng)絡(luò)通信協(xié)議數(shù)量不太多,并且各個(gè)通訊端口都是遵循很多分配結(jié)構(gòu),主要是Internet Assigned Numbers Authority,以下簡稱IANA所頒發(fā)的一系列注冊列表,而在實(shí)際網(wǎng)絡(luò)應(yīng)用協(xié)議識別的時(shí)候,其需要重點(diǎn)進(jìn)行服務(wù)端口的識別,主要是23端口來識別Telnet協(xié)議,使用80端口來識別HTTP協(xié)議等。對于所有的網(wǎng)絡(luò)通訊端口都是必須要遵循相關(guān)標(biāo)準(zhǔn)進(jìn)行操作,從而才能夠更好的進(jìn)行各個(gè)端口操作。表1所示的是一些常用應(yīng)用協(xié)議所對應(yīng)的端口。
表1 常用應(yīng)用協(xié)議對應(yīng)端口示例
圖1所示是目前使用比較廣泛的網(wǎng)絡(luò)建模的TCP/IP網(wǎng)絡(luò)協(xié)議模型,對于這個(gè)程序會廣泛的適應(yīng)通信協(xié)議層,主要是有效的進(jìn)行各個(gè)網(wǎng)絡(luò)端口的識別。
圖1 網(wǎng)絡(luò)應(yīng)用程序的數(shù)據(jù)傳遞的過程
圖2 協(xié)議識別檢測流程
3.1.2 基于網(wǎng)絡(luò)行為的協(xié)議識別技術(shù)
這種技術(shù)主要的研究對象是數(shù)據(jù)流,其主要的作用是進(jìn)行整個(gè)過程的特征提取,對于該種方法主要是通過提取不同類型的互聯(lián)網(wǎng)應(yīng)用狀態(tài)特征,達(dá)到對于這種技術(shù)主要是將數(shù)據(jù)流作為主要的研究對象,并且從龐大的網(wǎng)絡(luò)流數(shù)據(jù)中進(jìn)行相關(guān)特征提取,對于該種方法,主要是通過提取不同類型的互聯(lián)網(wǎng)應(yīng)用狀態(tài)特征實(shí)現(xiàn)各個(gè)數(shù)據(jù),對于該種方法能夠有效地進(jìn)行通信協(xié)議的識別,例如語音通話,整個(gè)過程中的傳輸速度需要控制的允許范圍是130~220byte之間,并且需要確保整體的繪畫速率控制范圍在20~84kbit/s,這個(gè)過程中會話保持的時(shí)間非常長。
協(xié)議識別檢測如圖2。
首先,因?yàn)閭鬏攨f(xié)議,主要包括TCP協(xié)議和UDP協(xié)議,而對于TCP協(xié)議又被分為了兩個(gè)類別,即握手協(xié)議和傳輸協(xié)議,對于每一種類型都具有其主要特征,在進(jìn)行識別的過程中需要進(jìn)行區(qū)別對待。在本次的匹配中需要使用相關(guān)數(shù)據(jù)進(jìn)行預(yù)算,從而能夠整體降低運(yùn)算次數(shù),確保整體的執(zhí)行效率。最后如果系統(tǒng)通過便利匹配,能夠正確地進(jìn)行各個(gè)數(shù)據(jù)包的識別,可以使用當(dāng)前數(shù)據(jù)包的包頭信息進(jìn)行各個(gè)數(shù)據(jù)流的確定,然后進(jìn)行應(yīng)用程協(xié)議的判定,并且進(jìn)行各個(gè)數(shù)據(jù)包的判定,不再需要再次進(jìn)行匹配,能夠直接進(jìn)行識別。
3.3.1 數(shù)據(jù)預(yù)處理
對于數(shù)據(jù)預(yù)處理主要是針對出現(xiàn)的GET字段出現(xiàn)youku字樣,應(yīng)答Content-Type字段出現(xiàn)了video/mp4字樣,其主要是代表了整個(gè)流媒體的傳輸協(xié)議。當(dāng)明確的相關(guān)數(shù)據(jù)后,需要進(jìn)行各個(gè)數(shù)據(jù)流工具的提取,通過網(wǎng)絡(luò)通信五元組組進(jìn)行文件的數(shù)據(jù)整理,并且刪除相關(guān)用餐內(nèi)容,將各個(gè)數(shù)據(jù)進(jìn)行儲存,在整個(gè)應(yīng)用的過程中,將數(shù)據(jù)消息時(shí)間進(jìn)行重命名,然后再進(jìn)行數(shù)據(jù)特征提取。
3.3.2 特征識別驗(yàn)證
特征識別驗(yàn)證需要充分的識別出其中的各個(gè)指標(biāo),主要是準(zhǔn)確率和召回率。而對于準(zhǔn)確地主要是正確的進(jìn)行類型數(shù)量以及類型總數(shù)量比例的識別,從而能夠進(jìn)行準(zhǔn)確地地查看。而對于召回率主要是針對各個(gè)類型數(shù)量和網(wǎng)絡(luò)的類型總數(shù)量的比例進(jìn)行整正確的識別,其關(guān)于協(xié)議識別算法中的兩個(gè)指標(biāo)能夠來進(jìn)行各個(gè)工作性能的識別,包括準(zhǔn)確率和召回力。而對于準(zhǔn)確的主要是正確的進(jìn)行類型數(shù)量以及類型總數(shù)量比例的識別,從而能夠進(jìn)行準(zhǔn)確率的查看。
本原新系統(tǒng)定位是一種網(wǎng)絡(luò)流量分析系統(tǒng),將其應(yīng)用于網(wǎng)絡(luò)出口,能夠有效地監(jiān)測各個(gè)網(wǎng)絡(luò)數(shù)據(jù)流量。對于該系統(tǒng)主要具備以下幾個(gè)功能,包括:一有效地進(jìn)行目標(biāo)流媒體傳輸協(xié)議特征的提取,二在進(jìn)行流媒體協(xié)議特征中進(jìn)行配置。三有效地進(jìn)行流媒體傳輸協(xié)議的網(wǎng)絡(luò)識別。四標(biāo)記一個(gè)個(gè)檢測的結(jié)果。使用該系統(tǒng)相關(guān)人員能夠有效地進(jìn)行流媒體傳輸協(xié)議的特征提取,方便進(jìn)行特征庫的建立,并且能夠?qū)崟r(shí)的監(jiān)測各個(gè)傳輸協(xié)議,動(dòng)態(tài)進(jìn)行檢測結(jié)果的反饋,目前主要是通過圖表或者信息形式進(jìn)行,通過相關(guān)人員進(jìn)行輔助處理,提交相關(guān)信息做好系統(tǒng)處置。
該系統(tǒng)架構(gòu)主要有以下方面組成,包括用戶接口、數(shù)據(jù)捕獲模塊、協(xié)議解析模塊、特征提取模塊、協(xié)議識別模塊和協(xié)議特征庫,而對于其中的用戶接口以外的模塊是主要的部分,其結(jié)構(gòu)圖為圖3。
圖3 系統(tǒng)架構(gòu)圖
用戶接口主要的作用是方便用戶和系統(tǒng)進(jìn)行交互,有效的連接各個(gè)功能,從而能夠及時(shí)的進(jìn)行數(shù)據(jù)的查看。
數(shù)據(jù)捕獲模塊主要是有效地進(jìn)行協(xié)議特征的提取,并且做好相應(yīng)的匹配,根據(jù)各個(gè)需求進(jìn)行數(shù)據(jù)包的傳輸。
本文主要使用的是特征提取模塊的方法,通過獲取的相關(guān)數(shù)據(jù)包中的特征信息進(jìn)行數(shù)據(jù)的存入,從而獲得相關(guān)信息。
數(shù)據(jù)庫模塊的作用是能夠更好的完成各個(gè)協(xié)議負(fù)載特征,其內(nèi)容主要包括了增、刪、改、查等方面。對于該系統(tǒng)最大特點(diǎn)是信息量大,為了更好的確保整體的查詢效率,在語句查詢的時(shí)候需要嚴(yán)格的按照標(biāo)準(zhǔn)進(jìn)行。進(jìn)行搜索數(shù)據(jù)庫創(chuàng)建的過程中需要重點(diǎn)進(jìn)行控制,從而能夠確保整體的維護(hù),并且能夠快速的找到其中的相關(guān)策略。
就目前的情況來看,數(shù)據(jù)庫在整個(gè)系統(tǒng)是最為關(guān)鍵的部分,數(shù)據(jù)庫接口必須要保證整體的穩(wěn)定性,防止因?yàn)樵L問破壞數(shù)據(jù)庫的整體性,因此在這個(gè)過程中會使用封鎖和封鎖協(xié)議。數(shù)據(jù)庫還需要具備相應(yīng)的自動(dòng)備份的功能,每天可以選擇增加備份的形式來進(jìn)行儲存空間的控制,但是需要注意的是整個(gè)過程需要定期進(jìn)行備份,防止出現(xiàn)突發(fā)事件,使得整體的數(shù)據(jù)受到影響。
總之,隨著社會的不斷發(fā)展,網(wǎng)絡(luò)流媒體得到進(jìn)一步發(fā)展,使得整體的網(wǎng)絡(luò)環(huán)境帶來了很大的影響,進(jìn)一步加強(qiáng)流媒體傳輸協(xié)議的識別分析非常重要,因此需要重點(diǎn)加強(qiáng)對其的研究。