李兆斌 韓 禹 魏占禎 劉澤一
(北京電子科技學(xué)院 北京 100070)
SDN將控制層與數(shù)據(jù)轉(zhuǎn)發(fā)層解耦,控制層負(fù)責(zé)管控全局網(wǎng)絡(luò),數(shù)據(jù)轉(zhuǎn)發(fā)層負(fù)責(zé)按照控制層下發(fā)的流表完成數(shù)據(jù)轉(zhuǎn)發(fā)。這極大提高了網(wǎng)絡(luò)部署和管理的靈活性,使SDN得到大量推廣與應(yīng)用,成為5G通信、數(shù)據(jù)中心網(wǎng)絡(luò)等熱點(diǎn)領(lǐng)域的關(guān)鍵技術(shù)。
SDN的優(yōu)勢之一就是可以實(shí)現(xiàn)對(duì)數(shù)據(jù)流量的集中管控。為了更好地發(fā)揮這種優(yōu)勢,如何進(jìn)行細(xì)粒度流量管控,提高管控效率成為研究熱點(diǎn)。文獻(xiàn)[1-3]提出了多種SDN網(wǎng)絡(luò)中的流量管控方案。文獻(xiàn)[4-5]提出了在數(shù)據(jù)中心網(wǎng)絡(luò)應(yīng)用環(huán)境下的SDN流量調(diào)度方案。文獻(xiàn)[6]提出了一種在物聯(lián)網(wǎng)應(yīng)用環(huán)境下的SDN流量管理機(jī)制。這些研究都沒有在實(shí)施管控前對(duì)流量進(jìn)行分類,僅是根據(jù)網(wǎng)絡(luò)擁塞程度,對(duì)所有數(shù)據(jù)流進(jìn)行無類別差異的管控。然而,當(dāng)用戶在SDN中同時(shí)觀看在線視頻和進(jìn)行下載時(shí),在帶寬有限的情況下需要?jiǎng)討B(tài)調(diào)節(jié)在線視頻和下載的速率以提高用戶體驗(yàn),但現(xiàn)有的SDN流量管控方案由于無法區(qū)分流量類型往往難以實(shí)現(xiàn)上述有針對(duì)性的流量管控。如果SDN控制器能在實(shí)施管控前明確區(qū)分出在線視頻流量和下載流量,就能根據(jù)數(shù)據(jù)流量類別有針對(duì)性的合理配置網(wǎng)絡(luò)資源。
但目前數(shù)據(jù)流量的種類日趨復(fù)雜,傳統(tǒng)的基于端口匹配、基于深度包檢測等分類方法由于動(dòng)態(tài)端口、加密數(shù)據(jù)包的出現(xiàn)已經(jīng)很難準(zhǔn)確判斷出流量種類。針對(duì)傳統(tǒng)數(shù)據(jù)流量分類方法的種種局限,基于機(jī)器學(xué)習(xí)的數(shù)據(jù)流量分類方法應(yīng)運(yùn)而生。它通過統(tǒng)計(jì)數(shù)據(jù)流量的各種信息來判定應(yīng)用類型,因此也被稱為基于統(tǒng)計(jì)的數(shù)據(jù)流量分類方法。其憑借分類范圍廣、能夠處理高維度數(shù)據(jù)等優(yōu)勢,成為當(dāng)今數(shù)據(jù)流量分類領(lǐng)域最炙手可熱的技術(shù)。伴隨著對(duì)機(jī)器學(xué)習(xí)研究的逐漸加深,現(xiàn)今已經(jīng)有眾多研究者使用機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)流量進(jìn)行過分類。文獻(xiàn)[7]實(shí)現(xiàn)了對(duì)加密流量的分類;文獻(xiàn)[8]實(shí)現(xiàn)了對(duì)HTTP、FTP、BitTorrent、SMTP流量的分類;文獻(xiàn)[9]實(shí)現(xiàn)了對(duì)FTP、TELNET、DNS、IM流量的分類;文獻(xiàn)[10]實(shí)現(xiàn)了對(duì)P2P流量的分類;文獻(xiàn)[11]實(shí)現(xiàn)了對(duì)HTTP流量的分類。在對(duì)視頻流量和下載流量的分類方面;文獻(xiàn)[12]對(duì)網(wǎng)絡(luò)視頻業(yè)務(wù)流的特征選取與分類方法進(jìn)行了研究;文獻(xiàn)[13]實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)游戲流量和視頻業(yè)務(wù)流量的分類。但目前使用機(jī)器學(xué)習(xí)算法對(duì)在線視頻流量和下載流量進(jìn)行分類的研究依然較少。
本文首先需要研究選取有效特征,在離線模式下使用機(jī)器學(xué)習(xí)算法訓(xùn)練出可以對(duì)在線視頻流量和下載流量進(jìn)行高準(zhǔn)確度區(qū)分的模型。由于使用網(wǎng)絡(luò)流統(tǒng)計(jì)特征作為機(jī)器學(xué)習(xí)分類依據(jù),所以特征選擇的好壞,直接影響到模型的分類效果。根據(jù)對(duì)比研究,本文選擇了8個(gè)特征,見表1。所有特征的統(tǒng)計(jì)信息均取自單段流前1 500個(gè)TCP數(shù)據(jù)包。
表1 特征集合
續(xù)表1
數(shù)據(jù)集中單獨(dú)使用每個(gè)特征對(duì)在線視頻流量和下載流量進(jìn)行區(qū)分時(shí),根據(jù)數(shù)據(jù)集中流量分布情況可以大致判斷出特征的有效性。其中前5個(gè)特征為網(wǎng)絡(luò)流量分類常用特征,本文不再贅述。后3個(gè)特征是根據(jù)在線視頻流量和下載流量的數(shù)據(jù)包特征研究后有針對(duì)性選取,分別為PSH標(biāo)志數(shù)量,包大小變換次數(shù),下上行數(shù)據(jù)流總字節(jié)數(shù)之比。
PSH是TCP報(bào)頭中的一個(gè)標(biāo)志位。當(dāng)兩個(gè)程序在進(jìn)行交互通信時(shí),一端的程序想要立即收到對(duì)方響應(yīng),TCP就可以使用Push操作。接收端在收到包含PSH標(biāo)志位的數(shù)據(jù)時(shí),迅速將數(shù)據(jù)交付給應(yīng)用層。在線視頻流量和下載流量傳輸急迫性存在差別,一般情況下載流量由于需要及時(shí)響應(yīng),每段流中PSH數(shù)量相對(duì)多一些。由圖1可見,PSH數(shù)量大于400左右時(shí)數(shù)據(jù)為下載流量的情況較多,否則數(shù)據(jù)為在線視頻流量的情況較多,可以看出PSH數(shù)量作為區(qū)分在線視頻流量和下載流量的特征能起到一定效果。
圖1 使用PSH標(biāo)志數(shù)量分類的流量分布
包大小變換次數(shù)是指在同一段數(shù)據(jù)流內(nèi)連續(xù)傳輸?shù)臄?shù)據(jù)包大小發(fā)生變化的次數(shù)。一般情況下,由于下載時(shí)數(shù)據(jù)包內(nèi)容和大小變化較大,所以下載流量的包大小變換次數(shù)要比在線視頻流量多。如圖2所示,包大小變換次數(shù)大于550左右時(shí),數(shù)據(jù)為下載流量的情況較多,否則數(shù)據(jù)為在線視頻流量的情況較多,可以看出包大小變換次數(shù)作為區(qū)分在線視頻流量和下載流量的特征能起到一定效果。
圖2 使用包大小變換次數(shù)分類的流量分布
下上行數(shù)據(jù)流總字節(jié)數(shù)之比是指一段下行數(shù)據(jù)流到達(dá)1 500個(gè)數(shù)據(jù)包時(shí)總字節(jié)數(shù)與此時(shí)上行的另一段反向數(shù)據(jù)流總字節(jié)數(shù)之比。一般情況,在線視頻流量在進(jìn)行上下行交互時(shí),由于存在緩沖機(jī)制,不需要時(shí)時(shí)上傳,所以上行傳輸頻率低,下上行數(shù)據(jù)流總字節(jié)數(shù)之比就高。而下載流量時(shí)時(shí)都要進(jìn)行交互,上傳傳輸頻率高,下上行數(shù)據(jù)流總字節(jié)數(shù)之比就低。圖3顯示下上行數(shù)據(jù)流總字節(jié)數(shù)之比大于75左右時(shí),數(shù)據(jù)為在線視頻流量的情況較多,否則數(shù)據(jù)為下載流量的情況較多,可以看出下上行數(shù)據(jù)流總字節(jié)數(shù)之比作為區(qū)分在線視頻流量和下載流量的特征能起到一定效果。
圖3 使用下上行數(shù)據(jù)流總字節(jié)數(shù)之比分類的流量分布
本文需要研究將離線模式下訓(xùn)練出的基于機(jī)器學(xué)習(xí)的數(shù)據(jù)流量分類模型應(yīng)用到SDN中實(shí)現(xiàn)實(shí)時(shí)流量分類功能。SDN實(shí)時(shí)流量分類應(yīng)用總體設(shè)計(jì)方案如圖4所示,主要分為以下幾部分:利用_packet_in_handler()函數(shù)提取和保存流量信息;設(shè)計(jì)Calculate()函數(shù)計(jì)算所需流量特征;將流量特征處理成機(jī)器學(xué)習(xí)可調(diào)用的形式;將處理完成的流量特征導(dǎo)入機(jī)器學(xué)習(xí)模型進(jìn)行分類計(jì)算。計(jì)算出的分類結(jié)果可以應(yīng)用到流量管控中,實(shí)現(xiàn)對(duì)流量的細(xì)粒度操作,進(jìn)而提高QoS。
圖4 SDN實(shí)時(shí)流量分類應(yīng)用總體設(shè)計(jì)
在SDN中,控制器實(shí)現(xiàn)實(shí)時(shí)流量分類功能需要先提取和分析數(shù)據(jù)包內(nèi)容,而Packet-In消息可以將到達(dá)OpenFlow交換機(jī)的數(shù)據(jù)包發(fā)送至控制器,所以本文利用Packet-In消息完成相關(guān)設(shè)計(jì)工作。
具體實(shí)現(xiàn)流程如圖5所示??刂破骱蚈penFlow交換機(jī)建立連接后,數(shù)據(jù)包會(huì)以Packet-In消息的形式上傳給控制器。因?yàn)樵诰€視頻流量和下載流量均以TCP包為主,所以本文只分析TCP包。若數(shù)據(jù)包不是TCP包,控制器會(huì)將數(shù)據(jù)包丟棄;若數(shù)據(jù)包是TCP包,則要提取數(shù)據(jù)包的包大小等信息。接著,若TCP包數(shù)據(jù)屬于新的數(shù)據(jù)流,則新建這條流對(duì)應(yīng)的統(tǒng)計(jì)信息列表;若TCP數(shù)據(jù)包屬于已有數(shù)據(jù)流,則更新這條流對(duì)應(yīng)的統(tǒng)計(jì)信息列表。當(dāng)某條數(shù)據(jù)流中包個(gè)數(shù)到達(dá)1 500時(shí),調(diào)用Calculate()函數(shù)計(jì)算數(shù)據(jù)流的8個(gè)流量特征。最后將計(jì)算出的流量特征進(jìn)行格式處理后導(dǎo)入機(jī)器學(xué)習(xí)模型進(jìn)行分類計(jì)算,得出分類結(jié)果。
圖5 SDN實(shí)時(shí)流量分類應(yīng)用實(shí)現(xiàn)流程
本文測試使用Wmware WorkStation 12 pro虛擬機(jī),操作系統(tǒng)使用Ubuntu16.04,SDN控制器使用Ryu,測試平臺(tái)使用Mininet。測試應(yīng)用環(huán)境如圖6所示,具體包括實(shí)時(shí)流量分類應(yīng)用、控制器、OpenFlow交換機(jī)、主機(jī)等部分,其中主機(jī)nat0與互聯(lián)網(wǎng)直接相連,主機(jī)h1、h2與互聯(lián)網(wǎng)的交互都要通過主機(jī)nat0作為傳輸媒介。Ryu控制器的IP地址為127.0.0.1,主機(jī)h1、h2,nat0的IP地址分別為10.0.0.1、10.0.0.2、10.0.0.3。
圖6 SDN實(shí)時(shí)流量分類應(yīng)用測試環(huán)境
(1) 采集數(shù)據(jù)集 本文在SDN中使用WireShark抓取了大量不同時(shí)間段在線視頻流量和下載流量的數(shù)據(jù)包。因?yàn)榫W(wǎng)絡(luò)環(huán)境會(huì)隨著時(shí)間等各種因素發(fā)生變化,為了使實(shí)驗(yàn)數(shù)據(jù)更能反映不同種類流量的普遍特性,抓取時(shí)間跨度從2018年1月-2018年3月。其中在線視頻流量主要抓取了主流視頻網(wǎng)站的在線視頻數(shù)據(jù)流,下載流量主要抓取了主流下載網(wǎng)站的軟件、游戲等各種下載數(shù)據(jù)流,每次抓取大概持續(xù)5分鐘,以pcap文件形式保存。圖7是抓取的視頻數(shù)據(jù)包。
圖7 使用WireShark抓取的視頻數(shù)據(jù)包
(2) 數(shù)據(jù)集標(biāo)簽化 使用WireShark抓取的數(shù)據(jù)包中,每個(gè)pcap文件會(huì)有很多數(shù)據(jù)流,但其中可能只有一兩條屬于有效在線視頻流量或者有效下載流量,其余均為一些小時(shí)延的無關(guān)web流,在進(jìn)行數(shù)據(jù)集標(biāo)簽化的過程中需要將這些無關(guān)數(shù)據(jù)流剔除掉。本文選取包數(shù)量大于1 000個(gè)且平均包大小大于800字節(jié)的數(shù)據(jù)流為有效數(shù)據(jù)流,按照主機(jī)訪問的是在線視頻請(qǐng)求或是下載請(qǐng)求對(duì)相應(yīng)有效數(shù)據(jù)流進(jìn)行標(biāo)簽化,標(biāo)簽分別為:multimedia(在線視頻流量)、download(下載流量)。
(3) 處理數(shù)據(jù)集 將數(shù)據(jù)集中的每條數(shù)據(jù)流處理成只包含平均包大小、包大小的標(biāo)準(zhǔn)差、數(shù)據(jù)流傳輸速率、包到達(dá)平均時(shí)間間隔、包到達(dá)時(shí)間間隔的標(biāo)準(zhǔn)差、PSH標(biāo)志數(shù)量、包大小變化次數(shù)、下上行數(shù)據(jù)流總字節(jié)數(shù)之比這8個(gè)特征的形式。之后將處理好的數(shù)據(jù)集按照隨機(jī)抽樣的方法進(jìn)行分割,其中70%為訓(xùn)練集,30%為測試集。
(4) 使用機(jī)器學(xué)習(xí)算法對(duì)訓(xùn)練集進(jìn)行訓(xùn)練 本文使用Sklearn進(jìn)行機(jī)器學(xué)習(xí)的相關(guān)訓(xùn)練測試工作。Sklearn是一個(gè)Python常用的機(jī)器學(xué)習(xí)算法庫,能夠使用相應(yīng)接口實(shí)現(xiàn)不同算法的調(diào)用,使用時(shí)將訓(xùn)練集導(dǎo)入Sklearn內(nèi)置的相應(yīng)機(jī)器學(xué)習(xí)算法函數(shù)即可完成訓(xùn)練。為了選取較優(yōu)的算法,本文對(duì)比測試了10種常用的監(jiān)督機(jī)器學(xué)習(xí)算法,其中4種為集成算法,分別是:隨機(jī)森林(RandomForest)、極端隨機(jī)樹(ExtraTrees)、AdaBoost、漸變樹提升(GradientBoosting)。另外6種為普通算法,分別是:決策樹(DecisionTree(CART))、樸素貝葉斯(Naive Bayes)、多層神經(jīng)網(wǎng)絡(luò)(Multi-layer Perceptron)、邏輯回歸(LogisticRegression)、K最近鄰(k-NearestNeighbor)、支持向量機(jī)(Support Vector Machine)。
(5) 使用離線測試集評(píng)估模型并輸出模型 完成訓(xùn)練后需要使用離線測試集對(duì)訓(xùn)練好的機(jī)器學(xué)習(xí)模型進(jìn)行評(píng)估,機(jī)器學(xué)習(xí)模型一般通過查準(zhǔn)率(Precision)、召回率(Recall)、綜合評(píng)價(jià)指標(biāo)(F1_score)、正確率(Accuracy)進(jìn)行評(píng)估。手動(dòng)設(shè)置如果判定為在線視頻流量,則做出positive判定,如果判定不是在線視頻流量(下載流量),則做出Negative判定。TP表示正確的positive判定數(shù)量,FP表示錯(cuò)誤的positive判定數(shù)量,TN表示正確的Negative判定數(shù)量,F(xiàn)N表示錯(cuò)誤的Negative判定數(shù)量。則四個(gè)參數(shù)定義為:Precision=TP/(TP+FP),Recall=TP/(TP+FN),F(xiàn)1_score=P×R/2(P+R),Accuracy=(TP+TN)/(TP+FP+TN+FN)。不同機(jī)器學(xué)習(xí)分類模型使用離線測試集進(jìn)行評(píng)估得出的分類性能指標(biāo)如表2所示。
表2 不同機(jī)器學(xué)習(xí)分類模型得出的分類性能指標(biāo) %
可以看出,隨機(jī)森林(RandomForest)模型的綜合評(píng)價(jià)指標(biāo)(F1_score)和正確率(Accuracy)均最高,所以選取并輸出隨機(jī)森林模型在SDN中設(shè)計(jì)實(shí)現(xiàn)實(shí)時(shí)分類流量應(yīng)用。
(6) SDN實(shí)時(shí)流量分類應(yīng)用測試效果 在使用Ubuntu系統(tǒng)搭建的SDN虛擬環(huán)境中,按照設(shè)計(jì)方案,利用選取的隨機(jī)森林模型,編程實(shí)現(xiàn)SDN實(shí)時(shí)流量分類應(yīng)用。應(yīng)用測試時(shí),先在打開Ryu控制器和應(yīng)用文件,再將Ryu控制器與Mininet連通。接著在Mininet中打開h1主機(jī),配置好網(wǎng)絡(luò)后使用h1主機(jī)訪問相應(yīng)網(wǎng)站時(shí),命令行界面就會(huì)顯示出流量分類結(jié)果。SDN實(shí)時(shí)流量分類應(yīng)用測試效果如圖8所示,應(yīng)用顯示內(nèi)容包含計(jì)算出的流量種類與本段數(shù)據(jù)流的特征信息。
(a) 觀看在線視頻時(shí)的應(yīng)用測試效果
(b) 進(jìn)行下載時(shí)的應(yīng)用測試效果圖8 SDN實(shí)時(shí)流量分類應(yīng)用測試效果圖
(7) SDN實(shí)時(shí)流量分類應(yīng)用分類性能測試 本文選取了10個(gè)主流網(wǎng)站對(duì)SDN實(shí)時(shí)流量分類應(yīng)用的分類性能進(jìn)行測試,其中5個(gè)視頻網(wǎng)站,分別是愛奇藝視頻、音悅Tai、優(yōu)酷視頻、B站、騰訊視頻;5個(gè)下載網(wǎng)站,分別是中關(guān)村在線下載、PC6下載站、華軍軟件園、下載吧、百度軟件中心。每個(gè)網(wǎng)站分別隨機(jī)選取20條數(shù)據(jù)流進(jìn)行實(shí)時(shí)分類測試,測試結(jié)果如圖9所示??梢钥闯?,本文設(shè)計(jì)的SDN實(shí)時(shí)流量分類應(yīng)用分類準(zhǔn)確率較高,平均準(zhǔn)確率達(dá)到91.5%。
圖9 SDN實(shí)時(shí)流量分類應(yīng)用在線測試準(zhǔn)確率
3.3.1分類應(yīng)用測試效果分析與比較
本部分主要分析測試時(shí)的數(shù)據(jù)包數(shù)量閾值選取和應(yīng)用顯示效果。
當(dāng)分類應(yīng)用捕捉到數(shù)據(jù)流通過時(shí),開始對(duì)同段數(shù)據(jù)流中數(shù)據(jù)包進(jìn)行計(jì)數(shù),命令行界面會(huì)分別在數(shù)據(jù)包數(shù)量到達(dá)500和1 000時(shí)進(jìn)行文字提醒。當(dāng)同段數(shù)據(jù)流中數(shù)據(jù)包數(shù)量到達(dá)1 500時(shí),即判定此條數(shù)據(jù)流為在線視頻或者下載,并開始計(jì)算此條數(shù)據(jù)流的特征信息。分類應(yīng)用通過隨機(jī)森林算法,根據(jù)計(jì)算出的特征信息得出分類結(jié)果。選擇1 500作為分類時(shí)的數(shù)據(jù)包數(shù)量閾值的原因如下:
一是經(jīng)實(shí)驗(yàn)分析與比較,在正常瀏覽網(wǎng)頁(不進(jìn)行視頻或下載業(yè)務(wù))時(shí),短時(shí)的流量種類繁雜,且同段數(shù)據(jù)流的數(shù)據(jù)包數(shù)量較少,一般很難達(dá)到1 500。而進(jìn)行在線視頻或下載業(yè)務(wù)時(shí),短時(shí)流量種類較為單一,同段數(shù)據(jù)流瞬時(shí)流量較大。因此,當(dāng)某段數(shù)據(jù)流中包個(gè)數(shù)達(dá)到1 500時(shí),基本可以判定此條數(shù)據(jù)流為在線視頻或者下載。
二是經(jīng)實(shí)驗(yàn)分析與比較,當(dāng)數(shù)據(jù)包數(shù)量閾值到達(dá)1 500時(shí),分類準(zhǔn)確率基本達(dá)到峰值。再提高閾值,分類準(zhǔn)確率提高的幅度十分有限。考慮到處理效率的原因,選擇1 500作為閾值可以在保證較高處理效率的同時(shí)實(shí)現(xiàn)較高的分類準(zhǔn)確率。
分類結(jié)果計(jì)算完成后,命令行界面會(huì)顯示如下信息:流量種類(在線視頻或下載)、此條數(shù)據(jù)流信息(源IP地址、目的IP地址、源端口、目的端口)、平均包大小、包大小的標(biāo)準(zhǔn)差、數(shù)據(jù)流傳輸速率、包到達(dá)平均時(shí)間間隔、包到達(dá)時(shí)間間隔的標(biāo)準(zhǔn)差、PSH標(biāo)志數(shù)量、包大小變化次數(shù)、下上行數(shù)據(jù)流總字節(jié)數(shù)之比。通過以上信息可以清楚分辨數(shù)據(jù)流是在線視頻或下載,并能掌握數(shù)據(jù)流分類的有關(guān)特征信息。
3.3.2分類性能測試分析與比較
本部分主要分析本文測試時(shí)在線視頻流量和下載流量的分類性能并與文獻(xiàn)[13]進(jìn)行對(duì)比。
通過圖9可見,在測試的10個(gè)網(wǎng)站中,視頻與下載流量綜合分類準(zhǔn)確率約為91.5%。有8個(gè)網(wǎng)站分類準(zhǔn)確率等于或高于85%,這8個(gè)網(wǎng)站中有5個(gè)網(wǎng)站的分類準(zhǔn)確率達(dá)到100%。所有測試網(wǎng)站中僅有2個(gè)網(wǎng)站分類準(zhǔn)確率偏低,一個(gè)為75%,另一個(gè)為80%。經(jīng)數(shù)據(jù)分析這2個(gè)網(wǎng)站的不同種類數(shù)據(jù)流特征信息非常相似,導(dǎo)致分類應(yīng)用產(chǎn)生了一定程度的誤判。
同時(shí)與文獻(xiàn)[13]中對(duì)于在線視頻流量和下載流量的分類性能進(jìn)行對(duì)比分析。本文對(duì)于在線視頻流量和下載流量的分類相對(duì)于文獻(xiàn)[13]有以下改進(jìn):
文獻(xiàn)[13]中當(dāng)數(shù)據(jù)包閾值為1 000時(shí),全局正確率在85%左右且波動(dòng)較大;閾值到達(dá)4 000時(shí),分類準(zhǔn)確率才能穩(wěn)定在92%左右。但本文通過優(yōu)化特征集并結(jié)合SDN的架構(gòu)優(yōu)勢,實(shí)現(xiàn)了在數(shù)據(jù)包數(shù)量閾值僅為1 500時(shí),也可以將分類準(zhǔn)確率穩(wěn)定保持在91.5%左右的效果。這樣既能優(yōu)化處理效率,又能保持較高的分類準(zhǔn)確率。
SDN控制層由于需要處理大量數(shù)據(jù)流,如何在處理前對(duì)流量進(jìn)行分類,以便在后續(xù)操作中減輕SDN控制層處理壓力,從而實(shí)現(xiàn)細(xì)粒度管控,已經(jīng)成為SDN研究的熱點(diǎn)之一。本文設(shè)計(jì)的基于機(jī)器學(xué)習(xí)的SDN實(shí)時(shí)流量分類應(yīng)用可以實(shí)時(shí)、有效地區(qū)分在線視頻流量和下載流量。今后的研究重點(diǎn)在于如何將分類結(jié)果應(yīng)用到SDN中實(shí)現(xiàn)細(xì)粒度的數(shù)據(jù)流量管控,進(jìn)而優(yōu)化QoS。