李奕江,葉會(huì)標(biāo),謝仁華,樓佳麗,莊丹娜,李傳煌
基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)性能智能預(yù)測(cè)
李奕江1,葉會(huì)標(biāo)2,謝仁華1,樓佳麗1,莊丹娜1,李傳煌1
(1.浙江工商大學(xué)信息與電子工程學(xué)院(薩塞克斯人工智能學(xué)院),浙江 杭州 310018;2.中國(guó)電信股份有限公司浙江分公司,浙江 杭州 310020)
傳統(tǒng)網(wǎng)絡(luò)性能預(yù)測(cè)技術(shù)存在網(wǎng)絡(luò)狀態(tài)獲取不夠全面及網(wǎng)絡(luò)性能評(píng)估準(zhǔn)確性欠佳等問(wèn)題,利用圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)推理網(wǎng)絡(luò)關(guān)系數(shù)據(jù)的特點(diǎn),結(jié)合捕獲的網(wǎng)絡(luò)全局信息,提出了一種基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)性能智能預(yù)測(cè)方法。通過(guò)網(wǎng)絡(luò)系統(tǒng)抽象及網(wǎng)絡(luò)性能建模,將復(fù)雜的網(wǎng)絡(luò)信息轉(zhuǎn)化為形式化的圖數(shù)據(jù)進(jìn)行描述,利用圖空域卷積處理圖網(wǎng)絡(luò)節(jié)點(diǎn)的消息傳遞過(guò)程,實(shí)現(xiàn)網(wǎng)絡(luò)信息之間的關(guān)系推理,研究了實(shí)現(xiàn)網(wǎng)絡(luò)性能預(yù)測(cè)的圖神經(jīng)網(wǎng)絡(luò)模型,提出了一種能處理流量矩陣、網(wǎng)絡(luò)拓?fù)?、路由策略、?jié)點(diǎn)配置的圖神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu),最后通過(guò)實(shí)驗(yàn)論證了模型能更好地實(shí)現(xiàn)包括時(shí)延、抖動(dòng)和丟包率的網(wǎng)絡(luò)性能的準(zhǔn)確預(yù)測(cè)。
圖神經(jīng)網(wǎng)絡(luò);網(wǎng)絡(luò)性能預(yù)測(cè);網(wǎng)絡(luò)建模;網(wǎng)絡(luò)分析
由于網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)通信技術(shù)的迅猛發(fā)展,網(wǎng)絡(luò)規(guī)模及其流量呈指數(shù)型增長(zhǎng),隨之產(chǎn)生了各項(xiàng)復(fù)雜的網(wǎng)絡(luò)業(yè)務(wù),用戶的需求存在增長(zhǎng)趨勢(shì)[1]。與此同時(shí),許多具有實(shí)時(shí)性特點(diǎn)的新興多媒體業(yè)務(wù)有著嚴(yán)格的時(shí)延、抖動(dòng)、丟包率、吞吐量等服務(wù)質(zhì)量(quality of service,QoS)參數(shù)要求。種種跡象表明,網(wǎng)絡(luò)規(guī)模的日益龐大和結(jié)構(gòu)的逐漸復(fù)雜,導(dǎo)致如今影響網(wǎng)絡(luò)正常運(yùn)行的因素不斷增加,對(duì)網(wǎng)絡(luò)性能進(jìn)行實(shí)時(shí)智能預(yù)測(cè)的需求也越來(lái)越大。
現(xiàn)有的建模技術(shù)并不能實(shí)現(xiàn)對(duì)相關(guān)性能指標(biāo)的準(zhǔn)確估計(jì),存在計(jì)算量龐大、模型構(gòu)建理想化、網(wǎng)絡(luò)信息考慮不全面等缺陷。對(duì)于網(wǎng)絡(luò)性能分析方面的研究,國(guó)內(nèi)外都做了大量的工作,基本分為測(cè)量法、解析法、仿真法。單純利用軟件、硬件工具來(lái)監(jiān)測(cè)相關(guān)特性度量進(jìn)行數(shù)據(jù)的簡(jiǎn)單運(yùn)算[2-6]無(wú)法滿足新型網(wǎng)絡(luò)對(duì)測(cè)量分析的嚴(yán)格要求;利用數(shù)學(xué)理論方法描述性能特征和系統(tǒng)參數(shù)之間的關(guān)系,得到性能估計(jì)的參數(shù)解(如排隊(duì)論、網(wǎng)絡(luò)演算等)[7-11]建立的是理想模型,與實(shí)際復(fù)雜的網(wǎng)絡(luò)有差異;抽象建立網(wǎng)絡(luò)系統(tǒng)模型,結(jié)合數(shù)學(xué)描述和網(wǎng)絡(luò)建模相關(guān)技術(shù)進(jìn)行性能預(yù)測(cè)[12-15]是現(xiàn)在的趨勢(shì),但現(xiàn)有的智能仿真模型在更廣泛應(yīng)用的非歐幾里得領(lǐng)域(如擁有復(fù)雜、不規(guī)律的連接信息的現(xiàn)實(shí)網(wǎng)絡(luò)中)性能一般。圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)[16-17]憑借其強(qiáng)大的對(duì)于復(fù)雜圖數(shù)據(jù)處理能力而廣受歡迎,過(guò)去在圖神經(jīng)網(wǎng)絡(luò)研究領(lǐng)域涌現(xiàn)了可用于解決實(shí)際場(chǎng)景中預(yù)測(cè)和分類問(wèn)題的各種模型[18-23],在實(shí)際網(wǎng)絡(luò)中,可以將網(wǎng)絡(luò)映射成節(jié)點(diǎn)與邊的關(guān)系,利用GNN從非結(jié)構(gòu)化數(shù)據(jù)中生成圖,其輸出不隨節(jié)點(diǎn)的輸入順序?yàn)檗D(zhuǎn)移,邊表示兩個(gè)節(jié)點(diǎn)之間的依賴關(guān)系,并可以依賴周圍的狀態(tài)來(lái)更新節(jié)點(diǎn)的狀態(tài),這對(duì)網(wǎng)絡(luò)的性能預(yù)測(cè)研究非常有實(shí)際意義。當(dāng)前的GNN模型仍然存在著深層網(wǎng)絡(luò)性能劇降、代表性節(jié)點(diǎn)難選取和可擴(kuò)展性不夠等問(wèn)題,尤其在實(shí)際網(wǎng)絡(luò)建模方面,仍缺少完整地考慮實(shí)際網(wǎng)絡(luò)狀態(tài)和運(yùn)行的GNN模型。本文受消息傳遞神經(jīng)網(wǎng)絡(luò)(message passing neural network,MPNN)機(jī)制[24]和RouteNet模型[25]啟發(fā),分析已有的GNN模型并進(jìn)行改進(jìn),構(gòu)建綜合考慮實(shí)際網(wǎng)絡(luò)的GNN模型。
針對(duì)圖神經(jīng)網(wǎng)絡(luò)在處理有依賴關(guān)系數(shù)據(jù)的優(yōu)秀能力,結(jié)合軟件定義網(wǎng)絡(luò)(software defined network,SDN)可編程控制全局信息和已有的網(wǎng)絡(luò)性能評(píng)估方法,本文提出一種基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)性能智能預(yù)測(cè)方法。該方法利用深度學(xué)習(xí)中的圖神經(jīng)網(wǎng)絡(luò)作為一種計(jì)算機(jī)網(wǎng)絡(luò)建模技術(shù)構(gòu)建估計(jì)網(wǎng)絡(luò)性能的模型,輸入網(wǎng)絡(luò)基礎(chǔ)抽象和網(wǎng)絡(luò)流量特征,預(yù)測(cè)時(shí)延、丟包率等網(wǎng)絡(luò)性能,通過(guò)得到的性能預(yù)測(cè)結(jié)果智能地調(diào)整網(wǎng)絡(luò)行為,保持網(wǎng)絡(luò)可靠的運(yùn)行性能,為網(wǎng)絡(luò)用戶提供更優(yōu)質(zhì)的服務(wù)。
本文所提出的網(wǎng)絡(luò)性能智能預(yù)測(cè)架構(gòu),結(jié)合SDN,通過(guò)控制器獲取網(wǎng)絡(luò)全局信息;在得到網(wǎng)絡(luò)實(shí)時(shí)狀態(tài)信息的情況下,通過(guò)網(wǎng)絡(luò)建模實(shí)現(xiàn)網(wǎng)絡(luò)性能的有效預(yù)測(cè)。其中,建模得到的網(wǎng)絡(luò)模型是使用收集的或者網(wǎng)絡(luò)模擬的數(shù)據(jù)專門訓(xùn)練的圖神經(jīng)網(wǎng)絡(luò)來(lái)構(gòu)建的,能夠捕獲網(wǎng)絡(luò)要素的基本關(guān)系,例如,它可以對(duì)將流量負(fù)載、路由策略與網(wǎng)絡(luò)性能聯(lián)系起來(lái)的函數(shù)進(jìn)行建模。
采用圖網(wǎng)絡(luò)的思路:首先構(gòu)建一個(gè)“圖”數(shù)據(jù),通過(guò)理解圖節(jié)點(diǎn)的基本關(guān)系含義,再進(jìn)行具體的網(wǎng)絡(luò)數(shù)據(jù)的學(xué)習(xí)?;诖?,可以憑借已知的節(jié)點(diǎn)之間的消息傳遞性,推理下一個(gè)圖結(jié)構(gòu)中關(guān)系,為此將網(wǎng)絡(luò)性能預(yù)測(cè)分為兩個(gè)問(wèn)題看待:網(wǎng)絡(luò)系統(tǒng)抽象和網(wǎng)絡(luò)性能建模。
實(shí)際物理網(wǎng)絡(luò)可描述為網(wǎng)絡(luò)的既定配置,包括網(wǎng)絡(luò)拓?fù)洹⒋笮?、網(wǎng)絡(luò)節(jié)點(diǎn)配置、路由策略等,將這些基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)及配置處理成一般圖形的神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)的輸入,針對(duì)圖結(jié)構(gòu)進(jìn)行訓(xùn)練和推理從而設(shè)計(jì)新的圖神經(jīng)網(wǎng)絡(luò)模型,網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)抽象化描述如圖1所示。
圖1 網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)抽象化描述
加之由隨機(jī)分布(包括到達(dá)間和包長(zhǎng)度過(guò)程)描述的流量,在不考慮物理誤差等隨機(jī)條件的情況下,將這些隨機(jī)過(guò)程組合在網(wǎng)絡(luò)中,網(wǎng)絡(luò)系統(tǒng)抽象化描述如圖2所示。
由上述網(wǎng)絡(luò)系統(tǒng)抽象,擬定輸入流量矩陣、網(wǎng)絡(luò)拓?fù)?、路由策略、?jié)點(diǎn)配置,圖神經(jīng)網(wǎng)絡(luò)模型能通過(guò)將拓?fù)渲械墓?jié)點(diǎn)、鏈路與由路由方案產(chǎn)生的源—目的路徑以及通過(guò)它們的流量進(jìn)行建模來(lái)實(shí)現(xiàn)理解拓?fù)浣Y(jié)構(gòu)、路由和輸入流量之間的復(fù)雜關(guān)系,對(duì)所有節(jié)點(diǎn)的端到端平均時(shí)延等其他性能進(jìn)行估計(jì),網(wǎng)絡(luò)性能建模描述如圖3所示。
結(jié)合上述兩項(xiàng)描述,本文依賴于圖神經(jīng)網(wǎng)絡(luò)模型的推理能力來(lái)有效地操作和推廣以圖表示的
環(huán)境,希望能夠在整個(gè)網(wǎng)絡(luò)拓?fù)渲袀鞑ト魏温酚煞桨福⒊橄蟪霎?dāng)前網(wǎng)絡(luò)狀態(tài)的有意義的信息。在該種情況下,網(wǎng)絡(luò)建模能夠接收到不同路由方案、節(jié)點(diǎn)配置、拓?fù)渥兓土髁烤仃囎兓?,并精確地預(yù)測(cè)網(wǎng)絡(luò)的性能。將實(shí)時(shí)收集到的流量信息、網(wǎng)絡(luò)狀態(tài)、管理狀態(tài)作為不同的網(wǎng)絡(luò)配置,通過(guò)圖神經(jīng)網(wǎng)絡(luò)可以進(jìn)行相互之間的聯(lián)系,從而根據(jù)當(dāng)前的網(wǎng)絡(luò)狀態(tài)生成性能指標(biāo),基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)性能智能預(yù)測(cè)架構(gòu)如圖4所示。
圖4 基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)性能智能預(yù)測(cè)架構(gòu)
對(duì)于給定網(wǎng)絡(luò),依據(jù)圖網(wǎng)絡(luò)定義,定義描述拓?fù)溥B接關(guān)系為:
若將節(jié)點(diǎn)、鏈路和路徑分別依據(jù)路由配置進(jìn)行關(guān)系連接,則對(duì)于節(jié)點(diǎn)和路徑之間的關(guān)系來(lái)說(shuō),針對(duì)固定網(wǎng)絡(luò)拓?fù)浜鸵阎穆酚膳渲?,某一?jié)點(diǎn)狀態(tài)與所有包含該節(jié)點(diǎn)的路徑狀態(tài)有關(guān),因此可將節(jié)點(diǎn)集合和路徑集合重新定義為:
同理可得鏈路與路徑關(guān)系的各自集合表示:
本文中目標(biāo)構(gòu)建的圖神經(jīng)網(wǎng)絡(luò)模型基于一種表示空域卷積的形式化框架——MPNN,這是一種由圖網(wǎng)絡(luò)(graph network,GN)、門控循環(huán)單元(gate recurrent unit,GRU)、圖自編碼器(graph auto-encoder,GAE)、多層感知機(jī)(multi-layer perceptron,MLP)所構(gòu)成的級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)模型。依據(jù)前面對(duì)網(wǎng)絡(luò)特性的分析,本文將輸入路徑、鏈路、節(jié)點(diǎn)特征,輸出路徑級(jí)別的隱藏狀態(tài)信息,評(píng)估路徑級(jí)別的性能指標(biāo),設(shè)計(jì)的圖神經(jīng)網(wǎng)絡(luò)模型具體架構(gòu)如圖5所示。
首先收集NSFNet拓?fù)涞木W(wǎng)絡(luò)狀態(tài)視圖和資源視圖的數(shù)據(jù)集,其中,數(shù)據(jù)集包括相關(guān)性能信息、流量信息、路由信息和拓?fù)湫畔ⅰDP鸵罁?jù)DataNetAPI從數(shù)據(jù)集中提取所需的特征信息,進(jìn)行格式轉(zhuǎn)化和數(shù)據(jù)預(yù)處理——將數(shù)據(jù)統(tǒng)一映射到[0,1]完成歸一化。再使用TensorFlow框架中常用的二進(jìn)制序列數(shù)據(jù)文件存儲(chǔ)格式TFRecords來(lái)實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)及讀取。最后將其劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于調(diào)整網(wǎng)絡(luò)的參數(shù)權(quán)重和偏差,測(cè)試集用于測(cè)試訓(xùn)練后的網(wǎng)絡(luò)模型來(lái)反映網(wǎng)絡(luò)性能。給定圖網(wǎng)絡(luò)G,根據(jù)路由策略RM,將節(jié)點(diǎn)、鏈路和路徑特征(x, x, x)作為輸入,得到節(jié)點(diǎn)、鏈路和路徑的初始狀態(tài)集合(h0, h0, h0)。
具體地,本文所設(shè)定的節(jié)點(diǎn)特征x為節(jié)點(diǎn)配置信息,鏈路特征x為鏈路帶寬,路徑特征x為路徑級(jí)別輸入流量,其中節(jié)點(diǎn)配置信息見表1。
表1 節(jié)點(diǎn)配置信息
對(duì)節(jié)點(diǎn)進(jìn)行空域卷積,將連接節(jié)點(diǎn)的所有隱藏狀態(tài)信息求和,以更新當(dāng)前節(jié)點(diǎn)的隱藏狀態(tài),如式(7)所示。
根據(jù)節(jié)點(diǎn)、鏈路和路徑的相互關(guān)系,進(jìn)行狀態(tài)的更新:
其中,|p|表示路徑p的標(biāo)識(shí)符,和為隱藏狀態(tài)的更新函數(shù)。節(jié)點(diǎn)、鏈路、路徑的狀態(tài)空域卷積過(guò)程如圖6所示。
圖6 節(jié)點(diǎn)、鏈路、路徑的狀態(tài)空域卷積過(guò)程
根據(jù)MPNN,可以將空域卷積分為兩個(gè)步驟:消息傳遞和狀態(tài)更新,即對(duì)于第條路徑來(lái)說(shuō),若要更新路徑的隱藏信息,對(duì)與該條路徑相關(guān)聯(lián)的節(jié)點(diǎn)和鏈路的狀態(tài)信息進(jìn)行消息交錯(cuò)傳遞;再結(jié)合路徑當(dāng)前狀態(tài)進(jìn)行狀態(tài)更新。
其中,M為消息函數(shù),U為更新函數(shù),為空域卷積的運(yùn)行步數(shù)。
循環(huán)該隱藏狀態(tài)消息傳遞和狀態(tài)更新過(guò)程,使得每個(gè)目標(biāo)實(shí)體的隱藏狀態(tài)都波動(dòng)很小,圖的信息流動(dòng)總體趨于平穩(wěn),節(jié)點(diǎn)、鏈路、路徑的消息傳遞過(guò)程如圖7所示。
圖7 節(jié)點(diǎn)、鏈路、路徑的消息傳遞過(guò)程
這一消息傳遞過(guò)程由GRU完成。將當(dāng)前輸入特征x和節(jié)點(diǎn)傳遞下來(lái)的包含之前相關(guān)信息的隱藏狀態(tài)h?1作為GRU的輸入,通過(guò)式(11)~式(14)的計(jì)算過(guò)程,得到隱藏節(jié)點(diǎn)的輸出y和傳遞給下一個(gè)隱藏狀態(tài)h。
完成上述過(guò)程之后,在神經(jīng)網(wǎng)絡(luò)進(jìn)行擬合前加入GAE,以學(xué)習(xí)狀態(tài)特征和輸出特征的高效表示,提取更有用的信息,提高相關(guān)度。GAE對(duì)輸入的狀態(tài)數(shù)據(jù)進(jìn)行去噪以及為了可視化進(jìn)行降維,可以在預(yù)測(cè)結(jié)果生成的前提下降低模型復(fù)雜度。
經(jīng)過(guò)一系列的消息傳遞過(guò)程以及信息提取過(guò)程之后,對(duì)狀態(tài)進(jìn)行聚合并讀出預(yù)測(cè)值,主要使用讀出函數(shù)計(jì)算整張圖的特征向量,輸出路徑級(jí)特征的預(yù)測(cè)值。本文所構(gòu)建的圖神經(jīng)網(wǎng)絡(luò)由MLP來(lái)進(jìn)行圖讀取,并在該圖神經(jīng)網(wǎng)絡(luò)中引入ReLU激活函數(shù),使其更加逼近非線性函數(shù)。
為了解決在模型在訓(xùn)練和預(yù)測(cè)的時(shí)候輸入的數(shù)據(jù)分布的不同,采用計(jì)劃采樣機(jī)制[26]。該機(jī)制在模型訓(xùn)練的前期,以較大的概率輸入目標(biāo)序列的真實(shí)標(biāo)簽以改善因?yàn)槟P陀?xùn)練初期預(yù)測(cè)不準(zhǔn)確而難以收斂的現(xiàn)象,隨著訓(xùn)練過(guò)程的進(jìn)行,概率慢慢衰減。設(shè)已訓(xùn)練到了個(gè)mini-batch,則定義概率為反向sigmoid衰減,以此增加模型容錯(cuò)能力。
由于在訓(xùn)練過(guò)程生成y時(shí),輸入的y?1為訓(xùn)練集標(biāo)注序列的真值,而在預(yù)測(cè)的時(shí)候,輸入的y'?1為在?1步時(shí)生成的可能是預(yù)測(cè)正確也可能是預(yù)測(cè)錯(cuò)誤的標(biāo)簽,若為錯(cuò)誤標(biāo)簽,則會(huì)導(dǎo)致錯(cuò)誤爆炸。計(jì)劃采樣機(jī)制在訓(xùn)練過(guò)程中,下一步的輸入不完全使用真實(shí)的序列標(biāo)簽,以概率選擇真實(shí)標(biāo)簽,以概率1?選擇模型的自身輸出,在訓(xùn)練的過(guò)程中,大小如學(xué)習(xí)率一樣可變,計(jì)劃采樣機(jī)制如圖8所示。
圖8 計(jì)劃采樣機(jī)制
本文設(shè)定GNN參數(shù)的配置為一個(gè)包含GNN基本參數(shù)(如隱藏層層數(shù)、學(xué)習(xí)率等的配置文件)。在明確輸入的數(shù)據(jù)集以及配置文件后,首先會(huì)對(duì)圖神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí):在前向傳播中,調(diào)用全局更新函數(shù)(前饋神經(jīng)網(wǎng)絡(luò))T次,令h收斂,即節(jié)點(diǎn)的隱藏狀態(tài)近似不動(dòng)點(diǎn)解,通過(guò)局部輸出函數(shù)得到有監(jiān)督信號(hào)節(jié)點(diǎn)的輸出和計(jì)算出模型的損失,進(jìn)而迭代式計(jì)算T次梯度,得到與對(duì)最初隱藏狀態(tài)h0的梯度,更新模型參數(shù)。在該過(guò)程中,需設(shè)置學(xué)習(xí)步數(shù)表示學(xué)習(xí)數(shù)量,指定前饋和反饋過(guò)程次數(shù)和終止條件,以此調(diào)整網(wǎng)絡(luò)的權(quán)重和偏差達(dá)到穩(wěn)定的狀態(tài),用于模型的擬合。最終,經(jīng)過(guò)訓(xùn)練的圖神經(jīng)網(wǎng)絡(luò)會(huì)用于測(cè)試集測(cè)試,評(píng)估最終模型的預(yù)測(cè)能力。
具體的基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)性能智能預(yù)測(cè)算法如算法1所示。
算法1 基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)性能智能預(yù)測(cè)算法
本實(shí)驗(yàn)的硬件條件是搭載有核心型號(hào)為GP102的NVIDIA TITAN XP顯卡的GPU服務(wù)器,軟件環(huán)境是64位Ubuntu16.04操作系統(tǒng),運(yùn)算平臺(tái)為CUDA10.1,使用TensorFlow作為深度學(xué)習(xí)框架,編程語(yǔ)言是Python。
本文通過(guò)L2損失——均方誤差(mean square error,MSE)作為損失誤差函數(shù),通過(guò)均方根誤差(root mean square error,RMSE)和皮爾森(Pearson)系數(shù)評(píng)估模型的表現(xiàn),通過(guò)L1損失——平均絕對(duì)誤差(mean absolute error,MAE)對(duì)比評(píng)估本文提出的模型與Rusek等[25]提出的RouteNet模型的表現(xiàn),通過(guò)RMSE指標(biāo)來(lái)對(duì)比評(píng)估本文提出的模型與Huang等[27]提出的DRL-TC模型的表現(xiàn),通過(guò)計(jì)算絕對(duì)平均距離(mean absolute distance,MAD)來(lái)表示預(yù)測(cè)結(jié)果的好壞。
首先收集NSFNet拓?fù)湎碌木W(wǎng)絡(luò)狀態(tài)視圖和資源視圖的數(shù)據(jù)集,其中,數(shù)據(jù)集包括相關(guān)性能信息、流量信息、路由信息和拓?fù)湫畔ⅰ1疚牡臄?shù)據(jù)集為開源數(shù)據(jù)集,由Rusek等[28]在知識(shí)定義網(wǎng)絡(luò)(knowledge defined network,KDN)[28]經(jīng)OMNet++仿真軟件建模NSFNet拓?fù)渌谩?/p>
此外本文選用2021 ITU Artificial Intelligence / Machine Learning in 5G Challenge官方所提供的數(shù)據(jù)集來(lái)進(jìn)行模型泛化性測(cè)試,該開源數(shù)據(jù)集通過(guò)OMNet++建模生成。與NSFNet數(shù)據(jù)集所包含的信息相同,該數(shù)據(jù)集也包含了相關(guān)的性能信息、流量信息、路由信息和拓?fù)湫畔⒌取?/p>
本文通過(guò)DataNetAPI對(duì)兩個(gè)數(shù)據(jù)集分別進(jìn)行所需要信息的提取,并進(jìn)行數(shù)據(jù)預(yù)處理——?dú)w一化,讓不同維度的特征在數(shù)值上有一定可比性,將數(shù)據(jù)統(tǒng)一映射到[0,1]上,以利于模型在訓(xùn)練過(guò)程中收斂。本文采用的min-max標(biāo)準(zhǔn)化:變量代表模型使用的預(yù)測(cè)變量,變量代表目標(biāo)值。則對(duì)序列{1,2,…, x}進(jìn)行變換:
本文采取NSFNet網(wǎng)絡(luò)數(shù)據(jù)集樣本26萬(wàn)個(gè),對(duì)測(cè)試集,以大約7:3的比例使用選取訓(xùn)練集中不包含的剩余樣本112 000個(gè)。則本文使用的數(shù)據(jù)集樣本見表2。
表2 系統(tǒng)訓(xùn)練集與測(cè)試集樣本參數(shù)
其中,數(shù)據(jù)集包含了不同的路由方案和各種流量強(qiáng)度的流量矩陣,在利用樣本數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練的過(guò)程中,每次訓(xùn)練從數(shù)據(jù)集中隨機(jī)選擇80%的數(shù)據(jù)集作為圖神經(jīng)網(wǎng)絡(luò)模型深度學(xué)習(xí)的訓(xùn)練數(shù)據(jù)集,在訓(xùn)練結(jié)束后,選取數(shù)據(jù)集中的另外20%數(shù)據(jù)集作為模型驗(yàn)證集進(jìn)行測(cè)試,在訓(xùn)練期間,為防止過(guò)擬合,添加L2正則化損失最小化,通過(guò)Tensorboard觀察模型收斂狀況,達(dá)到收斂狀態(tài)后,保存最終模型。
設(shè)置自適應(yīng)時(shí)刻估計(jì)(adaptive moment estimation,Adam)算法,初始學(xué)習(xí)率為0.001,批次大小為32、迭代次數(shù)為80 000、激活函數(shù)為ReLU,需要再實(shí)驗(yàn)進(jìn)一步確認(rèn)神經(jīng)元數(shù)和層數(shù)。為此,本文設(shè)計(jì)4種圖神經(jīng)網(wǎng)絡(luò)模型見表3。
表3 4種不同的圖神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
其中,變化的是在消息傳遞過(guò)程中依賴的GRU神經(jīng)元數(shù)以及在讀出階段使用的MLP全連接層數(shù)和各層的神經(jīng)元數(shù)。對(duì)比設(shè)計(jì)的4種GNN模型,改變GRU和MLP的神經(jīng)元數(shù)和MLP全連接層數(shù),對(duì)不同的GNN模型進(jìn)行模型訓(xùn)練,GNN模型的L2損失對(duì)比如圖9所示。
由圖9可知,模型損失值收斂的速度幾近趨同,GNN0和GNN2相較于GNN1和GNN3波動(dòng)較大,預(yù)測(cè)效果相對(duì)較弱且不穩(wěn)定。為了進(jìn)一步篩選表現(xiàn)最優(yōu)的模型,分別對(duì)時(shí)延、抖動(dòng)和丟包率3種網(wǎng)絡(luò)性能進(jìn)行模型訓(xùn)練,并將RMSE和Pearson系數(shù)作為評(píng)價(jià)參數(shù)。其中,RMSE越接近0,Pearson系數(shù)越接近1,模型表現(xiàn)越好。更明確地,本文分別對(duì)時(shí)延、抖動(dòng)和丟包率3種網(wǎng)絡(luò)性能進(jìn)行模型訓(xùn)練,同樣將RMSE和Pearson系數(shù)作為評(píng)價(jià)參數(shù)。以時(shí)延為例,得到了如圖10、圖11所示RMSE和Pearson系數(shù)對(duì)比。
圖9 GNN模型的L2損失對(duì)比
圖10 GNN模型的RMSE對(duì)比
圖11 GNN模型的Pearson系數(shù)對(duì)比
圖10和圖11可看出,GNN1相較于其他3種GNN模型的RMSE平均值離0更近,同時(shí),其Pearson系數(shù)平均值也離1更近。訓(xùn)練步數(shù)一樣,GNN1模型的誤差波動(dòng)范圍是最小的,因此,可以說(shuō)明其預(yù)測(cè)的效果相較于其他模型來(lái)說(shuō)較好且穩(wěn)定,而隨著訓(xùn)練步數(shù)增加,GNN1的收斂值也是最小的。
4種不同的圖神經(jīng)網(wǎng)絡(luò)模型收斂后的各性能評(píng)估結(jié)果見表4。
從表4可以更清晰地看出:在硬件條件和數(shù)據(jù)集都相同的情況下,4種圖神經(jīng)網(wǎng)絡(luò)模型都有比較優(yōu)秀的收斂效果,其中GNN1在時(shí)延、抖動(dòng)和丟包率的RMSE系數(shù)比其他3種圖神經(jīng)網(wǎng)絡(luò)都要更接近0,Pearson系數(shù)更接近1。
表4 四種不同的圖神經(jīng)網(wǎng)絡(luò)模型性能評(píng)估結(jié)果比較
綜上所述,本文選取GNN1作為最終新構(gòu)建的GNN模型,其GRU層數(shù)為2,神經(jīng)元數(shù)為32以及MLP全連接層數(shù)為2,各層的神經(jīng)元數(shù)為256。為了驗(yàn)證本文構(gòu)建的GNN模型相較于RouteNet來(lái)說(shuō),由于擴(kuò)展了體系結(jié)構(gòu)和模型改進(jìn)而評(píng)估更準(zhǔn)確,為此進(jìn)行實(shí)驗(yàn)對(duì)比,本文選取MAE作為度量模型的預(yù)測(cè)能力的評(píng)價(jià)參數(shù),如圖12所示。
圖12 新構(gòu)建的GNN模型與RouteNet模型的MAE對(duì)比
如圖12所示,隨著訓(xùn)練步數(shù)的增加,新構(gòu)建的GNN模型與RouteNet相較而言,MAE函數(shù)曲線波動(dòng)更小,且距0更近,因此預(yù)測(cè)效果更為優(yōu)秀穩(wěn)定。尤其是步數(shù)越多,差距越明顯。經(jīng)計(jì)算,在0~100 000步數(shù)范圍中,新構(gòu)建的GNN模型的MAE系數(shù)平均值大約為0.028 2,而RouteNet的MAE系數(shù)平均值大約為0.034 9,相比之下新構(gòu)建的GNN模型降低了近19.20%的MAE指標(biāo)。這都得益于模型的改進(jìn)對(duì)于有用信息的提取更為精準(zhǔn),使得訓(xùn)練時(shí)候的預(yù)測(cè)能力得到明顯的提升。
為進(jìn)一步驗(yàn)證本文新構(gòu)建的GNN模型在網(wǎng)絡(luò)性能預(yù)測(cè)能力上具有明顯的優(yōu)越性,再選取RMSE作為度量模型預(yù)測(cè)能力的評(píng)價(jià)參數(shù),與DRL-TC模型進(jìn)行實(shí)驗(yàn)對(duì)比。本研究將800個(gè)不同的隨機(jī)網(wǎng)絡(luò)流量矩陣按每組100個(gè)均分為8組,進(jìn)行所述新構(gòu)建GNN模型與DRL-TC模型的預(yù)測(cè)能力評(píng)估,對(duì)每組流量矩陣分別測(cè)試并計(jì)算得到相應(yīng)的RMSE指標(biāo),如圖13所示。
圖13 新構(gòu)建的GNN模型與DRL-TC模型的RMSE對(duì)比
如圖13所示,綜合各個(gè)網(wǎng)絡(luò)流量矩陣分組,從整體上看新構(gòu)建的GNN模型與DRL-TC模型相比RMSE指標(biāo)的函數(shù)曲線波動(dòng)更小,且距0更近,可以得出其預(yù)測(cè)效果更為優(yōu)秀穩(wěn)定。經(jīng)計(jì)算,在所選取的8組共800個(gè)隨機(jī)流量矩陣中,新構(gòu)建的GNN模型的RMSE系數(shù)平均值大約為0.063 2,而DRL-TC的RMSE系數(shù)平均值大約為0.082 5,相比之下新構(gòu)建的GNN模型降低了近23.39%的RMSE指標(biāo),從而證明了本文新構(gòu)建的GNN模型具有更為優(yōu)秀的網(wǎng)絡(luò)性能預(yù)測(cè)能力。
更進(jìn)一步地,為了體現(xiàn)體系結(jié)構(gòu)的擴(kuò)展對(duì)性能評(píng)估的影響,先用MAD刻畫新構(gòu)建的GNN模型的預(yù)測(cè)結(jié)果,選取時(shí)延模型進(jìn)行真實(shí)值與預(yù)測(cè)值的差值。使用Python中的seaborn.regplot線性回歸模型擬合函數(shù),將足量“真實(shí)值-預(yù)測(cè)值”數(shù)據(jù)對(duì)作為輸入,進(jìn)行擬合計(jì)算得到所需的回歸線;從而能夠以橫縱坐標(biāo)分別表示真實(shí)值和預(yù)測(cè)值的離散點(diǎn)是否聚集在回歸線上判斷訓(xùn)練后的模型是否有良好的預(yù)測(cè)性能。
新構(gòu)建的GNN模型在時(shí)延預(yù)測(cè)上的結(jié)果如圖14所示。
圖14 新構(gòu)建的GNN模型在時(shí)延預(yù)測(cè)上的結(jié)果
由圖14可知,經(jīng)GNN模型預(yù)測(cè)的結(jié)果散點(diǎn)基本都聚集在回歸線上,經(jīng)計(jì)算其絕對(duì)平均距離MAD為0.026 7,預(yù)測(cè)值與真實(shí)值基本重合,由此證實(shí)了新構(gòu)建的模型在網(wǎng)絡(luò)性能評(píng)估中的時(shí)延指標(biāo)有突出表現(xiàn)。為了總體評(píng)估該模型在時(shí)延、抖動(dòng)和丟包率中的預(yù)測(cè)性能以及與RouteNet作體系結(jié)構(gòu)上的對(duì)比,本文采用累積分布函數(shù)(cumulative distribution function ,CDF)對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析。
新構(gòu)建的GNN模型與RouteNet模型網(wǎng)絡(luò)性能預(yù)測(cè)的CDF對(duì)比如圖15所示,對(duì)于CDF圖像來(lái)說(shuō),以平均相對(duì)誤差(mean relative error ,MRE)作為橫坐標(biāo),以預(yù)測(cè)的離散結(jié)果與實(shí)際的離散值的相對(duì)誤差小于或等于的值的累積分布作為縱坐標(biāo),即:
圖15 新構(gòu)建的GNN模型與RouteNet模型網(wǎng)絡(luò)性能預(yù)測(cè)的CDF對(duì)比
由于CDF為離散變量的和,因此呈現(xiàn)的是梯形結(jié)構(gòu),最終會(huì)達(dá)到1,CDF梯形線越集中到中心點(diǎn)位置,則預(yù)測(cè)效果越優(yōu)秀。首先對(duì)于新構(gòu)建GNN模型來(lái)說(shuō),由于本次采用的是經(jīng)時(shí)延數(shù)據(jù)訓(xùn)練的模型,因此可以看出實(shí)線部分中,時(shí)延的預(yù)測(cè)效果要略好于抖動(dòng)和丟包率,在其他網(wǎng)絡(luò)性能評(píng)估指標(biāo)中同樣具有良好的預(yù)測(cè)效果。由于模型的體系結(jié)構(gòu)經(jīng)過(guò)調(diào)整和改進(jìn),綜合考慮到了節(jié)點(diǎn)信息,在新構(gòu)建的包含節(jié)點(diǎn)配置的數(shù)據(jù)集下,相對(duì)于虛線來(lái)說(shuō),實(shí)線要明顯更靠近中心線,說(shuō)明新構(gòu)建的GNN模型的預(yù)測(cè)值與真實(shí)值的相對(duì)誤差分布更接近于0,該模型在預(yù)測(cè)評(píng)估網(wǎng)絡(luò)性能這一方面要比RouteNet更加精準(zhǔn)。
進(jìn)一步地,為測(cè)試本文提出的GNN模型的跨數(shù)據(jù)集泛化效果,選用 2021年ITU Artificial Intelligence/Machine Learning in 5G Challenge所提供的數(shù)據(jù)集來(lái)進(jìn)行實(shí)驗(yàn)。為了能夠?qū)δP偷目鐢?shù)據(jù)集泛化效果進(jìn)行合理評(píng)估,此處所采取的實(shí)驗(yàn)方案與基于NSFNet數(shù)據(jù)集進(jìn)行測(cè)試時(shí)保持一致,同樣采用CDF指標(biāo)來(lái)對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析。
基于新數(shù)據(jù)集進(jìn)行網(wǎng)絡(luò)性能預(yù)測(cè)的CDF對(duì)比如圖16所示,從圖16上可以看出,基于該數(shù)據(jù)集的測(cè)試結(jié)果與基于NSFNet數(shù)據(jù)集的測(cè)試結(jié)果呈現(xiàn)相同的梯形結(jié)構(gòu)。并且在時(shí)延、抖動(dòng)和丟包率3項(xiàng)性能指標(biāo)上,相對(duì)于代表RouteNet的虛線來(lái)說(shuō),代表新構(gòu)建的GNN模型的實(shí)線同樣要更靠近中心線,這證明了其在新數(shù)據(jù)集上進(jìn)行網(wǎng)絡(luò)性能預(yù)測(cè)評(píng)估時(shí),同樣有著更加精準(zhǔn)的效果。由此可以得出,本文所構(gòu)建的GNN模型具有較好的跨數(shù)據(jù)集泛化效果。
圖16 基于新數(shù)據(jù)集進(jìn)行網(wǎng)絡(luò)性能預(yù)測(cè)的CDF對(duì)比
為測(cè)試本文所提出的基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)性能智能預(yù)測(cè)模型在真實(shí)環(huán)境中的性能效果,將其應(yīng)用于SDN路由優(yōu)化中。模型基于SDN獲取的網(wǎng)絡(luò)實(shí)時(shí)狀態(tài)信息,預(yù)測(cè)得到網(wǎng)絡(luò)性能參數(shù),能夠?qū)崟r(shí)調(diào)整網(wǎng)絡(luò)行為,完成路由策略的優(yōu)化。
所述應(yīng)用網(wǎng)絡(luò)性能智能預(yù)測(cè)模型的SDN路由優(yōu)化方案,主要分為兩個(gè)步驟:第一步是從SDN數(shù)據(jù)平面獲取真實(shí)輸入數(shù)據(jù),應(yīng)用網(wǎng)絡(luò)模型預(yù)測(cè)特定配置的網(wǎng)絡(luò)性能;第二步是在SDN控制平面接收到網(wǎng)絡(luò)狀態(tài)的實(shí)時(shí)更新后,結(jié)合預(yù)測(cè)網(wǎng)絡(luò)性能信息與當(dāng)前網(wǎng)絡(luò)狀態(tài)信息找到最優(yōu)路由。該SDN路由優(yōu)化方案具體如圖17所示。
圖17 基于網(wǎng)絡(luò)性能智能預(yù)測(cè)模型的SDN路由優(yōu)化方案
同時(shí),本文將該路由優(yōu)化的整體方案作為待評(píng)估策略,選取深度確定性策略梯度(deep deterministic policy gradient,DDPG)算法進(jìn)行策略性能的測(cè)試評(píng)估。DDPG是一個(gè)強(qiáng)大的針對(duì)連續(xù)行為的策略學(xué)習(xí)算法,基于該算法以及行為?評(píng)判(actor- critic,AC)框架的策略評(píng)估架構(gòu)如圖18所示。
圖18 基于AC框架的DDPG算法策略評(píng)估架構(gòu)
此外,本實(shí)驗(yàn)使用基于Dijkstra算法的ShortestPath路由優(yōu)化方案、基于RouteNet模型的路由優(yōu)化方案等兩種策略作為對(duì)照,與基于本研究所提出的網(wǎng)絡(luò)性能智能預(yù)測(cè)模型的SDN路由優(yōu)化方案進(jìn)行性能對(duì)比。
本研究評(píng)估了在6種不同的流量強(qiáng)度(traffic intensity,TI)場(chǎng)景下,不同的路由優(yōu)化策略所實(shí)現(xiàn)的性能,并對(duì)每種TI各評(píng)估100個(gè)不同的網(wǎng)絡(luò)流量矩陣?;谏鲜龌A(chǔ),對(duì)3種不同的路由優(yōu)化策略,分別測(cè)試并計(jì)算得到600組數(shù)據(jù),再通過(guò)性能指標(biāo)平均值的比對(duì),得出最佳的方案。
本實(shí)驗(yàn)中所關(guān)注的性能指標(biāo)為時(shí)延、抖動(dòng)-時(shí)延比和丟包率。時(shí)延與丟包率越低,則意味著經(jīng)過(guò)對(duì)應(yīng)路由優(yōu)化策略優(yōu)化之后的網(wǎng)絡(luò)性能越佳;而抖動(dòng)由時(shí)延產(chǎn)生,可表征前后兩個(gè)時(shí)延值的差異,時(shí)延-抖動(dòng)比越低,可以說(shuō)明經(jīng)對(duì)應(yīng)路由優(yōu)化策略優(yōu)化后的網(wǎng)絡(luò)狀態(tài)越穩(wěn)定。實(shí)際上,當(dāng)經(jīng)優(yōu)化后網(wǎng)絡(luò)性能指標(biāo)越佳,網(wǎng)絡(luò)狀態(tài)越穩(wěn)定,在整體架構(gòu)中其他部分完全一致的前提下,可以證明優(yōu)化策略中所使用的網(wǎng)絡(luò)性能預(yù)測(cè)模型具有更佳效果。
上述3種優(yōu)化策略在流量強(qiáng)度為11~16所得到的時(shí)延、抖動(dòng)-時(shí)延比和丟包率對(duì)比情況如圖19、圖20和圖21所示,各性能指標(biāo)都用箱線圖表示,其中,軸表示不同的流量強(qiáng)度,軸分別表示時(shí)延、抖動(dòng)-時(shí)延比和丟包率。
圖19 不同優(yōu)化策略在不同流量強(qiáng)度下的時(shí)延對(duì)比
從圖19中可以看到,3種策略中,應(yīng)用了本文研究所提出的網(wǎng)絡(luò)性能智能預(yù)測(cè)模型的路由優(yōu)化策略對(duì)應(yīng)的時(shí)延最低,且隨著流量強(qiáng)度的上升,與其余兩種路由優(yōu)化策略的差距愈加明顯。
從圖20中可以看到,3種策略中,應(yīng)用了本文研究所提出的網(wǎng)絡(luò)性能智能預(yù)測(cè)模型的路由優(yōu)化策略對(duì)應(yīng)的抖動(dòng)-時(shí)延比最低,且隨著流量強(qiáng)度的上升,與其余兩種路由優(yōu)化策略的差距同樣呈現(xiàn)愈加明顯的趨勢(shì)。
從圖21中可以看到,3種策略中,應(yīng)用了本文研究所提出的網(wǎng)絡(luò)性能智能預(yù)測(cè)模型的路由優(yōu)化策略對(duì)應(yīng)的丟包率是最低的。
圖20 不同優(yōu)化策略在不同流量強(qiáng)度下的抖動(dòng)/時(shí)延對(duì)比
圖21 不同優(yōu)化策略在不同流量強(qiáng)度下的丟包率對(duì)比
結(jié)合以上實(shí)驗(yàn)結(jié)果,可以得到的結(jié)論是,在3種路由優(yōu)化策略中,應(yīng)用了本文研究所提出的網(wǎng)絡(luò)性能智能預(yù)測(cè)模型的路由優(yōu)化策略性能最佳,即證明了該模型的網(wǎng)絡(luò)性能預(yù)測(cè)具有最佳效果。
該對(duì)比實(shí)驗(yàn)所使用的數(shù)據(jù)是通過(guò)SDN數(shù)據(jù)平面獲取真實(shí)輸入數(shù)據(jù),即在真實(shí)環(huán)境下使用真實(shí)數(shù)據(jù)完成了模型預(yù)測(cè)性能指標(biāo)的測(cè)試,驗(yàn)證了本文所提出的基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)性能智能預(yù)測(cè)模型具有極佳的預(yù)測(cè)效果,要明顯優(yōu)于一般傳統(tǒng)模型以及RouteNet模型等。
網(wǎng)絡(luò)新興業(yè)務(wù)的急劇增多帶來(lái)了對(duì)QoS的更嚴(yán)格要求,復(fù)雜的網(wǎng)絡(luò)信息使得網(wǎng)絡(luò)性能的分析面臨著重大挑戰(zhàn),已提出的網(wǎng)絡(luò)性能分析技術(shù)面對(duì)實(shí)際復(fù)雜多變的網(wǎng)絡(luò)有著計(jì)算困難、與實(shí)際差異巨大、考慮不全面等問(wèn)題,為此如何綜合考慮影響網(wǎng)絡(luò)性能的各類因素,從而對(duì)復(fù)雜網(wǎng)絡(luò)進(jìn)行可靠的性能分析這一難題亟待解決。
本文在結(jié)合網(wǎng)絡(luò)性能分析方法和圖神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,將性能分析定為智能預(yù)測(cè),提出了一種基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)性能智能預(yù)測(cè)總體方案,并將該方案分為網(wǎng)絡(luò)系統(tǒng)抽象和網(wǎng)絡(luò)性能建模這兩個(gè)問(wèn)題分析并結(jié)合SDN控制組件的集中管制下可獲取的網(wǎng)絡(luò)信息和圖網(wǎng)絡(luò)的定義,將網(wǎng)絡(luò)進(jìn)行系統(tǒng)抽象并進(jìn)行圖數(shù)據(jù)描述,對(duì)原始網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行了提取和處理,以節(jié)點(diǎn)、鏈路和路徑的相互消息傳遞過(guò)程為主要設(shè)計(jì)理念,基于圖神經(jīng)網(wǎng)絡(luò)空域卷積的框架,擴(kuò)展了原圖神經(jīng)網(wǎng)絡(luò)的體系結(jié)構(gòu)并構(gòu)建了多種不同結(jié)構(gòu)的圖神經(jīng)網(wǎng)絡(luò)模型。選取表現(xiàn)最佳的圖神經(jīng)網(wǎng)絡(luò)模型并在仿真以及真實(shí)場(chǎng)景中進(jìn)行了時(shí)延、抖動(dòng)和丟包率等多種網(wǎng)絡(luò)性能指標(biāo)的實(shí)驗(yàn)評(píng)估,證明了該模型網(wǎng)絡(luò)性能智能預(yù)測(cè)的有效性和優(yōu)勢(shì)。
在本文研究基礎(chǔ)上,下一階段將在模型中加入更多具有代表性的網(wǎng)絡(luò)特征和性能特征,就實(shí)現(xiàn)多樣化網(wǎng)絡(luò)性能智能預(yù)測(cè)模型的應(yīng)用場(chǎng)景方向開展進(jìn)一步的研究工作。
[1] 2020年中國(guó)互聯(lián)網(wǎng)發(fā)展趨勢(shì)報(bào)告[EB]. 2020.
Report on China's Internet Development Trend in 2020[EB]. 2020.
[2] LIU L K, ZHANG H L, SHI J T, et al. I2P anonymous communication network measurement and analysis[C]// Smart Computing and Communication, 4th International Conference. Switzerland: Springer Cham, 2019:105-115.
[3] CHEN Y, HU J Y, ZHAO H, et al. Measurement and analysis of the swarm social network with tens of millions of nodes[J]. IEEE Access, 2018: 1.
[4] 戴冕, 程光, 周余陽(yáng). 軟件定義網(wǎng)絡(luò)的測(cè)量方法研究[J]. 軟件學(xué)報(bào), 2019(6):1853-1874.
DAI M, CHENG G, ZHOU Y Y. Survey on measurement method in software-defined networking[J]. Journal of Software, 2019(6):1853-1874.
[5] JIA S Y, LUCKIE M, HUFFAKER B, et al. Tracking the deployment of IPv6: topology, routing and performance[J]. Computer Networks, 2019 (165): 106947.
[6] 馬衛(wèi)國(guó), 郎為民, 張寅, 等. 虛擬化網(wǎng)絡(luò)功能測(cè)量問(wèn)題研究[J]. 電信快報(bào), 2020 (3): 1-5.
MA W G, LANG W M, ZHANG Y, et al. Research on function measurement of virtual network[J]. Telecommunications Information, 2020(3): 1-5.
[7] 辛建芳, 朱琦, 梁廣俊, 等. 基于排隊(duì)論的D2D蜂窩異構(gòu)網(wǎng)絡(luò)的性能分析[J]. 信號(hào)處理, 2018, 34(4): 391-399.
XIN J F, ZHU Q, LIANG G J, et al. Performance analysis based on queuing theory for D2D underlaying cellular networks[J]. Journal of Signal Processing, 2018, 34(4): 391-399.
[8] 熊兵, 左明科, 黎維, 等. 面向軟件定義核心網(wǎng)的OpenFlow分組轉(zhuǎn)發(fā)優(yōu)先制排隊(duì)模型研究[J]. 電子學(xué)報(bào), 2019, 47(10): 2040-2049.
XIONG B, ZUO M K, LI W, et al. A prioritized queueing model of OpenFlow packet forwarding in software-defined core networks[J]. Acta Electronica Sinica, 2019, 47(10): 2040-2049.
[9] 李慶華, 陳志剛, 張連明, 等. 基于網(wǎng)絡(luò)演算的無(wú)線自組網(wǎng)QoS性能確定上界研究[J]. 通信學(xué)報(bào), 2008(29): 32-39.
LI Q H, CHEN Z G, ZHANG L M, et al. Deterministic upper bounds on QoS performance about wireless ad hoc network based on network calculus[J]. Journal on Communications, 2008(29): 32-39.
[10] 任雙印. 基于網(wǎng)絡(luò)演算的軟件定義網(wǎng)絡(luò)服務(wù)質(zhì)量研究[D]. 長(zhǎng)沙:國(guó)防科技大學(xué), 2018.
REN S Y. A software defined network QoS research based on network calculus[D]. Chang sha: National University of Defense Technology, 2018.
[11] GEYER F, BONDORF S. DeepTMA: predicting effective contention models for network calculus using graph neural networks[C]//IEEE INFOCOM 2019-IEEE Conference on Computer Communications. Piscataway: IEEE Press, 2019.
[12] XIAO S H, HE D D, GONG Z B. Deep-Q: traffic-driven QoS inference using deep generative network[C]//The 2018 Workshop on Network Meets AI & ML. New York: ACM Press, 2018: 67-73.
[13] GEYER F. DeepComNet: Performance evaluation of network topologies using graph-based deep learning[C]//Proceedings of the 11th EAI International Conference on Performance Evaluation Methodologies and Tools. New York: ACM Press, 2017.
[14] NAKASHIMA M, SIM A, KIM J. Evaluation of deep learning models for network performance prediction for scientific facilities[C]//HPDC'20: The 29th International Symposium on High-Performance Parallel and Distributed Computing. New York: ACM Press, 2020.
[15] SHI ZP, LI J, WU CT. DeepDDoS: online DDoS attack detection[C]//2019 IEEE Global Communications Conference (GLOBECOM). Piscataway: IEEE Press, 2020.
[16] GORI M, MONFARDINI G, SCARSELLI F. A new model for learning in graph domains[C]//IEEE International Joint Conference on Neural Networks. Piscataway: IEEE Press, 2005.
[17] SCARSELLI F, GORI M, TSOI A C, et al. The graph neural network model[J]. IEEE Transactions on Neural Networks, 2009, 20(1):61-80.
[18] XIAN XF, FANG LG, SUN SM. ReGNN: A repeat aware graph neural network for session-based recommendations[J]. IEEE Access, 2020, 8:98518-98525.
[19] RAGESH R, SELLAMANICKAM S, LINGAM V, et al. A graph convolutional network composition framework for semi-supervised classification[EB]. 2020.
[20] WANG ZY, GOMBOLAY M. Learning scheduling policies for multi-robot coordination with graph attention networks[J]. IEEE Robotics and Automation Letters, 2020.5(3): 4509-4516
[21] FAN S, HUANG B, Labeled graph generative adversarial networks[EB]. 2019.
[22] GUO SN, LIN YF, FENG N, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[C]//Proceedings of the AAAI Conference on Artificial Intelligence, Piscataway: IEEE Press, 2019(33): 922-929.
[23] PENG H, WANG HF, DU BW, et al. Spatial temporal incidence dynamic graph neural networks for traffic flow forecasting[J]. Information Sciences, 2020(521): 277-290.
[24] GILMER J, SCHOENHOLZ S S, RILEY P F, et al. Neural message passing for quantum chemistry[C]//Proceedings of the 34th International Conference on Machine Learning. Cambridge: JMLR, 2017(70): 1263-1272.
[25] RUSEK K, JOSé SUáREZ-VARELA, MESTRES A, et al. Unveiling the potential of graph neural networks for network modeling and optimization in SDN[C]//Proceedings of the 2019 ACM Symposium on SDN Research. New York: ACM Press, 2019: 140-151.
[26] BENGIO S, VINYALS O, JAITLY N, et al. Scheduled sampling for sequence prediction with recurrent neural networks[C]// Advances in Neural Information Processing Systems. New York: Curran Associates, Inc., 2015: 1171-1179.
[27] HUANG XH, ZENG M, XIE K. Intelligent traffic control for QoS optimization in hybrid SDNs[J]. Computer Networks, 2021, 189(2): 107877.
[28] CLARK D D, PARTRIDGE C, RAMMING J C, et al. A knowledge plane for the internet[C]//Conference on Applications. New York: ACM Press, 2003: 3-10.
Intelligent prediction method of network performance based on graph neural network
LI Yijiang1, YE Huibiao2, XIE Renhua1, LOU Jiali1, ZHUANG Danna1, LI Chuanhuang1
1. School of Information and Electronic Engineering (Sussex Artificial Intelligence Institute), Zhejiang Gongshang University, Hangzhou 310018, China 2. Zhejiang Branch of China Telecom Co., Ltd., Hangzhou 310020, China
There are some problems in the traditional network performance prediction technology, such as incomplete network state acquisition and poor accuracy of network performance evaluation. Combined with the characteristics of graph neural network learning and reasoning network relational data and the captured global information of the network, on the basis of the current network performance prediction methods, an intelligent prediction method of network performance based on graph neural network was proposed. Aiming at the complex network information, through the research of network system abstraction and network performance modeling, the network information can be transformed into the graph space convolution was used to process the message passing process of graph network nodes to realize the relationship reasoning between network information. The graph neural network model for network performance prediction was studied, and a graph neural network architecture which could deal with traffic matrix, network topology, routing strategy and node configuration was proposed. Finally, the experiments show that the model can better achieve accurate prediction of the network performance including delay, jitter and packet loss rate.
graph neural network, network performance prediction, network modeling, network analysis
TP393
A
10.11959/j.issn.1000?0801.2022062
2021?09?23;
2022?02?05
李傳煌,chuanhuang_li@zjgsu.edu.cn
國(guó)家自然科學(xué)基金資助項(xiàng)目(No.61871468);國(guó)家自然科學(xué)基金國(guó)際合作與交流項(xiàng)目(No.62111540270);浙江省新型網(wǎng)絡(luò)標(biāo)準(zhǔn)與應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室資助項(xiàng)目(No.2013E10012);浙江省重點(diǎn)研發(fā)計(jì)劃基金資助項(xiàng)目(No.2020C01079)
s: The National Natural Science Foundation of China (No.61871468), Projects of International Cooperation and Exchanges NSFC (No. 62111540270), Zhejiang Key Laboratory of Network Standards and Applied Technology (No.2013E10012), Zhejiang Key Research and Development Program (No.2020C01079)
李奕江(1997? ),男,浙江工商大學(xué)信息與電子工程學(xué)院(薩塞克斯人工智能學(xué)院)碩士生,主要研究方向?yàn)樾乱淮W(wǎng)絡(luò)技術(shù)、人工智能應(yīng)用。
葉會(huì)標(biāo)(1973? ),男,中國(guó)電信股份有限公司浙江分公司云網(wǎng)監(jiān)控維護(hù)中心核心網(wǎng)室主任,主要研究方向?yàn)橹袊?guó)電信4G、5G核心網(wǎng)、VoLTE網(wǎng)絡(luò)的運(yùn)營(yíng)管理等。
謝仁華(1997? ),男,浙江工商大學(xué)信息與電子工程學(xué)院(薩塞克斯人工智能學(xué)院)碩士生,主要研究方向?yàn)樾乱淮W(wǎng)絡(luò)技術(shù)、人工智能應(yīng)用。
樓佳麗(1998? ),女,浙江工商大學(xué)信息與電子工程學(xué)院(薩塞克斯人工智能學(xué)院)碩士生,主要研究方向?yàn)樾乱淮W(wǎng)絡(luò)技術(shù)、人工智能應(yīng)用。
莊丹娜(1995? ),女,浙江工商大學(xué)信息與電子工程學(xué)院(薩塞克斯人工智能學(xué)院)碩士生,主要研究方向?yàn)樾乱淮W(wǎng)絡(luò)技術(shù)、人工智能應(yīng)用。
李傳煌(1980? ),男,博士,浙江工商大學(xué)信息與電子工程學(xué)院(薩塞克斯人工智能學(xué)院)教授、碩士生導(dǎo)師,主要研究方向?yàn)檐浖x網(wǎng)絡(luò)、開放可編程網(wǎng)絡(luò)、邊緣計(jì)算、人工智能應(yīng)用。