◆馮臻
IP骨干網(wǎng)流量的自動(dòng)化預(yù)測
◆馮臻
(中國通信建設(shè)集團(tuán)設(shè)計(jì)院有限公司第四分公司 河南 450052)
高效可靠的網(wǎng)絡(luò)流量預(yù)測是網(wǎng)絡(luò)規(guī)劃和容量擴(kuò)展的基礎(chǔ)。當(dāng)前互聯(lián)網(wǎng)流量預(yù)測缺少完善的知識(shí)模板,本文介紹了一種基于工程實(shí)踐特征并相對(duì)簡單、可運(yùn)行的預(yù)測模板來滿足IP網(wǎng)絡(luò)規(guī)劃的需要。首先根據(jù)IP骨干網(wǎng)流量的特點(diǎn),通過對(duì)多因子回歸以及函數(shù)自適應(yīng)模板對(duì)流量進(jìn)行研究和預(yù)測。其次以現(xiàn)網(wǎng)實(shí)際參數(shù)的仿真計(jì)算為基礎(chǔ),比較了兩種模板的特點(diǎn)、優(yōu)缺點(diǎn),說明預(yù)測模板選擇和數(shù)據(jù)改善的原理和辦法。最后,在此基礎(chǔ)上提供了能夠符合很多個(gè)時(shí)間序列需要的自動(dòng)化流量預(yù)估體系,在一定程度上優(yōu)化的同時(shí)提高了流量預(yù)測效率。最后,期待了以后該預(yù)測工作的發(fā)展方向和重點(diǎn)。
時(shí)間序列;流量預(yù)測;預(yù)測模型
近幾年,隨著互聯(lián)網(wǎng)應(yīng)用和服務(wù)的爆發(fā)式發(fā)展,作為關(guān)鍵承載網(wǎng)的IP骨干網(wǎng)流量始終保持持續(xù)增長的趨勢。數(shù)據(jù)表明,近兩年運(yùn)營商IP骨干網(wǎng)流量增長率在25%-30%之間,為了滿足頂級(jí)服務(wù)和應(yīng)用的流量承載需求,運(yùn)營商需實(shí)時(shí)監(jiān)控網(wǎng)絡(luò)流量狀態(tài)和鏈路利用率情況,在網(wǎng)絡(luò)規(guī)劃中評(píng)估網(wǎng)絡(luò)負(fù)載現(xiàn)狀和預(yù)測規(guī)劃期內(nèi)流量的增長趨勢和幅度,依據(jù)預(yù)測結(jié)果提出合理的網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化和能力擴(kuò)容建議。所以,對(duì)流量預(yù)測的精準(zhǔn)性在網(wǎng)絡(luò)計(jì)劃工作里起著極其關(guān)鍵的作用。
與傳統(tǒng)電話網(wǎng)絡(luò)不同,IP骨干網(wǎng)流量具備突發(fā)、自相似、長相關(guān)、周期性和混沌的特征,這些特性造成了泊松的傳統(tǒng)流量模板不再適用IP網(wǎng)絡(luò)。所以,近些年行業(yè)內(nèi)提出了一些例如神經(jīng)網(wǎng)絡(luò)的理論模板、模糊的理論模板等基于智能算法的IP網(wǎng)絡(luò)流量預(yù)測理論模板,然而在其實(shí)際應(yīng)用中來看它們?nèi)詿o法滿足要求。所以,在欠缺理想的理論模板的條件下,需要從現(xiàn)網(wǎng)數(shù)據(jù)的研究中,歸納總結(jié)合理的預(yù)測參數(shù)及模型,以補(bǔ)償理論模板中的不足。
首先IP骨干網(wǎng)有著極高的流量聚合特點(diǎn),以某個(gè)城市或省為對(duì)象來說,它的顆粒度高達(dá)數(shù)百Gbit / s甚至數(shù)Tbit / s,在實(shí)際項(xiàng)目中,重點(diǎn)關(guān)心的是鏈路中總流量的總變化范圍。其次,它的規(guī)劃周期普遍以年為單位,例如,對(duì)1年和3年內(nèi)規(guī)劃期內(nèi)預(yù)測總流量。相較于以日為顆粒度進(jìn)行觀察的流量,它的長時(shí)間增加波動(dòng)比短期的突發(fā)幅度要大得多,長時(shí)間的變化過程能夠更好地體現(xiàn)出流量的變化走勢。下圖顯示了短時(shí)間流量(每日流量)和長時(shí)間流量(每月流量)隨時(shí)間的變化趨勢,可以看出,短時(shí)間流量隨時(shí)間變化具有很大的波動(dòng),而長時(shí)間流量則顯示出恒定的增長走勢。
圖1 流量變化圖
在IP骨干網(wǎng)的流量預(yù)測中,雖然缺少理想的理論模板,但還是有很多的項(xiàng)目實(shí)踐經(jīng)驗(yàn)可以用來借鑒、歸納、總結(jié),從而形成預(yù)測模型。
多因子回歸模型是一種把時(shí)間序列趨勢外推和流量變化比率分析相結(jié)合的預(yù)測方法,就是對(duì)時(shí)間序列的長期走勢采用趨勢外推方法進(jìn)行曲線擬合,同時(shí)研究分析和檢查對(duì)流量特點(diǎn)有重大影響的宏觀或微觀原因,來修正和改善通過趨勢外推法獲得的預(yù)測結(jié)果。
因?yàn)橼厔萃馔魄€擬合不能體現(xiàn)流量變化的內(nèi)在原因,所以有必要引入一些與流量變化緊密相關(guān)的影響因素,并將其作為曲線變化的約束條件來修改流量的長時(shí)間趨勢。這些影響因素有寬帶用戶數(shù)量、平均流量速度、平均訪問帶寬和使用類型、用戶行為、內(nèi)容分布、資源策略和區(qū)域經(jīng)濟(jì)狀況等。因?yàn)楹w許多因素,并且每個(gè)因素之間的關(guān)系都很復(fù)雜,所以模板的重點(diǎn)就是對(duì)這些影響因子的選擇。
函數(shù)自適應(yīng)模板不是一般的時(shí)間序列模板,而是將時(shí)間序列預(yù)估問題轉(zhuǎn)換為實(shí)時(shí)和自適應(yīng)曲線練習(xí)的過程。在本文的任務(wù)中,流量是因變量,對(duì)曲線擬合而言,它是趨勢項(xiàng)和季節(jié)性項(xiàng)的總和。該模板具有更多可調(diào)整的參數(shù)和更大的靈活性,但它往往會(huì)發(fā)生多度擬合的問題,在實(shí)踐中,必須采取相關(guān)辦法來最大限度地防止這類問題的出現(xiàn)。
歷史流量趨勢項(xiàng)的研究和解決實(shí)際上可以歸類于選擇變化點(diǎn)并確定流量的增長率問題,就是解決特定變化點(diǎn)上時(shí)間序列的增長率。
當(dāng)前時(shí)間序列普遍伴隨周期變化而出現(xiàn)季節(jié)性變化,例如天、周、月和年,這也稱為周期性變化,這時(shí)候就需要用一個(gè)周期性函數(shù)來表述時(shí)間序列的周期性變化。
大規(guī)模的流量預(yù)測要求包括對(duì)出站流量、IDC流量、城域網(wǎng)流量、國際流量、以及互聯(lián)互通流量等進(jìn)行研究預(yù)測。以出站流量來舉例,除了香港澳門和臺(tái)灣外,我國還有31個(gè)省,同時(shí)流量分為流入和流出兩個(gè)方向;以城域網(wǎng)舉例,我國約有300個(gè)城域網(wǎng),也分為流入和流出兩個(gè)方向。這些預(yù)估對(duì)象結(jié)合起來可以達(dá)到幾百甚至上千個(gè),然而要對(duì)這些流量的時(shí)間序列逐個(gè)進(jìn)行研究預(yù)估,假如全部依賴手工來選擇模板和相應(yīng)的數(shù)據(jù)、調(diào)整數(shù)據(jù),繁重的工作量會(huì)使流量的預(yù)估成為不可能完成的工作。所以,對(duì)于上面的兩種預(yù)測模板,本文將提供一種具有針對(duì)性的自動(dòng)化預(yù)測體系,如圖2所示。
自動(dòng)化預(yù)測體系的預(yù)測過程如下:分別使用兩個(gè)預(yù)測模板對(duì)流量進(jìn)行預(yù)測,并在相同機(jī)密間隔的條件下,選擇殘差平方和的最小或平均絕對(duì)百分比誤差最小的模板用作當(dāng)前流量時(shí)間序列的最終預(yù)測模板;在多因子回歸模型里,就要經(jīng)過多因子相對(duì)關(guān)鍵性研究、數(shù)據(jù)來源可靠性等整體條件選擇最關(guān)鍵的影響因子;自適應(yīng)模板中,關(guān)鍵是在置信區(qū)間一致的條件下選擇 SSE 或 MAPE 最好的預(yù)測模板及數(shù)據(jù)組合;最后使用交叉驗(yàn)證方法來對(duì)預(yù)測的結(jié)果進(jìn)行評(píng)估,此時(shí)把該預(yù)測結(jié)果上報(bào)到流量起點(diǎn),同時(shí)對(duì)后期的流量收集進(jìn)行參數(shù)對(duì)比研究,通過把目標(biāo)區(qū)域網(wǎng)絡(luò)擴(kuò)大和實(shí)際經(jīng)營情況相結(jié)合來研究預(yù)測流量與實(shí)際流量的不同,以此來用作流量預(yù)測后評(píng)估進(jìn)一步改善模板和數(shù)據(jù),最終形成閉環(huán)的流量預(yù)測評(píng)估調(diào)整體制。當(dāng)前該系統(tǒng)主要使用在運(yùn)營商的大型 IP 網(wǎng)絡(luò)里的省際流量、城域網(wǎng)流量、IDC 流量的長時(shí)間預(yù)測里,在一定程度上很大的提升了該網(wǎng)絡(luò)計(jì)劃建設(shè)的質(zhì)量和效率。
圖2 自動(dòng)化預(yù)測體系
與該流量緊密相關(guān)的影響原因有寬帶用戶數(shù)量、流量速度、訪問帶寬和資源方法及經(jīng)濟(jì)進(jìn)步等,若是需要更加準(zhǔn)確的研究,還要把所包含的用戶行為分析、使用類型分析以及內(nèi)容分布等進(jìn)行研究。但是,對(duì)于大顆粒度以及非實(shí)時(shí)流量(例如來自骨干網(wǎng)的出站流量)來說,在工程實(shí)踐里,只需關(guān)注用戶數(shù)量、平均流量速度、平均訪問帶寬和區(qū)域經(jīng)濟(jì)進(jìn)步對(duì)流量的影響即可滿足要求。
當(dāng)利用自適應(yīng)模板來對(duì)IP骨干網(wǎng)進(jìn)行擬合和預(yù)估時(shí),首先就要明確趨勢項(xiàng)和季節(jié)項(xiàng)的數(shù)據(jù),即容量參數(shù)cap(僅對(duì)Logistics 趨勢增長)、變化點(diǎn)數(shù)、變化點(diǎn)權(quán)值參數(shù)cps和季節(jié)性權(quán)重參數(shù)sps。變點(diǎn)的數(shù)量和變點(diǎn)權(quán)值數(shù)據(jù)體現(xiàn)了曲線擬合的速度和靈活性,變點(diǎn)的數(shù)量越多,變點(diǎn)的權(quán)重越大,那么曲線變化速度越快、走勢越靈活,然而擬合太多,風(fēng)險(xiǎn)也就越大,預(yù)估范圍的不確定就越大;季節(jié)權(quán)重?cái)?shù)據(jù)ps體現(xiàn)了季節(jié)成分的靈活性,值越大,那么它的變化就越快也會(huì)愈發(fā)明顯。
伴隨各類新應(yīng)用和業(yè)務(wù)的持續(xù)出現(xiàn),IP骨干網(wǎng)的成長和范圍依然有著不確定性,這將給流量預(yù)測以及網(wǎng)絡(luò)設(shè)計(jì)優(yōu)化帶來更大的困難和挑戰(zhàn),尤其是網(wǎng)絡(luò)流量的趨勢研究以及預(yù)測需求將變得更加緊迫。怎樣把它與現(xiàn)有的預(yù)測模板中的長處進(jìn)行結(jié)合,同時(shí)開發(fā)新的預(yù)測辦法來對(duì)它的走向和出現(xiàn)的問題進(jìn)行解決,這會(huì)是以后流量預(yù)測工作的關(guān)鍵。
[1]韋烜,阮科,黃曉瑩,陳迅,黃燦燦.IP骨干網(wǎng)流量的自動(dòng)化預(yù)測[J].電信科學(xué),2020,36(08):175-183.
[2]張大偉,郭寧,鄒昕威.骨干網(wǎng)流量檢測中的DNS分析與實(shí)現(xiàn)[J].電腦編程技巧與維護(hù),2018(05):103-105+108.
[3]魯義軒.中興通訊創(chuàng)新核心路由器“兩招鮮” 骨干網(wǎng)流量優(yōu)化更智能[J].通信世界,2018(09):44-45.
[4]何曉明,邢亮,盧泉,鄒潔.SDN在ChinaNet骨干網(wǎng)流量優(yōu)化的應(yīng)用實(shí)踐[J].移動(dòng)通信,2018,42(02):59-64.
[5]羅玲,殷保群,曹杰.基于sketch數(shù)據(jù)結(jié)構(gòu)與正則性分布的骨干網(wǎng)流量異常分析與識(shí)別[J].系統(tǒng)科學(xué)與數(shù)學(xué),2015,35(01):1-8.
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2021年8期