班 瑞 華潤多 李 峙 王 鵬 耿書鵬
1.中訊郵電咨詢設(shè)計院有限公司
2.中國聯(lián)合網(wǎng)絡(luò)通信集團有限公司
3.北京航天航空大學
隨著家庭寬帶和5G業(yè)務(wù)的快速發(fā)展,運營商數(shù)據(jù)網(wǎng)網(wǎng)絡(luò)設(shè)備承載的業(yè)務(wù)流量大大增加。為了保障業(yè)務(wù)的正常發(fā)展,需定期對網(wǎng)絡(luò)設(shè)備進行擴容,增加設(shè)備的處理能力,降低設(shè)備負荷。數(shù)據(jù)網(wǎng)網(wǎng)絡(luò)設(shè)備包括核心路由器和匯聚/接入路由器,其中匯聚/接入路由器雙上聯(lián)至核心路由器,擴容匯聚/接入路由器上聯(lián)鏈路時需保障對端核心路由器下聯(lián)端口滿足擴容需求或按需擴容。由于匯聚/接入路由器下聯(lián)網(wǎng)絡(luò)設(shè)備類型眾多,且下聯(lián)需求多為下聯(lián)網(wǎng)絡(luò)設(shè)備上報所得,不在本文討論范圍,即本文考慮匯聚/接入路由器上聯(lián)需求及核心路由器上聯(lián)、下聯(lián)需求。同時,網(wǎng)絡(luò)設(shè)備包含母卡、子卡和端口,因此擴容方案應(yīng)包含以上內(nèi)容的類型和數(shù)量。
現(xiàn)有板卡擴容方案是通過計算設(shè)備利用率,人工定義擴容閾值,當利用率高于閾值時,進行擴容;通過人工獲取板卡字典庫,根據(jù)專家經(jīng)驗,確定板卡的類型和數(shù)量,擬定擴容方案。利用率計算公式:利用率=流量/網(wǎng)絡(luò)配置帶寬。
現(xiàn)有方案存在如下問題:(1)閾值通過人工方式定義,多為專家經(jīng)驗判定,不夠精確;(2)選取板卡時需使用字典庫,字典庫需要個人通過人工方式定期維護和更新,易存在錯誤及版本老舊問題;(3)選取板卡類型和數(shù)量,強依賴專家經(jīng)驗,各省市擴容時專家經(jīng)驗不一致,部分經(jīng)驗不夠準確。
針對上述問題,提出通過如下方式解決:(1)基于網(wǎng)絡(luò)中全部設(shè)備歷史運行數(shù)據(jù),通過大數(shù)據(jù)分析,計算設(shè)備利用率增長幅度,自動判定閾值,使其更精確;(2)基于網(wǎng)絡(luò)中全部設(shè)備和板卡,通過大數(shù)據(jù)分析其匹配關(guān)系,自動建立板卡字典庫,減少人工維護工作量,并解決因人工失誤導致的字典庫版本錯誤和老舊問題;(3)建立板卡推薦算法,統(tǒng)一全國各省市數(shù)據(jù)網(wǎng)網(wǎng)絡(luò)設(shè)備擴容算法和步驟,自動生成擴容方案,使其準確、通用。
數(shù)據(jù)網(wǎng)網(wǎng)絡(luò)設(shè)備包含兩個層級:匯聚/接入路由器層和核心路由器層,網(wǎng)路組織示意圖如下:一對核心路由器下聯(lián)多個匯聚/接入路由器,口字形上聯(lián)上層網(wǎng)絡(luò)(如圖1所示),或交叉型上聯(lián)上層網(wǎng)絡(luò)(如圖2所示)。匯聚/接入路由器下聯(lián)的多種設(shè)備,定義為下層網(wǎng)絡(luò)。上層網(wǎng)絡(luò)和下層網(wǎng)絡(luò)不在本文討論范疇內(nèi)。
圖1 口字形上聯(lián)
圖2 交叉形上聯(lián)
圖2 基于復制的任務(wù)加速算法的體系結(jié)構(gòu)
總體流程分為如下部分:(1)大數(shù)據(jù)分析擴容閾值;(2)板卡推薦算法實現(xiàn);(3)篩選需要擴容的設(shè)備;(4)自動生成擴容板卡方案。
4.2.1 大數(shù)據(jù)分析擴容閾值
本文目標是擴容“雙高”設(shè)備,即上聯(lián)帶寬利用率以及配置端口利用率均大于閾值的設(shè)備,因此需要確定帶寬利用率以及端口利用率的閾值。通過大數(shù)據(jù)分析全網(wǎng)設(shè)備歷史數(shù)據(jù),逐臺設(shè)備分析其歷史帶寬和端口利用率的變化規(guī)律,最后選取能夠滿足全網(wǎng)設(shè)備的閾值,具體過程如下:
(1)為計算帶寬利用率閾值,對每一臺設(shè)備完成(2)~(4)步驟。
(2)因每個時間周期T都對全網(wǎng)設(shè)備生成擴容方案,可將該設(shè)備每周期T的數(shù)據(jù)作為一個分組,分別計算第i個周期Ti的流量峰值速率,記為MRmax-i。該峰值速率所對應(yīng)時間的小時記為hi。
(3)提取該設(shè)備Ti-1且小時為hi的所有數(shù)據(jù)作為分組,計算該分組的平均流量值,記為MRavg-(i-1)。
(4)定義Ti的流量增長系數(shù)αi=MRmax-i/MRavg-(i-1),對歷史數(shù)據(jù)中所有月份計算完成后,定義該設(shè)備流量增長系數(shù)α=MAX(αi),i=0,1,2…n。
(5)對每臺設(shè)備計算α,取全網(wǎng)設(shè)備最大的α記為αmax。
(6)帶寬利用率閾值a=[100%/αmax*100]%。
上述步驟原理為帶寬利用率Br=最大流量速率Mr/配置帶寬B,即Br=Mr/B,假設(shè)不擴容,即B不變,Br與Mr成正比。因每周期T都會進行擴容,當預測下個周期的利用率低于100%,即可判定該設(shè)備本周期不需要擴容,因此計算歷史每個周期的流量增長系數(shù),當歷史周期數(shù)量足夠,可假定本周期的流量增長系數(shù)不會超過歷史最大值。因Br與Mr成正比,利用率的增長系數(shù)也不會超過流量增長系數(shù)αmax,所以判定設(shè)備不需要擴容的閾值a*αmax應(yīng)小于100%,可得出閾值a的計算公式。
同理,計算端口利用率閾值b,步驟如下:(1)對每一臺設(shè)備完成(2)、(3)步驟;(2)第i個月最后一天的使用端口數(shù)量,記為PUi;(3)定義第i個月的端口增長系數(shù)βi=PUi/PUi-1。定義該設(shè)備端口增長系數(shù)β= MAX(βi),i=0,1,2…n;(4)對每臺設(shè)備計算β,取全網(wǎng)設(shè)備最大的β記為βmax;(5)配置端口利用率閾值b=[100%/βmax*100]%。
4.2.2 板卡推薦算法實現(xiàn)
本文通過擴容板卡解決網(wǎng)絡(luò)設(shè)備利用率過高的問題。因現(xiàn)網(wǎng)板卡型號眾多,需要根據(jù)端口類型,推薦最優(yōu)板卡(含母卡、子卡),生成擴容方案。
(1)建立設(shè)備、板卡關(guān)聯(lián)關(guān)系
基于大數(shù)據(jù)獲取網(wǎng)絡(luò)設(shè)備(核心路由器、匯聚/接入路由器)信息,分析每臺設(shè)備的設(shè)備、母卡包含關(guān)系,每個母卡的母卡、子卡包含關(guān)系,建立數(shù)據(jù)庫,數(shù)據(jù)庫中一條記錄代表一塊子卡或者母卡。其中設(shè)備對母卡是“一對多”關(guān)系,母卡對子卡是“一對多”關(guān)系。建立板卡關(guān)系時,只選擇實際處理業(yè)務(wù)的板卡,包含固定和靈活板卡。
(2)板卡評價體系實現(xiàn)
基于上述數(shù)據(jù)庫,統(tǒng)計出各型號板卡(子卡、母卡)的最新入網(wǎng)年份、板卡密度、板卡記錄條數(shù)、板卡類型,結(jié)合端口數(shù)據(jù)統(tǒng)計出板卡上端口的在線比例。根據(jù)專家經(jīng)驗,評價各維度重要程度,對其打分和加權(quán),計算每個型號的板卡得分。評價體系如表1所示。
表1 板卡評價體系表
總得分S=∑Si*Wi,Si為各維度的得分,Wi為對應(yīng)權(quán)重。
(3)建立板卡推薦庫
對設(shè)備、板卡關(guān)聯(lián)關(guān)系表中的記錄進行評價打分,并按設(shè)備廠家、設(shè)備平臺能力、板卡承載端口類型進行分組,選出每組得分最高的子卡或母卡型號,建立板卡推薦數(shù)據(jù)庫,描述如表2所示。
表2 板卡推薦庫描述表
4.2.3 篩選需要擴容的設(shè)備
(1)“雙高”路由器定義
“雙高”路由器定義為上聯(lián)帶寬利用率>閾值a,配置端口利用率>閾值b的路由器設(shè)備。其中,上聯(lián)帶寬利用率記為Rb;上聯(lián)方向流量速率記為M;上聯(lián)配置端口帶寬記為B;配置端口利用率記為Rp;某類型已使用端口數(shù)量記為Ui,該類型配置的端口數(shù)量記為Mi,該類型端口能力記為Ai。
Rb=M/B;
Rp=∑(Ui*Ai)/∑(Mi*Ai),i∈該設(shè)備端口類型集合;
因此“雙高”路由器定義為Rb>a & Rp>b的路由器。
(2)篩選“雙高”設(shè)備流程
篩選雙高核心、匯聚/接入路由器,主要流程:(1)遍歷所有數(shù)據(jù)網(wǎng)網(wǎng)絡(luò)設(shè)備,對每一臺設(shè)備進行下述操作。(2)獲取該設(shè)備類型,如果是匯聚/接入路由器,則將同局址所有匯聚/接入路由器作為整體;如果是核心路由器,則將該核心路由器所在的一對核心路由器作為整體。(3)對該整體計算上聯(lián)帶寬利用率和端口配置利用率,與閾值a和b比較。(4)判斷是否是雙高設(shè)備,并加入雙高設(shè)備列表。
對下一個設(shè)備進行(2)~(4)步驟,直至所有設(shè)備判斷完畢。
4.2.4 自動生成擴容板卡方案
本文主要針對匯聚/接入路由器以及核心路由器進行擴容,其網(wǎng)絡(luò)組織關(guān)系見上文數(shù)據(jù)網(wǎng)組網(wǎng)結(jié)構(gòu)。
匯聚/接入路由器擴容上聯(lián)鏈路后,需考慮其對端核心路由器能否滿足需求,因此擴容匯聚/接入路由器流程與擴容核心路由器流程不一致,且有先后順序,本文將分別闡述。
(1)匯聚/接入路由器擴容方案
①按照上文“雙高”路由器定義,篩選出“雙高”匯聚/接入路由器列表。
②遍歷該列表,對每一個設(shè)備進行下述流程。
③根據(jù)運維要求,匯聚/接入路由器設(shè)備鏈路不能捆綁,即所有上聯(lián)鏈路端口類型需一致。因此獲取當前設(shè)備現(xiàn)有上聯(lián)鏈路端口類型,作為需擴容的端口類型??赏ㄟ^對端設(shè)備類型為核心路由器,判斷該端口為上聯(lián)端口。
④按照設(shè)備平臺能力、廠家、需擴容端口類型,從上文板卡推薦庫中獲取可擴容板卡序列,因端口可能由子卡承載也可能由母卡直接承載,序列中包含1塊子卡+1塊母卡或1塊直接承載端口的母卡。
⑤序列中只有母卡則擴母卡;序列中為子卡+母卡,則先擴一塊子卡后,根據(jù)該設(shè)備是否有可用空余子槽位,判斷是否需要擴母卡。
⑥根據(jù)不同容災(zāi)方案要求,分為一次至少擴兩塊板卡和一次擴一塊板卡。
⑦擴容1或2個板卡序列后,重新判斷該設(shè)備是否為“雙高”設(shè)備,如是,則繼續(xù)擴容一個板卡序列,至該設(shè)備不是“雙高”設(shè)備。
⑧輸出該匯聚/接入路由器擴容方案。
⑨計算使上聯(lián)帶寬利用率<閾值a和配置端口利用率<閾值b所需擴容的實際端口數(shù)量,并向上取2的整數(shù)倍(因匯聚/接入路由器上聯(lián)一對核心路由器),將該匯聚/接入路由器擴容端口數(shù)量和類型平均加入到其上聯(lián)的一對核心路由器下聯(lián)擴容需求中。
⑩重復以上流程,直到所有雙高匯聚/接入路由器生成擴容方案。
(2)核心路由器擴容方案實現(xiàn)
核心路由器擴容分為因匯聚/接入路由器擴容上聯(lián)帶來的下聯(lián)擴容需求,以及“雙高”核心路由器的上聯(lián)擴容需求,因此核心路由器擴容流程分為兩步,且下聯(lián)需求必須滿足,滿足后端口配置變化,再計算是否是“雙高”核心路由器。
①首先獲取核心路由器下聯(lián)擴容需求,逐個核心路由器對需求匯總處理,則核心路由器的下聯(lián)需求可能包含多種端口類型。
②分別獲取該核心路由器下聯(lián)需求的每一種端口類型和數(shù)量,進行后續(xù)擴容操作。每次按一個端口考慮。
③判斷該核心路由器是否有該類型多余可用端口,數(shù)量是否滿足,計算數(shù)量時需要保證配置端口利用率不能超過閾值b。如不滿足,則需擴容。
④根據(jù)該核心路由器平臺能力、廠家、擴容端口類型,從上文板卡推薦庫中獲取可擴容板卡序列,同匯聚/接入路由器,該序列可能為子卡+母卡或只有母卡。
⑤按照運維要求,核心路由器不涉及容災(zāi)問題,則每次只擴容1塊子卡或母卡。
⑥循環(huán)并依此處理該端口類型中所有端口的數(shù)量需求、該核心路由器所有端口類型的需求、所有核心路由器的需求,直到所有核心路由器下聯(lián)需求被滿足。
至此,匯聚/接入路由器擴容帶來的核心路由器下聯(lián)擴容需求處理完成。
擴容核心路由器上聯(lián)需求與擴容匯聚/接入路由器上聯(lián)需求方法類似,不再贅述。
本文提出的數(shù)據(jù)網(wǎng)自動生成擴容板卡方案,解決了網(wǎng)絡(luò)擴容需求,向網(wǎng)絡(luò)自動化邁進了一步。經(jīng)驗證,本系統(tǒng)適用于現(xiàn)網(wǎng)所有設(shè)備。定期使用本系統(tǒng),可以篩選現(xiàn)網(wǎng)高負荷網(wǎng)絡(luò)設(shè)備,自動生成板卡擴容方案,實現(xiàn)網(wǎng)絡(luò)的快速擴容,降低網(wǎng)絡(luò)負荷,提升業(yè)務(wù)保障。