謝海華
(江蘇省廣電有線信息網(wǎng)絡(luò)股份有限公司鹽城分公司,江蘇 鹽城 224001)
有線IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)的建設(shè)與運(yùn)用研究
謝海華
(江蘇省廣電有線信息網(wǎng)絡(luò)股份有限公司鹽城分公司,江蘇 鹽城 224001)
建設(shè)可運(yùn)營(yíng)、可管理的寬帶IP城域網(wǎng)的運(yùn)營(yíng)已成為有線電視運(yùn)營(yíng)商網(wǎng)絡(luò)建設(shè)的重點(diǎn)。文章主要介紹了如何建設(shè)一套可視化的網(wǎng)絡(luò)質(zhì)量監(jiān)控系統(tǒng),來(lái)實(shí)現(xiàn)對(duì)有線IP城域網(wǎng)運(yùn)行質(zhì)量進(jìn)行長(zhǎng)時(shí)間監(jiān)控,并幫助運(yùn)營(yíng)商感知用戶的使用體驗(yàn)、快速實(shí)現(xiàn)故障定位、提升服務(wù)質(zhì)量。
IP城域網(wǎng);可視化;質(zhì)量監(jiān)控;關(guān)鍵業(yè)績(jī)指標(biāo);關(guān)鍵質(zhì)量指標(biāo)
隨著國(guó)家“三網(wǎng)融合”政策的推進(jìn)以及有線網(wǎng)絡(luò)自身發(fā)展的需要,近年來(lái)各級(jí)有線網(wǎng)絡(luò)都先后建成了自己的寬帶城域網(wǎng)并投入了實(shí)際運(yùn)營(yíng),在網(wǎng)的專網(wǎng)用戶、寬帶用戶、互動(dòng)用戶數(shù)量急劇增加,與此同時(shí),用戶的報(bào)修與投訴也有了很大幅度的增長(zhǎng),有線IP城域網(wǎng)絡(luò)的運(yùn)營(yíng)管理面臨前所未有的挑戰(zhàn)[1]。因此,如何使IP網(wǎng)絡(luò)運(yùn)行質(zhì)量直觀化、可視化,如何實(shí)時(shí)監(jiān)控并及時(shí)為有效提升IP網(wǎng)絡(luò)承載的可靠性提供事實(shí)依據(jù),已成為眾多有線網(wǎng)絡(luò)運(yùn)營(yíng)者關(guān)注的焦點(diǎn)。
目前有線IP城域網(wǎng)的維護(hù)工作主要是由各維護(hù)站人員進(jìn)行,而問(wèn)題多發(fā)在接入側(cè),如入戶線或網(wǎng)絡(luò)路由問(wèn)題、用戶反應(yīng)上網(wǎng)慢等,主要的處理方法或是遠(yuǎn)程電話指導(dǎo)用戶操作,或派人現(xiàn)場(chǎng)處理,不僅溝通與時(shí)間成本高、對(duì)現(xiàn)場(chǎng)人員要求高,而且對(duì)接入、承載、出口、不同網(wǎng)段也缺乏快速界定的手段,用戶網(wǎng)絡(luò)恢復(fù)經(jīng)常需要較長(zhǎng)時(shí)間,從而影響用戶使用,導(dǎo)致抱怨頻頻。
目前對(duì)網(wǎng)絡(luò)的有效監(jiān)控和管理更多地集中在從匯聚到出口的網(wǎng)絡(luò),而沒(méi)有端到端的質(zhì)量評(píng)估手段,對(duì)用戶實(shí)際使用體驗(yàn)關(guān)注較少,容易出現(xiàn)匯聚到出口的網(wǎng)絡(luò)很好,但是可能由于應(yīng)用層面的域名系統(tǒng)(Domain Name System,DNS)或超文本傳輸協(xié)議(HyperText Transfer Protocol,HTTP)響應(yīng)慢、網(wǎng)內(nèi)網(wǎng)間時(shí)延大、帶寬利用率低等問(wèn)題導(dǎo)致用戶上網(wǎng)質(zhì)量下降、用戶體驗(yàn)很差。
目前對(duì)網(wǎng)絡(luò)的管理主要通過(guò)網(wǎng)管軟件進(jìn)行,網(wǎng)管軟件主要是對(duì)網(wǎng)絡(luò)的拓?fù)?、告警、配置進(jìn)行管理,更多的關(guān)注是網(wǎng)絡(luò)是否此時(shí)出現(xiàn)異常。對(duì)階段性的指標(biāo),沒(méi)有考量手段,對(duì)網(wǎng)絡(luò)整體的質(zhì)量水平?jīng)]有數(shù)據(jù)進(jìn)行評(píng)定和支撐,無(wú)法對(duì)網(wǎng)絡(luò)層面和應(yīng)用層面質(zhì)量進(jìn)行度量。
許多網(wǎng)絡(luò)問(wèn)題經(jīng)常是在用戶投訴后才得以發(fā)現(xiàn),從而嚴(yán)重影響了廣電網(wǎng)絡(luò)的服務(wù)品質(zhì)。隨著互動(dòng)、流媒體等新業(yè)務(wù)的不斷開展,對(duì)運(yùn)維的要求也更高,特別是流媒體業(yè)務(wù)對(duì)網(wǎng)絡(luò)質(zhì)量的變化非常敏感,這就更需要對(duì)用戶體驗(yàn)、對(duì)網(wǎng)絡(luò)質(zhì)量進(jìn)行長(zhǎng)期實(shí)施監(jiān)控,對(duì)趨勢(shì)發(fā)展進(jìn)行分析、提前預(yù)防問(wèn)題發(fā)生,做到主動(dòng)運(yùn)維。
很多地市以下級(jí)有線IP城域網(wǎng)絡(luò)主要直接面向用戶,與直接面向出口的上級(jí)數(shù)據(jù)網(wǎng)絡(luò)之間由于管理權(quán)限限制,由上而下不透明、無(wú)法及時(shí)把握上級(jí)網(wǎng)絡(luò)設(shè)備及總互聯(lián)網(wǎng)出口的運(yùn)行狀況。許多時(shí)候雖懷疑某些故障與省級(jí)網(wǎng)絡(luò)或出口有關(guān)系,但缺乏相應(yīng)的手段和數(shù)據(jù)支撐[2]。
有線IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)的建設(shè)目標(biāo),是要實(shí)時(shí)、不間斷對(duì)IP城域網(wǎng)網(wǎng)絡(luò)質(zhì)量和互聯(lián)網(wǎng)業(yè)務(wù)質(zhì)量、互動(dòng)電視頁(yè)面服務(wù)質(zhì)量進(jìn)行測(cè)試與評(píng)估,通過(guò)部署在網(wǎng)絡(luò)中的軟件、硬件探針實(shí)時(shí)采集網(wǎng)絡(luò)及業(yè)務(wù)性能數(shù)據(jù),并將網(wǎng)絡(luò)和業(yè)務(wù)性能數(shù)據(jù)和測(cè)試結(jié)果運(yùn)算成相應(yīng)的關(guān)鍵業(yè)績(jī)指標(biāo)(Key Performance Indicator,KPI)和關(guān)鍵質(zhì)量指標(biāo)(Key Quality Indicators,KQI),并以豐富的圖表形式在客戶端展現(xiàn)指標(biāo)的運(yùn)算結(jié)果,便于運(yùn)維人員直觀識(shí)別網(wǎng)絡(luò)性能的劣化、可快速判斷出網(wǎng)絡(luò)故障并為進(jìn)一步的網(wǎng)絡(luò)優(yōu)化與擴(kuò)容提供依據(jù)。
因此,建成后有線IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng),將主要包括以下幾個(gè)功能模塊:(1)網(wǎng)絡(luò)質(zhì)量長(zhǎng)期監(jiān)控。能夠?qū)}城IP城域骨干網(wǎng)絡(luò)的運(yùn)行狀況進(jìn)行實(shí)時(shí)、長(zhǎng)期的監(jiān)控,對(duì)網(wǎng)絡(luò)質(zhì)量(時(shí)延、抖動(dòng)、丟包率)作出準(zhǔn)確的評(píng)估。(2)業(yè)務(wù)質(zhì)量長(zhǎng)期監(jiān)控。能夠?qū)}城IP城域骨干網(wǎng)絡(luò)提供的寬帶和互動(dòng)電視業(yè)務(wù)的質(zhì)量進(jìn)行實(shí)時(shí)、長(zhǎng)期的監(jiān)控,及時(shí)發(fā)現(xiàn)問(wèn)題,為客戶改善業(yè)務(wù)質(zhì)量提供依據(jù)。(3)故障定界。當(dāng)鹽城IP城域骨干網(wǎng)絡(luò)或業(yè)務(wù)出現(xiàn)問(wèn)題時(shí),通過(guò)運(yùn)維軟探針可以做到對(duì)故障進(jìn)行快速定界,方便網(wǎng)絡(luò)運(yùn)維人員定位解決問(wèn)題。(4)圖形化展示。以豐富的圖表形式將采集的網(wǎng)絡(luò)和業(yè)務(wù)性能數(shù)據(jù)和測(cè)試結(jié)果(KPI,KQI)在客戶端展現(xiàn)出來(lái),便于運(yùn)維人員直觀識(shí)別網(wǎng)絡(luò)性能的優(yōu)劣狀態(tài)[3]。
某地市有線IP城域網(wǎng)的核心路由器、交換機(jī)等全部采用華為系列中高端產(chǎn)品,均內(nèi)置網(wǎng)絡(luò)質(zhì)量分析(Network Quality Analyzer,NQA)功能與數(shù)據(jù)外聯(lián)接口,通過(guò)定制開發(fā)的可視化質(zhì)量監(jiān)測(cè)系統(tǒng),可以很方便地完成從S9300交換機(jī)到地市出口路由器間每一段網(wǎng)絡(luò)鏈路質(zhì)量的長(zhǎng)期監(jiān)控與統(tǒng)計(jì)(包括時(shí)延、抖動(dòng)、丟包等指標(biāo))、建立指標(biāo)告警閾值、對(duì)指標(biāo)異常進(jìn)行預(yù)警并呈現(xiàn)出直觀的網(wǎng)絡(luò)質(zhì)量拓?fù)鋱D,網(wǎng)絡(luò)的主動(dòng)運(yùn)維和故障定界。
同時(shí)配套部署內(nèi)置運(yùn)維軟探針(探測(cè)系統(tǒng)客戶端,安裝在用戶電腦或運(yùn)維人員便攜機(jī)上)或外置硬探針(專用探測(cè)硬件+軟件一體機(jī),安裝在各節(jié)點(diǎn)機(jī)房),用來(lái)對(duì)網(wǎng)絡(luò)路徑連通性、對(duì)網(wǎng)絡(luò)質(zhì)量、對(duì)HSI(高速上網(wǎng)業(yè)務(wù))指標(biāo)(如DNS解析時(shí)延、HTTP首包到達(dá)、下載時(shí)延、下載速度等)進(jìn)行檢測(cè)。通過(guò)網(wǎng)絡(luò)層及業(yè)務(wù)層各項(xiàng)指標(biāo)的檢測(cè),實(shí)現(xiàn)對(duì)問(wèn)題進(jìn)行分界分責(zé)、提高故障定位效率。
完成IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)部署的有線IP城域網(wǎng)拓?fù)鋱D及探測(cè)示意如圖1所示,根據(jù)現(xiàn)狀網(wǎng)絡(luò)拓?fù)洌謩e部署內(nèi)置探針(路由器及交換機(jī)啟用NQA)、外置硬探針、內(nèi)置運(yùn)維軟探針。虛線路徑為終端用戶到互聯(lián)網(wǎng)路徑和終端到互動(dòng)電視路徑,可分應(yīng)用層和網(wǎng)絡(luò)層面進(jìn)行質(zhì)量評(píng)估和監(jiān)控。帶箭頭實(shí)線路徑為NQA之間網(wǎng)絡(luò)鏈路路徑,用以對(duì)業(yè)務(wù)承載網(wǎng)絡(luò)進(jìn)行質(zhì)量評(píng)估和監(jiān)控。系統(tǒng)支持對(duì)多種業(yè)務(wù)的監(jiān)測(cè),如上網(wǎng)業(yè)務(wù)、VOIP業(yè)務(wù)、流媒體業(yè)務(wù)(騰訊視頻、愛(ài)奇藝等)、VPN業(yè)務(wù)、互動(dòng)電視業(yè)務(wù)等,可充分滿足日后業(yè)務(wù)發(fā)展需求。只需要網(wǎng)絡(luò)和探針可達(dá),IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)就可通過(guò)帶內(nèi)或帶外方式集中管理各種類型的探針、集中呈現(xiàn)數(shù)據(jù)結(jié)果、下發(fā)管理策略。
利用現(xiàn)有匯聚層到出口側(cè)設(shè)備內(nèi)置的NQA功能與定制的監(jiān)測(cè)系統(tǒng)軟件,IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)能夠集中對(duì)IP網(wǎng)絡(luò)業(yè)務(wù)層面和網(wǎng)絡(luò)層面的質(zhì)量指標(biāo)進(jìn)行長(zhǎng)期監(jiān)控,實(shí)現(xiàn)網(wǎng)絡(luò)路徑的拓?fù)淇梢暋⒕W(wǎng)絡(luò)性能告警可視,清晰掌握匯聚到互聯(lián)網(wǎng)出口每段網(wǎng)絡(luò)質(zhì)量。
網(wǎng)絡(luò)質(zhì)量長(zhǎng)期監(jiān)測(cè)支持端到端性能監(jiān)控,主要測(cè)試指標(biāo)為UDP測(cè)試(包括UDP時(shí)延、UDP抖動(dòng)、UDP丟包率等,主要用于內(nèi)置NQA功能的有線骨干網(wǎng)絡(luò)部分長(zhǎng)期監(jiān)測(cè))、ICMP測(cè)試(平均往返時(shí)延、丟包率等,主要用于沒(méi)有NQA功能的接入側(cè)EPON與ONU等網(wǎng)元部分監(jiān)測(cè),以及不在當(dāng)?shù)毓芾矸秶鷥?nèi)的核心路由器以上部分的監(jiān)測(cè)如出口路由器等),監(jiān)測(cè)結(jié)果可以日、周、月、年為單位,并綜合成KPI性能指標(biāo)并形成波形圖、矩陣圖等,同時(shí)通過(guò)閾值的設(shè)定實(shí)時(shí)反映各項(xiàng)KPI指標(biāo)的越限情況并進(jìn)行告警,達(dá)到質(zhì)量可視、服務(wù)滿足度可視。這樣通過(guò)自下而上的層層匯聚,管理人員便可以直觀了解網(wǎng)絡(luò)和應(yīng)用質(zhì)量,如果發(fā)現(xiàn)問(wèn)題再由上而下進(jìn)行分析。以直觀的波形圖方式展示,供運(yùn)維人員分析。
圖1 IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)部署與探測(cè)流程示意
業(yè)務(wù)質(zhì)量的長(zhǎng)期監(jiān)控主要通過(guò)外置探針完成。在外置探針上,以服務(wù)等級(jí)協(xié)議(Service-Level Agreement,SLA)方式下發(fā)HTTP測(cè)試?yán)龑?duì)用戶使用較多或反映問(wèn)題較多的網(wǎng)站、互動(dòng)電視首頁(yè)等進(jìn)行實(shí)時(shí)的、長(zhǎng)期的監(jiān)測(cè),或同樣以SLA方式下發(fā)Flash視頻測(cè)試?yán)龑?duì)視頻網(wǎng)站進(jìn)行實(shí)時(shí)監(jiān)控,通過(guò)對(duì)比分析不同網(wǎng)站或同一網(wǎng)站不同時(shí)間監(jiān)測(cè)獲得數(shù)據(jù)的對(duì)比、分析,即可快速判斷出終端用戶在上某個(gè)網(wǎng)站或觀看視頻時(shí)的用戶體驗(yàn)效果、發(fā)現(xiàn)網(wǎng)際互聯(lián)的瓶頸所在以便有針對(duì)性地向出口供應(yīng)商提出改善要求等。業(yè)務(wù)質(zhì)量長(zhǎng)期監(jiān)控的測(cè)試指標(biāo)主要包括HTTP測(cè)試指標(biāo)(包括DNS解析時(shí)間、HTTP首包到達(dá)時(shí)間、HTTP文本頁(yè)面下載時(shí)長(zhǎng)、HTTP完整頁(yè)面下載時(shí)長(zhǎng)、HTTP下載速度等)、Flash測(cè)試指標(biāo)(如Flash首包到達(dá)時(shí)間、Flash播放速度與下載速率匹配度等)。
在本項(xiàng)目中,出口側(cè)共部署硬件探針2個(gè),分別監(jiān)測(cè)寬帶業(yè)務(wù)和互動(dòng)電視業(yè)務(wù),均可在應(yīng)用層和網(wǎng)絡(luò)層面進(jìn)行質(zhì)量評(píng)估和長(zhǎng)期監(jiān)控,同時(shí)還可作測(cè)試高速互聯(lián)網(wǎng)訪問(wèn)(High Speed Internet access,HSI)及網(wǎng)絡(luò)質(zhì)量的內(nèi)部參考點(diǎn)、協(xié)助故障定界、定位。
拓?fù)涓婢梢曅Ч鐖D2所示。
圖2 IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)監(jiān)測(cè)效果示意
通過(guò)對(duì)安裝在用戶或運(yùn)維人員電腦中的軟探針、安裝在中心機(jī)房的2個(gè)外置探針以及部分設(shè)備中的內(nèi)置探針NQA配合使用,我們以測(cè)試套的方式下發(fā)測(cè)試?yán)鸬綄?duì)網(wǎng)絡(luò)故障分段定界的作用。互動(dòng)電視業(yè)務(wù)通過(guò)互動(dòng)電視接入側(cè)的運(yùn)維軟探針,進(jìn)行互動(dòng)電視首頁(yè)連接質(zhì)量檢測(cè),掌握用戶訪問(wèn)互動(dòng)電視首頁(yè)連接速度。寬帶接入業(yè)務(wù)與終端通過(guò)在運(yùn)維人員的筆記本或用戶的電腦上安裝運(yùn)維軟探針,可靈活地對(duì)網(wǎng)絡(luò)路徑連通性進(jìn)行檢測(cè),對(duì)網(wǎng)絡(luò)質(zhì)量、HSI高速上網(wǎng)業(yè)務(wù)指標(biāo)等進(jìn)行檢測(cè),并配合故障定界,協(xié)助故障定位。
如當(dāng)用戶投訴訪問(wèn)某個(gè)HTTP資源時(shí)體驗(yàn)很差,首先通過(guò)查看部署在地市路由器出口的硬件探針監(jiān)控看該測(cè)試點(diǎn)的KPI指標(biāo)是否有明顯劣化,若有明顯劣化(比如測(cè)試失敗、完整頁(yè)面下載時(shí)長(zhǎng)過(guò)長(zhǎng)等),則問(wèn)題為地市出口問(wèn)題(可能互聯(lián)帶寬出現(xiàn)資源擁塞所導(dǎo)致)或者地市出口之上的問(wèn)題。若在此點(diǎn)的KPI指標(biāo)沒(méi)有明顯劣化,則在接入層引入運(yùn)維軟探針(安裝在用戶電腦或運(yùn)維人員便攜機(jī)上),對(duì)網(wǎng)絡(luò)路徑連通性進(jìn)行檢測(cè),對(duì)網(wǎng)絡(luò)質(zhì)量、HSI高速上網(wǎng)業(yè)務(wù)進(jìn)行檢測(cè),把軟探針上的測(cè)試指標(biāo)和出口路由器處硬探針的測(cè)試指標(biāo)進(jìn)行對(duì)比,若軟探針的測(cè)試結(jié)果較差,則說(shuō)明是接入層到核心路由器之間的網(wǎng)絡(luò)有問(wèn)題,然后再結(jié)合NQA網(wǎng)絡(luò)分段測(cè)試指標(biāo),最終找到出問(wèn)題的網(wǎng)段。其流程示意圖如圖3所示。
通過(guò)IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)的建設(shè),有線網(wǎng)絡(luò)運(yùn)營(yíng)商可以實(shí)現(xiàn)對(duì)IP網(wǎng)絡(luò)和業(yè)務(wù)端到端可視化運(yùn)維,運(yùn)維人員周期性地收集網(wǎng)絡(luò)性能和業(yè)務(wù)品質(zhì)數(shù)據(jù),可有效支撐IP網(wǎng)絡(luò)評(píng)估優(yōu)化,滿足網(wǎng)絡(luò)運(yùn)維未來(lái)演進(jìn)的需要。通過(guò)對(duì)數(shù)據(jù)的分析,運(yùn)維人員還可將其中的趨勢(shì)內(nèi)容挖掘出來(lái),對(duì)潛在的故障點(diǎn)和薄弱環(huán)節(jié)進(jìn)行預(yù)判斷,使運(yùn)維人員可以提前感知終端用戶的業(yè)務(wù)體驗(yàn)程度,預(yù)先判斷業(yè)務(wù)是否會(huì)發(fā)生劣化,并提前解決由此帶來(lái)的一系列問(wèn)題,從而提高運(yùn)營(yíng)效率,減少終端用戶投訴,提高客戶忠誠(chéng)度,并降低運(yùn)維成本,增強(qiáng)市場(chǎng)的競(jìng)爭(zhēng)力。
圖3 HIS問(wèn)題排查示意
[1] 胡治國(guó),田春岐,杜亮,等.IP網(wǎng)絡(luò)性能測(cè)量研究現(xiàn)狀和進(jìn)展[J].軟件學(xué)報(bào),2017(1):105-134.
[2] 林義勇,盧艷.IP網(wǎng)絡(luò)狀態(tài)參數(shù)可視化與質(zhì)量評(píng)估系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[C].襄陽(yáng):全國(guó)信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議專刊,2016.
[3] 王健.一種IP網(wǎng)絡(luò)鏈路質(zhì)量監(jiān)測(cè)定位的設(shè)計(jì)方案[J].山東通信技術(shù),2014(4):23-25.
Study on construction and application of visual quality monitoring system for CATV’s IP metropolitan area network
Xie Haihua
(Jiangsu Broadcasting Cable Information Network Co., Ltd., Yancheng Branch, Yancheng 224001, China)
The construction of operational and manageable broadband IP metropolitan area network has become the key point of CATV operators’ network construction. This paper introduces how to construct a visual quality monitoring system for CATV’s IP metropolitan area network, to realize the long time monitoring of the network’s running quality, and help the CATV operators to perceive the user experience, rapidly realize the fault location and improve the quality of service.
IP metropolitan area network; visual; quality monitor; key performance indicator; key quality indicators
謝海華(1975— ),男,江蘇濱海人,高級(jí)工程師,碩士;研究方向:計(jì)算機(jī)網(wǎng)絡(luò)技術(shù),數(shù)字電視技術(shù)。