蔡超,袁林,張錫娜
(1.中訊郵電咨詢設計院有限公司,河南 鄭州450007;2.中國聯(lián)合網(wǎng)絡通信有限公司重慶市分公司,重慶400042)
運營技術廣角
集約化寬帶服務智能運維體系構建方法
蔡超1,袁林2,張錫娜2
(1.中訊郵電咨詢設計院有限公司,河南 鄭州450007;2.中國聯(lián)合網(wǎng)絡通信有限公司重慶市分公司,重慶400042)
隨著寬帶提速戰(zhàn)略的推行和IPTV/OTT等視頻類流媒體業(yè)務的迅速發(fā)展,用戶對運營商網(wǎng)絡服務體驗的要求不斷提升,現(xiàn)有分層、分段、缺乏關聯(lián)的運維體系和方法已不能滿足新形勢下的網(wǎng)絡運維工作需求。以流媒體業(yè)務為聚焦點,提出一套在寬帶IP網(wǎng)內(nèi)基于“端到端網(wǎng)絡質(zhì)量監(jiān)控”和“故障自診斷功能”構建集約化寬帶服務智能運維體系的方法,以期對運營商網(wǎng)絡運維工作的效率及智能化水平的提升有所助益。
寬帶網(wǎng)絡;質(zhì)量監(jiān)控;故障自診斷;智能運維
從電信運營商角度著眼,隨著國家“寬帶提速”戰(zhàn)略的實施和網(wǎng)內(nèi)視頻流媒體應用流量的快速增長,接入速率的提高和業(yè)務體驗的提升是未來寬帶業(yè)務發(fā)展的必然趨勢。隨著“光進銅退,光纖接入”的規(guī)模部署和CDN等關鍵技術的規(guī)模應用,寬帶用戶的互聯(lián)網(wǎng)使用行為隨之發(fā)生改變——視頻類流媒體業(yè)務興起,并迅速成為固定互聯(lián)網(wǎng)及移動互聯(lián)網(wǎng)流量最主要的增長點。技術和應用的發(fā)展改變著用戶的網(wǎng)絡期望:由于用戶對視頻類流媒體業(yè)務的質(zhì)量非常敏感,運營商寬帶用戶已不再僅僅關注通斷性故障,轉而更加專注網(wǎng)絡質(zhì)量和業(yè)務體驗,這也給目前的網(wǎng)絡、建設工作帶來嚴峻挑戰(zhàn)和沉重壓力。本文以流媒體業(yè)務為聚焦點,提出一套在寬帶IP網(wǎng)內(nèi)基于“端到端網(wǎng)絡質(zhì)量監(jiān)控”和“故障自診斷功能”構建集約化寬帶服務智能運維體系的方法,以期對運營商網(wǎng)絡運維工作的效率及智能化水平的提升有所助益。
圖1 業(yè)務的端到端網(wǎng)絡體系
2.1 現(xiàn)狀及問題
流量經(jīng)營時代,建立以用戶感知為中心的網(wǎng)絡運維服務體系,從傳統(tǒng)的關注轉發(fā)指標的網(wǎng)絡維護跨越到新型的面向用戶感知的網(wǎng)絡維護,已經(jīng)成為電信運營商的共同訴求。但現(xiàn)網(wǎng)網(wǎng)絡分層建設、分段管理、端到端割裂的運維、建設管理模式無法滿足網(wǎng)絡運維工作的新需求,給運維轉型帶來困擾:無法對網(wǎng)絡運營狀況進行端到端的系統(tǒng)性監(jiān)控和分析;故障定位過程復雜,無法快速獲取用戶業(yè)務及網(wǎng)絡關鍵數(shù)據(jù),排障難度高,排障效率低下;業(yè)務及網(wǎng)絡質(zhì)量劣化無法預警。
此外,現(xiàn)網(wǎng)各類業(yè)務支撐系統(tǒng)及運營支撐系統(tǒng)(各級網(wǎng)管系統(tǒng)、號線系統(tǒng)、計費認證系統(tǒng)、營賬系統(tǒng)、用戶服務系統(tǒng)等)雖然分類較細,細分功能強大,但各系統(tǒng)相對獨立,無法做到資源共享、數(shù)據(jù)互通和系統(tǒng)聯(lián)動,資源利用效率低下。
2.2 主客觀條件
在當前形勢下,運營商謀求構建以用戶感知為中心的集約化寬帶服務智能運維體系,實現(xiàn)運維工作跨越式轉型,具備以下有利條件:
·隨著互聯(lián)網(wǎng)思維的沖擊和專業(yè)間融合,運營商運維、建設各團隊專業(yè)人員全網(wǎng)思路已形成,運維建設團隊較以往更加關注網(wǎng)絡整體、關注業(yè)務體驗、關注用戶維系;
·經(jīng)過十余年的建設和發(fā)展,目前運營商網(wǎng)絡信息化水平大幅度提升,縱向及橫向管理支撐系統(tǒng)較為完善,數(shù)據(jù)采集類目齊全;
· 近年來,大數(shù)據(jù)分析技術從方法、工具到實踐均已實現(xiàn)成熟,數(shù)據(jù)關聯(lián)和數(shù)據(jù)挖掘更易產(chǎn)生質(zhì)變。思想上的轉變和資源、技術上的有利條件使運營商運維管理工作的跨越式轉型成為可能。
2.3 研究目標
充分挖掘現(xiàn)有系統(tǒng)價值、整合各類支撐系統(tǒng)數(shù)據(jù)信息資源,輔以目前能實現(xiàn)的技術條件,實現(xiàn)對網(wǎng)絡“端到端”的業(yè)務質(zhì)量監(jiān)控,并進而構建集約化的寬帶服務智能運維體系,是本研究的目標。
對相關概念及范圍做必要說明如下。
(1)業(yè)務
鑒于視頻類業(yè)務發(fā)展迅猛,而其相較于傳統(tǒng)業(yè)務,業(yè)務承載環(huán)節(jié)更多、鏈條更長、用戶體驗更敏感,因此著重以視頻類流媒體業(yè)務作為關注對象。
(2)端到端網(wǎng)絡
以視頻類流媒體業(yè)務為例,端到端是指用戶網(wǎng)絡→寬帶接入網(wǎng)→寬帶城域網(wǎng)→流媒體業(yè)務平臺全程網(wǎng)絡。傳統(tǒng)寬帶業(yè)務應用類似。業(yè)務的端到端網(wǎng)絡體系如圖1所示。
(3)監(jiān)控
監(jiān)控即監(jiān)測和控制。高效準確的全網(wǎng)常態(tài)化質(zhì)量監(jiān)測和故障定位是基礎,而通過接口與網(wǎng)絡及支撐系統(tǒng)的交互控制能力則使遠程一鍵式排障成為可能。監(jiān)測和控制是構建集約化的寬帶服務智能運維體系的必要手段。
3.1 總體思路
對網(wǎng)絡及業(yè)務質(zhì)量的“端到端”監(jiān)控是構建集約化寬帶服務智能運維體系的前提,其實現(xiàn)基礎則是對業(yè)務網(wǎng)絡及業(yè)務支撐系統(tǒng)的各環(huán)節(jié)進行關鍵數(shù)據(jù)采集。
通過與現(xiàn)網(wǎng)系統(tǒng)打通接口,能夠采集到涵蓋以下3個層面的數(shù)據(jù)信息:網(wǎng)絡 (用戶網(wǎng)絡、接入網(wǎng)絡、IP城域網(wǎng)絡);業(yè)務(寬帶上網(wǎng)、IPTV/OTT視頻業(yè)務等);用戶(簽約套餐、用戶狀態(tài)等)。
通過對采集數(shù)據(jù)的分類管理、邏輯分析、應用呈現(xiàn),即可實現(xiàn)針對具體業(yè)務的端到端網(wǎng)絡質(zhì)量監(jiān)測;并進而能夠根據(jù)分析結果與周邊支撐體系進行互動,實現(xiàn)對網(wǎng)絡和業(yè)務的集約化服務、支撐、管控。各環(huán)節(jié)中,數(shù)據(jù)采集是前提、數(shù)據(jù)管理是基礎、對數(shù)據(jù)的集中分析和邏輯判斷是靈魂,數(shù)據(jù)應用是目的。集約化寬帶服務智能運維體系實現(xiàn)架構如圖2所示。
所需基礎數(shù)據(jù)來源如下。
·運營商網(wǎng)絡側網(wǎng)管系統(tǒng):寬帶接入網(wǎng)網(wǎng)管、IP數(shù)據(jù)網(wǎng)綜合網(wǎng)管、IPTV/OTT平臺側專業(yè)網(wǎng)管。
·用戶網(wǎng)絡側探針系統(tǒng):機頂盒探針、PC客戶端探針。
· 資源管理系統(tǒng):接入網(wǎng)號線系統(tǒng)。
此外,為最終形成集約化的寬帶服務智能運維體系,實現(xiàn)客服側故障預先處理、工單自動派發(fā)、故障快速定位、提升排障效率等目標,還需與以下系統(tǒng)打通接口,形成跨系統(tǒng)交互。
·業(yè)務支持系統(tǒng):包括寬帶認證鑒權系統(tǒng)(AAA)、計費營賬系統(tǒng)、寬帶測速系統(tǒng)。
·客服支撐系統(tǒng):包括客服系統(tǒng)、電子運維系統(tǒng)、工單系統(tǒng)。
對數(shù)據(jù)信息基于應用目的進行邏輯處理是本文研究的核心問題。從形成集約化的“寬帶服務智能運維體系”目標出發(fā),并結合現(xiàn)網(wǎng)運維需求進行分析,體系至少應具備以下兩方面的能力:
· 端到端的常態(tài)化網(wǎng)絡質(zhì)量監(jiān)測能力;
· 基于端到端網(wǎng)絡監(jiān)測體系的故障診斷能力。
3.2 端到端的常態(tài)化網(wǎng)絡質(zhì)量監(jiān)測的實現(xiàn)
端到端的常態(tài)化網(wǎng)絡質(zhì)量監(jiān)控,具體來說即實現(xiàn)“網(wǎng)絡劣化預警”能力,其應具備如下特點:精準定位、事先預警;聚焦網(wǎng)絡、聚焦業(yè)務。常態(tài)化網(wǎng)絡質(zhì)量監(jiān)測由被動監(jiān)測和主動監(jiān)測兩類手段協(xié)同完成。
3.2.1 被動信息采集監(jiān)測
被動監(jiān)測是常態(tài)化網(wǎng)絡質(zhì)量監(jiān)測體系的基礎,是對網(wǎng)絡質(zhì)量變化情況的初步感知。通過對現(xiàn)網(wǎng)網(wǎng)管支撐系統(tǒng)的數(shù)據(jù)采集,可實現(xiàn)對網(wǎng)絡質(zhì)量的靜態(tài)監(jiān)測:通過現(xiàn)網(wǎng)測速系統(tǒng)數(shù)據(jù),結合號線系統(tǒng)信息,對近期測速不達標區(qū)域進行定位和預警,并可通過GIS進行呈現(xiàn);通過現(xiàn)網(wǎng)網(wǎng)管系統(tǒng),從網(wǎng)絡層面對中繼負荷較高區(qū)域進行預警。常態(tài)化網(wǎng)絡質(zhì)量監(jiān)測實現(xiàn)原理(被動監(jiān)測)如圖3所示。
圖3 常態(tài)化網(wǎng)絡質(zhì)量監(jiān)測實現(xiàn)原理(被動監(jiān)測)
3.2.2 前向主動信息采集監(jiān)測
主動監(jiān)測手段是對被動監(jiān)測結果的驗證和補充。主動監(jiān)測在不同場景下有不同的實現(xiàn)手段。
(1)場景一:未部署用戶側探針
圖2 集約化寬帶服務智能運維體系實現(xiàn)架構
主動監(jiān)測以經(jīng)過被動監(jiān)測初步確認的網(wǎng)絡質(zhì)量劣化預警區(qū)域為監(jiān)測目標。對于未部署用戶側探針的用戶,通過主動ping操作獲取網(wǎng)絡各段時延、抖動等信息并進行分析對比;對于無法ping通終端的用戶(原因可能是不在線),對同區(qū)域用戶進行隨機掃描:如在寬帶業(yè)務并發(fā)比50%左右的情況下,若隨機掃描的區(qū)域內(nèi)10個用戶均不在線,則可確認為大面積故障并觸發(fā)預警。如圖4所示,場景一可實現(xiàn)對運營商側網(wǎng)絡的端到端監(jiān)測。
圖4 場景一實現(xiàn)運營商側網(wǎng)絡的端到端監(jiān)測
(2)場景二:用戶側部署PC端軟探針
若用戶側部署有探針系統(tǒng),則可通過主動撥測、循環(huán)上報等方式獲取信息。
主動撥測:由遠端后臺指定策略,由客戶端發(fā)起測試任務并將采集數(shù)據(jù)上報后臺。具體原理如圖5所示。
圖5 用戶側PC探針主動撥測原理
主動循環(huán)上報:探針按照規(guī)定頻率或時間節(jié)點,自動發(fā)起網(wǎng)絡指標測試任務,并將系統(tǒng)上報遠端后臺,具體原理如圖6所示。
圖6 PC探針主動循環(huán)上報原理
如圖7所示,場景二可實現(xiàn)從用戶網(wǎng)絡到運營商網(wǎng)絡的端到端監(jiān)測。
圖7 場景二實現(xiàn)家庭到運營商網(wǎng)絡的端到端監(jiān)測
場景二針對傳統(tǒng)寬帶業(yè)務,檢測采集的網(wǎng)絡指標主要有:以太網(wǎng)吞吐率、以太網(wǎng)分組個數(shù)、IP分組吞吐率、IP分組個數(shù)、平均IP分組大小、分組丟失率、抖動、時延。
(3)場景三:用戶側部署IPTV/OTT TV機頂盒軟探針
場景三與場景二類似,可通過主動撥測、循環(huán)上報等方式獲取信息。
主動撥測:由遠端后臺指定策略,由客戶端發(fā)起測試任務,并將采集數(shù)據(jù)上報后臺。用戶側TV探針主動撥測原理如圖8所示。
圖8 用戶側TV探針主動撥測原理
主動循環(huán)上報:探針按照規(guī)定頻率或時間節(jié)點,自動發(fā)起網(wǎng)絡指標測試任務,并將系統(tǒng)上報遠端后臺,具體原理如圖9所示。
圖9 TV探針主動循環(huán)上報原理
撥測服務器設置:為了實現(xiàn)TV類流媒體業(yè)務端到端的質(zhì)量監(jiān)測,可通過部署撥測服務器,對視頻源和EPG服務器按照既定策略進行撥測,實時了解視頻源質(zhì)量和服務器質(zhì)量,完善網(wǎng)絡探針端到端的監(jiān)測能力。主動撥測應用場景有以下方面:
· 對視頻源進行撥測,監(jiān)測各頻道的節(jié)目質(zhì)量狀況,判斷節(jié)目的可用性;
·對EPG服務器進行撥測,監(jiān)測EPG服務器的性能;·對業(yè)務平臺服務器進行撥測,監(jiān)測用戶認證、EPG
下發(fā)等功能;
·對CDN服務器進行撥測,監(jiān)測服務器性能。
撥測服務器工作流程如下:后臺根據(jù)撥測策略,向撥測服務器發(fā)送撥測指令,撥測服務器向目標服務器發(fā)起撥測,采集節(jié)目性能指標、服務器性能指標等數(shù)據(jù),回送至網(wǎng)絡探針平臺進行分析和展示。針對流媒體業(yè)務的策略撥測原理如圖10所示。
圖10 針對流媒體業(yè)務的策略撥測原理
場景三可實現(xiàn)從用戶到業(yè)務平臺的端到端的網(wǎng)絡質(zhì)量監(jiān)測,如圖11所示。
圖11 場景三實現(xiàn)對業(yè)務的端到端監(jiān)測
場景三針對流媒體視頻TV類業(yè)務,除了前述網(wǎng)絡指標外,還需要采集與業(yè)務相關的網(wǎng)絡參數(shù),主要指標如下。
· 網(wǎng)絡指標:以太網(wǎng)吞吐率、以太網(wǎng)分組個數(shù)、IP層吞吐率、IP分組個數(shù)、平均IP分組大小、分組丟失、抖動、時延。
·IPTV指標:頻道切換時間、DF、MLR、MLT-15、RTP吞吐率、RTP分組個數(shù)、RTP字節(jié)數(shù)、RTP收到分組數(shù)、RTP分組丟失數(shù)、視頻播放時延。
·OTT TV指標:卡屏時長、卡屏次數(shù)、點播時延HLS分片間隔偏離、HLS分片下載時間偏離、HLS亂序分片數(shù)、TCP重傳率、TCP重復率、TCP建立時間、HTTP響應時延、HTTP錯誤碼。
·EPG指標:EPG用戶數(shù)、EPG訪問數(shù)、成功EPG訪問數(shù)、EPG請求成功率、EPG頁面響應時延、EPG頁面下載時延、域名解析時長、頁面大小、返回碼、頁面URL、HTTP請求數(shù)、HTTP響應數(shù)。
3.3 基于端到端網(wǎng)絡監(jiān)測體系的故障診斷及處理
3.3.1 故障診斷流程
全程全網(wǎng)的故障診斷和定位原理概述如下:根據(jù)故障類型抽象多種細分的“原子”故障診斷功能,按照故障診斷場景進行配置組合,并經(jīng)過邏輯判斷流程予以最終確認。一個完整的故障診斷行為的實現(xiàn),是基于多種診斷“原子”功能組合分析的結果,如圖12所示。
圖12 故障自診斷流程
基礎“原子”功能以及解決具體問題的“‘原子’功能組合”可以根據(jù)具體需求進行邏輯流程定義。對一些關鍵的“原子”功能和典型的診斷實例進行描述。
3.3.2 診斷“原子”功能
(1)大面積故障診斷
診斷功能說明:根據(jù)網(wǎng)絡實際情況設定參考門限判斷網(wǎng)絡各層面設備是否中斷、時延是否正常、分組丟失率是否過高、抖動是否偏大,具體方法如下。
· 同步設備告警:設備上報告警信息。
·主動ping測:網(wǎng)管系統(tǒng)定時ping測告警。
·設備性能故障:根據(jù) ping測的時延(如超過 40~60 ms)結合流量(大于或等于85%)判斷設備是否出現(xiàn)性能故障。
· 診斷次數(shù)分析:系統(tǒng)記錄診斷賬號,并關聯(lián)資源鏈路進行分析,如發(fā)現(xiàn)同一設備下的用戶存在多次(需確定閾值)記錄,則將該設備列為疑似故障設備。
(2)接入層設備診斷
診斷功能說明:提供寬帶接入網(wǎng)設備(DSLAM、ONU、OLT)診斷測試功能,給出診斷結論以及故障原因。
通過用戶賬號(用戶身份證號碼)等基本信息條件,實現(xiàn)對DSLAM、ONU、OLT接入設備的診斷測試,測試主要內(nèi)容為設備基本信息,如:設備名稱、設備類型、設備型號、設備板卡、設備端口、小區(qū)名稱、設備生產(chǎn)廠商、設備IP地址、上聯(lián)端口名稱、下聯(lián)端口名稱、設備性能、中繼流量等。
(3)接入線路質(zhì)量診斷
診斷功能說明:對寬帶用戶(ADSL、FTTB、FTTH接入方式)接入線路進行實時診斷測試,給出診斷結論以及故障原因。
通過用戶賬號(用戶身份證號碼)等基本信息,實現(xiàn)對ADSL、FTTB、FTTH寬帶用戶接入線路的診斷測試,測試主要內(nèi)容如下。
·ADSL、FTTB寬帶用戶,測試主要內(nèi)容為:電氣線長、最新使用模板、最新下行MABR、下行平均MABR、下行最大MABR、下行最小MABR、最新上行MABR、上行平均MABR、上行最大MABR、上行最小MABR、最新下行噪聲容限、平均下行噪聲容限、最大下行噪聲容限、最小下行噪聲容限、最新上行噪聲容限、平均上行噪聲容限、最大上行噪聲容限、最小上行噪聲容限、最新下行同步速率、平均下行同步速率、最大下行同步速率、最小下行同步速率、最新上行同步速率、平均上行同步速率、最大上行同步速率、最小上行同步速率、是否與ADSL1同步、穩(wěn)定性、不穩(wěn)定原因、高能噪聲、虛接、廣播噪聲、脈沖噪聲、阻抗不平衡、高頻高能噪聲、下行MABR偏低、上行MABR偏低、同步狀態(tài)、上行可達率、下行可達率、上行實際可達率、下行實際可達率、上行噪聲容限、下行噪聲容限、上行衰減、下行衰減等。
·對于FTTH接入方式的寬帶用戶,測試主要內(nèi)容為:上行光衰、下行光衰、家庭網(wǎng)關(OUN)發(fā)送及接收光功率、OLT發(fā)送及接收光功率等。
(4)IP承載網(wǎng)設備診斷
診斷功能說明:提供IP城域網(wǎng)設備 (接入?yún)R聚交換機、環(huán)網(wǎng)交換機、BRAS、核心路由器)診斷測試功能,給出診斷結論以及故障原因。
通過用戶賬號(用戶身份證號碼)等基本信息條件,實現(xiàn)對接入?yún)R聚交換機、環(huán)網(wǎng)交換機、BRAS、核心路由器設備的診斷測試,測試主要內(nèi)容為:設備基本信息(例如:設備名稱、設備類型、設備生產(chǎn)廠商、設備IP地址、上聯(lián)端口名稱、下聯(lián)端口名稱)、設備配置問題(例如:端口帶寬)、設備狀態(tài)(例如:設備CPU平均利用率、內(nèi)存平均利用率、入口速率、入口利用率、入口分組丟失率、出口速率、出口利用率、出口分組丟失率)等。
(5)承載網(wǎng)質(zhì)量診斷
診斷功能說明:提供對寬帶承載網(wǎng)設備(接入?yún)R聚交換機、環(huán)網(wǎng)交換機、BRAS、核心路由器)實時ping測試功能,給出診斷網(wǎng)絡質(zhì)量測試結論。
通過用戶賬號(用戶身份證號碼)等基本信息條件,實現(xiàn)對接入?yún)R聚交換機、環(huán)網(wǎng)交換機、BRAS、核心路由器)設備的實時ping測試功能,測試顯示結果主要為:分組時延、分組丟失率、時延、抖動等實時信息。
(6)AAA認證診斷
數(shù)據(jù)采集:以寬帶賬號為索引,系統(tǒng)登錄“AAA認證計費系統(tǒng)”,判斷AAA系統(tǒng)登錄可用性,登錄成功查詢:賬號是否存在、賬號開戶時間、賬號套餐、賬號服務帶寬、端口綁定標志、賬號綁定標識、賬號服務可用性、賬號在線狀態(tài)、賬號認證狀態(tài)、賬號最近一次登錄時間、賬號認證失敗原因、賬號黑名單狀態(tài)、次數(shù)。查詢賬號對應設備號、內(nèi)外層VLAN、IP地址、MAC地址判斷賬號對應的賬號BAS設備、DSLAM設備/ONU(亦可從號線系統(tǒng)中獲?。?、用戶IP地址、用戶MAC地址。
判斷邏輯:A賬號是否存在;B賬號是否可用;C賬號是否綁定;D賬號綁定關系是否一致;E最近是否正常;F賬號是否在線;G認證失敗原因;H賬號是否進入黑名單。
(7)用戶賬戶診斷
判斷邏輯:通過調(diào)用營賬、CRM等系統(tǒng),獲取用戶賬務狀態(tài)、用戶賬戶余額等信息并進行分析,判斷是否因資費問題導致服務提供異常。
(8)帶寬配置診斷
數(shù)據(jù)采集:以賬號為索引查詢“營賬系統(tǒng)”中賬號基本信息、開戶帶寬、賬號狀態(tài)(正常、欠停、拆機);查詢AAA系統(tǒng)/BRAS中的用戶配置帶寬、結合提速系統(tǒng)信息進行匹配分析。
判斷邏輯:A是否欠費停機;B是否與AAA系統(tǒng)中賬號信息一致;C賬號狀態(tài)是否一致;D配置帶寬是否一致。
(9)綁定關系診斷
判斷邏輯:通過調(diào)用AAA系統(tǒng)認證日志 (包括認證時間、認證失敗原因、賬號綁定信息)、號線系統(tǒng)(接入設備IP地址、接入設備端口號)、網(wǎng)管系統(tǒng)(BAS的IP地址、BAS的端口)等信息),判斷是否因綁定關系錯誤導致服務提供異常。
(10)終端狀態(tài)診斷
判斷邏輯:在用戶側探針中獲取信息,如客戶端系統(tǒng)是否正常、負荷是否正常、網(wǎng)卡工作是否正常等。
3.3.3 故障診斷實例
基于診斷“原子”功能,列舉部分常見故障的診斷流程邏輯實例。
(1)用戶信息綜合查詢
通過用戶賬號(用戶身份證號碼)等基本信息,匯總以下用戶關聯(lián)信息:
·用戶基本信息:用戶姓名、用戶住址、用戶聯(lián)系方式;
·用戶業(yè)務信息:用戶入網(wǎng)時間、用戶購買產(chǎn)品名稱、產(chǎn)品協(xié)議到期時間、協(xié)議帶寬;
·用戶賬務信息:用戶賬戶余額、是否欠費、付費類型;
·用戶狀態(tài)(AAA):用戶賬號狀態(tài)、用戶綁定信息、用戶是否在線、AAA配置帶寬;
·提速狀態(tài):用戶提速信息,提速狀態(tài);
· 用戶在線狀態(tài):用戶是否在線;
·用戶認證信息:用戶最后一次認證時間、認證結果、最后一次認證失敗原因(跟用戶在線狀態(tài)、端口綁定狀態(tài)、AAA用戶狀態(tài)關聯(lián))。
(2)撥號超時(錯誤678、651)故障定位診斷
撥號超時故障自診斷流程如圖13所示,共涉及3個診斷“原子”功能。
圖13 撥號超時故障自診斷流程
(3)用戶密碼認證錯誤定位診斷
用戶認證故障自診斷流程如圖14所示,共涉及3個診斷“原子”功能。
圖14 用戶認證故障自診斷流程
(4)網(wǎng)速卡頓故障定位診斷
網(wǎng)速卡頓故障自診斷流程如圖15所示。
(5)“頻繁掉線”故障定位診斷
掉線故障自診斷流程如圖16所示。
3.3.4 快速故障處理
在快速故障定位的基礎上,集中的支撐體系平臺可通過系統(tǒng)間接口交互進行集約化快速故障處理,在端到端監(jiān)測基礎上實現(xiàn)故障修復和管控。常用基本排障措施如下:
圖15 網(wǎng)速卡頓故障自診斷流程
圖16 掉線故障自診斷流程
· 設備端口重啟;
· 用戶付費狀態(tài)同步;
· 用戶賬號解綁、下線,重置密碼;
· 簽約帶寬與配置帶寬同步,配置帶寬調(diào)整。
在反向操作過程中,需通過嚴格的網(wǎng)絡安全配置、操作認證流程、分權分域規(guī)則保障各系統(tǒng)和網(wǎng)絡安全。
4.1 IPTV/OTT機頂盒內(nèi)置軟探針部署
網(wǎng)絡探針可以部署在用戶側、網(wǎng)絡側、視頻源側。部署在用戶側的軟探針性能最好,但難度也較大,首先需要適配各個廠商的IPTV/OTT機頂盒,其次還要做到讓用戶無感知的便捷部署。對于用戶側軟探針的部署思路如下:由于現(xiàn)網(wǎng)客戶端機頂盒業(yè)已部署,因此只能考慮采用服務器更新方式為終端機頂盒部署探針。實踐可采用和機頂盒廠商ROM進行版本集成分發(fā),利用升級服務器統(tǒng)一進行版本升級的方式完成機頂盒軟探針快速部署。
4.2 接入端口數(shù)據(jù)采集指標的完整性保證
由于接入層端口的速率、衰減、噪聲容限等關鍵指標的采集需通過SNMP(simple network management protocol,簡單網(wǎng)管協(xié)議)實現(xiàn)。對于在線用戶可實時采集,若用戶不在線則無法實時獲取數(shù)據(jù)。
可通過以下方法保障接入端口數(shù)據(jù)采集指標的完整性。
· 加大數(shù)據(jù)采集的頻度。經(jīng)實測,若每天對每個用戶輪詢采集8次,則當月覆蓋用戶率可以達到97%以上。
· 提升號線系統(tǒng)中賬號與設備、端口的對應關系準確性,以確保賬號能對應上相應的端口數(shù)據(jù)。
4.3 大數(shù)據(jù)應用分析的引入
端到端、多系統(tǒng)、實時、輪詢、迭代的數(shù)據(jù)采集使各項功能的實現(xiàn)更加準確,也使后續(xù)的功能擴展成為可能。面對長期積累下來的海量數(shù)據(jù),利用大數(shù)據(jù)手段,對數(shù)據(jù)進行合理的歸類、迭代、去冗,實現(xiàn)對網(wǎng)絡、業(yè)務、用戶3個層面的數(shù)據(jù)統(tǒng)計分析成為必然選擇。
在實際應用中,大數(shù)據(jù)分析結合GIS(地理信息系統(tǒng))信息,可以通過表格、圖形等多種方式呈現(xiàn)全網(wǎng)、分區(qū)域、分小區(qū)、分客戶類型的多維度的網(wǎng)絡業(yè)務質(zhì)量情況,支撐運維、建設、市場等工作。
在互聯(lián)網(wǎng)業(yè)務應用和技術發(fā)展的大背景下,運營商網(wǎng)絡智能化被賦予更多的內(nèi)涵和外延,構建“基于業(yè)務的端到端的智能網(wǎng)絡管道”和“基于用戶體驗的智能運維體系”是運營商網(wǎng)絡發(fā)展的必由之路。
以業(yè)務應用體驗為聚焦點,構建“用戶+網(wǎng)絡+應用”三位一體的寬帶智能運維支撐體系,在縱向上覆蓋從業(yè)務平臺到家庭側的端到端網(wǎng)絡,橫向上充分利用各類已部署支撐系統(tǒng),并輔以數(shù)據(jù)建模、PC客戶端軟探針、家庭網(wǎng)關軟探針、終端App等創(chuàng)新手段,實現(xiàn)跨專業(yè)、跨網(wǎng)絡、跨平臺的數(shù)據(jù)共享、整合及聯(lián)動。這對電信運營商來說既是從流程、組織到技術手段上的有益創(chuàng)新,也是對未來網(wǎng)絡智能化運營的積極探索。
基于該研究成果的寬帶服務智能運維系統(tǒng)已在南方某省運營商現(xiàn)網(wǎng)部署并測試應用,實踐證明,該系統(tǒng)能夠切實提升網(wǎng)絡運維工作的效率和智能化水平。在當前寬帶提速及業(yè)務應用快速發(fā)展的背景下,具有現(xiàn)實參考意義。當前研究成果和實踐集中于解決“運維智能化”問題,為更好地聚焦和服務用戶業(yè)務,基于用戶對各類業(yè)務體驗容忍基線的調(diào)研和模擬,采用動態(tài)數(shù)據(jù)建模方法進行“業(yè)務體驗量化評測”將是下一步的研究方向。
[1]吳簡.面向業(yè)務的基于模糊關聯(lián)規(guī)則挖掘的網(wǎng)絡故障診斷[D].成都:電子科技大學,2012. WU J.Service-oriented network fault diagnosis based on fuzzy association rule mining[D].Chengdu:University of Electronic Science and Technology,2012.
[2]馮月霞,樊志強.智能巡檢系統(tǒng)提升網(wǎng)絡運維自動化水平的研究[J].移動通信,2015(14):54-57. FENG Y X,FAN Z Q.Research on automation enhancement of network operation and maintenance based on intelligent inspection system[J].Mobile Communications,2015(14):54-57.
[3]逯利軍,錢培專,凌志輝.IPTV網(wǎng)絡中實現(xiàn)業(yè)務故障診斷定位的方法:CN102710453A[P].2012. LU L J,QIAN P Z,LING Z H.Method for realizing fault diagnosis and location of service in IPTV network: CN102710453A[P].2012.
[4]陳崗.網(wǎng)絡用戶、性能、故障管理系統(tǒng)的設計與實現(xiàn)[D].南京:東南大學,2000. CHEN G.The research and implementation of network user management,performance management and fault management[D]. Nanjing:Southeast University,2000.
[5]苗磊.通信網(wǎng)絡在線診斷與重構分布式性能管理的設計與實現(xiàn)[D].沈陽:東北大學,2001. MIAO L.Design and implementation of communication network on line diagnosis and reconfiguration of distributed performance management[D].Shenyang:Northeastern University,2001.
[6]李彤巖.基于數(shù)據(jù)挖掘的通信網(wǎng)告警相關性分析研究[D].成都:電子科技大學,2010.LI T Y.Researches on data mining based alarm correlationanalysis in communication networks[D].Chengdu:University of Electronic Science and Technology,2010.
Construction of an intelligent maintenance system of intensive broadband service
CAI Chao1,YUAN Lin2,ZHANG Xina2
1.China Information Technology Designing Consulting Institute Co.,Ltd.,Zhengzhou 450007,China 2.Chongqing Branch of China United Network Communication Co.,Ltd.,Chongqing 400042,China
With the spreading of broadband acceleration strategy and the quick development of streaming media such as IPTV/OTT,a higher quality of experience on the services of telecom operators need to be satisfied.The current maintenance system and method is operating on different levels and segments,which is lack of interactive functions and cooperation.Therefore,a new method is required to satisfy the network maintenance work in the new developing environment.A new method was proposed to construct the intelligent maintenance system of the intensive broadband service.With this method,it is able to achieve the end-to-end quality monitoring and automatic self-diagnosis functions.The method will benefit the services of telecom operators and will improve the efficiency and intelligence of telecom operators.
broadband network,quality monitoring,automatic self-diagnosis,intelligent maintenance
TN915
A
10.11959/j.issn.1000-0801.2017016
蔡超(1984-),男,中訊郵電咨詢設計院有限公司工程師,主要從事數(shù)據(jù)網(wǎng)規(guī)劃及設計工作。
袁林(1974-),男,中國聯(lián)合網(wǎng)絡通信有限公司重慶市分公司工程師、維護中心高級經(jīng)理,主要從事IP網(wǎng)及支撐系統(tǒng)維護管理工作。
張錫娜(1989-),女,中國聯(lián)合網(wǎng)絡通信有限公司重慶市分公司工程師,主要從事IP網(wǎng)及支撐系統(tǒng)運維管理工作。
2016-11-13;
2017-01-05