陸 震 蔣永西 張正鍇 莊 靜
1.中郵建技術(shù)有限公司;2.南京科通通信工程技術(shù)服務(wù)有限公司
在人工智能的共識下,新世紀的通信運營商深刻認識到在行業(yè)新常態(tài)下面對這樣的新挑戰(zhàn),需要不斷提升業(yè)務(wù)水平和服務(wù)能力,滿足移動互聯(lián)時代快速響應(yīng)和端到端服務(wù)的巨大需求,確保為客戶提供最優(yōu)質(zhì)的服務(wù)體驗。而滿足客戶需求和提供優(yōu)質(zhì)服務(wù)的一個重要前提是將人工智能的思維形態(tài)和維護模式作為現(xiàn)階段通信運營商實現(xiàn)新發(fā)展、獲得新成就的核心引擎。
通信維護,作為整個通信生態(tài)至關(guān)重要的一環(huán),對通信網(wǎng)絡(luò)的正常運營和客戶的使用感知,都有著直接和廣泛的影響。目前,通信設(shè)備維護量巨大,人均維護設(shè)備數(shù)量提升超過50%,而且隨著用戶數(shù)量的增加不斷增多,在基本實現(xiàn)集約增效的前提下,迫切需要深入貫徹人工智能思維,進一步利用智能化工具深度優(yōu)化維護工作,顯著提升客戶感知和業(yè)務(wù)效率,完善通信運營商的集約維護運營體系。
1.1.1 網(wǎng)絡(luò)演進
隨著百兆寬帶、高清ITV及LTE業(yè)務(wù)的部署和發(fā)展,通信網(wǎng)絡(luò)中的設(shè)備種類多樣性越發(fā)顯著,集中化趨勢越來越明顯,設(shè)備的集中化帶來監(jiān)控集約化,分散式交換演變?yōu)镮MS,數(shù)據(jù)專業(yè)扁平化,平臺專業(yè)云化。需要更先進的維護手段才能滿足集中化網(wǎng)絡(luò)。
網(wǎng)絡(luò)集中化后,大量設(shè)備使得現(xiàn)網(wǎng)的復(fù)雜程度和網(wǎng)絡(luò)容量成級數(shù)倍的上升,現(xiàn)網(wǎng)的網(wǎng)絡(luò)管理需要一種更加精細化和智慧化的網(wǎng)絡(luò)監(jiān)控手段。
以某省一家通信運營商為例,日均告警量已達140萬條,需要預(yù)處理的告警5700條,工單2633張,監(jiān)控人員預(yù)處理人員只有33人,人均工作超負荷,預(yù)處理及時率和準確率無法保證,故障告警預(yù)處理人員需掌握不同廠家設(shè)備處理方法,難以深入處理。
這就需要集中監(jiān)控和集約化維護向智慧監(jiān)控轉(zhuǎn)變,傳統(tǒng)的網(wǎng)絡(luò)運維管理方式已經(jīng)無法滿足“面向端到端業(yè)務(wù),面向客戶管理”的業(yè)務(wù)需求。為了建立與全業(yè)務(wù)發(fā)展相適應(yīng)的新運維故障管理體系,網(wǎng)絡(luò)故障管理應(yīng)該從被動的告警監(jiān)控向更智慧的層面上轉(zhuǎn)變。
1.1.2 網(wǎng)絡(luò)監(jiān)控的要求
網(wǎng)絡(luò)集中監(jiān)控以后,省集中監(jiān)控中心不僅是全省網(wǎng)絡(luò)監(jiān)控的第一責(zé)任人,同時也成為全省網(wǎng)絡(luò)安全運行第一責(zé)任人,承擔(dān)全省集中監(jiān)控、網(wǎng)絡(luò)分析、通信保障、客服支撐、設(shè)備資源管理等工作的第一責(zé)任人職責(zé)。在監(jiān)控人員變少,網(wǎng)絡(luò)設(shè)備復(fù)雜的情況下,原有的監(jiān)控模式面臨如下四個挑戰(zhàn):
(1)發(fā)現(xiàn)和分析挑戰(zhàn)。集中化程度高,集約化、跨專業(yè)影響面大,障礙原因復(fù)雜且難以查找,對如何發(fā)現(xiàn)定位障礙提出了新的挑戰(zhàn),所以我們要更智慧地發(fā)現(xiàn)和分析,從網(wǎng)絡(luò)告警監(jiān)控向用戶感知轉(zhuǎn)變:及時發(fā)現(xiàn)、提前預(yù)警、智能預(yù)處理。
(2)人工調(diào)度,個性化多。多家分公司維護人員數(shù)以千計,各分公司網(wǎng)絡(luò)業(yè)務(wù)規(guī)模千差萬別,維護人員業(yè)務(wù)水平參差不齊,造成了人工調(diào)度工單效率低,無法滿足各分公司個性化需求。
(3)設(shè)備管理越來越智能化、集約化后,對故障遠程處理和終結(jié)的要求也越來越高。從現(xiàn)場處理到遠程處理的轉(zhuǎn)變要求故障處理更加智能化,對監(jiān)控人員遠程處理技能相應(yīng)提出了更高的要求。各廠家網(wǎng)管各不同,需要監(jiān)控人員掌握不同廠家設(shè)備處理方法,對監(jiān)控人員要求高,培訓(xùn)時間長。
(4)集中化-集約化-智慧監(jiān)控。網(wǎng)絡(luò)監(jiān)控從集中化到集約化再到智慧監(jiān)控演進的過程中,網(wǎng)絡(luò)越來越復(fù)雜,設(shè)備越來越多,傳統(tǒng)的監(jiān)控模式捉襟見肘,無法適應(yīng)新集約化模式。
工業(yè)4.0人工智能的普及。工業(yè)4.0是德國政府《德國2020高技術(shù)戰(zhàn)略》中所提出的十大未來項目之一。該項目由德國聯(lián)邦教育局及研究部和聯(lián)邦經(jīng)濟技術(shù)部聯(lián)合資助,投資預(yù)計達2億歐元。旨在提升制造業(yè)的智能化水平,建立具有適應(yīng)性、資源效率及基因工程學(xué)的智慧工廠,在商業(yè)流程及價值流程中整合客戶及商業(yè)伙伴。其技術(shù)基礎(chǔ)是網(wǎng)絡(luò)實體系統(tǒng)及物聯(lián)網(wǎng)。人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。
為解決網(wǎng)絡(luò)集中監(jiān)控后出現(xiàn)的種種挑戰(zhàn),需要從智慧監(jiān)控方面入手,一一解決難題。主要分為四個方面:智慧發(fā)現(xiàn)、智慧分析、智慧調(diào)度、智慧處理。
2.1.1 跨專業(yè)群障定位
隨著通信運營商集約化維護的深入推進,部分運營商已實現(xiàn)了網(wǎng)絡(luò)設(shè)備與客戶的省級集中監(jiān)控,以及公眾客戶申告的集中支撐處理。但跨專業(yè)群障一直是集中監(jiān)控后突破的難點,其主要面臨以下困難:涉及面廣、定位滯后、升級規(guī)范亂、業(yè)務(wù)影響大。解決跨專業(yè)定位和升級規(guī)范的問題,對集中監(jiān)控質(zhì)量的提升有著重要意義。
某省運營商通過應(yīng)用群發(fā)障礙綜合定位平臺系統(tǒng)發(fā)現(xiàn)跨專業(yè)障礙,采取全省統(tǒng)一跨專業(yè)障礙升級規(guī)范,解決了長久以來集中監(jiān)控面臨的跨專業(yè)障礙發(fā)現(xiàn)難、升級與交互工作復(fù)雜的問題。群發(fā)障礙綜合定位平臺實現(xiàn)了集中監(jiān)控過程中跨專業(yè)、大面積故障快速定位,增強了智能處理手段,提高了障礙處理效率,實現(xiàn)了以下四大定位:
(1)定位光纜障礙
通過完善光纜資料,補錄光纜兩端設(shè)備端口信息,實現(xiàn)光纜與設(shè)備相關(guān)聯(lián),根據(jù)資源系統(tǒng)的數(shù)據(jù)源生成ONU-OLT的鏈路及OLT-BRAS/SR之間的鏈路與纜段的關(guān)系,根據(jù)告警信息查詢資源可定位到具體光纜。維護人員不用盲目查找原因,迅速定位障礙點,為恢復(fù)障礙贏得寶貴時間。如圖1所示。
圖1 光纜故障與設(shè)備資源關(guān)聯(lián)
(2)定位故障設(shè)備
根據(jù)資源系統(tǒng)的數(shù)據(jù)源生成從ONU到OLT到BRAS/SR的拓撲結(jié)構(gòu),根據(jù)具體的告警信息可定位到具體的設(shè)備及其上下聯(lián)設(shè)備以及具體的鏈路信息。例如BRAS下多個OLT中斷,同時上聯(lián)的同一BRAS端口有告警,則定位到BRAS端口問題。
(3)定位障礙區(qū)域
根據(jù)網(wǎng)元地址、局向信息、光纜信息進行定位。例如多個ONU故障定位到同一條光纜上,或多個DSLAM故障定位到同一條光纜上。
(4)定位群障申告量
將用戶資料與網(wǎng)絡(luò)資源關(guān)聯(lián),群障發(fā)生后,通過調(diào)用資源查詢該群障影響的所有用戶,呈現(xiàn)用戶申告的詳細信息。從而解決用戶申告與群障相關(guān)聯(lián)的難題,強化了對群障影響范圍及申告的掌控。
2.1.2 智能預(yù)警
(1)機房環(huán)境網(wǎng)絡(luò)智能預(yù)警
主要從以下幾個方面實現(xiàn)機房環(huán)境網(wǎng)絡(luò)智能預(yù)警:1)實時發(fā)現(xiàn)機房電壓、溫度異常,強化性能告警監(jiān)控;2)業(yè)務(wù)中斷前及時觸發(fā)網(wǎng)絡(luò)預(yù)警;3)根據(jù)關(guān)聯(lián)影響風(fēng)險的上層業(yè)務(wù)設(shè)備清單自動觸發(fā)預(yù)警;4)依據(jù)設(shè)備類型分類,分析影響范圍,實現(xiàn)從物理底層到應(yīng)用層的全面監(jiān)控。如圖2所示。
圖2 機房環(huán)境智能預(yù)警
(2)光纜群障智能發(fā)現(xiàn)和預(yù)警
主要有以下幾個方面(見圖3):
1)智能關(guān)聯(lián)多專業(yè)的告警信息,及時發(fā)現(xiàn)光纜障礙;2)自動預(yù)警受影響范圍和用戶數(shù),實現(xiàn)網(wǎng)絡(luò)與上層業(yè)務(wù)的故障關(guān)聯(lián);3)預(yù)警存在風(fēng)險的業(yè)務(wù),加強巡視備用線路。
圖3 光纜群障智能分析
資源管理支撐智能監(jiān)控精準定位。包括以下幾個方面:
(1)開發(fā)工具支撐定位異常分析。開發(fā)光纜信息查詢、光纜設(shè)備告警一鍵關(guān)聯(lián)、未歸并光纜關(guān)聯(lián)分析三個小工具,支撐光纜和光路關(guān)聯(lián)場景歸并定位異常分析。
(2)開發(fā)告警定位模擬器支撐定位異常分析。異常定位故障導(dǎo)入案例庫,可調(diào)整告警時間、告警等級、處理時間重新模擬;自動提示不符合預(yù)期定位具體判斷規(guī)則,便于告警定位異常分析。
(3)充分利用資源數(shù)據(jù)優(yōu)化規(guī)則。利用資源數(shù)據(jù)做好告警關(guān)聯(lián)歸并,同一故障告警不遺漏;優(yōu)化規(guī)則,充分利用資源關(guān)聯(lián),實現(xiàn)部分障礙無告警定位,例如板卡故障無告警定位。如圖4所示。
圖4 告警關(guān)聯(lián)歸并
2.3.1 建設(shè)“應(yīng)急保障統(tǒng)一溝通平臺”,提升障礙處理溝通效率
(1)當前問題與解決辦法
當前問題:應(yīng)急保障時多為電話、點對點QQ溝通,溝通效率低。
解決辦法:建設(shè)“應(yīng)急保障統(tǒng)一溝通平臺”。
(2)實現(xiàn)方法
建設(shè)應(yīng)急保障一鍵召集操作場景,嵌入工單系統(tǒng)。
1)通過人員姓名、賬號方式選擇人員,快速新建討論組;2)配置常用維護組人員模板,實現(xiàn)一鍵創(chuàng)建討論組;3)支持應(yīng)急保障期間的總結(jié)文檔、過程記錄等文件留檔;4)實現(xiàn)網(wǎng)絡(luò)故障工單鏈接分享,方便維護人員快速了解故障詳情。如圖5所示。
圖5 應(yīng)急保障統(tǒng)一溝通平臺
2.3.2 利用智慧調(diào)度,實現(xiàn)接入層監(jiān)控的自動化、智能化
(1)工單系統(tǒng)。1)實現(xiàn)接入層工單自動轉(zhuǎn)派、追派、掛起的功能,減輕集中監(jiān)控崗工作量,提升一線人員故障處理效率;2)開發(fā)異常工單管控箱、升級策略等功能,實現(xiàn)對乒乓單的人工管控,并對疑難工單實行自動升級。如圖6所示。
(2)智慧監(jiān)控管理系統(tǒng)。利用系統(tǒng)將集中實現(xiàn)轉(zhuǎn)派、追派、掛起規(guī)則的配置。
圖6 異常工單轉(zhuǎn)人工審核
2.4.1 處理能力集中配置、集中呈現(xiàn),提升障礙處理效率
(1)在工單系統(tǒng)的工單內(nèi)容呈現(xiàn)上,增加“智能預(yù)處理”模塊,包括性能、業(yè)務(wù)、定位、指導(dǎo)四大功能,并提供主動查詢按鈕。
(2)將現(xiàn)有預(yù)處理能力以“原子能力”的方式集中管理與呈現(xiàn)。
(3)模塊界面由“智慧監(jiān)控管理系統(tǒng)”集中實現(xiàn),嵌入工單系統(tǒng)中。
2.4.2 打造集中管理、統(tǒng)一配置的“智慧監(jiān)控管理系統(tǒng)”
(1)新建“智慧監(jiān)控管理系統(tǒng)”,集中配置,統(tǒng)一管理,監(jiān)控日常使用的配置場景集中管理,包括網(wǎng)管配置、告警配置、派單配置、群障配置、預(yù)處理配置等場景。如圖7所示。
(2)與告警系統(tǒng)、工單系統(tǒng)對接,同步現(xiàn)有的配置能力。
(3)采用“互聯(lián)網(wǎng)+”的設(shè)計理念,提升用戶友好性。1)借鑒“淘寶”、“京東”等頁面的設(shè)計思路,打破傳統(tǒng)生產(chǎn)系統(tǒng)的配置模式,引入“互聯(lián)網(wǎng)+”的設(shè)計風(fēng)格;2)關(guān)注用戶體驗:頁面簡潔大方,交互性強,快速配置。
2.4.3 提升配置的靈活性,做到好用、易用
在智慧監(jiān)控管理系統(tǒng)實現(xiàn)靈活配置:配置元素、條件、結(jié)果進行抽象歸類,實現(xiàn)組合配置,增加了配置的靈活性。
圖7 策略配置
通過智慧監(jiān)控,不僅減輕了一線維護人員的工作壓力,而且提升了故障處理效率??鐚I(yè)分析和故障定位,減少了派發(fā)崗位,以及非處理故障崗位的工單量;智慧分析,能減少用戶申告,提升客戶感知度,總體上節(jié)約了維護的人員。