【摘 要】首先根據(jù)當(dāng)前電信運營商形勢提出問題,然后具體介紹六步法的每個步驟,最后進(jìn)行成效分析。
【關(guān)鍵詞】六步法 告警 監(jiān)控 通信
一、引言
隨著全業(yè)務(wù)牌照的發(fā)放,通信行業(yè)業(yè)內(nèi)競爭加劇,在機(jī)遇與挑戰(zhàn)面前,各大運營商一手抓網(wǎng)絡(luò)建設(shè),一手抓市場經(jīng)營,兩者相輔相成缺一不可。
為適應(yīng)市場需求,運營商的網(wǎng)絡(luò)規(guī)模也在不斷擴(kuò)大,設(shè)備類型與設(shè)備數(shù)量激增。如何有效地對全網(wǎng)設(shè)備進(jìn)行監(jiān)控,并能從海量的設(shè)備告警中準(zhǔn)確、及時、精簡地派單到末端維護(hù)人員,成為了網(wǎng)絡(luò)維護(hù)工作的重中之重。
二、六步法
以浙江省為例,某運營商使用綜合監(jiān)控平臺對全網(wǎng)設(shè)備告警進(jìn)行統(tǒng)一監(jiān)控,日均告警量約為120萬左右,但日均故障工單的派發(fā)量為約3000張,派單比僅為1:400。效率如此之高的原因,是因為從原始告警產(chǎn)生到派發(fā)工單經(jīng)過了六道環(huán)節(jié),每道環(huán)節(jié)均可有效篩選告警,我們稱之為“六步法”。
(一)六步法概述。“六步法”是基于告警處理規(guī)則,并從綜合監(jiān)控平臺收到設(shè)備原始告警開始進(jìn)行的逐步篩選、過濾、優(yōu)化,并最終派發(fā)故障工單的過程。具體步驟如下:1、告警標(biāo)準(zhǔn)化:將各設(shè)備廠商自行定義的告警級別重新梳理,形成告警標(biāo)準(zhǔn)化集合,告警分為1-4級,剔除無效告警,從而大幅減少告警數(shù)量;2、屏蔽工程告警:凡是由于工程引起的網(wǎng)元告警均進(jìn)行工程預(yù)約,由此產(chǎn)生的工程告警將不進(jìn)行監(jiān)控和工單派發(fā);3、告警關(guān)聯(lián):對于同源告警進(jìn)行關(guān)聯(lián),抑制告警呈現(xiàn)與工單派發(fā)數(shù)量;4、優(yōu)化派單規(guī)則:配置故障工單派發(fā)規(guī)則,只對關(guān)注的告警進(jìn)行細(xì)化派單。對1、2級告警全量派單,3、4級告警進(jìn)一步細(xì)化派單規(guī)則,部分3級告警不派單,少量4級告警納入派單;5、派單時延配置:配置告警派單時延,告警歷時超過門限后才進(jìn)行派單。根據(jù)告警的影響制定分等分級響應(yīng)和通知機(jī)制,如低級別告警延長工單受理響應(yīng)時長,高級別告警增加IVR語音通知功能;6、工單壓縮:對派單后的工單進(jìn)行追加合并。
(二)告警標(biāo)準(zhǔn)化。為實現(xiàn)設(shè)備告警的規(guī)范化、標(biāo)準(zhǔn)化,須對原始告警進(jìn)行全量梳理,并根據(jù)告警的相關(guān)屬性、特性重新組合告警的內(nèi)容,并在綜合監(jiān)控平臺上呈現(xiàn)。從原始告警產(chǎn)生到綜合監(jiān)控平臺告警分級呈現(xiàn)。
告警標(biāo)準(zhǔn)化工作在設(shè)備到綜合監(jiān)控平臺側(cè)實現(xiàn)了告警解析標(biāo)準(zhǔn)化(KEY值獲取,實現(xiàn)告警定位)、告警信息標(biāo)準(zhǔn)化(告警標(biāo)題格式、告警正文格式)、告警定義標(biāo)準(zhǔn)化(重定義網(wǎng)管告警級別、對業(yè)務(wù)和設(shè)備的影響等),將各類原始告警進(jìn)行了梳理和歸類,同時結(jié)合運維管理的需要,提出了標(biāo)準(zhǔn)化的要求。另外,根據(jù)告警預(yù)處理的工作要求,對綜合監(jiān)控平臺提出了智能化手段要求,在實現(xiàn)標(biāo)準(zhǔn)化工作的過程中,進(jìn)行了告警關(guān)聯(lián)標(biāo)準(zhǔn)化的定義工作。
(三)屏蔽工程告警。工程告警管理的目的,旨在通過明確各維護(hù)單位的工作職責(zé),規(guī)范操作流程,包括對工程施工的各類信息做到事前及時、準(zhǔn)確的發(fā)布,工程期間對相關(guān)告警進(jìn)行有效的標(biāo)識,事后進(jìn)行統(tǒng)計和分析,以期達(dá)到保障網(wǎng)絡(luò)安全與提高工作效率為目的。
(四)告警關(guān)聯(lián)。網(wǎng)絡(luò)監(jiān)控人員面對移動通信網(wǎng)絡(luò)中產(chǎn)生的大量告警信息,往往很難從中找出故障的真正原因,從而無法快速實施故障修復(fù)和障礙排除。為了更好的解決故障,需要對所接收的告警信息進(jìn)行關(guān)聯(lián)分析和處理,以便準(zhǔn)確、快速地定位故障原因,壓縮派單量,確保監(jiān)控部門、專業(yè)維護(hù)部門執(zhí)行高效,提升故障處理質(zhì)量。
典型案例:以基站為主體的跨專業(yè)告警關(guān)聯(lián):當(dāng)發(fā)生無線基站退服告警時,觸發(fā)跨專業(yè)關(guān)聯(lián)規(guī)則,首先無線內(nèi)告警合并歸類,通過基站所屬機(jī)房查找24小時內(nèi)同一機(jī)房內(nèi)的動力告警,然后通過基站關(guān)聯(lián)的電路查找15分鐘內(nèi)電路A-Z兩端的端口告警,如果有查找動力或者傳輸專業(yè)的告警,則生成跨專業(yè)衍生告警,關(guān)聯(lián)所有相關(guān)無線、傳輸、動力專業(yè)告警,并通過一定的規(guī)則判斷出基站退服的故障產(chǎn)生的根源原因,并派單到根源故障的末端受理班組。
(五)延遲派單。配置告警派單時延,告警歷時超過門限后才進(jìn)行派單。為減少休息時間對一線維護(hù)人員的影響,根據(jù)告警的影響制定分等分級響應(yīng)和通知機(jī)制,如低級別告警延長工單受理響應(yīng)時長,高級別告警增加IVR語音通知功能。配置告警派單時延的另一個重要原因是告警自動恢復(fù)。大量告警在發(fā)生后會在短時間內(nèi)自動恢復(fù),維護(hù)人員無需對這些告警處理。不同專業(yè)告警應(yīng)根據(jù)告警自動恢復(fù)的概率統(tǒng)計制定合理的告警時延,使派單效率達(dá)到最高。
(六)優(yōu)化派單規(guī)則。配置派單規(guī)則,只對關(guān)注的告警進(jìn)行細(xì)化派單。在標(biāo)準(zhǔn)化基礎(chǔ)上對3、4級告警進(jìn)一步細(xì)化派單規(guī)則,部分3級告警不派單,少量4級告警納入派單。
隨著集中化運維工作的推進(jìn),要求告警派單直接派往末端班組。部分設(shè)備由于網(wǎng)絡(luò)不同網(wǎng)絡(luò)層次的管理職責(zé)劃歸到不同維護(hù)對象,可以根據(jù)網(wǎng)元設(shè)備級別、設(shè)備型號、設(shè)備屬性、業(yè)務(wù)類型進(jìn)行派單落地。
派單規(guī)則中,可通過設(shè)備的相關(guān)屬性,進(jìn)行派單細(xì)化,根據(jù)設(shè)備屬性進(jìn)行工單落地區(qū)分,根據(jù)維護(hù)職責(zé)落地到對應(yīng)的維護(hù)班組。如:區(qū)縣信息、傳輸設(shè)備級別、基站類型、光路信息、電路類型、設(shè)備型號等屬性。
(七)工單壓縮。派單后的工單在未報結(jié)前,如果出現(xiàn)同一網(wǎng)元同一告警,則把該告警追加合并到前一張工單中,不再產(chǎn)生新工單。EOMS收到綜合監(jiān)控平臺派發(fā)的多條告警,而這多條告警之間存在事先設(shè)定的相關(guān)關(guān)系時,則EOMS將多條告警合并為1個工單,EOMS系統(tǒng)將除第一條告警外的信息之間追加在工單中,從而減少維護(hù)人員處理工單的工作量,提高故障處理效率業(yè)務(wù)邏輯處理。
三、成效分析
浙江某運營商經(jīng)過近三年的項目推進(jìn),成效已初步呈現(xiàn)。初步驗證了“六步法”有利于提高網(wǎng)絡(luò)品質(zhì),有利于提升管理效率,有利于提高投入產(chǎn)出比”的工作評價標(biāo)準(zhǔn),同時在改革推進(jìn)過程中,我們也更加深刻地認(rèn)識到改革的意義和必要性:(一)能夠更加全面真實地掌握全省網(wǎng)絡(luò)運維情況;(二)能夠全面提升故障管理、資源管理、IT支撐手段管理、代維管理等網(wǎng)絡(luò)管理標(biāo)準(zhǔn)化水平,提高網(wǎng)絡(luò)管理能力;(三)能夠節(jié)省人員,縮短故障處理歷時,發(fā)揮集約化效能,提高工作效率。
參考文獻(xiàn):
[1]移動LABS 《集中化時代的告警處理效率提升》 http://labs.chinamobile.com/mblog/7373_31704 ,2009
[2] 張艷瓊 《綜合監(jiān)控》,《中國新通信》2013年09期,2013
作者簡介:崔斐,男,工程師,項目經(jīng)理,常年從事大型網(wǎng)絡(luò)監(jiān)控系統(tǒng)的建設(shè)管理工作。