余艷 張炳 易鳴 中國電信股份有限公司江西分公司無線網(wǎng)絡(luò)優(yōu)化中心 南昌市 330046
關(guān)鍵字:故障自動定位 集約化 市縣環(huán)網(wǎng)
長期以來,傳輸故障工單都是基于告警派發(fā),一線人員收到工單后,需要根據(jù)不同網(wǎng)元、單板、端口上報的告警信息人工分析故障原因和段落。自傳輸故障工單集約化管理后,各廠家網(wǎng)管發(fā)現(xiàn)的告警不再經(jīng)各級監(jiān)控中心轉(zhuǎn)派,而是上報給服保系統(tǒng)直接派到各處理工位,節(jié)省中間轉(zhuǎn)派環(huán)節(jié)時長,將故障處理時間更多的留給一線,但此舉同時弱化了省、市相關(guān)專業(yè)管控條線對市縣、縣縣網(wǎng)絡(luò)中斷故障的管控,長時間沒人搶修、沒有對故障進行應(yīng)急調(diào)度,極易導(dǎo)致環(huán)網(wǎng)節(jié)點脫網(wǎng),嚴重時還會導(dǎo)致整個縣局幾萬甚至上十萬用戶業(yè)務(wù)全部中斷,嚴重影響客戶感知。
為提高故障處理效率,縮短故障判斷時長,江西電信通過2年的迭代創(chuàng)新,開發(fā)出了系統(tǒng)故障自動定位系統(tǒng),可同步監(jiān)控不同廠家設(shè)備類型的網(wǎng)絡(luò)故障,及時督促地市及時搶修,有計劃的對其進行應(yīng)急調(diào)度,確保市縣節(jié)點不脫網(wǎng),進一步打造高質(zhì)量的網(wǎng)絡(luò),提升客戶服務(wù)能力和水平,助力企業(yè)高質(zhì)量跨越式發(fā)展。
因省內(nèi)使用的傳輸設(shè)備和網(wǎng)管涵蓋不同廠商設(shè)備,需在第三方網(wǎng)管上實時采集廠商網(wǎng)管的告警數(shù)據(jù)并加以分析,從而實現(xiàn)故障的自動定位。整個系統(tǒng)架構(gòu)包括:廠家網(wǎng)管、采集控制層、數(shù)據(jù)適配層、綜合網(wǎng)管數(shù)據(jù)中心。
(1)廠家網(wǎng)管:華為、中興、烽火等廠家網(wǎng)管。
(2)采集控制層:通過接口對各廠家網(wǎng)管或者其他外部系統(tǒng)接入的配置、告警、性能、消息、日志、操作指令等數(shù)據(jù)進行采集。
(3)數(shù)據(jù)適配層:由于各廠家的數(shù)據(jù)格式不一樣,需要根據(jù)采集同步到數(shù)據(jù)進行適配整合成傳輸綜合網(wǎng)管系統(tǒng)能識別的數(shù)據(jù)格式。
(4)綜合網(wǎng)管數(shù)據(jù)中心:對適配后的數(shù)據(jù)進行故障分析,將故障結(jié)果按照模板展示出來并通過短信平臺發(fā)送出去。
圖1 系統(tǒng)架構(gòu)模型圖
本系統(tǒng)主要通過對網(wǎng)管基礎(chǔ)數(shù)據(jù)采集適配,實現(xiàn)了基礎(chǔ)數(shù)據(jù)的還原,根據(jù)采集同步到的告警信息進行自動判斷和定位。
各廠商網(wǎng)管與綜合網(wǎng)管之間的接口采取了集團規(guī)范的I2接口,I2接口相比對corba接口增加了南向的內(nèi)容,但同時也簡化了corba接口的部分北向內(nèi)容,因此需要由傳輸綜合網(wǎng)管配置適配程序?qū)ν降降呐渲脭?shù)據(jù)進行適配轉(zhuǎn)換,形成傳輸系統(tǒng)的資源格式。
圖2 基礎(chǔ)數(shù)據(jù)還原流程圖
(1)對鏈型組網(wǎng)和環(huán)形組網(wǎng)的OTN網(wǎng)絡(luò),傳輸綜合網(wǎng)管通過I2接口查詢廠家網(wǎng)管拓撲子網(wǎng)、OMS通道,OTS通道信息,并分別還原出傳輸OTN環(huán)網(wǎng)、傳輸復(fù)用段、傳輸系統(tǒng)段等內(nèi)容。
圖3 還原出的OTN環(huán)網(wǎng)圖
(2)對鏈形、相交環(huán)、相切環(huán)、疊加環(huán)、環(huán)帶鏈等各種復(fù)雜組網(wǎng)方式的SDH網(wǎng)絡(luò),通過查詢廠家網(wǎng)管的所有光纖連接信息、纖纜連接的A端和Z端端口、保護組保護關(guān)系(工作端口和保護端口),保存在傳輸綜合網(wǎng)管數(shù)據(jù)庫中,形成一個自有的資源池,在資源池的基礎(chǔ)上制定判斷邏輯進行反復(fù)搜尋和判斷。
圖4 還原出的SDH環(huán)網(wǎng)圖
通過以上邏輯和方法判斷形成的傳輸環(huán)網(wǎng)、復(fù)用段、系統(tǒng)段數(shù)據(jù),增量更新資源池平臺,并將還原出的傳輸環(huán)網(wǎng)與專業(yè)網(wǎng)管的網(wǎng)元、拓撲連接形成關(guān)聯(lián)數(shù)據(jù),用于傳輸環(huán)網(wǎng)故障定位分析。
基于還原出來的OTN、SDH傳輸環(huán)網(wǎng)、復(fù)用段、系統(tǒng)段數(shù)據(jù),制定了故障定位總體流程,并對故障告警定位判斷規(guī)則進行了分類細化。
(1)故障定位分析總體流程如下:
圖5 故障定位分析總體流程
(2)故障告警定位判斷規(guī)則如下:
當(dāng)系統(tǒng)出現(xiàn)中斷類的告警時,按照以下規(guī)則進行分析:
圖6 復(fù)用段示意圖
分析的中斷類告警對象:OSC信號丟失,輸入合路信號丟失,光線路信號丟失。
判斷規(guī)則:
I:OSC信號丟失出現(xiàn)的段落為故障段落。
II:非OSC信號丟失的告警,互收告警的段落為故障段落,如A收B,且B收A。
III:非OSC信號丟失的告警,最靠近發(fā)端的段落為故障段落。
實現(xiàn)方式:首先,判斷是否是中斷類告警,若是,執(zhí)行規(guī)則I,輸出故障段落;若不是OSC信號丟失,執(zhí)行規(guī)則II,再判斷,是否輸入故障段落;若未執(zhí)行規(guī)則一和規(guī)則二,則執(zhí)行規(guī)則三,對規(guī)則三的執(zhí)行需要每次都進行追溯,直至找到最終段落。
(1)2019年在江西電信全省傳輸網(wǎng)絡(luò)實施,目前主要用于市-縣、縣-縣的傳輸故障及段落自動定位。2019年全省市縣環(huán)網(wǎng)節(jié)點0脫網(wǎng)。實時中斷情況及段落提示如下:
圖7 綜合網(wǎng)管故障定位結(jié)果圖
(2)C3環(huán)網(wǎng)中斷光纜故障時間達到考核要求,通過2019年10-12月數(shù)據(jù)分析發(fā)現(xiàn),在創(chuàng)新C3傳輸環(huán)網(wǎng)故障快速定位手段后,C3光纜中斷修復(fù)時長平均為311分鐘,低于360分鐘的考核修復(fù)時長。
圖8 故障自動定位后修復(fù)時長對比圖
我們將傳輸專業(yè)的基礎(chǔ)數(shù)據(jù)還原方法推廣到OLT雙上聯(lián)隱患排查行動中,助力企業(yè)2019年兩千戶OLT全部完成雙上行隱患改造、千戶OLT雙上行隱患改造完成率達99.62%,順利完成中國電信集團的考核指標(biāo)。
圖9 OLT雙上聯(lián)整治率圖
江西電信為推進傳輸集約化維護,基于傳輸綜合網(wǎng)管開發(fā)了故障自動定位系統(tǒng),首次實現(xiàn)了跨廠家故障的統(tǒng)一智能分析和快速定位,有效的指導(dǎo)一線精準(zhǔn)維護,進一步提高了傳輸基礎(chǔ)網(wǎng)絡(luò)的健壯性,更好的為客戶提供高質(zhì)量的服務(wù)。