蔡林峰 戴斌 王亮 中國電信股份有限公司江西分公司云網(wǎng)支撐事業(yè)部 南昌市 0029
萬宏謀2 中國電信股份有限公司江西分公司云網(wǎng)運(yùn)營部 南昌市 330029
傳統(tǒng)寬帶故障的監(jiān)控定位,基于寬帶PON網(wǎng)管實(shí)現(xiàn),定位最小顆粒是寬帶接入設(shè)備的端口--PON口,但每個(gè)PON口通常接無源分光器OBD 4-8個(gè),每個(gè)OBD可接入4-8個(gè)用戶,即一個(gè)PON口下有16-64個(gè)用戶。其中單個(gè)OBD的故障或OBD的光路故障,在PON口上并不產(chǎn)生告警,網(wǎng)管無法監(jiān)控定位。實(shí)際上,OBD故障(含連接它的主光路)占寬帶片障的比例比較大(約47%),對(duì)客戶感知影響大?;赑ON網(wǎng)管監(jiān)控的寬帶故障定位,顆粒大,在以3個(gè)用戶寬帶同源故障即為片障的監(jiān)測方面,存在較多的遺漏。
通過對(duì)所有單個(gè)寬帶、ITV用戶的申告信息的實(shí)時(shí)AI分析處理,實(shí)現(xiàn)OBD顆粒級(jí)別的故障主動(dòng)發(fā)現(xiàn),要求實(shí)現(xiàn)寬帶故障主動(dòng)發(fā)現(xiàn)精度達(dá)到3個(gè)用戶的級(jí)別。步驟如下:
采用對(duì)所有單個(gè)光寬帶ONU(光貓)的掉線信息的實(shí)時(shí)數(shù)據(jù)分析處理,實(shí)現(xiàn)了分光器故障主動(dòng)發(fā)現(xiàn),寬帶3個(gè)用戶以上的片障主動(dòng)發(fā)現(xiàn)率提升到了95%。
“片障”,是指影響3個(gè)及以上用戶的網(wǎng)絡(luò)故障,因?yàn)轭w粒細(xì),數(shù)量龐大(每月150萬次)。其中有源故障部分(PON口及以上部分),系統(tǒng)通過將PON網(wǎng)管、IP網(wǎng)管告警信息與資源系統(tǒng)用戶信息關(guān)聯(lián),可實(shí)時(shí)分析設(shè)備告警影響的用戶情況,生成用戶片障單,進(jìn)行故障管控處理。
對(duì)于寬帶無源部分(PON口以下)的二級(jí)分光故障,通過ONU狀態(tài)關(guān)聯(lián)分析,對(duì)同時(shí)超3個(gè)用戶ONU斷纖、PON口無用戶在線、PON口下不在線用戶超閾值、PON口下同時(shí)申告用戶超閾值進(jìn)行分析及片障發(fā)現(xiàn),實(shí)現(xiàn)對(duì)寬帶片障影響的用戶、關(guān)聯(lián)的申告用戶、未關(guān)聯(lián)寬帶片障的潛在申告用戶進(jìn)行監(jiān)控,主動(dòng)處理故障。如圖1所示。
圖1 無源片障分析流程
實(shí)現(xiàn)原理:①系統(tǒng)實(shí)時(shí)監(jiān)控處理PON網(wǎng)管中所有ONU離線告警數(shù)據(jù),在排除PON設(shè)備、板卡級(jí)別的情形、排除PON口告警的情形(主光路中斷);②對(duì)剩余的掉線ONU進(jìn)行大數(shù)據(jù)實(shí)時(shí)聚類:是否在同一個(gè)二級(jí)分光器內(nèi),有3個(gè)ONU同時(shí)斷線。如是,查詢?cè)摱?jí)分光器下ONU在線狀態(tài),如果是斷纖(LOS),則判該二級(jí)分光器光纖斷;③生成告警,并在告警系統(tǒng)中關(guān)聯(lián)資源系統(tǒng)該二級(jí)分OBD ID,派故障單給服保系統(tǒng)進(jìn)行故障處理。系統(tǒng)實(shí)現(xiàn)原理如圖2所示。
圖2 寬帶二級(jí)分光故障數(shù)據(jù)分析處理流程
判定為二級(jí)分光故障后,系統(tǒng)輪詢監(jiān)測AAA平臺(tái)上故障用戶的上線狀態(tài)(是否上網(wǎng)在線),結(jié)合現(xiàn)場修障人員通過APP反饋的修復(fù)狀態(tài),如該二級(jí)分光下的ONU有用戶上線,則認(rèn)為該二級(jí)分光段故障恢復(fù),釋放故障狀態(tài),解除跟蹤。
在隨機(jī)事例中,有一類現(xiàn)象,只產(chǎn)生兩種互斥的結(jié)果,如某種化驗(yàn)結(jié)果的陽性與陰性,接觸某傳染源的感染與未感染等。這種隨機(jī)事件是只具有兩種互斥結(jié)果的離散型隨機(jī)事件,稱為二項(xiàng)分類變量(Dichotomous Variable)的離散型隨機(jī)事件。它的發(fā)生概率,可以由二項(xiàng)分布(Binomial Distribution)對(duì)這類隨機(jī)事件的規(guī)律性進(jìn)行描述。
一般地,如果隨機(jī)變量服從二項(xiàng)分布,n次試驗(yàn)中正好得到k次成功的概率由二項(xiàng)分布計(jì)算公式給出:
寬帶接入網(wǎng)二級(jí)無源分光器的故障狀態(tài),只有兩種隨機(jī)狀態(tài),要么是中斷,要么不中斷。扣除割接、電源故障引起的中斷情況以后,線路中斷、分光器老化引起的故障是隨機(jī)發(fā)生的,因此滿足二項(xiàng)分布。
實(shí)際中OBD上用戶關(guān)聯(lián)(即OBD-ONU關(guān)聯(lián))的準(zhǔn)確率為68%,當(dāng)3個(gè)ONU故障聚類到同一OBD,同時(shí)發(fā)生中斷,則該OBD發(fā)生故障的概率為:
如上所述,根據(jù)同一OBD以下的3個(gè)ONU同時(shí)斷線,則可判定屬于該二級(jí)分光故障的準(zhǔn)確率為96.7%。
將OBD無源片障定義到(10秒-60秒之間均可)一分鐘內(nèi)同PON口下ONU同時(shí)斷纖大于3且PON設(shè)備本身無故障告警,則判斷為二級(jí)分光故障以后。系統(tǒng)調(diào)取網(wǎng)絡(luò)資源系統(tǒng)數(shù)據(jù),建立網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖,進(jìn)行OBD可視化展現(xiàn),便于現(xiàn)場的定位處理,如圖3所示。
圖3 定位到PON以下的二級(jí)分光單元
為提升片障主動(dòng)發(fā)現(xiàn),將智能片障分析的觸發(fā)提前到用戶申告之前,進(jìn)一步開展無源片障主動(dòng)分析工作,通過對(duì)天翼網(wǎng)關(guān)掉線、告警,通過PON口、時(shí)間段等進(jìn)行聚類、觸發(fā)同時(shí)掉線分析,進(jìn)行片障預(yù)警,搶在用戶申告前觸發(fā)片障預(yù)警信息,進(jìn)行申告攔截,發(fā)起主動(dòng)維護(hù)。比申告觸發(fā)的片障分析量提升80%,完整率95%以上。顯著減少了客服10000號(hào)的寬帶、ITV用戶的申告和投訴數(shù)量(全省由每月23.5萬次減少為14.5萬次,下降38%)。
客服系統(tǒng)片障自助攔截量,從每月的2124次,增長每月17529次,增幅達(dá)8.6倍,說明大量寬帶用戶申告時(shí)故障已經(jīng)在處理當(dāng)中,先于用戶發(fā)現(xiàn)故障,大大縮短了業(yè)務(wù)中斷時(shí)長,提升了客戶感知。圖4是寬帶無源故障定位功能上線后的申告攔截量增長情況,圖5是寬帶無源故障主動(dòng)發(fā)現(xiàn)量的占比情況。
圖4 系統(tǒng)月均片障攔截?cái)?shù)量
圖5 無源片障攔截?cái)?shù)量對(duì)比
關(guān)于寬帶的無源故障定位,武漢郵科院提出了一種部署OBD以下的光分支檢測信號(hào),進(jìn)行物理檢測的方法(專利《一種無源光接入網(wǎng)絡(luò)中支路故障定位的裝置和方法》2018年——CN105577458A),這種方法硬件成本高;華為提出一種終端設(shè)備掉電或者正常關(guān)電時(shí),判斷是設(shè)備故障還是線路故障的方法(專利《一種無源光網(wǎng)絡(luò)的故障定位方法及系統(tǒng)》2010年——CN101345581A),這種方式可實(shí)現(xiàn)PON口級(jí)別的故障定位,不能進(jìn)行PON口以下的二級(jí)OBD無源故障定位。本文基于數(shù)據(jù)分析的方法具有成本低、準(zhǔn)確率高的優(yōu)點(diǎn)。