[劉光 郭楊運(yùn) 張尚恩]
關(guān)于提升公眾客戶寬帶業(yè)務(wù)使用體驗(yàn)、增強(qiáng)用戶感知的工作,雖然已在全省范圍的光貓內(nèi)部署了QOE(體驗(yàn)質(zhì)量Quality of Experience,下同)感知探針,每周會(huì)定期撥測(cè)并統(tǒng)計(jì)用戶的網(wǎng)頁、視頻、游戲感知得分,用于在各地市維度、與其他運(yùn)營商維度進(jìn)行比較,但統(tǒng)計(jì)結(jié)果對(duì)于網(wǎng)絡(luò)優(yōu)化不具有針對(duì)性優(yōu)化意見,只是一個(gè)客觀的撥測(cè)結(jié)論,無法直接指導(dǎo)分公司進(jìn)行網(wǎng)絡(luò)優(yōu)化。此外,QOE 探針只有在路由型光modem(俗稱“光貓”)上才能進(jìn)行網(wǎng)頁、視頻、游戲的感知撥測(cè);對(duì)于橋接型光貓,QOE 探針只能進(jìn)行連通性撥測(cè),這大大限制了QOE 探針的使用能力。
現(xiàn)狀中發(fā)現(xiàn)了以下問題。
(1)提升用戶感知體驗(yàn)需求迫切,卻沒有高效的手段迅速定位導(dǎo)致用戶感知體驗(yàn)差的主要原因,無法快速優(yōu)化網(wǎng)絡(luò)。
(2)缺少主動(dòng)維護(hù)手段,更多的是待用戶報(bào)障后進(jìn)行用戶側(cè)網(wǎng)絡(luò)排查。
(3)雖有定期進(jìn)行QOE 撥測(cè),其數(shù)據(jù)價(jià)值未得以充分利用,目前僅停留在撥測(cè)結(jié)果統(tǒng)計(jì)匯總階段。
(4)QOE 撥測(cè)的適用范圍不夠廣,僅能針對(duì)路由型光貓進(jìn)行感知類撥測(cè),橋接型光貓無法獲知用戶感知情況。
(1)以QOE 感知數(shù)據(jù)中質(zhì)差撥測(cè)數(shù)據(jù)為基礎(chǔ),拓展出更多維度。以每周的QOE 撥測(cè)數(shù)據(jù)為基礎(chǔ),定義QOE 撥測(cè)得分低于80 分的為質(zhì)差ONU;基于端到端的分析方式,從質(zhì)差ONU(光網(wǎng)絡(luò)單元,即光MODEM,俗稱光貓)一端向上關(guān)聯(lián),查找質(zhì)差ONU 撥測(cè)時(shí)間點(diǎn)的ONU-OLT 之間鏈路利用率、收發(fā)光衰等情況,再向上關(guān)聯(lián)OLT-MSE(MSE 即多業(yè)務(wù)邊緣路由器)之間鏈路利用率情況、收發(fā)光衰情況、CRC 誤碼情況。
(2)除了上述設(shè)備類的客觀指標(biāo)外,還關(guān)聯(lián)了每周的熱點(diǎn)用戶投訴數(shù)據(jù),增加主動(dòng)申訴的用戶為切入點(diǎn),進(jìn)行關(guān)聯(lián)分析。
(1)終端質(zhì)差率匯總。統(tǒng)計(jì)本周內(nèi)每一款終端型號(hào)的QOE 質(zhì)差測(cè)試記錄數(shù)以及QOE 測(cè)試總數(shù),二者相除可得到每一款終端型號(hào)的質(zhì)差率,然后過濾掉統(tǒng)計(jì)結(jié)果中本周QOE 測(cè)試總數(shù)小于100 的終端(此類終端因測(cè)試樣本較少,質(zhì)差率不夠準(zhǔn)確)。
處理建議:光MODEM 自動(dòng)測(cè)試系統(tǒng)(俗稱“貓墻”)測(cè)試質(zhì)差終端是否確實(shí)存在使用問題,如貓墻測(cè)試無問題,需要QOE 檢查探針是否有問題。排除兩者問題之后,確認(rèn)是終端質(zhì)差問題。
(2)OLT-ONU PON 口出方向擁塞鏈路分析。關(guān)聯(lián)質(zhì)差ONU 測(cè)試記錄發(fā)生時(shí)間對(duì)應(yīng)的OLT PON 口的鏈路出方向流量情況,結(jié)合該鏈路的帶寬,統(tǒng)計(jì)該鏈路的利用率。定義鏈路利用率大于60%為擁塞,統(tǒng)計(jì)本周內(nèi)連接質(zhì)差ONU 的OLT 的PON 口,在QOE 質(zhì)差記錄撥測(cè)時(shí)間時(shí)出流量擁塞鏈路清單。
處理建議:檢查鏈路帶寬利用率,對(duì)超過50%帶寬利用率的進(jìn)行鏈路擴(kuò)容。
(3)OLT-ONU PON 口發(fā)光光衰分析。關(guān)聯(lián)質(zhì)差ONU 測(cè)試記錄發(fā)生時(shí)間對(duì)應(yīng)的OLT PON 口及對(duì)端端口的收發(fā)光功率情況,計(jì)算PON 口收發(fā)光光衰。定義光衰>30 dB 算作光衰較大,統(tǒng)計(jì)本周內(nèi)連接質(zhì)差ONU 的OLT的PON 口,在QOE 質(zhì)差記錄撥測(cè)時(shí)間時(shí)PON 口發(fā)光衰較大清單。
處理建議:檢查鏈路光衰情況,優(yōu)化鏈路光衰。
(4)OLT 質(zhì)差率匯總。統(tǒng)計(jì)本周內(nèi)每一臺(tái)OLT 下掛的ONU 中出現(xiàn)的QOE 質(zhì)差測(cè)試記錄數(shù)以下掛ONU 的所有QOE 測(cè)試總數(shù),可得到每一臺(tái)OLT 的質(zhì)差率,然后過濾掉統(tǒng)計(jì)結(jié)果中本周QOE 測(cè)試總數(shù)小于100 的OLT(此類OLT 因測(cè)試樣本較少,質(zhì)差率不夠準(zhǔn)確)。
處理建議:重點(diǎn)檢查該OLT 本周內(nèi)是否存在如下情況:硬件告警、上聯(lián)鏈路擁塞、上聯(lián)鏈路CRC 大量誤碼增長、上聯(lián)鏈路收光較低。
(5)既是寬帶業(yè)務(wù)抱怨熱點(diǎn)OLT 又是質(zhì)差ONU 集中OLT 匯總。匯總每周的10 000 號(hào)投訴工單,統(tǒng)計(jì)出抱怨集中的OLT,并查找此OLT 是否出現(xiàn)在質(zhì)差OLT 清單中,從而達(dá)到從業(yè)務(wù)和網(wǎng)絡(luò)兩個(gè)維度聚焦隱患OLT 的目的。
(6)OLT-MSE 上聯(lián)口入方向擁塞鏈路分析。關(guān)聯(lián)質(zhì)差ONU 測(cè)試記錄發(fā)生時(shí)間對(duì)應(yīng)的OLT 上聯(lián)MSE 的鏈路入方向流量情況,結(jié)合該鏈路的帶寬,統(tǒng)計(jì)該鏈路的利用率。定義鏈路利用率大于60%為擁塞,統(tǒng)計(jì)本周內(nèi)質(zhì)差ONU 測(cè)試記錄對(duì)應(yīng)OLT 上聯(lián)鏈路擁塞次數(shù)。
處理建議:檢查鏈路帶寬利用率,進(jìn)行鏈路擴(kuò)容。
(7)OLT-MSE 上聯(lián)口收CRC 大量誤碼增長分析。關(guān)聯(lián)質(zhì)差ONU 的上聯(lián)OLT,Aniss 每小時(shí)定期采集OLT上聯(lián)口的CRC 誤碼情況,對(duì)比前后小時(shí)CRC 變化情況。若CRC 誤碼增長值超過100 則記一次CRC 增加,統(tǒng)計(jì)本周內(nèi)質(zhì)差ONU 測(cè)試記錄對(duì)應(yīng)OLT 上聯(lián)鏈路CRC 誤碼增長次數(shù),然后過濾掉統(tǒng)計(jì)結(jié)果中CRC 誤碼增長次數(shù)<3 的記錄。
處理建議:檢查鏈路質(zhì)量,優(yōu)化鏈路質(zhì)量。
(8)OLT-MSE 上聯(lián)口既發(fā)生多次擁塞,又發(fā)生多次誤碼增長匯總。統(tǒng)計(jì)本周內(nèi)質(zhì)差ONU 測(cè)試記錄對(duì)應(yīng)OLT 上聯(lián)鏈路中既發(fā)生多次擁塞,又發(fā)生多次誤碼增長的鏈路。
處理建議:檢查鏈路帶寬利用率以及鏈路質(zhì)量,進(jìn)行鏈路擴(kuò)容及優(yōu)化鏈路質(zhì)量。
(9)MSE 質(zhì)差率匯總。統(tǒng)計(jì)本周內(nèi)每一臺(tái)MSE 下掛的ONU 中出現(xiàn)的QOE 質(zhì)差測(cè)試記錄數(shù)以及下掛ONU 的所有QOE 測(cè)試總數(shù),二者相除可得到每一臺(tái)MSE 的質(zhì)差率,然后過濾掉統(tǒng)計(jì)結(jié)果中本周QOE 測(cè)試總數(shù)小于500 的MSE(此類MSE 因測(cè)試樣本較少,質(zhì)差率不夠準(zhǔn)確)。
處理建議:重點(diǎn)檢查該MSE 本周內(nèi)是否存在如下情況:硬件告警、上聯(lián)鏈路擁塞、上聯(lián)鏈路CRC 大量誤碼增長、上聯(lián)鏈路收光較低。
(1)對(duì)于已關(guān)聯(lián)出多個(gè)維度的QOE 測(cè)試數(shù)據(jù),進(jìn)行標(biāo)簽化處理。設(shè)定QOE 撥測(cè)得分小于80 分的為質(zhì)差ONU,打上標(biāo)簽1,對(duì)于80 分以上的撥測(cè)記錄打上標(biāo)簽0。
(2)進(jìn)行數(shù)據(jù)質(zhì)量分析及預(yù)處理,由于Aniss(接入網(wǎng)綜合管理系統(tǒng))采集數(shù)據(jù)時(shí)存在個(gè)別事件采集失敗,會(huì)產(chǎn)生一些缺失值和異常值(特征缺失異常分析統(tǒng)計(jì)結(jié)果如圖1 所示),因此需要進(jìn)行數(shù)據(jù)質(zhì)量分析,并將缺失值和異常值處理掉后得到連續(xù)特征值,如圖2 所示。
圖1 各特征缺失值比例
圖2 連續(xù)型特征分布圖
(3)進(jìn)行特征工程,包括特征選擇,非數(shù)值型特征進(jìn)行one hot 處理,比如光貓所屬廠家、設(shè)備類型、軟件版本等離散型特征,如圖3 所示。
圖3 各特征之間的相關(guān)性,用于特征選擇
(4)進(jìn)行數(shù)據(jù)集劃分,將原始數(shù)據(jù)劃分成訓(xùn)練集、驗(yàn)證集和測(cè)試集。
(5)進(jìn)行模型選擇,分別使用決策樹、隨機(jī)森林?jǐn)?shù)、lightgbm、xgboost 等分類算法進(jìn)行訓(xùn)練,用混淆矩陣(如圖4 所示)來評(píng)估模型的準(zhǔn)確性,最后選擇訓(xùn)練得分最高的模型。
圖4 混淆矩陣
(6)使用網(wǎng)格搜索GridSearchCV 的方法對(duì)剛才選出的模型進(jìn)行參數(shù)調(diào)優(yōu),選出最優(yōu)的參數(shù)。
(7)使用調(diào)參后的模型對(duì)測(cè)試集進(jìn)預(yù)測(cè),評(píng)估模型。
通過對(duì)QOE 撥測(cè)數(shù)據(jù)的維度拓展,關(guān)聯(lián)接入層網(wǎng)管對(duì)于接入層設(shè)備的性能采集數(shù)據(jù),加以深度挖掘,聚焦QOE 質(zhì)差ONU 用戶的撥測(cè)記錄,精準(zhǔn)定位到導(dǎo)致這些質(zhì)差撥測(cè)數(shù)據(jù)的隱患點(diǎn),提供給分公司用于網(wǎng)絡(luò)優(yōu)化的明確指導(dǎo)意見,先于用戶發(fā)現(xiàn)故障點(diǎn),并及早排除隱患。此外,結(jié)合機(jī)器學(xué)習(xí)相關(guān)手段,可以進(jìn)行橋接型光貓的QOE 撥測(cè)結(jié)果預(yù)測(cè),大大加大了QOE 撥測(cè)的范圍,使橋接型光貓的感知測(cè)試成為可能。這樣就將維護(hù)的手段由指標(biāo)驅(qū)動(dòng)的被動(dòng)維護(hù)模式轉(zhuǎn)換為以用戶感知為導(dǎo)向的主動(dòng)維護(hù)模型,同時(shí)達(dá)到了提升了用戶感知體驗(yàn)的目的。