高功應(yīng),馬田豐,李 蓉,尼松濤(.中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司,北京 00033;.中訊郵電咨詢?cè)O(shè)計(jì)院有限公司鄭州分公司,河南鄭州,450007)
隨著5G 系統(tǒng)協(xié)同發(fā)展以及虛擬化、切片、MEC 等新技術(shù)引入,核心網(wǎng)網(wǎng)絡(luò)運(yùn)維和優(yōu)化難度明顯增加,特別是5GC 核心網(wǎng)具有分層解耦、設(shè)備節(jié)點(diǎn)眾多等特點(diǎn),性能、告警、感知等各類問題總量增加且定位困難。核心網(wǎng)專業(yè)一方面得益于屬于上層網(wǎng)絡(luò),網(wǎng)元及網(wǎng)管集中化程度較高,網(wǎng)絡(luò)質(zhì)量指標(biāo)問題點(diǎn)較少,便于數(shù)據(jù)采集工作的開展;另一方面,核心網(wǎng)業(yè)務(wù)流程和網(wǎng)元類別復(fù)雜,關(guān)鍵KPI 指標(biāo)繁多,不利于場(chǎng)景聚焦,而且根因分析涉及多專業(yè)協(xié)調(diào),不利于智能運(yùn)維快速反應(yīng)要求。
傳統(tǒng)人工方式難以滿足網(wǎng)絡(luò)保障SLA 要求,需要引入一系列自動(dòng)化平臺(tái)和智能化手段,以實(shí)現(xiàn)水平跨域、垂直跨層的端到端智能分析,提供智能化故障預(yù)防預(yù)測(cè)功能,提高運(yùn)維效率,最終實(shí)現(xiàn)可視、可控、可評(píng)測(cè)的數(shù)字化運(yùn)營(yíng)目標(biāo)。
中國(guó)聯(lián)通全國(guó)核心網(wǎng)網(wǎng)管支撐系統(tǒng)總體架構(gòu)分為“集團(tuán)+大區(qū)”2 級(jí)架構(gòu),如圖1 所示,供集團(tuán)、大區(qū)和省級(jí)3 級(jí)使用。集團(tuán)級(jí)網(wǎng)管由OSS 2.0 和一級(jí)NFVO構(gòu)成,2類系統(tǒng)之間形成主備關(guān)系。
圖1 核心網(wǎng)網(wǎng)管支撐系統(tǒng)架構(gòu)圖
集團(tuán)一級(jí)NFVO 為核心網(wǎng)一級(jí)網(wǎng)管平臺(tái),為集團(tuán)5GC 及其他核心網(wǎng)子域提供管理維護(hù)手段,實(shí)現(xiàn)全網(wǎng)核心網(wǎng)一點(diǎn)可視和支撐數(shù)字化運(yùn)營(yíng);為大區(qū)提供一點(diǎn)接入全網(wǎng)能力,實(shí)現(xiàn)跨大區(qū)的指標(biāo)分析及問題定位能力。目前集團(tuán)一級(jí)NFVO 平臺(tái)在實(shí)現(xiàn)5GC 統(tǒng)一納管、資源可視的基礎(chǔ)上,已開展vIMS 大區(qū)化、集中IMS、固網(wǎng)IMS、骨干核心網(wǎng)、切片/專網(wǎng)/MEC 等統(tǒng)一納管,如圖2所示。
圖2 核心網(wǎng)一級(jí)NFVO功能架構(gòu)圖
大區(qū)級(jí)網(wǎng)管層面由廠家OMC/NFVO+、反拉終端(OSS 2.0)和大區(qū)綜合監(jiān)控系統(tǒng)形成主備,大區(qū)核心網(wǎng)綜合網(wǎng)管系統(tǒng)滿足大區(qū)/省分公司日常實(shí)際生產(chǎn)維護(hù)工作以及面向切片/專網(wǎng)/MEC自動(dòng)化運(yùn)營(yíng)支撐需求。
全新的網(wǎng)絡(luò)形態(tài)和網(wǎng)絡(luò)規(guī)模給5G 網(wǎng)絡(luò)運(yùn)維工作帶來(lái)了極大的挑戰(zhàn)。隨著管理對(duì)象日益增多,網(wǎng)絡(luò)可能產(chǎn)生的故障大幅增加,人工監(jiān)控手段已無(wú)法滿足運(yùn)維需求。核心網(wǎng)專業(yè)主要有以下幾方面問題。
a)客服投訴痛點(diǎn):網(wǎng)絡(luò)信息向前臺(tái)推送能力弱,缺乏用戶簽約狀態(tài)數(shù)據(jù)前臺(tái)查詢能力;用戶感知投訴問題定位困難,解決周期長(zhǎng)等。
b)網(wǎng)絡(luò)維護(hù)痛點(diǎn):對(duì)云化網(wǎng)絡(luò)設(shè)備跨域跨層關(guān)聯(lián)、數(shù)據(jù)關(guān)聯(lián)能力,故障提前預(yù)警能力,網(wǎng)絡(luò)質(zhì)差指標(biāo)根因定位分析能力等需求迫切。
c)規(guī)劃建設(shè)痛點(diǎn):網(wǎng)絡(luò)容量負(fù)荷自動(dòng)預(yù)警能力不足。
d)行業(yè)客戶痛點(diǎn):5G 專網(wǎng)、切片和MEC 業(yè)務(wù)開通相對(duì)獨(dú)立,不具備快速開通和同開同停能力,不能滿足客戶自服務(wù)和業(yè)務(wù)指標(biāo)可視化等需求。
核心網(wǎng)數(shù)字化轉(zhuǎn)型的一個(gè)重要目標(biāo)是依托數(shù)字化平臺(tái)工具能力提升,打造自動(dòng)化和智能化的融合核心網(wǎng),面向規(guī)、建、維、營(yíng)全流程,提升網(wǎng)絡(luò)自動(dòng)化、智能化能力,提升網(wǎng)絡(luò)效率。在網(wǎng)絡(luò)規(guī)劃方面,實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)分析、規(guī)劃自動(dòng)化;在建設(shè)方面,實(shí)現(xiàn)網(wǎng)絡(luò)自動(dòng)編排、快速擴(kuò)縮容、自動(dòng)化配置、自動(dòng)測(cè)試等;在維護(hù)方面,實(shí)現(xiàn)故障自動(dòng)定位與自愈、智能監(jiān)控、故障預(yù)防預(yù)測(cè)等;在優(yōu)化方面,實(shí)現(xiàn)業(yè)務(wù)質(zhì)量實(shí)時(shí)監(jiān)測(cè)和網(wǎng)絡(luò)自動(dòng)調(diào)優(yōu)。
平臺(tái)工具是實(shí)現(xiàn)數(shù)字化運(yùn)營(yíng)的核心競(jìng)爭(zhēng)力,核心網(wǎng)數(shù)字化運(yùn)營(yíng)支撐平臺(tái)需滿足可視、可控、可評(píng)、智能決策的功能目標(biāo),實(shí)現(xiàn)云網(wǎng)業(yè)協(xié)同和CT/IT 融合目標(biāo),打造支撐生產(chǎn)作業(yè)、通信保障、安全生產(chǎn)和5GC 大區(qū)化運(yùn)營(yíng)的集約化云網(wǎng)運(yùn)營(yíng)體系,實(shí)現(xiàn)集約化項(xiàng)目全生命周期管理的規(guī)建維營(yíng)一體,實(shí)現(xiàn)TCO 效能最優(yōu),如圖3所示。
圖3 數(shù)字化運(yùn)營(yíng)總體思路
核心網(wǎng)智能運(yùn)營(yíng)平臺(tái)將以信息化的手段提升規(guī)、建、維、優(yōu)全流程數(shù)據(jù)分析及應(yīng)用,通過AI 賦能、數(shù)據(jù)賦能,實(shí)現(xiàn)智能化全過程運(yùn)營(yíng)。
結(jié)合數(shù)字化運(yùn)營(yíng)需求以及目前平臺(tái)現(xiàn)狀,核心網(wǎng)智能化運(yùn)營(yíng)平臺(tái)可采用分層架構(gòu)打造,如圖4所示。
數(shù)據(jù)獲取層為上層應(yīng)用統(tǒng)一提供數(shù)據(jù)采集能力,統(tǒng)一不同主設(shè)備廠家指標(biāo)規(guī)范及KPI/KQI 篩選規(guī)則;核心能力層提供AI 感知分析能力、編排配置能力、自動(dòng)規(guī)建優(yōu)化能力以及統(tǒng)一能力開發(fā)接口;智能應(yīng)用層面向智能規(guī)建、智能運(yùn)維、智能運(yùn)營(yíng)的不同場(chǎng)景,提供落地的應(yīng)用實(shí)現(xiàn)。
2.2.1 一級(jí)NFVO系統(tǒng)
運(yùn)營(yíng)商通過打造全國(guó)集中的一級(jí)NFVO 系統(tǒng)(見圖5),提升智能化能力;通過采集云核心網(wǎng)5GC 2C/2B/vIMS/EPC/CS 等多域網(wǎng)元的硬件/虛層/業(yè)務(wù)三層的CM/PM/告警數(shù)據(jù)統(tǒng)一納管和關(guān)聯(lián),實(shí)現(xiàn)多種智能化網(wǎng)管增強(qiáng)能力和數(shù)字化運(yùn)營(yíng)目標(biāo),包括迭代優(yōu)化網(wǎng)絡(luò)周報(bào)/月報(bào)專題數(shù)據(jù)統(tǒng)計(jì)整理、工程建設(shè)數(shù)據(jù)/項(xiàng)目采購(gòu)信息/經(jīng)營(yíng)分析用戶及終端數(shù)據(jù)常態(tài)化統(tǒng)一匯總分析及呈現(xiàn)、5G 2B 及物聯(lián)網(wǎng)用戶信息查詢、網(wǎng)元局?jǐn)?shù)據(jù)核查/網(wǎng)絡(luò)自動(dòng)巡檢/網(wǎng)絡(luò)容量預(yù)警及KPI 質(zhì)差根因定位等。
圖5 集團(tuán)一級(jí)NFVO網(wǎng)絡(luò)架構(gòu)圖
2.2.2 自動(dòng)撥測(cè)系統(tǒng)
全網(wǎng)部署自動(dòng)撥測(cè)系統(tǒng),提升測(cè)試效率,降低人力和終端成本消耗,自動(dòng)化撥測(cè)比例達(dá)到70%以上。
利用仿真撥測(cè)平臺(tái)實(shí)現(xiàn)測(cè)試即服務(wù)的TaaS 能力,仿真UE+NR 對(duì)接全網(wǎng)AMF/UPF,如圖6 所示,針對(duì)初始注冊(cè)(SUCI)成功率、Service Request成功率、Xn切換成功率、5G/4G 切換成功率等12 項(xiàng)信令面指標(biāo),Web/視頻/FTP 上傳下載/EPSFB 語(yǔ)音等5 項(xiàng)用戶面業(yè)務(wù)進(jìn)行仿真測(cè)試,實(shí)現(xiàn)周期性業(yè)務(wù)撥測(cè)監(jiān)控、設(shè)備升級(jí)擴(kuò)容撥測(cè)、開網(wǎng)全國(guó)漫游測(cè)試等場(chǎng)景不同程度的自動(dòng)化。
圖6 自動(dòng)化撥測(cè)系統(tǒng)業(yè)務(wù)架構(gòu)圖
2.2.3 優(yōu)化及預(yù)警系統(tǒng)
運(yùn)營(yíng)商按大區(qū)部署核心網(wǎng)優(yōu)化和故障預(yù)警增強(qiáng)功能,提升滿足投訴處理、用戶保障、故障預(yù)警、故障關(guān)聯(lián)分析、5G核心網(wǎng)指標(biāo)分析等需求的能力。
在核心網(wǎng)優(yōu)化增強(qiáng)方面,通過采集CHR 數(shù)據(jù),支持用戶業(yè)務(wù)流程還原、問題根因分析,實(shí)現(xiàn)用戶級(jí)問題的快速處理,輔助運(yùn)維人員快速閉環(huán)用戶投訴問題,保障VIP 用戶體驗(yàn);基于關(guān)鍵指標(biāo)、業(yè)務(wù)失敗次數(shù)統(tǒng)計(jì),結(jié)合CHR 數(shù)據(jù)關(guān)聯(lián)分析,實(shí)現(xiàn)問題根因分析和故障對(duì)象分析,輔助運(yùn)維人員及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)問題,評(píng)估和分析業(yè)務(wù)質(zhì)量,優(yōu)化網(wǎng)絡(luò)指標(biāo)。
在故障預(yù)警增強(qiáng)方面,引入故障主動(dòng)探測(cè)功能,對(duì)5GC 網(wǎng)元關(guān)鍵業(yè)務(wù)流程進(jìn)行實(shí)時(shí)仿真探測(cè),根據(jù)網(wǎng)元業(yè)務(wù)流程,識(shí)別前后端網(wǎng)元故障引起的網(wǎng)絡(luò)故障和容災(zāi)風(fēng)險(xiǎn);結(jié)合實(shí)時(shí)關(guān)鍵KPI 指標(biāo)、網(wǎng)元狀態(tài)、網(wǎng)絡(luò)仿真探測(cè)結(jié)果實(shí)現(xiàn)網(wǎng)元故障定界,按等級(jí)實(shí)現(xiàn)故障預(yù)警,輔助維護(hù)人員容災(zāi)倒換決策;容災(zāi)倒換過程中,實(shí)時(shí)監(jiān)控用戶數(shù)變化和關(guān)鍵業(yè)務(wù)指標(biāo),輔助判斷倒換發(fā)生后業(yè)務(wù)恢復(fù)情況,實(shí)現(xiàn)容災(zāi)恢復(fù)過程的可視可管。
2.2.4 VoLTE端到端優(yōu)化系統(tǒng)
運(yùn)營(yíng)商按大區(qū)部署VoLTE 端到端分析系統(tǒng),實(shí)現(xiàn)語(yǔ)音業(yè)務(wù)跨域端到端關(guān)聯(lián)分析,支撐解決網(wǎng)絡(luò)語(yǔ)音問題,提升網(wǎng)絡(luò)服務(wù)質(zhì)量。
基于5GC/IMS 大區(qū)化架構(gòu),部署VoLTE 端到端系統(tǒng),通過無(wú)線、核心網(wǎng)、IMS多域數(shù)據(jù)的關(guān)聯(lián),進(jìn)行端到端全流程評(píng)估VoLTE/EPS Fallback 業(yè)務(wù),實(shí)現(xiàn)問題發(fā)現(xiàn)、問題原因定界、問題優(yōu)化解決的閉環(huán)處理,如圖7所示,支撐業(yè)務(wù)質(zhì)量評(píng)估、專項(xiàng)優(yōu)化、客服投訴、運(yùn)營(yíng)支撐等應(yīng)用。
圖7 網(wǎng)絡(luò)優(yōu)化及故障處理流程圖
以核心網(wǎng)質(zhì)差根因分析場(chǎng)景為例,平臺(tái)工具自動(dòng)采集性能、xDR、CHR等數(shù)據(jù),通過大數(shù)據(jù)關(guān)聯(lián)分析,并結(jié)合數(shù)據(jù)模型AI學(xué)習(xí),實(shí)時(shí)發(fā)現(xiàn)劣化指標(biāo)以及預(yù)測(cè)指標(biāo)發(fā)展趨勢(shì),綜合端到端信令分析和呼叫日志分析等分析能力,深入分析指標(biāo)異常原因進(jìn)行根因分析和定界定位,固化設(shè)備、終端、業(yè)務(wù)等多因素專家經(jīng)驗(yàn)算法庫(kù),將問題和解決方案直接派單到一線維護(hù)人員,實(shí)現(xiàn)工單閉環(huán)管控??傮w流程如圖8所示。其中的關(guān)鍵指標(biāo)來(lái)源如表1所示。
表1 關(guān)鍵指標(biāo)來(lái)源表
圖8 質(zhì)差分析流程
系統(tǒng)從5GC、IMS 專業(yè)網(wǎng)管或NFVO 獲取相關(guān)KPI的性能統(tǒng)計(jì)數(shù)據(jù)。關(guān)鍵要求如下。
a)統(tǒng)計(jì)數(shù)據(jù)時(shí)間粒度:專業(yè)網(wǎng)管性能數(shù)據(jù)統(tǒng)計(jì)粒度為5 min。
b)數(shù)據(jù)及時(shí)性:延遲時(shí)間不得超過5 min,例如20:00—20:05生成數(shù)據(jù),系統(tǒng)提取時(shí)間不超過20:10。
c)原始數(shù)據(jù)齊全:嘗試、成功次數(shù),各類原因失敗次數(shù)等原始統(tǒng)計(jì)項(xiàng)均需上報(bào),以便對(duì)各統(tǒng)計(jì)項(xiàng)進(jìn)行波動(dòng)分析,更有針對(duì)性發(fā)現(xiàn)問題。
d)測(cè)量對(duì)象最小原則:網(wǎng)管上有關(guān)KPI 指標(biāo)的測(cè)量對(duì)象齊全,并且細(xì)分統(tǒng)計(jì)到支持的最小粒度(例如TAC),以便進(jìn)行精準(zhǔn)定位。
假設(shè)預(yù)警時(shí)間為M0,當(dāng)前KPI 指標(biāo)數(shù)據(jù)為P0,運(yùn)營(yíng)商網(wǎng)絡(luò)質(zhì)量KPI考核標(biāo)準(zhǔn)為J1。通過測(cè)算網(wǎng)絡(luò)質(zhì)量歷史運(yùn)行情況中的環(huán)比指標(biāo)P1 和同比指標(biāo)測(cè)算P2,以及指標(biāo)預(yù)警閾值算法MAX(J1,P1,P2),確定閾值。其中P1算法和P2算法如下。
P1=average(Pn),Pn=上一監(jiān)控時(shí)級(jí)周期時(shí)點(diǎn)內(nèi)每小時(shí)P數(shù)據(jù)(監(jiān)控時(shí)級(jí)周期可調(diào)整)。若監(jiān)控周期時(shí)點(diǎn)為一天24 h,M0 為18:00,則Pn為前日18:00 至當(dāng)日18:00的P數(shù)據(jù);若監(jiān)控周期時(shí)點(diǎn)為一天12 h(08:00—20:00),M0 為18:00,則Pn為前日18:00 至前日20:00,以及當(dāng)日08:00至當(dāng)日18:00的P數(shù)據(jù)。
P2=average(Pn),Pn=上一監(jiān)控日級(jí)周期內(nèi)每天M0 時(shí)的P數(shù)據(jù)(監(jiān)控日級(jí)周期可調(diào)整)。若監(jiān)控日級(jí)周期為一周,M0 為18:00,則Pn為當(dāng)日所在之前一周內(nèi)18:00的P數(shù)據(jù)。
指標(biāo)經(jīng)驗(yàn)庫(kù)如表2所示。
表2 指標(biāo)經(jīng)驗(yàn)庫(kù)表
通過實(shí)時(shí)跟蹤5GC 和IMS 域的關(guān)鍵性能KPI,發(fā)現(xiàn)質(zhì)差指標(biāo),通過匹配專家經(jīng)驗(yàn)和省分案例庫(kù)的豐富信息,定位根因,整合解決方案,高效指導(dǎo)網(wǎng)絡(luò)優(yōu)化工作的開展,提升用戶感知體驗(yàn)。
核心網(wǎng)專業(yè)應(yīng)繼續(xù)依托智能化運(yùn)營(yíng)平臺(tái)及工具手段,提升網(wǎng)絡(luò)自動(dòng)化、智能化能力,將網(wǎng)絡(luò)智能化水平從現(xiàn)有的L1/2提升至L3/4,并逐步實(shí)現(xiàn)完全自治。
a)從網(wǎng)絡(luò)規(guī)劃方面,基于現(xiàn)有一級(jí)NFVO 增加云核心網(wǎng)數(shù)字化運(yùn)營(yíng)場(chǎng)景分析功能。
b)在建設(shè)方面,基于現(xiàn)有自動(dòng)撥測(cè)系統(tǒng)繼續(xù)迭代豐富撥測(cè)場(chǎng)景,完善平臺(tái)自動(dòng)化撥測(cè)能力。
c)在維護(hù)方面,基于現(xiàn)有一級(jí)NFVO 增加MEC、5G 專網(wǎng)、5G 切片、固網(wǎng)IMS 等性能及資源納管范圍以及集中監(jiān)控分析、用戶數(shù)據(jù)查詢、數(shù)據(jù)配置核查等重點(diǎn)功能,基于現(xiàn)有故障預(yù)警系統(tǒng)繼續(xù)增強(qiáng)和完善故障預(yù)警功能。
d)在網(wǎng)絡(luò)優(yōu)化方面,繼續(xù)增強(qiáng)核心網(wǎng)優(yōu)化系統(tǒng)功能,并基于VoLTE 端到端分析系統(tǒng)進(jìn)行漫游等專項(xiàng)功能的增強(qiáng)迭代及VoNR 功能的演進(jìn),為5G 語(yǔ)音業(yè)務(wù)提供端到端關(guān)聯(lián)分析手段,引領(lǐng)現(xiàn)網(wǎng)5G 語(yǔ)音的智能優(yōu)化,助推中國(guó)聯(lián)通5G數(shù)字化運(yùn)維轉(zhuǎn)型。
依托自動(dòng)化平臺(tái)手段,通過聚焦分析場(chǎng)景,核心網(wǎng)數(shù)字化運(yùn)營(yíng)工作應(yīng)同時(shí)提升對(duì)市場(chǎng)、用戶、一線的支撐能力。
a)面向市場(chǎng),主動(dòng)匹配業(yè)務(wù)發(fā)展需求,提前部署網(wǎng)絡(luò)容量。
b)面向用戶,緊密跟蹤語(yǔ)音+數(shù)據(jù)體驗(yàn)感知,不斷優(yōu)化網(wǎng)絡(luò)質(zhì)量。
c)面向一線,簡(jiǎn)化運(yùn)營(yíng)流程,提高運(yùn)營(yíng)效率,逐步完善業(yè)務(wù)自動(dòng)化開通/調(diào)整和自服務(wù)能力靈活性。
同時(shí),針對(duì)目前“業(yè)務(wù)趕著建設(shè)跑、數(shù)據(jù)全靠手填表、出現(xiàn)故障四處找”現(xiàn)狀,提供“敏捷交付、智能分析、故障預(yù)警、快速定位”的運(yùn)營(yíng)服務(wù),為市場(chǎng)、用戶、一線人員提供全方位的運(yùn)營(yíng)支撐能力,推動(dòng)形成統(tǒng)一標(biāo)準(zhǔn)化的數(shù)字化運(yùn)營(yíng)場(chǎng)景、流程規(guī)范制度,并制定運(yùn)營(yíng)指標(biāo),以工單閉環(huán)驅(qū)動(dòng),深化運(yùn)營(yíng)效果。
核心網(wǎng)數(shù)字化轉(zhuǎn)型是一個(gè)系統(tǒng)的、長(zhǎng)期的、不斷積累的、不斷打破認(rèn)知壁壘的、CT 和IT 深入融合的過程。本文主要介紹了通過智能化工具平臺(tái)提升數(shù)字化運(yùn)營(yíng)能力的主要實(shí)踐,智能化工具平臺(tái)是數(shù)字化轉(zhuǎn)型的重要方面,但還需要結(jié)合完善的運(yùn)營(yíng)體系、規(guī)范的運(yùn)營(yíng)制度等,方能較好地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。