鄭 軍
南京中興新軟件有限公司
我國數(shù)字經(jīng)濟正在蓬勃發(fā)展,以5G為代表的新一代基礎(chǔ)設(shè)施將成為數(shù)字經(jīng)濟的關(guān)鍵支撐,通信運營商正在全力打造“網(wǎng)、云、數(shù)、智、邊、端、鏈”深度融合的新一代精品基礎(chǔ)設(shè)施,助力全社會千行百業(yè)數(shù)智化轉(zhuǎn)型。以5G、數(shù)據(jù)中心、工業(yè)互聯(lián)網(wǎng)為主要特征的新基建,拉動了整個經(jīng)濟社會的發(fā)展,起到乘數(shù)倍加的效應(yīng)。預(yù)計到2025年,我國5G網(wǎng)絡(luò)建設(shè)投資累計將超過1.2萬億元,并帶動產(chǎn)業(yè)鏈上下游以及各行業(yè)的應(yīng)用投資超過3.5萬億元。
中國移動把握數(shù)字經(jīng)濟機遇,通過“泛在連接、算力網(wǎng)絡(luò)、智慧中臺”等舉措,打造品質(zhì)一流的新型基礎(chǔ)設(shè)施。中國移動建成了全球最大的通信網(wǎng)絡(luò),具有高體系性、高復(fù)雜性、超大規(guī)模、高動態(tài)性、高可靠性的特征,亟需“深度感知、精準控制、自愈自優(yōu)”的網(wǎng)絡(luò)與運維能力,賦能數(shù)字經(jīng)濟發(fā)展,支撐敏捷高效運維;亟需通過全面推進“網(wǎng)絡(luò)自動駕駛”,加快網(wǎng)絡(luò)運維自身的數(shù)智化轉(zhuǎn)型升級,實現(xiàn)智慧運維,支撐業(yè)務(wù)提質(zhì)創(chuàng)收、支撐運維降本增效,助力中國移動四大目標(質(zhì)量領(lǐng)先、安全可控、敏捷高效、降本逐優(yōu))早日實現(xiàn),牽引信息服務(wù)邁上新臺階。
TM Forum制定了從L0至L5的自動化能力分級的宏觀標準,對四類網(wǎng)絡(luò)運維工作,按照自動化實現(xiàn)程度來劃分不同等級,從完全手工維護到部分自動、高度自動,最終到完全自動化、智能化的智慧運維水平。具體分類分級標準描述參加表1所示。
表1 TM Forum AN L0~L5 能力分級標準
操作執(zhí)行,主要是指網(wǎng)絡(luò)設(shè)備配置、巡檢、修復(fù)、割接等非硬件操作自動化。
網(wǎng)絡(luò)感知,主要是指通過數(shù)字化設(shè)備實現(xiàn)自動采集,對啞資源可以通過設(shè)備實現(xiàn)智能識別。
分析決策,主要是指網(wǎng)絡(luò)與業(yè)務(wù)故障監(jiān)控、質(zhì)量優(yōu)化實現(xiàn)自動分析、自動定界定位、自動制定策略。
意圖體驗,主要是指實現(xiàn)隱患預(yù)測、容量預(yù)測、客戶感知,實現(xiàn)智能洞察。
L0的主要特征是這些動作全靠手工進行,缺乏自動化的工具支撐;L1的特征是“執(zhí)行”部分有自動化系統(tǒng)支撐,但是其他幾個動作還是依賴手工;其他級別以此類推。
國內(nèi)外主流運營商網(wǎng)絡(luò)自動駕駛能力平均處于L1-L2之間。沃達豐歐洲7個子網(wǎng)(英國、德國、西班牙等),聚焦自動化率,預(yù)估評分1.6。中國聯(lián)通2021年Q2,無線專業(yè)評分1.7。TM Forum 2020年調(diào)查83%的運營商計劃3年內(nèi)達到L2。中國移動2021年初全網(wǎng)重點專業(yè)平均L1.8,年底實現(xiàn)了L2,整體處于行業(yè)前列,但仍需加速提升數(shù)智化運維能力,力爭全球領(lǐng)先。
第一步:積極參與產(chǎn)業(yè)標準推進。積極主導(dǎo)國際國內(nèi)行業(yè)標準制定,牽引行業(yè)合作伙伴落地實施,總結(jié)和分享中國移動最佳實踐,完善行業(yè)標準。
第二步:精心做好頂層設(shè)計。創(chuàng)新“234”AN能力分層架構(gòu);定義覆蓋網(wǎng)絡(luò)全生命周期的能力分域架構(gòu),分解37類核心運維能力;定義AN能力分級模型,從能力技術(shù)成熟度和能力應(yīng)用成效兩個維度綜合評定。
第三步:大力開展數(shù)智化能力建設(shè)與應(yīng)用。一方面建設(shè)好網(wǎng)元設(shè)備與OMC,引導(dǎo)設(shè)備廠商提升網(wǎng)元內(nèi)生運維自動化、智能化能力,提升OMC集中化采控能力、數(shù)據(jù)與操作開放能力;另一方面,進一步完善網(wǎng)管系統(tǒng),持續(xù)優(yōu)化運維流程、業(yè)務(wù)規(guī)則、數(shù)據(jù)模型,提升單域自治、跨域協(xié)同能力,大力推動AI技術(shù)應(yīng)用創(chuàng)新。
第四步:適時開展能力評估與分析。組織全網(wǎng)31省面向重點專業(yè)、業(yè)務(wù)、運維場景開展數(shù)智化能力評級;評選優(yōu)秀創(chuàng)新能力標桿,推動全網(wǎng)復(fù)制推廣;識別共性短板問題,針對性制定提升計劃,并推廣實施。
這四步是一個不斷循環(huán)持續(xù)改進的過程,如圖1所示。在下文中重點介紹第二步和第三步。
圖1 中國移動網(wǎng)絡(luò)自動駕駛實踐方法
參考TM Forum網(wǎng)絡(luò)運營架構(gòu)模型,構(gòu)建“234”AN能力分層架構(gòu),如圖2所示。該架構(gòu)模型的最上端是兩大業(yè)務(wù)目標,分別是“客戶發(fā)展”和“質(zhì)量領(lǐng)先”;以這兩大目標牽引,模型中嵌了三個閉環(huán)流程,分別是客戶需求管理閉環(huán)、跨專業(yè)端到端業(yè)務(wù)管理閉環(huán)、單專業(yè)資源管理閉環(huán);構(gòu)建四層協(xié)同的網(wǎng)絡(luò)運維數(shù)智化能力。
圖2 中國移動“234” AN能力分層架構(gòu)
面向網(wǎng)絡(luò)專業(yè)的單域自治是指構(gòu)建網(wǎng)元設(shè)備的內(nèi)生運維能力,這是實現(xiàn)自動駕駛網(wǎng)絡(luò)的基礎(chǔ)要素。具體說明參考2.3.1。
跨域協(xié)同方面主要包括跨域端到端業(yè)務(wù)開通、運行保障、質(zhì)量優(yōu)化和運維研發(fā)化轉(zhuǎn)型。具體說明參考2.3.2。
網(wǎng)絡(luò)自動駕駛的能力覆蓋網(wǎng)絡(luò)全生命周期,以規(guī)化、建設(shè)、維護、優(yōu)化、運營、資管6個運維域、11個核心運維場景(網(wǎng)絡(luò)規(guī)劃、設(shè)計部署、監(jiān)控排障、網(wǎng)絡(luò)巡檢、容量優(yōu)化、質(zhì)量優(yōu)化、業(yè)務(wù)開通、資源變更管理和資源數(shù)據(jù)管理等)為框架,持續(xù)梳理完善37類核心能力,從面向網(wǎng)絡(luò)專業(yè)的單域自治和面向業(yè)務(wù)端到端的跨域協(xié)同兩個方面,持續(xù)建設(shè)和完善網(wǎng)絡(luò)運維的自動化、智能化能力。
2.3.1 專業(yè)單域自治
前面提到過專業(yè)單域自治是實現(xiàn)網(wǎng)絡(luò)自動駕駛的基礎(chǔ)要素,中國移動的網(wǎng)絡(luò)包含最為核心的5大專業(yè),分別是無線、核心網(wǎng)、云、IP、傳輸5大專業(yè)。聯(lián)合設(shè)備廠家,重點提升OMC/專業(yè)運維工作臺、網(wǎng)元設(shè)備的數(shù)據(jù)采集、集中控制、高可靠、自優(yōu)化、可檢測、可操作等6大項、18小項運維支撐能力,實現(xiàn)網(wǎng)元內(nèi)生自動、內(nèi)生智能,這個過程就是單域自治。各網(wǎng)絡(luò)專業(yè)單域自治的基礎(chǔ)要素如表2所示。
以核心網(wǎng)的單域自治來說,打造AI注智的“自配置、自修復(fù)、自優(yōu)化”核心網(wǎng),實現(xiàn)業(yè)務(wù)永不中斷、變更安全高效和極致的業(yè)務(wù)體驗。這個工作要重點提升本網(wǎng)元的OMC/專業(yè)運維工作臺的能力,實現(xiàn)網(wǎng)元設(shè)備的數(shù)據(jù)自動采集,從而實現(xiàn)集中控制、可檢測、自優(yōu)化和高可靠等運維支撐能力。
第一是實現(xiàn)可感知。增強網(wǎng)元內(nèi)生亞健康檢測能力,解決隱患識別問題,提前預(yù)測預(yù)防,通過OMC實現(xiàn)海量數(shù)據(jù)隱患排查。
第二是實現(xiàn)高可靠。增強網(wǎng)元立體協(xié)同抗沖擊能力,各網(wǎng)元內(nèi)生智能流控能力,解決流量突發(fā)、信令浪涌等問題。通過OMC實現(xiàn)5GC容災(zāi)切換狀態(tài)可視可管理。
第三是實現(xiàn)可操作。通過自動測試引擎,通過仿真UE實現(xiàn)智能撥測:解決人工撥測效率低問題;支持灰度撥測引擎,通過真實UE自動采集業(yè)務(wù)感知度數(shù)據(jù),及時發(fā)現(xiàn)網(wǎng)絡(luò)隱患。通過OMC實現(xiàn)撥測KPI可視,從而最終實現(xiàn)機器值守。
各專業(yè)自治包含的主要能力框架以及能力要素如表2所示。
表2 各專業(yè)單域自治的基礎(chǔ)要素
2.3.2 跨域協(xié)同——端到端業(yè)務(wù)運營
端到端業(yè)務(wù)運營包括業(yè)務(wù)的開通、運行保障以及質(zhì)量優(yōu)化。
(1)在端到端業(yè)務(wù)開通方面實現(xiàn)了自勘察、自設(shè)計、自開通。
首先,實現(xiàn)業(yè)務(wù)驅(qū)動的跨域資源自勘察。通過業(yè)務(wù)驅(qū)動的跨域資源勘察,傳遞SLA需求,確認網(wǎng)絡(luò)資源(含帶寬、時延)等滿足業(yè)務(wù)上線需求,將原來人工轉(zhuǎn)換和拆單轉(zhuǎn)變?yōu)樽詣油睫D(zhuǎn)換三域需求,實現(xiàn)在線評估。
其次,實現(xiàn)模塊化切片業(yè)務(wù)編排自動設(shè)計。通過自動同步訂單信息,實現(xiàn)三域參數(shù)、跨域參數(shù)的自動生成,并實現(xiàn)人工在線審核。
最后,實現(xiàn)一站式自配置、一站式業(yè)務(wù)開通。協(xié)同各域資源實現(xiàn)網(wǎng)管配置自動下發(fā),自動配置DNN相關(guān)信息,并在線驗證業(yè)務(wù),從而實現(xiàn)業(yè)務(wù)開通的體驗電商化互聯(lián)網(wǎng)化。
(2)在端到端的運行保障方面通過引入體系化AI技術(shù),全面實現(xiàn)智監(jiān)控、智診斷和智修復(fù)。
第一,智監(jiān)控——以網(wǎng)絡(luò)監(jiān)控為主轉(zhuǎn)型為以網(wǎng)絡(luò)+業(yè)務(wù)監(jiān)控。以傳統(tǒng)的告警監(jiān)控及處理,通過事件聚合能力,將海量告警+多維數(shù)據(jù)聚合成少量的業(yè)務(wù)事件。通過多維數(shù)據(jù)關(guān)聯(lián)將故障識別率從65%提升到95%,從而可以自動提供業(yè)務(wù)保活方案。
第二,智診斷——從人工梳理規(guī)則轉(zhuǎn)變?yōu)轶w系化AI。通過故障樹、知識圖譜等AI技術(shù),自動生成故障診斷和業(yè)務(wù)閉環(huán)規(guī)則,智能定位問題網(wǎng)元。
第三,智修復(fù)——從流程自動化轉(zhuǎn)變?yōu)榫W(wǎng)絡(luò)自動化。傳統(tǒng)運維集中在流程自動化提升,而自動駕駛通過智能推薦方案,調(diào)用網(wǎng)元能力實現(xiàn)故障自動修復(fù),實現(xiàn)端到端故障自閉環(huán),讓業(yè)務(wù)快速恢復(fù)?;?。
(3)在端到端的質(zhì)量優(yōu)化方面,實現(xiàn)了智能感知、自動分析和智能調(diào)優(yōu)。
首先,實現(xiàn)智能感知。通過AI注智的異常檢測及主動預(yù)測,加上智能分析引擎加持,采用數(shù)字孿生技術(shù)仿真推演,優(yōu)化建議智能推薦,實現(xiàn)面向網(wǎng)絡(luò)/業(yè)務(wù)/用戶的感知主動預(yù)測和質(zhì)差根因自動定位。
其次,實現(xiàn)數(shù)據(jù)融合+跨域自動分析。通過集成無線/核心/承載等多數(shù)據(jù)源跨域自動分析,實現(xiàn)多數(shù)據(jù)源跨域分析。
最后,實現(xiàn)智能調(diào)優(yōu)。基于跨域分析結(jié)果,協(xié)同單域網(wǎng)絡(luò)能力智能調(diào)優(yōu),從而實現(xiàn)基于用戶體驗的跨域融通。
2.3.3 運維研發(fā)化轉(zhuǎn)型
實現(xiàn)網(wǎng)絡(luò)自動駕駛,需要產(chǎn)業(yè)協(xié)同,更需要核心能力自主掌控。加快實現(xiàn)網(wǎng)絡(luò)運維人員的運維研發(fā)化轉(zhuǎn)型,以自研為核心,通過內(nèi)部合作、外部引入,建立開放、共享、合作的網(wǎng)管系統(tǒng)生態(tài)體系。
采用SCRUM開發(fā)模式,實現(xiàn)運維自動化需求到軟件設(shè)計、程序?qū)崿F(xiàn)的快速轉(zhuǎn)換,制定從需求管理、敏捷開發(fā)到價值運營的一套標準化工作流程,實現(xiàn)開發(fā)過程可視化閉環(huán)管控。
自研的核心內(nèi)容包括自動化策略、數(shù)據(jù)分析建模和應(yīng)用編排的腳本制作。此外還要重點建設(shè)一體化的研發(fā)平臺,如RPA(機器人流程自動化)、九天AI平臺等。
面向中國移動業(yè)務(wù)發(fā)展和網(wǎng)絡(luò)技術(shù)演進,分三大階段有序推進數(shù)據(jù)驅(qū)動、IT賦能、AI注智的智慧運維新突破,十四五期間網(wǎng)絡(luò)自動駕駛達到L4級,實現(xiàn)單域網(wǎng)絡(luò)數(shù)據(jù)自配置、隱患自預(yù)防、參數(shù)自尋優(yōu),跨域業(yè)務(wù)開通分鐘級、運行無中斷、質(zhì)量自優(yōu)化。圖3描述了中國移動AN能力建設(shè)的路徑。
圖3 中國移動AN能力建設(shè)路徑
中國移動2021年底全網(wǎng)平均達到了L2,實現(xiàn)了部分自治,加快了“2+5+N”網(wǎng)管系統(tǒng)架構(gòu)調(diào)整,拉通了跨專業(yè)的端到端業(yè)務(wù)開通長流程,積極開展了啞資源維護等AI應(yīng)用試點,AI應(yīng)用API達到了100項。在基礎(chǔ)上,確定了未來4年的目標。
(1)2022-2023年的目標是全網(wǎng)平均達到L3,部分省達到L4,實現(xiàn)基本自治。
在網(wǎng)元內(nèi)生能力方面,網(wǎng)絡(luò)設(shè)備實現(xiàn)業(yè)務(wù)質(zhì)量可感知。網(wǎng)管系統(tǒng)能力方面,重點提升網(wǎng)絡(luò)自動控制和端到端業(yè)務(wù)質(zhì)量管理能力。強化傳輸、IP等專業(yè)的路由自動計算、數(shù)據(jù)自動配置,支撐政企業(yè)務(wù)極速開通?;跀?shù)據(jù)底座,實現(xiàn)端到端業(yè)務(wù)質(zhì)量分析優(yōu)化。
AI應(yīng)用創(chuàng)新方面,部分省規(guī)?;瘧?yīng)用AI技術(shù),基于技術(shù)中臺AI九天平臺,推動AI應(yīng)用能力融入現(xiàn)有網(wǎng)管生產(chǎn)系統(tǒng),AI應(yīng)用API達到200項。
(2)2024-2025年的目標是全網(wǎng)平均達到L4,實現(xiàn)高度自治。
網(wǎng)元內(nèi)生能力方面,網(wǎng)絡(luò)設(shè)備實現(xiàn)路由動態(tài)優(yōu)化;網(wǎng)管系統(tǒng)能力方面,全面實現(xiàn)各業(yè)務(wù)、各專業(yè)自動化運維能力。在業(yè)務(wù)開通、網(wǎng)絡(luò)監(jiān)控、網(wǎng)絡(luò)優(yōu)化各領(lǐng)域,持續(xù)優(yōu)化業(yè)務(wù)流程和業(yè)務(wù)規(guī)則,提升運維效率。AI應(yīng)用創(chuàng)新方面,全網(wǎng)規(guī)?;瘧?yīng)用AI技術(shù)。圍繞“現(xiàn)場作業(yè)圖像識別、網(wǎng)絡(luò)策略復(fù)雜計算、網(wǎng)絡(luò)大數(shù)據(jù)分析”3類應(yīng)用場景,構(gòu)建感知智能、診斷智能、預(yù)測智能、控制智能4大類網(wǎng)絡(luò)運維AI能力,實現(xiàn)全網(wǎng)規(guī)?;瘧?yīng)用。
2021年有16省貢獻107項AI能力上中臺,年底評選了10大AI標桿應(yīng)用。2022年持續(xù)拓展網(wǎng)絡(luò)域AI應(yīng)用的廣度和深度,各省基于集中化AI平臺,做好標桿應(yīng)用的推廣落地,并聚焦以下12類場景開展AI創(chuàng)新,積極參評全網(wǎng)優(yōu)秀應(yīng)用。集中化AI平臺將建立“能上能下”動態(tài)運營機制,加強AI能力運營。如表3所示。
表3 AI創(chuàng)新的12個場景
自動駕駛網(wǎng)絡(luò)旨在構(gòu)建端到端的運維能力,覆蓋規(guī)劃、建設(shè)、維護、優(yōu)化、運營和資管等全生命周期,基于大數(shù)據(jù)和AI技術(shù),表現(xiàn)為自動化、智能化的網(wǎng)絡(luò)能力與運維能力,從而為客戶帶來新的網(wǎng)絡(luò)價值和業(yè)務(wù)驅(qū)動力,為一線運維注入AI能力,面向消費者和垂直行業(yè)客戶提供“零等待、零故障、零接觸”的新型網(wǎng)絡(luò)與ICT服務(wù),支撐更高品質(zhì)業(yè)務(wù)發(fā)展,打造“自配置、自修復(fù)、自優(yōu)化”數(shù)智化運維能力。實現(xiàn)自動駕駛網(wǎng)絡(luò),是網(wǎng)絡(luò)與運維數(shù)智化轉(zhuǎn)型的必由之路,需要網(wǎng)絡(luò)技術(shù)演進、運維流程優(yōu)化、智能化技術(shù)運用、運維人員能力提升和產(chǎn)業(yè)鏈協(xié)同等多項舉措齊頭并進,需要體系化推進。