□ 文 梁 楊 胡立強 孫淳曄 趙 晗
作者單位:中國移動通信集團設(shè)計院有限公司河北分公司
2016年7月,在國務院印發(fā)的《“十三五”國家科技創(chuàng)新規(guī)劃》中,人工智能(Artificial Intelligence,簡稱“AI”)被作為新一代信息技術(shù)中的一項列入規(guī)劃。
2018年6月,在以“5G+AI,共創(chuàng)萬物智聯(lián)新時代”為主題的2018GTI國際產(chǎn)業(yè)峰會上,探討5G產(chǎn)業(yè)的發(fā)展趨勢,以及在萬物智聯(lián)新時代中5G與各行各業(yè)融合帶來的新機遇、新價值。中國移動提出,將主動把握萬物智能互聯(lián)新時代新趨勢,深化實施“大連接”戰(zhàn)略,加快推動5G和AI融合發(fā)展,打造5G+AI智慧運營和服務能力,努力成為數(shù)字化創(chuàng)新的全球領(lǐng)先運營商。
而在當前移動互聯(lián)網(wǎng)迅速發(fā)展的背景下,隨著市場的發(fā)展和電信運營商網(wǎng)絡制式的不斷更新升級,以“BAT”為代表的互聯(lián)網(wǎng)公司爭相搶占運營商網(wǎng)絡管道推廣各自的應用,各種智能終端廠商搶占用戶市場,電信運營商面臨嚴峻的“被管道化”危險;與此同時,我國電信市場移動數(shù)據(jù)和互聯(lián)網(wǎng)業(yè)務總量持續(xù)攀升,而資費水平逐年下降,收入增速持續(xù)走低,用戶的要求卻越來越高,電信運營商面臨著“降本增效”的壓力,亟需通過各種手段長效地解決此問題,而人工智能可助力運營商積極推進數(shù)字化創(chuàng)新,提高運營效率、節(jié)約成本。
人工智能包含四個組成要素,即“數(shù)據(jù)、算力、算法、場景”,其中,算法是人工智能的核心,當前算法中最具代表性的就是機器學習算法。
機器學習是利用能夠從數(shù)據(jù)中提取知識和模式的數(shù)學模型來解決業(yè)務問題,從機器學習問題本身分類的角度來看,可以將其分成下列類型的算法:如表2.1-1所示。
表2 .1-1 機器學習算法分類
隨著云計算、大數(shù)據(jù)時代的到來,計算能力的大幅提高可緩解訓練的低效性,訓練數(shù)據(jù)的大幅增加則可降低過擬合風險,因此,以“深度學習”為代表的復雜模型開始受到廣泛關(guān)注。
深度學習,即深層的神經(jīng)網(wǎng)絡,是一種大規(guī)模的神經(jīng)網(wǎng)絡,通常有許多處理層,即通過無監(jiān)督逐層訓練的有效手段進行多隱層網(wǎng)絡的訓練,進而通過增加隱層的數(shù)目的方式增加擁有激活函數(shù)的神經(jīng)元數(shù)目以及激活函數(shù)嵌套的層數(shù),從而提高深度學習模型的復雜度和學習器容量。
深度學習,包含DNN(深度神經(jīng)網(wǎng)絡)、CNN(卷積神經(jīng)網(wǎng)絡)、RNN(循環(huán)神經(jīng)網(wǎng)絡)等,其模型的多隱層特征,使計算機能夠處理比以前復雜得多的數(shù)據(jù),如視頻、圖像、語音和文本數(shù)據(jù),從而支持人工智能的最新進展。
根據(jù)參考文獻[7]所述,電信運營商傳統(tǒng)運維體系在運維過程中存在“系統(tǒng)變化感知滯后”、“未來故障無法預測”、“故障響應慢成本高”三大痛點。
針對上述痛點,可以結(jié)合大數(shù)據(jù)技術(shù)和深度學習算法,推出智能運維解決方案,以提升電信IT系統(tǒng)的運維能力——既提升了電信IT系統(tǒng)的維護效率,又節(jié)約了電信IT系統(tǒng)維護成本,滿足電信網(wǎng)絡智慧運維的需求。
AI網(wǎng)絡運維應用的設(shè)計流程如下:
第一階段(節(jié)點主動感知):利用運營商大數(shù)據(jù)平臺的優(yōu)勢,通過電信運營商IT支撐系統(tǒng)海量日志的自動采集及分析,主動感知IT系統(tǒng)節(jié)點運行狀態(tài)的變化。此階段包含節(jié)點日志實時采集、節(jié)點日志實時匯聚、節(jié)點狀態(tài)實時分析等三個步驟。
第二階段(運維網(wǎng)格構(gòu)建):采用大數(shù)據(jù)技術(shù)(如圖計算技術(shù))自動構(gòu)建運維網(wǎng)格,并通過可視化技術(shù)展示網(wǎng)絡各個節(jié)點的影響力、健康度以及依賴關(guān)系,實現(xiàn)IT支撐系統(tǒng)節(jié)點的立體感知。
第三階段(故障智能預測):利用諸如基于TensorFlow/Keras框架的深度學習算法,構(gòu)建運營商IT支撐系統(tǒng)日志的深度學習應用模型,實現(xiàn)IT支撐系統(tǒng)節(jié)點故障的智能預測。
深度學習數(shù)據(jù)處理流程如圖3.1-1所示。
根據(jù)參考文獻[8]所述,無線網(wǎng)絡覆蓋優(yōu)化是提升無線網(wǎng)絡質(zhì)量的重要工作內(nèi)容,現(xiàn)有覆蓋優(yōu)化主流技術(shù)以仿真優(yōu)化、人工經(jīng)驗優(yōu)化為主。此外,仿真優(yōu)化在很大程度上依賴傳播模型的準確性,沒有充分考慮用戶及業(yè)務量分布場景。下述網(wǎng)絡優(yōu)化應用利用深度學習來進行覆蓋優(yōu)化,設(shè)計思路分為以下幾個步驟 :
第一步:覆蓋TopN小區(qū)問題分析。利用MRO(Measurement Report of Original Type,測量報告原始數(shù)據(jù))數(shù)據(jù)中小區(qū)的覆蓋關(guān)系、地形地理位置數(shù)據(jù)、基站站型結(jié)構(gòu)數(shù)據(jù)、用戶分布情況等,構(gòu)建覆蓋評估矩陣,并通過預置規(guī)則判斷,輸出小區(qū)軟、硬參數(shù)定性調(diào)整建議或問題(包括接入電平/功率/A2門限/下傾角/方向角優(yōu)化建議,以及工參準確性問題),輸出TopN小區(qū)分析和定性優(yōu)化建議。
第二步:利用深度神經(jīng)網(wǎng)絡構(gòu)建本區(qū)域的覆蓋模型。使用小區(qū)網(wǎng)絡結(jié)構(gòu)、參數(shù)配置、地形地貌、業(yè)務類型、覆蓋指標、干擾指標等特征屬性,并將這些樣本按照業(yè)務邏輯進行向量化,預處理后用于網(wǎng)絡覆蓋的精細畫像,然后對本區(qū)域覆蓋模型進行訓練。
圖3 .1-1 IT系統(tǒng)運維節(jié)點故障自動預測業(yè)務流程圖
圖3 .2-1 基于深度學習的覆蓋優(yōu)化系統(tǒng)模型設(shè)計
第三步:覆蓋指標定量預測。動態(tài)輸入功率、方向角、傾角調(diào)整方案,實現(xiàn)對弱覆蓋、過覆蓋等指標量化預測;也可根據(jù)預測結(jié)果,實現(xiàn)全流程自動輸出推薦方案。
本應用的深度學習模型設(shè)計如圖3.2-1所示。
表3 .4-1 AI在電信網(wǎng)絡運維/優(yōu)化場景的應用情況
AI在電信網(wǎng)絡運營領(lǐng)域的應用不勝枚舉,除了上述兩種典型應用場景外,還有如下場景:
網(wǎng)絡運維領(lǐng)域中的資源質(zhì)監(jiān)場景,如針對分光器等無源網(wǎng)絡設(shè)備的清查稽核,此類應用以資源設(shè)備端口圖片為主要數(shù)據(jù)源,經(jīng)分析后提取出端口占用情況、端口序號等特征,利用TensorFlow框架,結(jié)合RFCN,RCNN等目標檢測算法模型,最終完成資源圖片質(zhì)檢,及端口占用檢測。
參數(shù)智能化設(shè)置與推薦場景,通過智能化的學習現(xiàn)網(wǎng)已有參數(shù)配置經(jīng)驗,快速復制和推廣參數(shù)優(yōu)化經(jīng)驗,LTE小區(qū)建模,分類,參數(shù)配置;異常網(wǎng)絡質(zhì)量特征的智能檢測、原因定位、告警/投訴預診斷,借助人工智能算法,預先預測網(wǎng)絡出問題概率,減少網(wǎng)絡故障實際發(fā)生概率,將運維模式從事后處理推向事前預防,大大減少投訴發(fā)生,提升客戶感知。
智能工單規(guī)則分析與精確派單,探索利用現(xiàn)網(wǎng)已積累的閉環(huán)工單處理數(shù)據(jù),進行挖掘分析并建立數(shù)學模型,利用有監(jiān)督機器學習算法,分析網(wǎng)絡特征與工單處理方案、工單反饋結(jié)果之間的映射關(guān)系等,通過大量數(shù)據(jù)訓練模型,實現(xiàn)網(wǎng)絡問題智能分類和工單智能派發(fā)。
智能隱患預測與自動巡檢,針對集中維護中的隱患預測、動態(tài)巡檢等需求進行機器學習和數(shù)據(jù)挖掘處理,通過同步用戶權(quán)限數(shù)據(jù),集中優(yōu)化平臺數(shù)據(jù),動環(huán)監(jiān)控數(shù)據(jù),從多維度對站點運維指標進行特征畫像,實現(xiàn)細粒度可視化的管理站點等等。
人工智能在電信網(wǎng)絡運維、優(yōu)化場景中的應用情況總結(jié)如表3.4-1所示。
人工智能在電信網(wǎng)絡運營前景非常廣闊,不僅是提高網(wǎng)絡運營效率、提升服務質(zhì)量的重要工具,而且將是改變運營模式的重要支撐。
通過針對上述AI在電信網(wǎng)絡類應用場景分析,可以總結(jié)出AI應用的實施具有規(guī)律性,需要有一套體系來作支撐,該體系中包括AI平臺技術(shù)架構(gòu)、AI實施的方法論以及切入方式等。
大數(shù)據(jù)的應用需要有云計算資源池和大數(shù)據(jù)平臺作為技術(shù)架構(gòu)支撐,人工智能的應用同樣需要有人工智能平臺作為技術(shù)架構(gòu)支撐,人工智能應用的開展對底層硬件有著特殊的需求,同時,電信運營商開展人工智能業(yè)務應用離不開大數(shù)據(jù)平臺的支撐;人工智能應用與底層支撐之間還需要集成算法等技術(shù)能力層。
基于以上因素考慮,本文提出一種電信行業(yè)人工智能平臺技術(shù)架構(gòu),如圖4.1-1所示,平臺整體劃分為三層,從底層到頂層依次為基礎(chǔ)支撐層、技術(shù)能力層、應用服務層,以及系統(tǒng)管理功能。
圖4 .1-1 電信行業(yè)人工智能平臺技術(shù)架構(gòu)圖
圖4 .2-1 人工智能應用實施方法論
如前文所述,人工智能包含“數(shù)據(jù)、算力、算法、場景”四個組成要素,其中電信運營商所掌握的數(shù)據(jù)資產(chǎn)種類眾多、數(shù)量龐大,針對如此龐大體量的數(shù)據(jù),如何與云計算資源池、大數(shù)據(jù)/人工智能平臺等結(jié)合處理,如何與多達上百種的人工智能算法建立關(guān)聯(lián),又如何有效地支持具體的應用場景等問題是電信運營商需要重點關(guān)注的問題,這些問題就需要方法論作為支撐和指導,根據(jù)方法論將這些要素串聯(lián)協(xié)同起來,為開展人工智能應用提供業(yè)務流程和實施路徑的指引。
本方法論基于質(zhì)量管理中的“PDCA循環(huán)”思想,并結(jié)合前述分析提出,即計劃(Plan)、執(zhí)行(Do)、檢查(Check)、處理(Act),如圖4.2-1所示。
人工智能應用實施方法論:首先,根據(jù)梳理后的業(yè)務需求確定出有價值的應用場景,如優(yōu)化網(wǎng)絡覆蓋、提升網(wǎng)絡運維效率、提升客戶體驗等;然后,在了解人工智能算法的基礎(chǔ)上,根據(jù)應用場景中的目標,基于應用場景中所涉及的流程或機制,選取相應的預處理(即數(shù)據(jù)采集、關(guān)聯(lián)和清洗等處理)后的數(shù)據(jù)源作為輸入,經(jīng)過數(shù)據(jù)分析后,選取好樣本特征,再針對提取的特征,選用合適的人工智能框架以及算法,經(jīng)過建模、訓練后得出AI模型,最后實現(xiàn)業(yè)務應用;在業(yè)務應用落地后,要持續(xù)對應用效果進行動態(tài)跟蹤評估,并反饋給建模分析迭代調(diào)優(yōu),以保證人工智能應用效果的持續(xù)提升。
對應人工智能的技術(shù)架構(gòu),其產(chǎn)業(yè)結(jié)構(gòu)也可分為應用層、技術(shù)層和基礎(chǔ)層三個層面,底層的基礎(chǔ)資源和技術(shù)研發(fā)的進步共同決定著上層應用的發(fā)展速度。
總體而言,人工智能的發(fā)展切入路徑可以分為三種模式,如圖4.3-1所示。自下向上切入,即從底層基礎(chǔ)切入,掌握海量數(shù)據(jù)資源,研究人工智能的核心算法和模型,并向技術(shù)研發(fā)和場景應用延伸;從中間切入,即從特定技術(shù)切入,如從語音、視覺識別等感知智能技術(shù)切入,并應用到教育、安防、交通等各個領(lǐng)域;從上層切入,即自上向下切入,即從上層應用場景切入,直接采用成熟的技術(shù)手段,發(fā)展產(chǎn)品和服務。
圖4 .3-1 人工智能的發(fā)展模式(切入方式)
科技巨頭普遍選擇從底層自下而上切入產(chǎn)業(yè)鏈,以縱向一體化的模式主導產(chǎn)業(yè)的發(fā)展,這種模式對主導企業(yè)要求較高:首先,必須具備一定深度的技術(shù)沉淀和相關(guān)的基礎(chǔ)資源積累;其次,本身擁有平臺級數(shù)據(jù)入口,從而具備大量數(shù)據(jù)資源用于深度學習和反饋演進;最后,通過人工智能的應用能為業(yè)務帶來極大優(yōu)化、節(jié)省大量的人力成本或提供創(chuàng)新的高附加值業(yè)務。
由于大部分企業(yè)不具備發(fā)展基礎(chǔ)平臺的能力,他們會基于自身的業(yè)務布局和技術(shù)積累,選擇諸如語音識別、機器交互、機器人等特定技術(shù),并開發(fā)相應的應用和產(chǎn)品,從中間切入。
創(chuàng)業(yè)公司多采用從上層切入的模式,其核心是將人工智能相關(guān)的成熟技術(shù)作為手段,結(jié)合有一定創(chuàng)造性的商業(yè)模式,提供具有特色的應用和智能硬件產(chǎn)品。
運營商的AI發(fā)展有其自身特色。運營商走在信息網(wǎng)絡的最前沿,能獲取用戶核心數(shù)據(jù),同時一直為用戶提供全面的ICT服務。運營商在信息化與數(shù)據(jù)方面有長遠的積累,這給運營商發(fā)展AI帶來一定的優(yōu)勢與差異性。
因此,針對電信運營商而言,考慮已建立相關(guān)平臺,擁有平臺級數(shù)據(jù)入口的條件,以及電信運營商的綜合實力不及谷歌、IBM、微軟等科技巨頭的現(xiàn)實因素,可參考“兩頭切入”的模式,立足自有核心業(yè)務優(yōu)勢,通過增強自主研發(fā)、靈活投資、加強與互聯(lián)網(wǎng)巨頭的合作等形式,布局人工智能的基礎(chǔ)層和技術(shù)層關(guān)鍵節(jié)點,挖掘數(shù)據(jù)價值,拓展和增加應用場景,創(chuàng)新商業(yè)模式,提升服務水平,在全球電信運營商“電信IT化”、“網(wǎng)絡虛擬化”的演進過程中,人工智能將發(fā)揮越來越重要的作用。
電信行業(yè)雖然在組織機構(gòu)上的基礎(chǔ)相對薄弱,如在人工智能戰(zhàn)略視野與方向、創(chuàng)新文化、對人工智能技術(shù)的組織性承諾、組織靈活性、組織驅(qū)變力、人工智能相關(guān)人才與技術(shù)能力,但由于擁有大量高質(zhì)量的數(shù)據(jù)積累以及自動化的工作流,為人工智能技術(shù)的介入提供了良好的技術(shù)鋪墊。
目前,人工智能技術(shù)已經(jīng)進入到大規(guī)模應用的前夜,雖然需要克服的技術(shù)問題還有很多,但不得不承認在某些研究充分的領(lǐng)域,規(guī)?;瘧脳l件已經(jīng)具備,但要使人工智能成功應用,與之相配套的技術(shù)研發(fā)及支撐保障體系可能更加重要。
對電信運營商而言,人工智能技術(shù)本身可能不具備銷售價值,其價值體現(xiàn)在嵌入人工智能技術(shù)產(chǎn)品的新特性、新功能的形成及提供,使原有產(chǎn)品具備業(yè)界競爭力、新價值發(fā)現(xiàn)、或節(jié)約產(chǎn)品的運營成本等。要實現(xiàn)人工智能技術(shù)的成功應用,并產(chǎn)生有助于業(yè)務生產(chǎn)的效果還有許多方面需要思考,例如應用人工智能技術(shù)的業(yè)務系統(tǒng)的升級有時需要的投資比單純的某項具體技術(shù)的應用成本還高,業(yè)務系統(tǒng)的流程設(shè)計、升級、測試工作量要超過人工智能技術(shù)本身。需要考慮的因素還包括:
(1)結(jié)合業(yè)務需求演進的技術(shù)長遠規(guī)劃,不但要求針對人工智能的應用進行業(yè)務需求系統(tǒng)化研究,包含近、遠期要實現(xiàn)的功能需求以及與之相適應的人工智能技術(shù)研究,還包含為實現(xiàn)這些業(yè)務功能所需具備的基礎(chǔ)系統(tǒng)條件、網(wǎng)絡條件、后臺服務數(shù)據(jù)條件等整體性研究。
(2)人工智能技術(shù)進展的跟蹤與研究,以及服務于電信行業(yè)發(fā)展需求的合作伙伴的選擇以及長期合作機制的建立。
(3)人工智能技術(shù)應用效果評價體系的建立及完善:人工智能技術(shù)的特點是使原有系統(tǒng)或產(chǎn)品具備智能屬性,其價值是附著在原有產(chǎn)品上,本身單獨的評價較難;根據(jù)業(yè)務應用規(guī)劃,建立科學合理的評價方式,并由評價方式確定參與單位在技術(shù)研發(fā)中的定位等問題需要思考研究。
(4)資源投入的持續(xù)性保障,如業(yè)務人員、科研人員、運維人員等。
(5)建立適配人工智能應用開發(fā)特點的項目管理方式?!?/p>