曾 偉,鐘檢榮,張 瑋,范 君(中國聯(lián)通北京市分公司,北京 100038)
5G將給社會帶來全新的改變,給用戶帶來全新的體驗(yàn)。目前,5G 應(yīng)用場景包括eMBB、uRLLC、mMTC 3種通信服務(wù)類型,公認(rèn)的5G 未來殺手級應(yīng)用包括VR/AR、自動駕駛、無人機(jī)、智能電網(wǎng)、無線醫(yī)療等。5G 將通過網(wǎng)絡(luò)切片的方式,給包括人和物在內(nèi)的、數(shù)量龐大的用戶提供適配的多樣連接。與此同時,5G將對運(yùn)營商的網(wǎng)絡(luò)運(yùn)維和用戶服務(wù)帶來全新的挑戰(zhàn),而用戶投訴處理將是5G 時代一大考題。面對5G 網(wǎng)絡(luò)復(fù)雜度、業(yè)務(wù)類型、用戶類型和數(shù)量的急劇增加,如何快速定位用戶投訴原因,制定投訴解決方案,給用戶滿意答復(fù),最終提升用戶滿意度,是5G 時代亟需解決的問題。
近年來,云計算、大數(shù)據(jù)、深度學(xué)習(xí)等技術(shù)的發(fā)展推動了人工智能產(chǎn)業(yè)的進(jìn)步,人工智能在各行各業(yè)的應(yīng)用遍地開花。目前主流的人工智能應(yīng)用中,最主要的是機(jī)器學(xué)習(xí)和深度學(xué)習(xí),它們專門研究計算機(jī)怎樣模擬人類的學(xué)習(xí)行為獲取新知識或技能,從而不斷改善自身性能。機(jī)器學(xué)習(xí)主要包括監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。本文研究了如何依托大數(shù)據(jù)系統(tǒng),利用機(jī)器學(xué)習(xí)的方法,開展5G用戶智能投訴處理,實(shí)現(xiàn)5G用戶投訴處理的自動化和智能化。
在整個方案中,第1 步需構(gòu)建一個用戶O 域與B域數(shù)據(jù)互通關(guān)聯(lián)的端到端大數(shù)據(jù)系統(tǒng),在該系統(tǒng)中,對全量的用戶信令進(jìn)行數(shù)據(jù)采集和數(shù)據(jù)分析。第2步是以用戶為中心,在機(jī)、卡、網(wǎng)、感、地、時、年、價等八大維度,為網(wǎng)內(nèi)每個用戶建立用戶畫像,以便在用戶發(fā)生投訴時進(jìn)行精準(zhǔn)快速的分析響應(yīng),并在此基礎(chǔ)上形成問題工單。第3 步是構(gòu)建機(jī)器學(xué)習(xí)智能系統(tǒng),在該系統(tǒng)中,通過將歷史工單和歷史分析結(jié)果進(jìn)行機(jī)器學(xué)習(xí),完成模型訓(xùn)練,得到問題分析模型,之后將新的問題工單作為輸入后,便能自動得到新問題的用戶投訴分析結(jié)果,實(shí)現(xiàn)5G用戶投訴處理分析的自動化和智能化。圖1展示了整個方案中數(shù)據(jù)的處理流程。
圖1 5G用戶智能投訴處理方案流程圖
要實(shí)現(xiàn)5G智能投訴處理,必須對用戶的呼叫業(yè)務(wù)質(zhì)量進(jìn)行全面的系統(tǒng)監(jiān)控,而這需要依托先進(jìn)的大數(shù)據(jù)系統(tǒng),基于用戶O域與B域數(shù)據(jù)的互通關(guān)聯(lián),建立基于全量用戶呼叫端到端信令流程的網(wǎng)絡(luò)質(zhì)量分析體系。
2.2.1 數(shù)據(jù)源范圍選取
為了構(gòu)建端到端大數(shù)據(jù)系統(tǒng),首先需要確定數(shù)據(jù)源的范圍。為了滿足端到端信令分析的需求,數(shù)據(jù)源需要包括O 域中的CS 域、EPC 域、IMS 域和RAN 域。為了后續(xù)能對用戶進(jìn)行畫像分析,從而在用戶發(fā)生投訴時精準(zhǔn)快速響應(yīng),數(shù)據(jù)源還需要包括B域數(shù)據(jù),主要涉及用戶套餐、流量、在網(wǎng)時長等。端到端大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源涉及的網(wǎng)元和接口如圖2所示。
圖2 數(shù)據(jù)源涉及的網(wǎng)元和接口
O域數(shù)據(jù)源主要包括:
a)CS域:電路域,主要有Iu-CS、CSFB等。
b)EPC 域:LTE 核心網(wǎng),主要有S1-MME、S1-U、S11、S5/8等。
c)IMS 域:多媒體會話,主要有Gm、Mw、Mx、Mg等。
d)RAN域:無線接入網(wǎng),主要有UU、X2、MR等。B域數(shù)據(jù)源主要包括:用戶套餐、流量、時長、用戶側(cè)賬單、用戶側(cè)詳單等。
2.2.2 大數(shù)據(jù)系統(tǒng)構(gòu)建
大數(shù)據(jù)系統(tǒng)構(gòu)建的目的是把各數(shù)據(jù)源整合起來,提取有用信息,再進(jìn)一步分析問題的原因所在。基于用戶每次業(yè)務(wù)的大數(shù)據(jù)系統(tǒng)具備查詢每個用戶每次業(yè)務(wù)相關(guān)信息的功能。需要以用戶業(yè)務(wù)為中心,以問題定位為目標(biāo),通過用戶、時間、地點(diǎn)、終端、行為、網(wǎng)元、信號、事件等多維度回溯用戶行為和網(wǎng)絡(luò)質(zhì)量,一鍵式全信令自動回溯,助力精準(zhǔn)定位問題。系統(tǒng)的主要模塊包括:
a)GIS 呈現(xiàn)。在該模塊中,主要通過GIS 地圖呈現(xiàn)5G用戶投訴問題發(fā)生時,用戶所處的地理位置和經(jīng)歷的服務(wù)小區(qū)。在進(jìn)行人工分析時,可以清晰直觀、一目了然地呈現(xiàn)問題,有助于問題的判斷。在進(jìn)行基于機(jī)器學(xué)習(xí)的自動化智能分析建模時,可以將分析結(jié)果輸出到GIS 地圖上,直觀地比對分析結(jié)果是否符合預(yù)期,從而幫助模型的修改完善。
b)無線話單。在該模塊中,涉及該5G 投訴的相關(guān)無線話單都被提取出來,每個話單中每個步驟的信令均可追溯。通過分析信令,可以判斷哪個環(huán)節(jié)出現(xiàn)了異常,從而判斷產(chǎn)生問題的原因。為了進(jìn)行基于機(jī)器學(xué)習(xí)的智能分析,異常環(huán)節(jié)會被提取出來,并打上標(biāo)簽,作為智能分析的輸入,幫助判斷造成5G 用戶投訴的原因。
c)網(wǎng)元告警。在該模塊中,主要呈現(xiàn)5G 用戶投訴涉及的網(wǎng)元告警,包括告警出現(xiàn)的網(wǎng)元編號、時間、告警名稱、告警影響等信息。網(wǎng)絡(luò)故障通常是新出問題的第一原因,而網(wǎng)元告警是判斷網(wǎng)絡(luò)故障的第一步。系統(tǒng)會根據(jù)預(yù)判條件,自動篩選出對投訴有影響的告警并呈現(xiàn)出來。在后續(xù)的基于機(jī)器學(xué)習(xí)的智能分析中,網(wǎng)元告警將作為重要的數(shù)據(jù)輸入為投訴分析提供重要依據(jù),而作為問題產(chǎn)生的重要原因之一也可能出現(xiàn)在分析結(jié)果的輸出中。
d)覆蓋/質(zhì)量。無線信號的覆蓋和質(zhì)量對用戶的5G網(wǎng)絡(luò)使用體驗(yàn)有重要影響,覆蓋差或質(zhì)量差會導(dǎo)致接入失敗、數(shù)據(jù)速率低、數(shù)據(jù)掉線等問題,是5G用戶投訴的重要原因之一,因此覆蓋和質(zhì)量情況是5G用戶投訴分析中必不可少的維度。在無線側(cè)的用戶測量報告MR 中,攜帶有關(guān)于當(dāng)前服務(wù)小區(qū)覆蓋和質(zhì)量情況的信息,系統(tǒng)將此信息提取出來并直觀地以時間為順序呈現(xiàn)出來。進(jìn)行基于機(jī)器學(xué)習(xí)的智能分析時,會將覆蓋和質(zhì)量信息進(jìn)行處理并作為數(shù)據(jù)輸入開展分析。
e)常駐小區(qū)。在此模塊中,系統(tǒng)根據(jù)算法自動提取5G投訴用戶的常駐小區(qū),并呈現(xiàn)一段時間內(nèi)各小區(qū)駐留次數(shù)。常駐小區(qū)是5G用戶投訴分析的基礎(chǔ),一切的分析均是在常駐小區(qū)之上開展。因?yàn)橛脩艏热话l(fā)生了投訴,說明問題并不是偶爾出現(xiàn),而是經(jīng)常出現(xiàn),嚴(yán)重影響了用戶的體驗(yàn),那么問題很可能是出現(xiàn)在常駐小區(qū)上。
f)網(wǎng)元KPI 指標(biāo)。在此模塊中,系統(tǒng)提取涉及5G用戶投訴相關(guān)網(wǎng)元的KPI指標(biāo),并根據(jù)需要呈現(xiàn)。KPI指標(biāo)反映了網(wǎng)元的健康程度,出現(xiàn)異常KPI 指標(biāo)的網(wǎng)元通常存在問題,極有可能是產(chǎn)生用戶投訴的原因。將KPI 異常的時間點(diǎn)與投訴時間點(diǎn)進(jìn)行匹配,若相吻合則更說明與投訴強(qiáng)相關(guān),在進(jìn)行基于機(jī)器學(xué)習(xí)的自動化智能分析時,網(wǎng)元KPI 將作為一個重要輸入數(shù)據(jù)進(jìn)行評估。
這6個主要模塊僅是端到端大數(shù)據(jù)系統(tǒng)中可視化呈現(xiàn)的部分,為了進(jìn)行基于機(jī)器學(xué)習(xí)的5G用戶投訴智能分析,還有大量其他數(shù)據(jù)存儲在系統(tǒng)中,作為模型訓(xùn)練和分析的數(shù)據(jù)來源。
在大數(shù)據(jù)系統(tǒng)實(shí)現(xiàn)用戶業(yè)務(wù)端到端信令數(shù)據(jù)采集和分析的基礎(chǔ)上,需要以用戶為中心,在機(jī)、卡、網(wǎng)、感、地、時、年、價等八大維度(一百多個標(biāo)簽),為網(wǎng)內(nèi)每個用戶建立用戶畫像,以便在用戶發(fā)生投訴時進(jìn)行精準(zhǔn)快速的分析響應(yīng)(見圖3)。
圖3 八維用戶畫像示意圖
用戶畫像主要有3 個方面的作用。第一,通過建立用戶畫像,對用戶生成全方位的了解,在開展投訴分析時,可以有針對、有側(cè)重地進(jìn)行。例如,對于ARPU 值高的用戶,由于其貢獻(xiàn)了較多的企業(yè)收入,進(jìn)行投訴處理的優(yōu)先級應(yīng)提至較高;對于投訴次數(shù)較多的用戶,很可能其問題比較嚴(yán)重,如果不盡快解決,用戶滿意度差,離網(wǎng)的可能性較大,也應(yīng)將投訴處理的優(yōu)先級提至較高。第二,在建立用戶畫像后,可以根據(jù)用戶在各個維度的情況提取相關(guān)信息,形成經(jīng)驗(yàn)總結(jié),指導(dǎo)后續(xù)投訴的處理。例如,根據(jù)用戶終端的使用情況,匹配其投訴情況,可以總結(jié)出哪些型號的終端可能存在問題,導(dǎo)致非網(wǎng)絡(luò)原因的投訴的產(chǎn)生,在進(jìn)行投訴分析時將其作為一項(xiàng)重要參考。第三,也是最重要的一部分,在用戶畫像中,包含了用戶投訴和異常事件相關(guān)信息,將這些信息進(jìn)行加工處理,形成基于機(jī)器學(xué)習(xí)的5G 用戶智能投訴處理分析的數(shù)據(jù)輸入,利用機(jī)器學(xué)習(xí)智能系統(tǒng)進(jìn)行分析,最終輸出產(chǎn)生用戶投訴的原因。
用戶畫像的建立過程主要是在O 域數(shù)據(jù)和B 域數(shù)據(jù)打通的基礎(chǔ)上,從機(jī)、卡、網(wǎng)、感、地、時、年、價8個維度,根據(jù)需要設(shè)立標(biāo)簽,針對每個用戶提取標(biāo)簽信息,從而形成每個用戶的畫像。由于用戶的信息經(jīng)常發(fā)生變動,尤其是感知方面的信息,隨著網(wǎng)絡(luò)和用戶業(yè)務(wù)使用情況的不斷變化,用戶畫像中的信息也需要不斷更新,在開展5G用戶投訴分析時才具有時效性。
智能投訴處理的關(guān)鍵是用戶投訴問題的定界和定位。算法構(gòu)建的核心是基于用戶畫像的標(biāo)簽體系,結(jié)合歷史投訴單的內(nèi)容、地點(diǎn)以及歷史問題的定位結(jié)果,利用機(jī)器學(xué)習(xí)分類算法,反復(fù)迭代得出可靠穩(wěn)定的決策模型。
2.4.1 模型的建立與利用
機(jī)器學(xué)習(xí)的過程主要涉及到數(shù)據(jù)的準(zhǔn)備、模型的選取、模型的訓(xùn)練、模型的利用(見圖4)。在所有工作開始之前,需要梳理產(chǎn)生問題的原因類別,例如顯性故障、隱性故障、弱覆蓋、質(zhì)差、擁塞、高干擾、參數(shù)設(shè)置錯誤等。對每種原因類別,建立一個模型,模型的輸出是對是否存在該原因類別的二元判斷,即“是”或“否”。最終將所有類型的判斷綜合起來,形成總體分析結(jié)論。下面以3種原因類別的建模和分析為例說明機(jī)器學(xué)習(xí)模型的建立與利用。
圖4 機(jī)器學(xué)習(xí)模型的建立與利用
a)數(shù)據(jù)的準(zhǔn)備。在本方案中,數(shù)據(jù)主要來自大數(shù)據(jù)系統(tǒng)中與5G 用戶投訴相關(guān)的工單、用戶畫像結(jié)果、告警數(shù)據(jù)表、呼叫數(shù)據(jù)表等。將相關(guān)信息提取出來,形成n項(xiàng)指標(biāo),作為模型的輸入,將歷史工單分析結(jié)果即是否存在該種原因類別,形成標(biāo)簽,作為模型的輸出。
b)模型的選取。機(jī)器學(xué)習(xí)的分類算法有多種,包括邏輯回歸、線性判別分析、K 近鄰、分類和回歸樹、樸素貝葉斯、支持向量機(jī)等。在這里,選取隨機(jī)森林算法進(jìn)行模型的建立。隨機(jī)森林是通過集成學(xué)習(xí)的思想將多棵樹集成的一種算法,它通過隨機(jī)選取部分樣本和特征構(gòu)建多棵決策樹,其中每棵樹都是基于隨機(jī)向量的一個獨(dú)立集合的值產(chǎn)生的,最后再將多棵決策樹產(chǎn)生的結(jié)果整合在一起。隨機(jī)森林算法具有精確度高、不容易陷入過擬合、泛化能力等優(yōu)點(diǎn)。
c)模型的訓(xùn)練。針對每一種原因類別,建立一個模型,開展模型訓(xùn)練。例如,針對“顯性故障”這一原因類別,建立模型I,把數(shù)據(jù)按8∶2分成訓(xùn)練集、測試集2 個部分,將指標(biāo)1……指標(biāo)n作為輸入,標(biāo)簽作為輸出,代入隨機(jī)森林模型。在完成模型訓(xùn)練后,開展精度評估,調(diào)整相關(guān)參數(shù)設(shè)置,提高樣本數(shù)量,使得精度達(dá)到要求,即完成了模型的訓(xùn)練。
d)模型的利用。在收到5G 用戶投訴工單后,根據(jù)待處理工單,從各個數(shù)據(jù)表中提取工單用戶的前30天數(shù)據(jù),進(jìn)行相關(guān)數(shù)據(jù)處理之后,輸入到機(jī)器學(xué)習(xí)智能系統(tǒng)中,系統(tǒng)將輸出針對每種原因類別的二元判斷,即是否存在該原因類別。最終將結(jié)果綜合起來,即可形成5G用戶投訴的原因分析結(jié)果。
2.4.2 與客服感知系統(tǒng)的結(jié)合
客服感知系統(tǒng)是專門用于應(yīng)對用戶投訴開發(fā)的系統(tǒng)。系統(tǒng)所包含的投訴應(yīng)答,不僅包括網(wǎng)絡(luò)側(cè)問題,也包括業(yè)務(wù)、服務(wù)等方面的問題,是一個綜合的投訴應(yīng)答平臺。基于機(jī)器學(xué)習(xí)的模型輸出,作為網(wǎng)絡(luò)側(cè)的問題分析反饋結(jié)果,最終需要與客服感知系統(tǒng)結(jié)合,才能最終發(fā)揮作用,完成對5G 用戶投訴的智能處理,從而提升投訴分析和處理的效率。
從機(jī)器學(xué)習(xí)智能系統(tǒng)中輸出的分析結(jié)果,僅是對各種問題原因類別的一個二元判斷,尚未形成綜合結(jié)果。圖5 以3 種問題原因類別為例,展示了如何將單個結(jié)果形成為綜合結(jié)果,并輸出至客服感知系統(tǒng)。
圖5 機(jī)器學(xué)習(xí)綜合結(jié)果輸出至客服感知系統(tǒng)
在實(shí)際生產(chǎn)中,5G 用戶智能投訴分析系統(tǒng)與客服系統(tǒng)、工單系統(tǒng)緊密對接,日處理分析超過200單網(wǎng)絡(luò)問題的投訴,通過系統(tǒng)運(yùn)算,只需要1 h,并且給出的方案定位匹配率超過90%,大大提升了5G用戶投訴分析和方案制定的效率,節(jié)省了人工和時間成本,成為應(yīng)對5G時代用戶投訴的利器。
圖6 展示了使用5G 用戶智能投訴分析系統(tǒng)的一個案例,該案例中,由于基站故障導(dǎo)致了用戶投訴。智能系統(tǒng)分析出該投訴是由于名稱為“朝陽東窯平房區(qū)”的基站發(fā)生射頻告警產(chǎn)生,方案匹配率為90%。
圖6 基站告警引起用戶投訴分析結(jié)果
本文提出的基于機(jī)器學(xué)習(xí)的5G 用戶智能投訴處理方案,通過構(gòu)建用戶O 域數(shù)據(jù)和B 域數(shù)據(jù)互通關(guān)聯(lián)的大數(shù)據(jù)分析系統(tǒng),將用戶呼叫過程中的信令流程及網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行整合。為網(wǎng)內(nèi)每個用戶建立用戶畫像,以便用戶發(fā)生投訴時開展精準(zhǔn)快速的分析響應(yīng)。通過機(jī)器學(xué)習(xí)智能系統(tǒng),建立智能分析模型,實(shí)現(xiàn)5G 投訴問題原因的快速定位。經(jīng)過實(shí)際生產(chǎn)驗(yàn)證,方案定位匹配率超過90%,日均處理超過200 單網(wǎng)絡(luò)問題投訴,從用戶投訴處理的角度,為5G大規(guī)模商用的到來,在網(wǎng)絡(luò)的智能化和自動化運(yùn)營方面探索了一條道路。