楊慰民
中國(guó)移動(dòng)通信集團(tuán)福建有限公司,福建 福州 350003
基于大數(shù)據(jù)的移動(dòng)互聯(lián)網(wǎng)主動(dòng)運(yùn)維理論和實(shí)踐進(jìn)展
楊慰民
中國(guó)移動(dòng)通信集團(tuán)福建有限公司,福建 福州 350003
對(duì)于非話音的移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù),即使網(wǎng)絡(luò)指標(biāo)是完好的,仍然存在用戶感知不佳的現(xiàn)象?;诖髷?shù)據(jù)技術(shù)研究用戶感知和網(wǎng)絡(luò)性能指標(biāo)的關(guān)系,提出基于樣本空間置換的五元五階模型實(shí)施主動(dòng)運(yùn)維,先于用戶投訴發(fā)現(xiàn)并解決感知不佳問(wèn)題。相比傳統(tǒng)的運(yùn)維模式,主動(dòng)運(yùn)維模式以網(wǎng)絡(luò)性能管理為基礎(chǔ),能快速發(fā)現(xiàn)網(wǎng)絡(luò)中各節(jié)點(diǎn)之間的性能失衡、趨勢(shì)異常等隱性問(wèn)題。運(yùn)維人員根據(jù)分析結(jié)果主動(dòng)出擊,在故障發(fā)生前精確優(yōu)化,降低成本,提升網(wǎng)絡(luò)質(zhì)量及客戶滿意度。
移動(dòng)互聯(lián)網(wǎng);大數(shù)據(jù);用戶感知;性能分析;主動(dòng)運(yùn)維;五元五階;樣本空間置換
大數(shù)據(jù)、移動(dòng)互聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、云計(jì)算、物聯(lián)網(wǎng)等新一代信息技術(shù)構(gòu)成的IT架構(gòu)“第三平臺(tái)”是信息社會(huì)進(jìn)入新階段的標(biāo)志,對(duì)整個(gè)經(jīng)濟(jì)的轉(zhuǎn)型有引領(lǐng)和帶動(dòng)作用。電信運(yùn)營(yíng)商尤其是具有濃厚國(guó)資背景的中國(guó)電信運(yùn)營(yíng)商是承載“第三平臺(tái)”的主體。
運(yùn)營(yíng)商天然擁有大數(shù)據(jù),如大量用戶的相關(guān)數(shù)據(jù),相對(duì)互聯(lián)網(wǎng)企業(yè)而言準(zhǔn)確度更高,也更加完整。除此之外,運(yùn)營(yíng)商的基礎(chǔ)設(shè)施(如交換機(jī)、基站、數(shù)據(jù)通信設(shè)備、傳輸設(shè)備等)的運(yùn)行維護(hù)數(shù)據(jù)、告警信息、配置信息、性能信息是比傳統(tǒng)大數(shù)據(jù)范圍更廣、涉及領(lǐng)域更多、運(yùn)營(yíng)商獨(dú)有的、比大數(shù)據(jù)更大量的數(shù)據(jù)。然而傳統(tǒng)運(yùn)營(yíng)商對(duì)大數(shù)據(jù)的運(yùn)行主要表現(xiàn)在:對(duì)內(nèi),利用大數(shù)據(jù)進(jìn)行自我改造,應(yīng)用領(lǐng)域集中在內(nèi)部決策、精確營(yíng)銷和客戶服務(wù)領(lǐng)域;對(duì)外,形成對(duì)外開(kāi)放、可商業(yè)化的核心能力,將其封裝為服務(wù)和產(chǎn)品,實(shí)現(xiàn)商業(yè)模式的創(chuàng)新,助力“互聯(lián)網(wǎng)+”新經(jīng)濟(jì)、新常態(tài)的發(fā)展,如協(xié)助政府社會(huì)管理,根據(jù)場(chǎng)景、區(qū)域等維度,把相關(guān)數(shù)據(jù)做出畫(huà)像,協(xié)助做好政府社會(huì)管理。
對(duì)于某個(gè)可能引起用戶感知不佳甚至引發(fā)投訴的事件,電信運(yùn)營(yíng)商客戶服務(wù)領(lǐng)域有一組有趣的統(tǒng)計(jì)數(shù)據(jù):26個(gè)用戶因?yàn)榉?wù)質(zhì)量不佳有可能投訴但選擇保持沉默,其中只有1個(gè)用戶因服務(wù)不好選擇投訴。該事件同時(shí)會(huì)被傳播,其中,該事件被告知其他528人,最終有1 341人傳播了該事件。因此,解決客戶感知不佳的問(wèn)題迫在眉睫,無(wú)論用戶是否投訴,先于客戶發(fā)現(xiàn)問(wèn)題、解決問(wèn)題,是電信運(yùn)營(yíng)商亟待解決的難題。
中國(guó)移動(dòng)通信集團(tuán)公司(以下簡(jiǎn)稱中國(guó)移動(dòng))是全球最大的電信運(yùn)營(yíng)商,始終秉承“網(wǎng)絡(luò)質(zhì)量是企業(yè)的生命線”的理念。用戶感知與網(wǎng)絡(luò)性能指標(biāo)在傳統(tǒng)的電信運(yùn)營(yíng)商電路交換業(yè)務(wù)網(wǎng)絡(luò)中呈正相關(guān)特性。然而,對(duì)于非話音的移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù),即使網(wǎng)絡(luò)指標(biāo)是完好的,仍然存在用戶感知不佳的現(xiàn)象。運(yùn)營(yíng)商被動(dòng)通過(guò)投訴渠道獲取用戶的感知信息。本文研究用戶感知和網(wǎng)絡(luò)性能指標(biāo)的關(guān)系,基于大數(shù)據(jù)技術(shù),提出基于樣本空間置換的五元五階(five element five phase,F(xiàn)EFP)方法,實(shí)施主動(dòng)運(yùn)維,先于用戶投訴發(fā)現(xiàn)并解決感知不佳問(wèn)題。相比傳統(tǒng)的運(yùn)維模式,主動(dòng)運(yùn)維模式以網(wǎng)絡(luò)性能管理為基礎(chǔ),主動(dòng)進(jìn)行網(wǎng)絡(luò)分析,快速發(fā)現(xiàn)網(wǎng)絡(luò)中各節(jié)點(diǎn)之間的性能失衡、趨勢(shì)異常等隱性問(wèn)題,運(yùn)維人員根據(jù)分析結(jié)果主動(dòng)出擊,在故障發(fā)生前,有的放矢地進(jìn)行精確優(yōu)化,降低成本,提升網(wǎng)絡(luò)質(zhì)量及客戶滿意度。
2.1 電信業(yè)大數(shù)據(jù)的特點(diǎn)與構(gòu)成
中國(guó)電信運(yùn)營(yíng)商已經(jīng)將數(shù)據(jù)資源上升到數(shù)據(jù)資產(chǎn)。傳統(tǒng)電信業(yè)的大數(shù)據(jù)大約97%來(lái)自于運(yùn)維支撐系統(tǒng)(operation support system,OSS)域(以下簡(jiǎn)稱O域),3%來(lái)自于業(yè)務(wù)支撐系統(tǒng)(business support system,BSS)域(以下簡(jiǎn)稱B域)。其中,O域數(shù)據(jù)具有量大、精細(xì)、實(shí)時(shí)和貼近網(wǎng)絡(luò)行為等特點(diǎn),B域數(shù)據(jù)具有量小、匯總、離線、貼近用戶行為等特點(diǎn)。
傳統(tǒng)O域數(shù)據(jù)主要來(lái)自于網(wǎng)管系統(tǒng)數(shù)據(jù),特點(diǎn)是基于網(wǎng)絡(luò)設(shè)備的網(wǎng)元級(jí)(設(shè)備級(jí))的操作、管理、測(cè)量報(bào)告、運(yùn)行狀態(tài)結(jié)果等數(shù)據(jù)。通常采樣周期為15 min以上,時(shí)延0.5 h以上。然而,不同于傳統(tǒng)的“話音業(yè)務(wù)網(wǎng)絡(luò)好,客戶感知就好”,移動(dòng)互聯(lián)網(wǎng)網(wǎng)絡(luò)運(yùn)行實(shí)踐表明,即使O域呈現(xiàn)出的各種數(shù)據(jù)是正常的,仍然存在大量用戶感知不佳的現(xiàn)象,即用戶感知的精確刻畫(huà)和描述無(wú)法通過(guò)傳統(tǒng)的O域數(shù)據(jù)進(jìn)行表征。用戶的感知只能以用戶遇到問(wèn)題后的投訴間接反映,這就是運(yùn)營(yíng)商的傳統(tǒng)運(yùn)維方式。因此傳統(tǒng)以網(wǎng)元為中心的被動(dòng)式的網(wǎng)絡(luò)運(yùn)維體系已經(jīng)不適應(yīng)“體驗(yàn)為王”的移動(dòng)互聯(lián)網(wǎng)時(shí)代的特征要求。當(dāng)前客戶感知不僅僅取決于網(wǎng)絡(luò),更涉及終端、業(yè)務(wù)使用全流程的各個(gè)環(huán)節(jié)。以某省公司調(diào)查為例,影響客戶感知的各種因素中,網(wǎng)絡(luò)質(zhì)量問(wèn)題只占19%,剩下的81%的問(wèn)題分布在終端、業(yè)務(wù)和用戶側(cè)。而傳統(tǒng)以故障告警為重點(diǎn)的網(wǎng)絡(luò)運(yùn)維體系,已無(wú)法做到端到端全覆蓋、全過(guò)程、實(shí)時(shí)的質(zhì)量監(jiān)控分析。網(wǎng)絡(luò)主動(dòng)運(yùn)維“難”。傳統(tǒng)運(yùn)維模式是根據(jù)客戶投訴或網(wǎng)絡(luò)顯性故障,被動(dòng)地解決問(wèn)題,無(wú)法做到對(duì)客戶感知的主動(dòng)預(yù)判,所以永遠(yuǎn)都是慢客戶“一拍”,難以從根本上保障和提升客戶感知。因此,網(wǎng)絡(luò)必須加快向“客戶體驗(yàn)+主動(dòng)運(yùn)維”的模式轉(zhuǎn)型。主動(dòng)運(yùn)維必須通過(guò)大數(shù)據(jù)實(shí)現(xiàn),大數(shù)據(jù)分析中盡量匯集多種來(lái)源的數(shù)據(jù)是關(guān)鍵,大數(shù)據(jù)的數(shù)據(jù)源如果僅停留在傳統(tǒng)的運(yùn)維數(shù)據(jù)層面,數(shù)據(jù)會(huì)有一定的局限性和片面性,只有集成多個(gè)方面的原始數(shù)據(jù),才能反映事物的全貌。為了實(shí)現(xiàn)用戶感知的主動(dòng)保障,電信運(yùn)營(yíng)商已經(jīng)開(kāi)始如圖1右側(cè)所示的移動(dòng)通信網(wǎng)絡(luò)信令數(shù)據(jù)采集和互聯(lián)網(wǎng)業(yè)務(wù)的深度分組解析(deep packet inspection,DPI)項(xiàng)目建設(shè)。但是,如圖1所示,新的信令采集和DPI數(shù)據(jù)的體量遠(yuǎn)大于傳統(tǒng)數(shù)據(jù),非格式化的數(shù)據(jù)特點(diǎn)也更加顯現(xiàn)。這些特點(diǎn)又推動(dòng)數(shù)據(jù)分析向大數(shù)據(jù)思維和技術(shù)變革。
2.2 基于五元五階模型實(shí)現(xiàn)端到端客戶感知到移動(dòng)互聯(lián)網(wǎng)接續(xù)過(guò)程的映射
據(jù)某知名咨詢機(jī)構(gòu)對(duì)中國(guó)移動(dòng)用戶4G手機(jī)上網(wǎng)的調(diào)查報(bào)告顯示,數(shù)據(jù)業(yè)務(wù)的用戶感知是中國(guó)移動(dòng)當(dāng)前的薄弱環(huán)節(jié)。感知不佳主要體現(xiàn)在:沒(méi)信號(hào)、有信號(hào)但上不了網(wǎng)、網(wǎng)速慢以及掉線頻繁,如圖2所示。
LTE網(wǎng)絡(luò)質(zhì)量問(wèn)題定位需要以用戶業(yè)務(wù)感知為原則,即必須通過(guò)技術(shù)手段將用戶感知技術(shù)的指標(biāo)進(jìn)行表征,這樣就可以透過(guò)網(wǎng)絡(luò)視角匯聚用戶視角。圖3為在4G的LTE網(wǎng)絡(luò)中用戶感知與網(wǎng)絡(luò)對(duì)應(yīng)的技術(shù)過(guò)程的關(guān)系。
在圖3感知和技術(shù)流程對(duì)應(yīng)的基礎(chǔ)上,圖4則給出了基于客戶感知的端到端質(zhì)量保障分析流程。LTE數(shù)據(jù)業(yè)務(wù)的用戶感知需要建立一套規(guī)范的評(píng)估提升方法,實(shí)現(xiàn)端到端的性能分析,通過(guò)端到端質(zhì)量保障提升客戶感知。
因此,如圖3所示的網(wǎng)絡(luò)視角,與LTE網(wǎng)絡(luò)客戶感知直接相關(guān)的順序的時(shí)間流程包括5個(gè)步驟(階段),即附著(attach)、管道建立(EPS)、域名系統(tǒng)(DNS查詢)、傳輸控制協(xié)議(transmission control protool, TCP)鏈接建立以及業(yè)務(wù)使用。用戶使用業(yè)務(wù)涉及的從用戶側(cè)到網(wǎng)絡(luò)側(cè)端到端的所有網(wǎng)元和環(huán)節(jié)都影響用戶感知,將這些環(huán)節(jié)在空間上劃分為5個(gè)層面的元素(element),即用戶、終端、小區(qū)、網(wǎng)絡(luò)和業(yè)務(wù)。通過(guò)空間的5個(gè)維度(元素)和時(shí)間上的5個(gè)步驟可以在空間和時(shí)間維度上定位出用戶某次上網(wǎng)感知不佳的問(wèn)題所在,即用戶某次上網(wǎng)感知不佳,在空間上是哪個(gè)具體“元”(網(wǎng)元)導(dǎo)致,在時(shí)間上是發(fā)生在五階的具體哪個(gè)“階”。這就是五元五階模型。
圖1 電信業(yè)大數(shù)據(jù)的構(gòu)成示意
圖2 用戶感知調(diào)查報(bào)告
圖3 用戶感知與網(wǎng)絡(luò)接續(xù)過(guò)程的對(duì)應(yīng)關(guān)系
五元是相互匹配的元素,環(huán)節(jié)失配將導(dǎo)致業(yè)務(wù)不流暢或業(yè)務(wù)能力未充分挖掘。五階是順序的流水過(guò)程,任一階段出現(xiàn)問(wèn)題將導(dǎo)致斷流(業(yè)務(wù)中斷),KQI(key quality index,關(guān)鍵質(zhì)量指標(biāo))產(chǎn)生自每個(gè)環(huán)節(jié)。五元五階模型并非5×5 的簡(jiǎn)單疊加,而是基于大數(shù)據(jù)的多維度數(shù)據(jù)的上卷與下鉆,實(shí)現(xiàn)面向用戶感知的全方位的知識(shí)挖掘。五元五階模型一方面體現(xiàn)端到端能力保障和能力運(yùn)營(yíng)的最小變量級(jí),另一方面足夠完備地保證各項(xiàng)輸出。
基于FEFP模型的大數(shù)據(jù)技術(shù)使得從海量信息中快速提取有價(jià)值信息成為可能,獲取“5A”,即任何小區(qū)(any cell)、任何用戶(any user)、持任何終端(any terminal)、使用任何應(yīng)用(any service)獲得的量化的任何效果和品質(zhì)(any quantized quality)(如時(shí)延、速率)是獲取客戶感知的關(guān)鍵。要實(shí)現(xiàn)基于五元五階模型的“5A”目標(biāo),必須要有相應(yīng)的LTE信令采集數(shù)據(jù)支撐。
圖4 基于客戶感知的端到端保障體系流程
2.3 LTE信令采集DPI
傳統(tǒng)的網(wǎng)管數(shù)據(jù)更多記錄的是網(wǎng)元設(shè)備運(yùn)行的結(jié)果和狀態(tài)測(cè)量數(shù)據(jù),它側(cè)重于設(shè)備的運(yùn)行結(jié)果。但是大量事實(shí)表明,當(dāng)用戶出現(xiàn)明顯的感知異常時(shí),網(wǎng)元設(shè)備運(yùn)行結(jié)果表現(xiàn)為正常。為了實(shí)施保障用戶感知的主動(dòng)運(yùn)維,需要建設(shè)信令采集系統(tǒng),圖5是LTE網(wǎng)絡(luò)信令采集系統(tǒng)的結(jié)構(gòu)示意,覆蓋用戶面與控制面。表1給出了每個(gè)采集接口對(duì)應(yīng)可獲取的數(shù)據(jù)。
通過(guò)信令數(shù)據(jù)的采集和大數(shù)據(jù)分析,有可能實(shí)現(xiàn)用戶“5A”信息的獲取,繼而做到用戶感知的端到端體驗(yàn)保障,實(shí)現(xiàn)先于用戶投訴就主動(dòng)發(fā)現(xiàn)問(wèn)題、解決問(wèn)題的目標(biāo)。這就是主動(dòng)運(yùn)維及主動(dòng)運(yùn)維的意義和價(jià)值。
圖5 LTE信令采集結(jié)構(gòu)示意
表1 LTE信令采集接口及對(duì)應(yīng)的信息描述
基于LTE信令數(shù)據(jù)的采集和五元五階模型,利用大數(shù)據(jù)技術(shù)可實(shí)現(xiàn)以下目標(biāo):
· 對(duì)采集的數(shù)據(jù)進(jìn)行整理,對(duì)海量信息進(jìn)行過(guò)濾,多維度提取用戶行為信息;
· 通過(guò)網(wǎng)絡(luò)行為(便于理解的信令)啟發(fā)式呈現(xiàn)用戶行為;
· 通過(guò)關(guān)鍵績(jī)效指標(biāo)(key performance indicator,KPI)、KQI、體驗(yàn)質(zhì)量(quality of experience,QoE)多個(gè)維度網(wǎng)絡(luò)指標(biāo)量化映射網(wǎng)絡(luò)行為;
· 多個(gè)場(chǎng)景聯(lián)合分析,挖掘用戶感知;
· 建立特征,關(guān)聯(lián)端到端性能與模型,實(shí)現(xiàn)知識(shí)固化,通過(guò)固化的特征,指導(dǎo)用戶行為挖掘,實(shí)現(xiàn)閉環(huán)。
圖6為五元五階模型示意。其中,橫、縱坐標(biāo)分別是五元五階的五元和五階變量,通過(guò)五元五階共10個(gè)維度(在實(shí)際應(yīng)用中維度通常會(huì)超過(guò)10個(gè),新增的維度(如傳輸設(shè)備、數(shù)據(jù)通信設(shè)備)是指通過(guò)“五元”關(guān)聯(lián)而新增的變量)的變量構(gòu)建出用于主動(dòng)運(yùn)維的網(wǎng)絡(luò)行為分析、用戶行為分析、端到端性能分析、用戶感知分析以及網(wǎng)絡(luò)指標(biāo)分析等。基于這些應(yīng)用體系或應(yīng)用系統(tǒng)的分析結(jié)果,實(shí)現(xiàn)先于用戶投訴就主動(dòng)發(fā)現(xiàn)小至用戶級(jí)、大到全網(wǎng)的感知問(wèn)題,感知到問(wèn)題對(duì)應(yīng)五元五階中“元”或者“階”的具體位置,繼而針對(duì)性地解決問(wèn)題。這就是主動(dòng)運(yùn)維的過(guò)程。
圖6 五元五階模型
3.1 樣本空間置換算法
通過(guò)五元五階模型,利用大數(shù)據(jù)可以構(gòu)建出如圖7所示的多維數(shù)據(jù)倉(cāng)庫(kù)(cube)。這樣可生成一維和多維的“5A”用戶感知信息數(shù)據(jù)庫(kù),其中,用戶感知多維數(shù)據(jù)倉(cāng)庫(kù)是在一維基礎(chǔ)上的不同樣本數(shù)或所在不同空間維度的多元統(tǒng)計(jì)分析值。在該多維數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上,利用樣本空間置換算法進(jìn)行用戶感知問(wèn)題自動(dòng)定界以及主動(dòng)運(yùn)維工作。樣本存在于空間中,是一定空間中的樣本。一定樣本組成的小空間構(gòu)成了一個(gè)樣本,這個(gè)小空間形成的樣本又是更大空間的一個(gè)樣本。通過(guò)樣本和空間的不斷置換迭代進(jìn)行相應(yīng)感知指標(biāo)的對(duì)比,可以快速發(fā)現(xiàn)整個(gè)LTE網(wǎng)絡(luò)用戶、手機(jī)、小區(qū)、網(wǎng)絡(luò)以及業(yè)務(wù)平臺(tái)可能潛在的故障或相應(yīng)網(wǎng)元的性能劣化。
樣本空間置換算法實(shí)例如下。
案例:用戶感知多維數(shù)據(jù)倉(cāng)庫(kù)“發(fā)現(xiàn)”A用戶使用的某瀏覽業(yè)務(wù)網(wǎng)頁(yè)S無(wú)法呈現(xiàn),而全網(wǎng)的其他業(yè)務(wù)基本正常。其中,A用戶使用B終端,事件發(fā)生時(shí)段為T(mén)(一般采用小時(shí)粒度)。
使用樣本空間置換算法可以快速地進(jìn)行潛在“故障/隱患”判斷。判斷規(guī)則如下。
· 該時(shí)間段T內(nèi),全網(wǎng)除A之外的所有用戶使用瀏覽業(yè)務(wù)網(wǎng)頁(yè)S是否正常?如果全網(wǎng)所有用戶使用該業(yè)務(wù)均異常,那么業(yè)務(wù)網(wǎng)頁(yè)S發(fā)生故障。整個(gè)過(guò)程結(jié)束。否則,進(jìn)行以下判斷。
· 全網(wǎng)使用終端B的用戶在該時(shí)段內(nèi)瀏覽業(yè)務(wù)網(wǎng)頁(yè)S是否正常?如果正常,轉(zhuǎn)下一步。如果異常,全網(wǎng)使用終端B的用戶使用除業(yè)務(wù)網(wǎng)頁(yè)S外的業(yè)務(wù)是否正常?如果正常,結(jié)論是該款終端與該業(yè)務(wù)的匹配有問(wèn)題。整個(gè)過(guò)程結(jié)束。
· A用戶所在地點(diǎn)的小區(qū)其他用戶瀏覽業(yè)務(wù)網(wǎng)頁(yè)S是否正常?A用戶在T時(shí)段內(nèi)在該小區(qū)瀏覽業(yè)務(wù)網(wǎng)頁(yè)S外的其他業(yè)務(wù)是否正常?A用戶在其他小區(qū)內(nèi)使用其他業(yè)務(wù)是否正常?
通過(guò)上述簡(jiǎn)單的比較過(guò)程,可以快速定界出此次異常事件的主因:業(yè)務(wù)S有問(wèn)題,或者用戶A的個(gè)性問(wèn)題,或者用戶使用的終端B有問(wèn)題,或者用戶使用終端B的個(gè)性問(wèn)題,或者用戶所在小區(qū)有問(wèn)題,或者用戶所在小區(qū)與業(yè)務(wù)S的匹配問(wèn)題,或者用戶所在小區(qū)對(duì)應(yīng)的小區(qū)設(shè)備廠商的所有該版本設(shè)備有問(wèn)題,或者用戶所在小區(qū)對(duì)應(yīng)的核心網(wǎng)元的某個(gè)模塊甚至是核心網(wǎng)元有問(wèn)題。
這就是基于樣本空間置換算法的五元五階模型。在時(shí)間維度上將用戶的體驗(yàn)分解成不同的階段,通過(guò)空間上的5個(gè)維度的不斷相互置換,先于用戶投訴快速發(fā)現(xiàn)用戶感知不佳的原因,繼而解決故障隱患。
圖7 基于五元五階模型的多維數(shù)據(jù)倉(cāng)庫(kù)
3.2 樣本維度分類
假設(shè)用戶樣本的評(píng)估為y=f({a, b, c, d, e}),其中,a為用戶維度,b為終端維度,c為小區(qū)維度,d為網(wǎng)絡(luò)維度,e為業(yè)務(wù)維度,f函數(shù)為基于上述五元維度的評(píng)估。
對(duì)于用戶維度,可以有以下幾類空間:?jiǎn)斡脩鬉0,按運(yùn)行速度分類用戶A1,…,全量用戶An。
終端維度:該終端B0,同款終端B1,同廠商終端B2,…,全量終端Bm。
小區(qū)維度:該小區(qū)C0,同暫時(shí)接入控制(temporal access control, TAC)C1,同區(qū)域C2,同特征區(qū)域群C3,同地市C4,…,全省Cp。
網(wǎng)絡(luò)維度:所在核心網(wǎng)D0,同移動(dòng)管理實(shí)體(mobile management entity, MME) pool D1,…,全量Dq。
業(yè)務(wù)維度:該樣本當(dāng)前業(yè)務(wù)E0,同內(nèi)容提供商(service provider, SP)E1,按數(shù)據(jù)分組大小分業(yè)務(wù)E2,同協(xié)議E3,…,全業(yè)務(wù)Er。
上述的五元組成的樣本集合形成了相應(yīng)的空間集合,如下:
3.3 樣本空間置換定界規(guī)則
(1)定義一套規(guī)則
單用戶A0從屬于按運(yùn)行速率分類的某一類用戶A1,而A1又從屬于全量用戶An,那么如果存在Ai從屬于Aj,且不存在Ak使得Ai從屬于Ak,且Ak從屬于Aj,則認(rèn)為
(2)定界的實(shí)現(xiàn)原理
目標(biāo)是找到一個(gè)組合(Aw,Bv,Cx,Dy,Ez),其中,Aw是(A0,A1,A2,…,An)的元素,且a從屬于Aw,其他維度相同,使得f({Aw,Bv,Cx,Dy,Ez})達(dá)到異常閾值,而以下5個(gè)結(jié)果正?;蚱蛘#?/p>
舉例說(shuō)明,假設(shè)確認(rèn)所有在TAC005下通過(guò)核心網(wǎng)絡(luò)SAEGW01的用戶業(yè)務(wù)指標(biāo)異常(Cx為T(mén)AC005,Dy為SAEGW01),但是所有在TAC005從屬的大區(qū)域下通過(guò)核心網(wǎng)絡(luò)SAEGW01的用戶指標(biāo)基本正常(Cx為father(TAC005)),且所有在TAC005通過(guò)其他所有核心網(wǎng)絡(luò)的用戶業(yè)務(wù)(Dy為father(SAEGW01)也正常,那問(wèn)題就明確定界了,問(wèn)題出現(xiàn)在該TAC005與SAEGW01之間。
(3)定界實(shí)現(xiàn)過(guò)程
對(duì)于異常樣本(a,b,c,d,e):確定空間集合各個(gè)點(diǎn)的值,如A0為用戶王某某,A1為高速用戶,An為全量用戶。
明確5個(gè)維度內(nèi)各個(gè)子空間的從屬關(guān)系:father(A0)=A1,…。分5個(gè)維度,從最高空間An,Bm,Cp,Dq,Er向下遍歷(可以是廣度遍歷,也可以是深度遍歷),直到找到目標(biāo)Aw,Bv,Cx,Dy,Ez符合前面所述定界規(guī)則。
(4)定界過(guò)程的優(yōu)化
由于維度與空間太多,必然出現(xiàn)維度過(guò)多的“維災(zāi)難”。這種災(zāi)難在數(shù)據(jù)量極大的大數(shù)據(jù)中必須有效降低。解決“維災(zāi)難”的有效措施是無(wú)需遍歷所有可能的維度??紤]到五元(用戶/終端/小區(qū)/網(wǎng)絡(luò)/業(yè)務(wù))中5個(gè)維度并非完全無(wú)關(guān)(非正交),有些組合可以排除,或者將可能性較低的5個(gè)維度的組合的遍歷順序放在后面,通過(guò)這種方式提高分析效率。當(dāng)然,在實(shí)際工作中,通常通過(guò)經(jīng)驗(yàn)豐富的一線運(yùn)維人員進(jìn)行相關(guān)的規(guī)則優(yōu)化整理,目的是實(shí)現(xiàn)精簡(jiǎn)流程,快速實(shí)施定界。
一般而言,業(yè)務(wù)異常(業(yè)務(wù)維度)不會(huì)出現(xiàn)在小區(qū)級(jí)別(也就是該小區(qū)的同業(yè)務(wù)異常,其他小區(qū)的業(yè)務(wù)都正常),這種組合就可以排除或者放在最后。
4.1 通過(guò)主動(dòng)運(yùn)維提升面向網(wǎng)絡(luò)的主動(dòng)管理能力案例
在傳統(tǒng)網(wǎng)元監(jiān)控基礎(chǔ)上,通過(guò)集中性能管理平臺(tái)實(shí)現(xiàn)了網(wǎng)絡(luò)問(wèn)題的自動(dòng)預(yù)警,在網(wǎng)絡(luò)結(jié)構(gòu)組合變化中,主動(dòng)發(fā)現(xiàn)網(wǎng)元間的協(xié)調(diào)匹配問(wèn)題以及網(wǎng)元潛在的惡化傾向,并自動(dòng)觸發(fā)告警,問(wèn)題定位定界準(zhǔn)確率超過(guò)90%,目前主動(dòng)運(yùn)維成為網(wǎng)絡(luò)管理新常態(tài)。
如圖8所示,2015年7月,集中性能管理平臺(tái)預(yù)警廈門(mén)局點(diǎn)出現(xiàn)下載速率低于全省均值20%的情況,傳統(tǒng)網(wǎng)管系統(tǒng)無(wú)法發(fā)現(xiàn),客戶初期也沒(méi)有感知,但通過(guò)主動(dòng)運(yùn)維很快就發(fā)現(xiàn)并解決了問(wèn)題。先利用五元五階模型定界出該問(wèn)題屬于網(wǎng)絡(luò)側(cè)問(wèn)題,并排除核心網(wǎng)問(wèn)題,進(jìn)一步排查確定不是廈門(mén)局點(diǎn)互聯(lián)網(wǎng)路由的問(wèn)題,最終定位出是廈門(mén)局點(diǎn)與福州局點(diǎn)路由器參數(shù)配合問(wèn)題,并將參數(shù)由“數(shù)據(jù)分組轉(zhuǎn)發(fā)”改為“數(shù)據(jù)流轉(zhuǎn)發(fā)”,優(yōu)化后全省LTE下載速率提升25%左右,部分?jǐn)?shù)據(jù)分組轉(zhuǎn)發(fā)速率提升40%。
圖8 主動(dòng)運(yùn)維提升全網(wǎng)下載速率實(shí)例
4.2 通過(guò)主動(dòng)運(yùn)維提升面向客戶的實(shí)時(shí)保障能力案例
傳統(tǒng)運(yùn)維模式只能統(tǒng)計(jì)15 min顆粒度的網(wǎng)元級(jí)指標(biāo),且時(shí)延30 min以上,主動(dòng)運(yùn)維實(shí)踐的系統(tǒng)不但可以統(tǒng)計(jì)1 min顆粒度的客戶級(jí)感知指標(biāo),還能全量記錄所有感知不佳的用戶清單及對(duì)應(yīng)問(wèn)題,且時(shí)延不超過(guò)3 min,真正具備了實(shí)時(shí)保障客戶感知的能力。如圖9所示,該系統(tǒng)有效保障了2016年“雙十一”電商購(gòu)物客戶感知。
4.3 通過(guò)主動(dòng)運(yùn)維發(fā)現(xiàn)業(yè)務(wù)平臺(tái)問(wèn)題案例
福州某小區(qū)的“歐朋瀏覽器”網(wǎng)站的HTTP業(yè)務(wù)成功率超過(guò)閾值觸發(fā)告警。進(jìn)入自動(dòng)定界流程,通過(guò)比較發(fā)現(xiàn)該SP全網(wǎng)的指標(biāo)與同類業(yè)務(wù)其他SP全網(wǎng)的指標(biāo)存在明顯劣化現(xiàn)象,定位為SP問(wèn)題。采用基于樣本空間置換算法分析方法,對(duì)應(yīng)的流程如圖10所示?;谶@類流程的主動(dòng)運(yùn)維模式發(fā)現(xiàn)并解決了大量端到端感知隱患,包括多個(gè)無(wú)線廠商設(shè)備缺陷、傳輸分組傳送網(wǎng)(packet transport network,PTN)接入網(wǎng)問(wèn)題、省干傳輸問(wèn)題、無(wú)線參數(shù)配置問(wèn)題、基站參數(shù)設(shè)置問(wèn)題、終端適配問(wèn)題、內(nèi)容源問(wèn)題等。
圖9 主動(dòng)運(yùn)維提升面向客戶的實(shí)時(shí)保障能力實(shí)例
4.4 通過(guò)主動(dòng)運(yùn)維發(fā)現(xiàn)蘋(píng)果終端TCP成功率偏低問(wèn)題案例
2015年8月14日,主動(dòng)運(yùn)維平臺(tái)五階指標(biāo)—— TCP核心網(wǎng)成功率突然出現(xiàn)劣化,由平時(shí)的98%下降到87%,網(wǎng)管系統(tǒng)未有任何告警信息。
問(wèn)題排查:通過(guò)對(duì)五元維度的TCP核心網(wǎng)成功率進(jìn)行對(duì)比分析,排除用戶、終端、小區(qū)、網(wǎng)絡(luò)故障,精準(zhǔn)定位是由于部分業(yè)務(wù)側(cè)問(wèn)題導(dǎo)致。專業(yè)室進(jìn)一步排查,發(fā)現(xiàn)蘋(píng)果公司推送通知服務(wù)(apple push notification service,APNS)時(shí)延較長(zhǎng),該服務(wù)用于為有消息提醒服務(wù)的應(yīng)用提供推送接口,可能蘋(píng)果公司在服務(wù)器側(cè)有進(jìn)行相關(guān)業(yè)務(wù)性能的限制,對(duì)于超出能力的請(qǐng)求直接不響應(yīng),導(dǎo)致握手失敗。
依托大數(shù)據(jù)技術(shù),基于樣本空間置換算法的五元五階模型,創(chuàng)新提出并實(shí)踐了主動(dòng)運(yùn)維的新運(yùn)維模式,以用戶使用業(yè)務(wù)的端到端全流程體驗(yàn)視角,快速發(fā)現(xiàn)網(wǎng)絡(luò)中各節(jié)點(diǎn)之間的性能失衡、趨勢(shì)異常等隱性問(wèn)題,運(yùn)維人員根據(jù)分析結(jié)果主動(dòng)出擊,在故障發(fā)生前,有的放矢地進(jìn)行精確優(yōu)化,降低成本,提升移動(dòng)互聯(lián)網(wǎng)的網(wǎng)絡(luò)質(zhì)量及客戶滿意度。這種基于大數(shù)據(jù)的模式徹底改變了運(yùn)營(yíng)商的思維方式和生產(chǎn)方式,這些實(shí)踐傳統(tǒng)的非大數(shù)據(jù)做法是無(wú)法實(shí)現(xiàn)的,印證了大數(shù)據(jù)能產(chǎn)生大價(jià)值的思想。
大數(shù)據(jù)要產(chǎn)生價(jià)值,就要追求大數(shù)據(jù)生態(tài)系統(tǒng)的構(gòu)建。數(shù)據(jù)取之于生產(chǎn),源于生產(chǎn)過(guò)程的各個(gè)環(huán)節(jié)。大數(shù)據(jù)要服務(wù)于生產(chǎn),大數(shù)據(jù)的結(jié)果要融入生產(chǎn)的流程,才能產(chǎn)生大作用。大數(shù)據(jù)的應(yīng)用使得使用主體真正擁有數(shù)據(jù)資產(chǎn)能力。大數(shù)據(jù)理論體系注定是非實(shí)時(shí)的,然而實(shí)時(shí)的大數(shù)據(jù)應(yīng)用是特殊行業(yè)的剛性需求,必須采取創(chuàng)新的思維和技術(shù)。運(yùn)營(yíng)商的網(wǎng)絡(luò)運(yùn)維工作始終追求高效率和低成本。眾所周知,基于大數(shù)據(jù)相關(guān)技術(shù),傳統(tǒng)的許多無(wú)法實(shí)現(xiàn)的“愿望”在大數(shù)據(jù)的支撐下可以很容易實(shí)現(xiàn)。然而,由于大數(shù)據(jù)是海量的,原先認(rèn)為可以做到的事情可能因?yàn)榇髷?shù)據(jù)的大量數(shù)據(jù)變得很難實(shí)現(xiàn)。大數(shù)據(jù)技術(shù)在實(shí)踐過(guò)程中,需要辯證地在存儲(chǔ)、計(jì)算、效率、效果等多種維度中折中地進(jìn)行取舍,如“全量的用戶、抽樣的信息;抽樣的用戶、全量的信息”“特定事件、抽樣的時(shí)段信息”“非實(shí)時(shí)的匯聚的信息,實(shí)時(shí)的原始(未匯聚)的記錄”“精確地計(jì)算,大膽地近似”。
最后說(shuō)明一點(diǎn),本文涉及的利用大數(shù)據(jù)實(shí)施運(yùn)營(yíng)商主動(dòng)運(yùn)維技術(shù)由于涉及具有運(yùn)營(yíng)商特點(diǎn)的技術(shù)、流程和專業(yè)術(shù)語(yǔ),限于篇幅無(wú)法解釋說(shuō)明清楚。詳細(xì)可以查閱參考文獻(xiàn)[5]。
圖10 主動(dòng)運(yùn)維發(fā)現(xiàn)業(yè)務(wù)平臺(tái)問(wèn)題樣本空間置換過(guò)程實(shí)例
參考文獻(xiàn):
[1] 李國(guó)杰. 對(duì)大數(shù)據(jù)的再認(rèn)識(shí)[J]. 大數(shù)據(jù), 2015001. LI G J. Further understanding of big data[J]. Big Data Research, 2015001
[2] 周傲英, 錢衛(wèi)寧, 王長(zhǎng)波. 數(shù)據(jù)科學(xué)與工程:大數(shù)據(jù)時(shí)代的新興交叉學(xué)科[J]. 大數(shù)據(jù), 2015022. ZHOU A Y, QIAN W N, WANG C B. Data sciences and engineering an emerging interdisciplinary in the big data era[J]. Big Data Research, 2015022.
[3] 鄭緯民. 從系統(tǒng)角度審視大數(shù)據(jù)計(jì)算[J]. 大數(shù)據(jù), 2015002. ZHENG W M. Reviewing big data computation from a system perspective[J]. Big Data Research, 2015002.
[4] HAN J W, KAMBER M, PEI J. Data mining: concepts and techniques(3rd edition)[M]. Burlington: Morgan Kaufmann, 2011.
[5] 李正茂. 通信4.0:重新發(fā)明通信網(wǎng)[M]. 北京:中信出版集團(tuán), 2016. LI Z M. Communications V4.0: reinvention communication networks [M]. Beijing: Citic Press Group, 2016.
[6] 中國(guó)移動(dòng)通信集團(tuán)公司. 中國(guó)移動(dòng)上網(wǎng)日志留存系統(tǒng)三期規(guī)范—LTE采集解析設(shè)備XDR接口規(guī)范[R]. 北京: 中國(guó)移動(dòng)通信集團(tuán)公司,2015. China Mobile. The specification of internet log retention system (Phase III) of China Mobile—the interface of XDR specification of LTE DPI[R]. [S.l.:s.n.], 2015.
Theory and progress of active operation and maintenance of mobile internet based on big data
YANG Weimin
China Mobile Group Fujian Co., Ltd., Fuzhou 350108, China
The relationship between user's perception and network performance index was studied. A five-element-five-phase (FEFP) method based on substitution between sample and space was proposed. Active operation and maintenance mode based on network performance management, can quickly find out the performance of the network in the imbalance between the nodes, abnormal trend of hidden problems etc with active network analysis. According to the analysis of the initiative, the engineers can target for exact optimization, reduce the costs, improve the quality of the network and customer satisfaction before the failure occurred.
mobile internet, big data, user perception, performance analysis, active maintenance, five element five phase, sample and space substitution
TP3-0
A
10.11959/j.issn.2096-0271.2016070
2016-04-11
楊慰民(1970-),男,博士,中國(guó)移動(dòng)通信集團(tuán)福建有限公司網(wǎng)管中心副總經(jīng)理,通信專業(yè)教授級(jí)高級(jí)工程師,享受國(guó)務(wù)院特殊津貼。長(zhǎng)期致力于數(shù)字通信、移動(dòng)通信、通信中的信號(hào)處理和智能信息處理、大數(shù)據(jù)應(yīng)用等領(lǐng)域的科學(xué)研究工作。基于大數(shù)據(jù)的LTE網(wǎng)絡(luò)主動(dòng)運(yùn)維成果獲2015年度中國(guó)移動(dòng)科技進(jìn)步獎(jiǎng)一等獎(jiǎng)。