郭孔梁
(中國移動通信集團福建有限公司,福州 350108)
目前通信網(wǎng)絡的運維和優(yōu)化工作仍處于傳統(tǒng)網(wǎng)管支撐模式,網(wǎng)絡信令類數(shù)據(jù)的相關應用和平臺都集中在KPI計算或用戶投訴詳單查詢上,網(wǎng)管各個系統(tǒng)之間的數(shù)據(jù)互不共享,因此存在信息數(shù)據(jù)孤島問題,無法對各個業(yè)務以及各個平臺數(shù)據(jù)之間的內(nèi)在聯(lián)系和關聯(lián)關系進行有效的分析和利用,難以滿足大數(shù)據(jù)時代的數(shù)據(jù)挖掘需要。通過近年的實踐與探索,福建公司為提升綜合實力和網(wǎng)絡運營能力,滿足精細運維發(fā)展的需要,打破原有網(wǎng)管平臺只支持網(wǎng)絡運維的認識,將當前網(wǎng)絡技術和市場業(yè)務支撐有機結(jié)合,對相關的信令類數(shù)據(jù)進行深入挖掘和關聯(lián)分析,建設一個面向業(yè)務、面向客戶的網(wǎng)絡智能分析系統(tǒng)。
福建移動網(wǎng)絡智能分析系統(tǒng)主要利用Traffica和CHR數(shù)據(jù),通過網(wǎng)絡信令類數(shù)據(jù)的挖掘和關聯(lián)分析,進而分析用戶網(wǎng)絡行為和業(yè)務網(wǎng)絡質(zhì)量,提供面向客戶和面向市場的網(wǎng)絡支撐。業(yè)務上,除了常規(guī)的KPI計算和指標分析外,更加側(cè)重細粒度、精細化、面向網(wǎng)絡質(zhì)量、面向運維、面向市場支撐的多維度、多方式的挖掘和分析;在空間粒度上做到小區(qū)級,譬如能夠?qū)Ω鱾€小區(qū)的業(yè)務質(zhì)量狀況進行分析和排名,能夠?qū)ι顓^(qū)、商務區(qū)等不同場景特征的生活圈進行分析;在對象粒度上做到用戶級,譬如能夠?qū)χ攸c客戶進行業(yè)務質(zhì)量分析和故障原因溯源,能夠?qū)χ攸c客戶活動軌跡中的業(yè)務質(zhì)量進行監(jiān)控和回放;在時間粒度上能夠做到分鐘級,尤其是針對VIP客戶保障分析,采用了10 min分析粒度;在終端粒度上做到型號和操作系統(tǒng)級別,能夠分析不同型號、不同操作系統(tǒng)的終端業(yè)務質(zhì)量情況、市場占有率排名等。系統(tǒng)主要提供如下幾方面的分析功能。
(1)建立面向網(wǎng)絡運維的分析模式,提供整體網(wǎng)絡質(zhì)量分析、尋呼黑洞分析、單通串話分析、自動路測分析、掉話率自動分析、接續(xù)時長分析、用戶通話異常行為分析(包括掉話、接通、時延異常)、群發(fā)群呼分析、超短重呼分析等功能。
(2)建立面向客戶的分析模式,提供集團客戶保障分析、特定VIP客戶保障分析、終端品牌質(zhì)量分析、質(zhì)差用戶關聯(lián)分析、重點用戶分析、漫游用戶業(yè)務量和質(zhì)量分析、漫游用戶話務模型分析、漫游用戶交通工具分析等功能。
(3)建立面向業(yè)務的分析模式,提供特殊號碼特定業(yè)務的業(yè)務量和質(zhì)量分析、2G/3G業(yè)務質(zhì)量和業(yè)務量分析、業(yè)務流量流向分析、長途話務分析、3G用戶駐留2G網(wǎng)絡業(yè)務量分析、互聯(lián)互通業(yè)務質(zhì)量和業(yè)務量分析、特定場景分析、緊急呼叫號碼分析、企業(yè)短號和政府短號的業(yè)務量和質(zhì)量分析等功能。
本系統(tǒng)從技術架構(gòu)上分為數(shù)據(jù)采集層、數(shù)據(jù)存儲層、應用展現(xiàn)層。系統(tǒng)的技術架構(gòu)圖如圖1所示。數(shù)據(jù)采集層主要是搭建統(tǒng)一的數(shù)據(jù)采集層,實現(xiàn)異構(gòu)數(shù)據(jù)源的接入,并提供新增數(shù)據(jù)源的“插件式”接入功能,實現(xiàn)多級引擎的數(shù)據(jù)處理功能。數(shù)據(jù)存儲層是基于OLAP的多層數(shù)據(jù)庫存儲功能,實現(xiàn)對海量數(shù)據(jù)進行高效的存儲管理。從目標數(shù)據(jù)文件中提取報告,并將系統(tǒng)中所需的數(shù)據(jù)按面向分析主題的方法進行數(shù)據(jù)調(diào)整,通過數(shù)據(jù)倉庫完成各種粒度的相關事實數(shù)據(jù)存儲,使用多維建模方式完成各種專題數(shù)據(jù)模型的建立和分析,實現(xiàn)全網(wǎng)、全用戶的多維度、細粒度的分析。應用展現(xiàn)層主要完成面向網(wǎng)絡、面向業(yè)務、面向客戶的分析功能。先是調(diào)用數(shù)據(jù)存儲層提供的數(shù)據(jù)服務接口,定期執(zhí)行或接收用戶請求,按需執(zhí)行預先設定的業(yè)務分析功能,完成基于組件化的界面生成。系統(tǒng)界面可以通過導航條設定自己定制的查詢;生成基礎報表,支持報表任務管理,報表自動保存;定制需要的個性化報表;同時支持多維的統(tǒng)計和分析。后面將展開說明技術架構(gòu)的搭建。
網(wǎng)絡智能分析系統(tǒng)的核心數(shù)據(jù)來源于諾西Traffica和華為CHR準信令數(shù)據(jù)的提取和處理,輔助來源于話務網(wǎng)管,騷擾電話等外圍系統(tǒng)數(shù)據(jù)。以分析數(shù)據(jù)源主數(shù)據(jù)來看,福建全省每天生成的Traffica和CHR數(shù)據(jù)將近1T的容量,因此高效靈活的數(shù)據(jù)處理過程是網(wǎng)絡分析平臺的核心和關鍵。系統(tǒng)通過兩級引擎實現(xiàn)對原始數(shù)據(jù)采集、抽取、規(guī)整、過濾同時生成所需的細粒度基礎指標。數(shù)據(jù)處理模塊設計成多個模塊化組件,主要包括數(shù)據(jù)源讀取模塊、預處理模塊、兩級引擎、KPI分布式處理模塊。數(shù)據(jù)源讀取模塊負責將文件中的記錄讀取到內(nèi)存當中,并且轉(zhuǎn)換成規(guī)則引擎需要的對象。在讀取的循環(huán)中,每讀取一個對象,就向規(guī)則會話(RuleSession)中插入一個對象,直到文件結(jié)束。預處理模塊處理的對象是從文件中直接生成的對象,它和規(guī)則計算Fact對象是一一對應的,它負責判斷此對象是否需要送至規(guī)則引擎進行計算,例如空白對象不需要送入規(guī)則引擎。
圖1 系統(tǒng)技術架構(gòu)示意圖
其中一級引擎模塊是整個ETL數(shù)據(jù)處理的核心模塊。一級引擎接受采集的Fact對象,計算出KPI或COUNT的值。引入了規(guī)則引擎的技術來進行處理,根據(jù)規(guī)則中包含的指定過濾條件,判斷其能否匹配運行時刻的實時條件來執(zhí)行規(guī)則中所規(guī)定的動作。二級引擎主要負責接收一級引擎計算的KPI,對同一類型的KPI聚合,計算出正確的KPI值,同時接收網(wǎng)管系統(tǒng)傳遞的KPI,并根據(jù)預先設定的告警閾值,產(chǎn)生出正確的告警信息。二級引擎還接收一級引擎?zhèn)鱽淼腃OUNT的值,聚合算出COUNT的正確的值,并存入數(shù)據(jù)庫倉庫,供后面的事實分析和鉆取。
另外對于某些KPI是另外的KPI的比率或者函數(shù)的,例如某某率是兩個KPI相除的結(jié)果,還要用到KPI分布式處理組件。
網(wǎng)絡智能分析系統(tǒng)采用 OLAP技術構(gòu)建多維數(shù)據(jù)庫,建立全網(wǎng)全用戶的Cube和多專題的Cube,支持用戶自定義的多維度分析和鉆取。基于數(shù)據(jù)倉庫/Cube/OLAP的分層、多維數(shù)據(jù)存儲和分析技術架構(gòu),通過分專題建立的Cube,向上層應用提供靈活、高效的OLAP分析。圖2是系統(tǒng)基于數(shù)據(jù)倉庫/Cube/OLAP的多維分析技術架構(gòu)示意圖。
圖2 基于數(shù)據(jù)倉庫/Cube/OLAP的多維分析技術架構(gòu)
網(wǎng)絡智能分析系統(tǒng)的多維數(shù)據(jù)庫設計流程如下:先根據(jù)業(yè)務需求集合所有維度和度量值構(gòu)建一個涵蓋所有業(yè)務范圍的一個大數(shù)據(jù)倉庫;再根據(jù)該數(shù)據(jù)倉庫構(gòu)建一個大型多維數(shù)據(jù)庫;根據(jù)業(yè)務需求將需要經(jīng)常組合查詢的維度的度量集合在一起,設計多個小的數(shù)據(jù)庫;利用自主開發(fā)的ETL工具將大Cube中的數(shù)據(jù)分割抽取到小數(shù)據(jù)倉庫中;基于各個小的數(shù)據(jù)倉庫再次構(gòu)建相對小巧的多維數(shù)據(jù)庫。
相比傳統(tǒng)一次抽取的Cube具有如下優(yōu)勢:用戶最終查詢的是粗粒度的小Cube,性能大大提高;有小數(shù)據(jù)倉庫的存在,有效解決了大數(shù)據(jù)量事實表不好保存歷史數(shù)據(jù)的問題;與大Cube構(gòu)建聚合相比,這種小Cube設計更簡單,冗余少,與大Cube分別部署相互不受影響;根據(jù)業(yè)務邏輯分割后的Cube可讀性更好,容易理解;分割后的小數(shù)據(jù)庫倉庫處理性能大大提高。
在多維分析報表上,本系統(tǒng)區(qū)別于傳統(tǒng)的固定格式報表和可多維拖拽的報表,既避免了固定報表的過于死板,又避免了拖拽報表的展示效果差和權(quán)限控制效果差,實現(xiàn)了突破和創(chuàng)新。首先對多維數(shù)據(jù)庫進行XML格式的定義和對象化;然后利用傳統(tǒng)技術開發(fā)幾種固定的頁面(可無限擴展);對頁面所需的動態(tài)元素也進行 XML格式定義和對象化;動態(tài)解析頁面的 XML配置取得頁面對象;根據(jù)頁面對象獲取頁面類型和所查詢的Cube名稱;解析Cube的XML配置生成Cube對象。然后根據(jù)頁面動態(tài)元素(例如表格的行、列、篩選條件、鉆取維度、排序方式等)和 Cube配置對象生成多維查詢語句MDX (多維表達式)。最后通過XML配置生成的MDX查詢數(shù)據(jù)庫來獲取數(shù)據(jù),并據(jù)獲取到的數(shù)據(jù)和頁面配置中定義的展現(xiàn)方式繪制出報表頁面。
采用這種方式的好處如下:將Cube配置、報表配置、頁面展示解析程序都變成模塊化,可任意插入和刪除,而不需要改動程序結(jié)構(gòu);如果新增Cube,只需在Cube配置文件中加一節(jié)配置;如果新增報表只需要在頁面配置文件中新增一節(jié)配置,無需重新開發(fā);如果要新增報表展現(xiàn)方式只需要加一種解析程序。
Cube單維度頁面的設計舉例如下。
在面向設備的傳統(tǒng)網(wǎng)管數(shù)據(jù)中,只能提供分地市、分設備的接通率、掉話率等指標,而對網(wǎng)絡提供的業(yè)務,比如13800138000充值業(yè)務、17951 IP電話業(yè)務、10086客服電話等特殊號碼業(yè)務,無法知曉這些業(yè)務的網(wǎng)絡指標情況。而在網(wǎng)絡智能分析系統(tǒng)中就提供這種面向業(yè)務的指標分析,例如可以輸出各類企業(yè)短號、政府短號等網(wǎng)絡質(zhì)量指標,為網(wǎng)絡精細化管理提供數(shù)據(jù)支撐。另外深入研究運營商接入短號的接通率等網(wǎng)絡質(zhì)量變化(如12593業(yè)務接通率、17951業(yè)務接通率等)、研究企業(yè)和政府接入短號的業(yè)務量情況,為短號接入由競爭對手轉(zhuǎn)接改直連的市場運營提供數(shù)據(jù)支撐。
特殊號碼通話分析主要包括基于特服號碼的業(yè)務量TOPN分布分析和基于特服號碼的業(yè)務量趨勢分析等功能。從輸出分析頁面,可以得出如下指標:某日110特殊號碼通話次數(shù)是15 056次,通話時長是248.75 h,接通率指標是98.76%,掉話率指標時0.95%。再比如,從分析系統(tǒng)可以看出某個時期用戶撥打119的接通率是98.63%,撥打4000號碼的接通率是96.57%,撥打10086電話的接通率是99.07%。
本文詳細從數(shù)據(jù)處理、數(shù)據(jù)存儲、數(shù)據(jù)展示幾個方面闡述了網(wǎng)絡智能分析系統(tǒng)的實現(xiàn)方案,并舉例說明分析系統(tǒng)在實際網(wǎng)絡分析工作中的應用。此方案已經(jīng)在福建省投入使用,并取得良好的效果。隨著今后TDSCDMA、LTE基站快速部署和大量TD-SCDMA和LTE終端投放,為準確進行網(wǎng)絡資源投放和終端投放的匹配度分析,該系統(tǒng)還將不斷完善和加強。