中國聯(lián)通江蘇省分公司 南京 210029
邊界漫游(Border Roaming)指的是在處于行政區(qū)劃交界處的兩地(省或地級市)基站出現(xiàn)信號交叉覆蓋現(xiàn)象[1],如果兩地信號強(qiáng)弱不同就可能發(fā)生邊界漫游,造成用戶實(shí)際地理位置處于本地行政區(qū)的情況下使用了非本地行政區(qū)的基站信號,生成漫游話單,從而產(chǎn)生不應(yīng)有的長途費(fèi)、漫游費(fèi),使用戶多支付了通信費(fèi)用。
為解決由于邊界漫游話單多收用戶長途費(fèi)、漫游費(fèi)而引發(fā)的客戶投訴問題,移動(dòng)業(yè)務(wù)計(jì)費(fèi)系統(tǒng)會對處于邊界地區(qū)的基站小區(qū)作為邊界漫游小區(qū)進(jìn)行特殊標(biāo)識,對在這些特殊小區(qū)內(nèi)產(chǎn)生的漫游話單重新按非漫游計(jì)費(fèi)方式進(jìn)行批價(jià)處理,因此,邊界漫游小區(qū)[2]標(biāo)識是否及時(shí)、準(zhǔn)確就成為邊界漫游計(jì)費(fèi)是否準(zhǔn)確的關(guān)鍵所在。隨著中國聯(lián)通業(yè)務(wù)規(guī)模的高速增長,通信網(wǎng)絡(luò)也在同步進(jìn)行著大規(guī)模的建設(shè)和擴(kuò)容,網(wǎng)絡(luò)的不斷調(diào)整優(yōu)化使得邊界漫游小區(qū)信號的覆蓋范圍頻繁變動(dòng),傳統(tǒng)的邊界漫游小區(qū)手工維護(hù)方式很難做到及時(shí)準(zhǔn)確,特別是相鄰省分的小區(qū)調(diào)整更難及時(shí)更新。
本文分析的重點(diǎn)是通過大數(shù)據(jù)分析方法,自動(dòng)識別邊界漫游小區(qū), 做到數(shù)據(jù)與業(yè)務(wù)的完美結(jié)合,改善工作流程讓工作更加高效,從而保證新增加的邊界漫游小區(qū)及時(shí)添加到計(jì)費(fèi)系統(tǒng)中,解決由于邊界漫游話單多收用戶漫游費(fèi)而引發(fā)的客戶投訴,提升聯(lián)通對用戶的服務(wù)品質(zhì),減少用戶投訴引起的話費(fèi)返還等維系成本;對網(wǎng)絡(luò)調(diào)整后不再是邊界漫游小區(qū)的及時(shí)發(fā)現(xiàn)并刪除,避免真實(shí)漫游話單當(dāng)作本地話單進(jìn)行批價(jià)而造成話費(fèi)損失。
邊界地區(qū)的基站信號太強(qiáng)以致對相鄰區(qū)域產(chǎn)生了覆蓋,這是導(dǎo)致邊界漫游問題的根本原因[2]。如:當(dāng)用戶處于北京和河北交界處時(shí),由于信號覆蓋范圍受天氣、建筑、樹木等影響,會出現(xiàn)不穩(wěn)定的情況,哪邊的信號強(qiáng),手機(jī)就會切換到信號強(qiáng)的網(wǎng)絡(luò)。各地頻繁進(jìn)行網(wǎng)絡(luò)建設(shè)與優(yōu)化調(diào)整,造成部分邊界地區(qū)存在基站信號互相干擾、越界覆蓋等問題,加強(qiáng)地區(qū)間協(xié)作是解決問題的關(guān)鍵。
邊界問題一直是無線網(wǎng)絡(luò)優(yōu)化的難點(diǎn),在頻率割接及日常優(yōu)化工作中關(guān)注較少,存在問題較多,并且邊界基站本身具有3個(gè)特點(diǎn)[3]。1)基站稀疏,覆蓋較遠(yuǎn),切換較城區(qū)少;2)對網(wǎng)絡(luò)總體指標(biāo)的影響較大;3)用戶撥打電話時(shí)容易引起掉話;因此,對邊界漫游小區(qū)進(jìn)行全面檢查、調(diào)整優(yōu)化就顯得非常重要。
邊界漫游小區(qū)的界定是邊漫工作中的瓶頸,由于兩個(gè)區(qū)域邊界的基站信息不能實(shí)時(shí)共享、網(wǎng)絡(luò)不斷的變化,很容易造成邊界漫游小區(qū)過少或遺漏的情況,所以,邊界漫游小區(qū)的正確性和完整性非常關(guān)鍵。
運(yùn)用數(shù)據(jù)分析方法,從客戶感知出發(fā),切實(shí)跟蹤客戶使用情況,還原邊界漫游場景,從而形成一種全新的邊界漫游小區(qū)的識別方式。與傳統(tǒng)方式相比,該方法更貼近客戶實(shí)際使用,識別過程中一方面能發(fā)掘地理位置上不易覺察的邊界漫游小區(qū),另一方面可對路測中發(fā)現(xiàn)但實(shí)際鮮有用戶接觸到的小區(qū)從邊界漫游小區(qū)中剔除。兩方面結(jié)合,修正邊界漫游小區(qū)信息,使邊界漫游小區(qū)的識別更為準(zhǔn)確。
數(shù)據(jù)與業(yè)務(wù)的完美結(jié)合、工作流程的改善讓工作更加高效,僅需對計(jì)費(fèi)話單進(jìn)行周期性分析,即可充分觀察到邊界漫游的發(fā)生情況,足不出戶即可對邊界漫游小區(qū)分布情況有精準(zhǔn)的判斷,在提高識別精度的前提下避免了大量實(shí)地路測的工作量。
在時(shí)效性方面,傳統(tǒng)方式與他省邊界位置的信息交換需要依賴人工傳遞,時(shí)間延遲過于被動(dòng)?,F(xiàn)有方式通過主動(dòng)分析用戶清單,在更短的周期內(nèi)就能達(dá)到識別新的邊界漫游小區(qū)的效果。
從IT系統(tǒng)走向大數(shù)據(jù)決策,著眼點(diǎn)在于未來服務(wù),通過大數(shù)據(jù)、云計(jì)算的處理分析手段,實(shí)現(xiàn)業(yè)務(wù)綜合治理、開拓新應(yīng)用、創(chuàng)造公司利潤、降低公司成本等目標(biāo),實(shí)現(xiàn)這個(gè)目標(biāo)需要具備如下三個(gè)前提條件。
1)新技術(shù)契機(jī):云計(jì)算技術(shù)成熟應(yīng)用的契機(jī),使我們能利用新技術(shù)達(dá)到以前傳統(tǒng)方式所達(dá)不到的效果。
2)公司戰(zhàn)略要求:大數(shù)據(jù)統(tǒng)一支撐的新管理模式要求提供信息武器,展現(xiàn)大數(shù)據(jù)信息價(jià)值。
3)公司內(nèi)部需求:公司對網(wǎng)絡(luò)運(yùn)維工作的高效率要求與傳統(tǒng)運(yùn)維工作的現(xiàn)狀不匹配。
邊界漫游小區(qū)自動(dòng)識別是通過對客戶語音清單的深度分析,探索實(shí)際發(fā)生邊漫特征的小區(qū),從而輔助邊界漫游小區(qū)計(jì)費(fèi)處理的一種方法。該方法需要對清單進(jìn)行分析處理識別疑似邊界小區(qū)。用戶在較短的時(shí)間內(nèi)進(jìn)行兩次通話,兩次通話分別是本地通話和漫游地通話,則可認(rèn)定本地通話的基站小區(qū)和漫游地通話的基站小區(qū)為疑似相鄰邊界漫游基站小區(qū)。一段時(shí)間內(nèi)兩個(gè)基站小區(qū)成對出現(xiàn)的次數(shù)越高,成為相鄰邊界漫游基站小區(qū)的可能性越大,影響用戶范圍越廣,流程如圖1所示。
運(yùn)用云計(jì)算技術(shù)處理清單數(shù)據(jù),能夠高效率、可持續(xù)地計(jì)算處理清單,并穩(wěn)定地執(zhí)行分析流程,確保結(jié)果穩(wěn)定落地并應(yīng)用。
圖1 識別流程
1)數(shù)據(jù)準(zhǔn)備。①確認(rèn)本次分析清單的分析周期;②剔除錯(cuò)誤異常清單后提取計(jì)費(fèi)系統(tǒng)上月全量漫游話單,僅選取對本次分析有關(guān)聯(lián)的字段(如表1所示);③計(jì)費(fèi)系統(tǒng)提供最近的邊界漫游基站參數(shù)信息。
表1 有關(guān)聯(lián)的字段
2)算法選擇。本次采用的是主成分分析(Principal Component Analysis,PCA), 將多個(gè)變量通過線性變換以選出較少個(gè)數(shù)重要變量的一種多元統(tǒng)計(jì)分析方法。又稱主分量分析[4]。
在很多情形下變量之間有一定的相關(guān)關(guān)系,當(dāng)兩個(gè)變量之間有一定相關(guān)關(guān)系時(shí),可以解釋為這兩個(gè)變量反映此課題的信息有一定的重疊。主成分分析是對于原先提出的所有變量,將重復(fù)的變量(關(guān)系緊密的變量)刪去,建立盡可能少的新變量,使得這些新變量是兩兩不相關(guān)的,而且這些新變量在反映課題的信息方面盡可能保持原有的信息。
設(shè)法將原來變量重新組合成一組新的互相無關(guān)的幾個(gè)綜合變量,同時(shí)根據(jù)實(shí)際需要從中取出幾個(gè)較少的綜合變量,盡可能多地反映原來變量的信息統(tǒng)計(jì)方法叫做主成分分析或主分量分析,也是數(shù)學(xué)上用來降維的一種方法。
3)算法原理。主成分分析是把原來多個(gè)變量化為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分析方法,從數(shù)學(xué)角度來看,這是一種降維處理技術(shù)。假定有n個(gè)樣本,每個(gè)樣本共有p個(gè)變量描述,這樣就構(gòu)成了一個(gè)n×p階的地理數(shù)據(jù)矩陣:
要從這么多變量的數(shù)據(jù)中抓住事物的內(nèi)在規(guī)律性,需要在p維空間中加以考察,這是比較麻煩的。為了克服這一困難,就需要進(jìn)行降維處理,即用較少的幾個(gè)綜合指標(biāo)來代替原來較多的變量指標(biāo),而且使這些較少的綜合指標(biāo)既能盡量多地反映原來較多指標(biāo)所反映的信息,同時(shí)它們之間又是彼此獨(dú)立的。那么,這些綜合指標(biāo)(即新變量)應(yīng)如何選取呢?顯然,最簡單的形式就是取原來變量指標(biāo)的線性組合,適當(dāng)調(diào)整組合系數(shù),使新的變量指標(biāo)之間相互獨(dú)立且代表性最好。
如果記原來的變量指標(biāo)為,它們的綜合指標(biāo)——新變量指標(biāo)為。則
在公式(2)中,系數(shù)lij由下列原則來決定:
(1)zi與zj(i≠j;i,j=1,2,…,m)相互無關(guān);
(2)z1是x1,x2,…,xp的一切線性組合中方差最大者;z2是與z1不相關(guān)的x1,x2,…,xp的所有線性組合中方差最大者;……;zm是與z1,z2,……zm-1都不相關(guān)的x1,x2,…,xp的所有線性組合中方差最大者。
這樣決定的新變量指標(biāo)z1,z2,…,zm分別稱為原變量指標(biāo)x1,x2,…,xp的第一,第二,…,第m主成分。其中,z1在總方差中占的比例最大,z2,z3,…,zm的方差依次遞減。在實(shí)際問題的分析中,常挑選前幾個(gè)最大的主成分,這樣既減少了變量的數(shù)目,又抓住了主要矛盾,簡化了變量之間的關(guān)系。
從以上分析可以看出,找主成分就是確定原來變量xj(j=1,2,…,p)在諸主成分zi(i=1,2,…,m)上的載荷lij(i=1,2,…,m;j=1,2,…,p),從數(shù)學(xué)上容易知道,它們分別是x1,x2,…,xp的相關(guān)矩陣的m個(gè)較大的特征值所對應(yīng)的特征向量。
通過算法選擇對邊界漫游業(yè)務(wù)影響重要的元素,依據(jù)云計(jì)算平臺的海量數(shù)據(jù)沉淀和云計(jì)算平臺的強(qiáng)大運(yùn)算能力,輸出疑似邊界漫游小區(qū)。
1)分析指標(biāo)選擇。根據(jù)邊界漫游業(yè)務(wù)涉及的元素及主成分算法的理解,進(jìn)行用戶特征和消費(fèi)特征的分析。因此,分析需要用到的主要信息可能如表2所示。
表2 分析用到的主要信息表
2)運(yùn)用Greenplum分布式數(shù)據(jù)庫處理算法。本次計(jì)算采用Greenplum云數(shù)據(jù)庫,Greenplum云數(shù)據(jù)庫軟件是業(yè)內(nèi)首創(chuàng)的大規(guī)模并行處理(Massively Parallel Processing,MPP)的數(shù)據(jù)庫軟件產(chǎn)品,它包含大規(guī)模并行計(jì)算技術(shù)和數(shù)據(jù)庫技術(shù)最新的研發(fā)成果:包括按列存儲數(shù)據(jù)庫、數(shù)據(jù)庫內(nèi)壓縮、MapReduce、永不停機(jī)擴(kuò)容、多級容錯(cuò)等等。同時(shí)云計(jì)算的按需自服務(wù)、共享資源池、快速彈性能力、普遍網(wǎng)絡(luò)訪問、可度量的服務(wù)五大特點(diǎn)帶來了一種新興的IT開發(fā)、部署和交付模式,允許按需交付、提供信息服務(wù),且可以在實(shí)現(xiàn)資源集約共享的基礎(chǔ)上按需動(dòng)態(tài)彈性分配來降低成本,優(yōu)化IT服務(wù),使沉淀和分析海量的計(jì)費(fèi)清單數(shù)據(jù)成為可能,在數(shù)據(jù)沉淀、統(tǒng)計(jì)、分析應(yīng)用中充分體現(xiàn)其價(jià)值。
運(yùn)用Greenplum云數(shù)據(jù)庫處理8月份用戶通話清單,按照對數(shù)據(jù)寬表中的字段,進(jìn)行主成分分析,生成識別邊界漫游小區(qū)的指標(biāo),按照統(tǒng)計(jì)數(shù)據(jù)的范圍匯總指標(biāo)。對分析清單進(jìn)行以下處理(以地市間漫游為例)。
地市A用戶從地市A到地市B,第一條通話為非漫游通話,第二條是漫游通話,分析過程中記錄以下信息:第一條話單和第二條話單的基站信息、通話開始時(shí)間、通話結(jié)束時(shí)間;兩條話單的間隔(第二條話單的通話開始時(shí)間減去第一條話單的通話結(jié)束時(shí)間)。
地市A用戶從地市B回到地市A,第一條通話為漫游通話,第二條是非漫游通話;分析過程中記錄以下信息:第一條話單和第二條話單的基站信息、通話開始時(shí)間、通話結(jié)束時(shí)間;兩條話單的間隔(第二條話單的通話開始時(shí)間減去第一條話單的通話結(jié)束時(shí)間)。
地市A用戶從地市C到地市B,第一條通話為漫游通話,第二條也是漫游通話;分析過程中記錄以下信息:第一條話單和第二條話單的基站信息、通話開始時(shí)間、通話結(jié)束時(shí)間;兩條話單的間隔(第二條話單的通話開始時(shí)間減去第一條話單的通話結(jié)束時(shí)間)。
將以上三種分析方法數(shù)據(jù)進(jìn)行合并,并且對兩條話單的間隔時(shí)間進(jìn)行分檔處理,形成邊界漫游基站360度視圖。
運(yùn)用分布式統(tǒng)計(jì)數(shù)據(jù)庫處理數(shù)據(jù)的效率高于傳統(tǒng)關(guān)系型數(shù)據(jù)。
3)驗(yàn)證現(xiàn)有邊界漫游參數(shù)。通過對邊界漫游基站360度視圖的分析結(jié)果得到如下結(jié)論。
設(shè)定地市與邊界地市單位間隔時(shí)間(如:同一用戶邊漫話單間隔2分鐘或5分鐘或其他),統(tǒng)計(jì)所提供的分析清單中存在多少次邊界漫游通話。
地市與邊界地市存在邊界漫游通話,基站信息已經(jīng)配置在計(jì)費(fèi)系統(tǒng)的邊界漫游信息表中。
地市與邊界地市存在疑似邊界漫游通話,但基站信息沒有配置在計(jì)費(fèi)系統(tǒng)的邊界漫游信息表中。
在計(jì)費(fèi)系統(tǒng)的邊界漫游信息表中存在地市與邊界地市的基站信息,但提供的分析清單沒有任何邊界漫游通話行為。
按照上述數(shù)據(jù)模型與實(shí)現(xiàn)方式,系統(tǒng)生成8月份疑似邊界漫游小區(qū)數(shù)據(jù),以模型優(yōu)化調(diào)整后的首次實(shí)際應(yīng)用為例,疑似邊界漫游小區(qū)數(shù)據(jù)生成后與移動(dòng)業(yè)務(wù)計(jì)費(fèi)系統(tǒng)當(dāng)前配置邊界漫游小區(qū)數(shù)據(jù)匹配情況如表3所示,識別模型處理的識別率達(dá)到了89.3%。
表3 數(shù)據(jù)匹配情況
同時(shí)將未匹配成功的疑似邊界漫游小區(qū)交給運(yùn)行維護(hù)部網(wǎng)絡(luò)優(yōu)化中心進(jìn)行確認(rèn),每個(gè)地市的成對出現(xiàn)頻次TOP10的小區(qū)共130組,確認(rèn)有效達(dá)129個(gè),準(zhǔn)確率達(dá)99.2%,出現(xiàn)頻次TOP30小區(qū)準(zhǔn)確率約85%,總體準(zhǔn)確率70%以上,說明需要增補(bǔ)大量的邊界小區(qū)信息。
另外存在3 518個(gè)小區(qū)沒有任何邊漫通話數(shù)據(jù),考慮予以剔除,以降低業(yè)務(wù)計(jì)費(fèi)系統(tǒng)處理負(fù)荷。
固化數(shù)據(jù)生成與維護(hù)流程,首先由江蘇聯(lián)通信息化事業(yè)部通過數(shù)據(jù)模型每周自動(dòng)生成疑似邊界漫游小區(qū),其次運(yùn)行維護(hù)部對系統(tǒng)識別出的邊界漫游小區(qū)進(jìn)行全面的核查、確認(rèn),經(jīng)確認(rèn)后的小區(qū)由計(jì)費(fèi)系統(tǒng)維護(hù)人員及時(shí)在系統(tǒng)中進(jìn)行標(biāo)識。通過固化的流程一方面更精準(zhǔn)地識別出邊界漫游小區(qū),另一方面對已經(jīng)加入的邊界漫游小區(qū)進(jìn)行跟蹤,對無邊漫特征的小區(qū)及時(shí)從計(jì)費(fèi)參數(shù)表中剔除,從而減少對用戶的錯(cuò)誤優(yōu)惠,對邊界漫游小區(qū)的加入和退出形成了閉環(huán)的管理,如圖2所示。
圖2 數(shù)據(jù)生成與維護(hù)流程
通過自動(dòng)識別模型的有效應(yīng)用,使得邊界漫游小區(qū)識別流程效率和工作成效得到了很好的提升。體現(xiàn)了信息化技術(shù)的服務(wù)支撐能力,具體體現(xiàn)在以下4方面。
1)降低客戶投訴。自動(dòng)識別方法的使用為主動(dòng)發(fā)現(xiàn)問題、及時(shí)更正計(jì)費(fèi)處理贏得了時(shí)間,為客戶及時(shí)解決問題,變被動(dòng)接受客戶投訴為主動(dòng)服務(wù)客戶,對該類型投訴量的下降和客戶滿意度提升將大有裨益,自邊界漫游自動(dòng)識別上線后,用戶關(guān)于邊界漫游的月均投訴量下降了2000筆左右。
2)提高識別準(zhǔn)確率。自動(dòng)識別方法每周定期測算新增邊界小區(qū),及時(shí)提供給運(yùn)維部門予以確認(rèn),提高了邊界小區(qū)識別的及時(shí)性。同時(shí)該方法基于真實(shí)用戶感知進(jìn)行分析,準(zhǔn)確率得到大幅提高。
3)減少運(yùn)營商收益損失。邊界漫游小區(qū)識別能力的提升,將有效減少公司在該類投訴上產(chǎn)生的退費(fèi)損失、減少了不必要的優(yōu)惠、省際漫游等費(fèi)用的支出,同時(shí)在充分保證用戶感知度的前提下,有效剔除了非邊界漫游小區(qū)的錯(cuò)誤配置數(shù)據(jù),杜絕了公司正常收益的流失。
4)提高運(yùn)維工作效率。通過自動(dòng)識別,系統(tǒng)將疑似邊界漫游小區(qū)進(jìn)行了有效篩選,后續(xù)人工識別的小區(qū)數(shù)大幅下降,節(jié)省了大量的人力物力成本,同時(shí)提升了整體工作流程的執(zhí)行效率。
將數(shù)據(jù)分析方法運(yùn)用于邊界漫游小區(qū)識別工作是一次積極的嘗試,是一種工作方法的探索和創(chuàng)新,結(jié)果證明成效顯著。江蘇聯(lián)通信息化事業(yè)部將繼續(xù)積極探索數(shù)據(jù)分析在公司各項(xiàng)工作中的應(yīng)用可能,主動(dòng)服務(wù)各業(yè)務(wù)部門,為公司的經(jīng)營發(fā)展和管理提升提供強(qiáng)有力的支撐。
[1]謝顯忠.基于TDD的第四代移動(dòng)通信技術(shù)[M].北京:電子工業(yè)出版社,2005
[2]施瓦茨,許希斌.移動(dòng)通信[M].李云洲,譯.北京:電子工業(yè)出版社,2013
[3]何林娜.數(shù)字移動(dòng)通信技術(shù)[M].北京:機(jī)械工業(yè)出版社,2010
[4]何曉群.現(xiàn)代統(tǒng)計(jì)分析方法與應(yīng)用(第3版)[M].北京:中國人民大學(xué)出版社,2012