王磊
(中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司,北京 100080)
當(dāng)前,LTE網(wǎng)絡(luò)中各設(shè)備廠家通用配置參數(shù)和私有無(wú)線參數(shù)總和已超過(guò)8000余個(gè),這些復(fù)雜參數(shù)僅依靠人工經(jīng)驗(yàn)很難進(jìn)行精細(xì)化配置。首先,各設(shè)備廠家近萬(wàn)項(xiàng)無(wú)線參數(shù),需要從中分析和梳理出日常LTE網(wǎng)絡(luò)重點(diǎn)關(guān)注和優(yōu)化的參數(shù);同時(shí),在全網(wǎng)LTE基站數(shù)已達(dá)到100多萬(wàn)情況下,這些重點(diǎn)參數(shù)需要在復(fù)雜多變的場(chǎng)景下做到最優(yōu)配置;此外,還需要研究一種通過(guò)計(jì)算機(jī)算法能夠自動(dòng)化的學(xué)習(xí)現(xiàn)網(wǎng)已有的海量參數(shù)配置經(jīng)驗(yàn)的方法,從而使得優(yōu)化經(jīng)驗(yàn)得到快速?gòu)?fù)制和推廣。
上述需求,歸結(jié)為L(zhǎng)TE網(wǎng)絡(luò)參數(shù)的精細(xì)化設(shè)置的問(wèn)題,在LTE時(shí)代,中國(guó)移動(dòng)已具備多維度數(shù)據(jù)的集中分析基礎(chǔ),集團(tuán)層面和各省內(nèi)都已逐步建立了多維度大數(shù)據(jù)共享平臺(tái),可以通過(guò)關(guān)聯(lián)挖據(jù)現(xiàn)有數(shù)據(jù)中有價(jià)值的信息,自動(dòng)化的學(xué)習(xí)和固化分場(chǎng)景的參數(shù)設(shè)置的優(yōu)秀經(jīng)驗(yàn),并推廣到各地。
個(gè)性化推薦系統(tǒng)和相關(guān)算法在今天互聯(lián)網(wǎng)的產(chǎn)品和應(yīng)用中已被廣泛采用,包括今天經(jīng)常使用的相關(guān)搜索、話題推薦、電子商務(wù)的各種產(chǎn)品推薦等等。一般認(rèn)為,推薦系統(tǒng)這個(gè)研究領(lǐng)域源于協(xié)同過(guò)濾算法的提出。
舉一個(gè)通俗的例子:比如某天很無(wú)聊,想下載一部電影看看。但當(dāng)你打開(kāi)某個(gè)下載網(wǎng)站,面對(duì)數(shù)不勝數(shù)的電影,你會(huì)手足無(wú)措,不知道該看哪一部。此時(shí),就遇到了信息過(guò)載的問(wèn)題,需要一個(gè)人或者工具來(lái)幫助你做篩選,給出一些建議供你選擇。
不過(guò),總不能時(shí)時(shí)刻刻都去麻煩“專家”給你推薦,這時(shí)需要的是一個(gè)自動(dòng)化的工具,它可以通過(guò)分析你的歷史興趣和行為特征,從龐大的電影庫(kù)中找到幾部符合你興趣特征的電影供你選擇。這個(gè)工具就是個(gè)性化推薦系統(tǒng)。
推薦系統(tǒng)的發(fā)展過(guò)程中,各種各樣的推薦算法層出不窮。這些方法的歸類有很多不同的方式。比如,可以按照數(shù)據(jù)分成協(xié)同過(guò)濾、內(nèi)容過(guò)濾、社會(huì)化過(guò)濾,也可以按照算法分成基于鄰域的算法、 基于圖的算法、 基于矩陣分解或者概率模型的算法。
從上面介紹的給人推薦電影的個(gè)性化推薦系統(tǒng)中,我們得到啟發(fā),如果現(xiàn)網(wǎng)已經(jīng)具備了海量的網(wǎng)優(yōu)經(jīng)驗(yàn)數(shù)據(jù),就可以根據(jù)不同的網(wǎng)絡(luò)場(chǎng)景特征數(shù)據(jù),進(jìn)行LTE小區(qū)粒度的特征抽取和多維度分析,從而使計(jì)算機(jī)自動(dòng)化的學(xué)習(xí)和挖掘出現(xiàn)網(wǎng)優(yōu)秀的參數(shù)配置經(jīng)驗(yàn),建立起LTE小區(qū)級(jí)特征數(shù)據(jù)與參數(shù)配置經(jīng)驗(yàn)的模型。
進(jìn)一步擴(kuò)展,基于成熟的協(xié)同過(guò)濾算法,就可以實(shí)現(xiàn)針對(duì)不同場(chǎng)景特征的小區(qū),個(gè)性化的自動(dòng)推薦LTE網(wǎng)絡(luò)配置參數(shù),從而大大提升網(wǎng)絡(luò)優(yōu)化尤其是參數(shù)優(yōu)化的工作效率。
LTE網(wǎng)優(yōu)參數(shù)智能優(yōu)化系統(tǒng)的流程架構(gòu)主要分為:特征選取、數(shù)據(jù)預(yù)處理、聚類分析、網(wǎng)絡(luò)質(zhì)量分析、特征匹配與參數(shù)推薦這5個(gè)環(huán)節(jié),如圖1所示。
2.3.1 LTE無(wú)線小區(qū)的特征建模
要實(shí)現(xiàn)面向LTE網(wǎng)優(yōu)參數(shù)的自動(dòng)化推薦和設(shè)置系統(tǒng),首先環(huán)節(jié)就是進(jìn)行LTE無(wú)線小區(qū)粒度的特征建模。而以往那種人工的、標(biāo)簽化的無(wú)線場(chǎng)景分類方式則較為粗放,難以量化(如機(jī)場(chǎng)、醫(yī)院、學(xué)校、寫(xiě)字樓等傳統(tǒng)標(biāo)簽方式)。
因此,需要從多個(gè)維度考慮,選取可量化的特征屬性進(jìn)行LTE無(wú)線場(chǎng)景的精細(xì)分類,包括但不限于:LTE小區(qū)結(jié)構(gòu)特征(如站高、海拔、站間距、下傾角、天線屬性); LTE小區(qū)業(yè)務(wù)量特征(如控制面/用戶面/語(yǔ)音/數(shù)據(jù)業(yè)務(wù)量特征、時(shí)間序列特征); 用戶分布特征(如距離、方位分布特征); 用戶移動(dòng)性特征(如切換特征); 鄰小區(qū)的站址結(jié)構(gòu)特征(如鄰區(qū)站高、 站間距、下傾角、相關(guān)性角度); 地形地貌特征(如主覆蓋區(qū)域內(nèi)的建筑高度、密度分布); 互操作配置策略特征(如本系統(tǒng)、異系統(tǒng)切換/重選策略)等等。
圖1 LTE網(wǎng)優(yōu)參數(shù)智能優(yōu)化流程架構(gòu)
2.3.2 多數(shù)據(jù)關(guān)聯(lián)提取與數(shù)據(jù)預(yù)處理
進(jìn)行無(wú)線小區(qū)的特征建模所用到的數(shù)據(jù),包括現(xiàn)網(wǎng)海量的參數(shù)配置數(shù)據(jù)、MR測(cè)量數(shù)據(jù)、工參結(jié)構(gòu)數(shù)據(jù)、鄰區(qū)配置數(shù)據(jù)、性能指標(biāo)數(shù)據(jù)、3D地圖數(shù)據(jù)等多維度數(shù)據(jù)源。
從數(shù)據(jù)源提取數(shù)據(jù)后,首先要進(jìn)行數(shù)據(jù)清洗,因?yàn)槲覀兡玫降臄?shù)據(jù)可能包含了缺失值(北向輸出缺失),也可能包含噪音值(如錯(cuò)誤工參),也可能因?yàn)槿斯や浫脲e(cuò)誤導(dǎo)致有異常點(diǎn)存在,對(duì)我們的模型構(gòu)建和算法運(yùn)算出有效信息造成了一定的困擾,所以我們需要通過(guò)一些方法,盡量提高數(shù)據(jù)的質(zhì)量。數(shù)據(jù)清洗一般包括如下步驟:分析數(shù)據(jù)、缺失值處理、異常值處理、去重處理等。
2.3.3 基于聚類算法的小區(qū)特征分簇分類
在完成數(shù)據(jù)預(yù)處理環(huán)節(jié)后,引入了無(wú)監(jiān)督機(jī)器學(xué)習(xí)聚類算法進(jìn)行小區(qū)特征分簇分類:如基于可變權(quán)重的K-Means算法、BIRCH算法、DBSCAN算法等:能夠讓計(jì)算機(jī)程序自動(dòng)完成小區(qū)特征的定量分簇分類。
每個(gè)小區(qū)均可以看作是一個(gè)具有P維屬性的數(shù)據(jù)對(duì)象(即用多維空間的一個(gè)向量點(diǎn)來(lái)表示),在地里維度上,特定區(qū)域內(nèi)的所有N個(gè)小區(qū),組成了N×P矩陣(N個(gè)對(duì)象×P個(gè)屬性),如公式(1):
基于可變權(quán)重的距離度量進(jìn)行聚類算法相似度計(jì)算,如公式(2):
小區(qū)無(wú)線特征的聚類運(yùn)算過(guò)程可視化,可將不同類別小區(qū)用不同顏色表示,如圖2所示。
2.3.4 無(wú)線參數(shù)配置與網(wǎng)絡(luò)質(zhì)量相關(guān)性分析
此步驟中,使用在上一環(huán)節(jié)各場(chǎng)景特征聚類劃分結(jié)果后的簇內(nèi)小區(qū),進(jìn)行網(wǎng)絡(luò)質(zhì)量評(píng)價(jià),挖掘現(xiàn)網(wǎng)各個(gè)場(chǎng)景下的局部參數(shù)最優(yōu)配置,進(jìn)行IT平臺(tái)固化,固化后的簇內(nèi)局部參數(shù)配置經(jīng)驗(yàn),用于后續(xù)按照協(xié)同過(guò)濾算法進(jìn)行參數(shù)經(jīng)驗(yàn)值的自動(dòng)化推薦。
2.3.5 基于協(xié)同過(guò)濾算法的小區(qū)特征匹配與LTE參數(shù)自動(dòng)化推薦
在當(dāng)前成熟的個(gè)性化推薦系統(tǒng)中,基于鄰域的協(xié)同過(guò)濾算法,仍然是最為流行的推薦算法,其中KNN即是典型的鄰域算法(K-Nearest Neighbor algorithm,K最近鄰算法),通過(guò)計(jì)算樣本個(gè)體間的距離或者相似度尋找與每個(gè)輸入樣本個(gè)體最相近的K個(gè)個(gè)體(即:找到特征最相似LTE無(wú)線小區(qū)的過(guò)程),算法的時(shí)間復(fù)雜度跟樣本的個(gè)數(shù)直接相關(guān),需要與每個(gè)個(gè)體完成一次兩兩比較的過(guò)程。
在計(jì)算K近鄰的過(guò)程中,距離和相似度度量是KNN的基礎(chǔ)算法,因?yàn)镵NN的個(gè)體相似度或鄰近的距離都會(huì)選擇距離度量和相似度度量中的某種方法進(jìn)行計(jì)算,本文所述工具在此處也重復(fù)使用了前面章節(jié)描述的可變權(quán)重距離度量進(jìn)行相似度計(jì)算。
在本文介紹的LTE參數(shù)自動(dòng)化推薦系統(tǒng)的實(shí)踐過(guò)程中,就使用了小區(qū)粒度的KNN算法(LTE cell-based kNN)找到參數(shù)最優(yōu)經(jīng)驗(yàn)庫(kù)中的特征最相似LTE無(wú)線小區(qū),從而實(shí)現(xiàn)參數(shù)取值的自動(dòng)推薦輸出。
2.3.6 LTE參數(shù)實(shí)時(shí)推薦系統(tǒng)的改進(jìn)方法
目前主流的推薦系統(tǒng),當(dāng)分析的對(duì)象數(shù)量(如電子商務(wù)領(lǐng)域的用戶和商品,以及本文所描述的LTE無(wú)線小區(qū))達(dá)到一定數(shù)目時(shí),推薦算法都面臨嚴(yán)重的可擴(kuò)展性問(wèn)題,推薦的實(shí)效性變得較差,如何在算法和架構(gòu)上提高推薦速度是很多公司不得不思考的問(wèn)題。目前,在算法上主要通過(guò)引入聚類技術(shù)和改進(jìn)實(shí)時(shí)協(xié)同過(guò)濾算法提高推薦速度。
在算法上,一般可采用EM(Expectation-Maximization)、K-Means、模糊聚類等聚類技術(shù)提高推薦速度,因?yàn)槭褂镁垲惣夹g(shù)可以大大縮小待匹配對(duì)象的最近鄰居搜索范圍,從而提高推薦的實(shí)時(shí)性。
在本文介紹的LTE參數(shù)自動(dòng)化推薦系統(tǒng)中,即采用了基于可變權(quán)重的K-Means算法,作為前置環(huán)節(jié),通過(guò)將LTE無(wú)線小區(qū)進(jìn)行場(chǎng)景特征的聚類分簇,先將小區(qū)級(jí)特征聚類為典型場(chǎng)景,在每個(gè)場(chǎng)景內(nèi)部進(jìn)行參數(shù)設(shè)置評(píng)估,固化優(yōu)秀參數(shù)配置經(jīng)驗(yàn)。從而在參數(shù)推薦環(huán)節(jié), 也就減少了算法計(jì)算量,基本實(shí)現(xiàn)了參數(shù)取值的實(shí)時(shí)推薦功能。
LTE參數(shù)智能推薦和優(yōu)化工具在某省內(nèi)選擇67個(gè)高掉線TOP小區(qū),使用場(chǎng)景參數(shù)自動(dòng)推薦工具輸出參數(shù)修改建議,累計(jì)修改254項(xiàng)參數(shù)。
計(jì)算機(jī)自動(dòng)輸出參數(shù)修改情況,如表1所示。
圖2 小區(qū)無(wú)線特征的聚類運(yùn)算過(guò)程可視化
表1 自動(dòng)化算法推薦參數(shù)取值情況
按照計(jì)算機(jī)自動(dòng)輸出的參數(shù)經(jīng)驗(yàn)推薦值,進(jìn)行調(diào)整后無(wú)線接通率從99.45%提升至99.65%,提升了0.21個(gè)分點(diǎn),無(wú)線掉線率從0.5%下降至0.37%,改善了0.13個(gè)百分點(diǎn),切換成功率從98.85%提升到了98.91%,提升了0.06個(gè)百分點(diǎn),可以看到,基于機(jī)器學(xué)習(xí)和挖掘的參數(shù)經(jīng)驗(yàn)取值自動(dòng)推薦方法,對(duì)于該地區(qū)TOP小區(qū)具有明顯改善作用。
通過(guò)算法驗(yàn)證結(jié)果證明,使用基于機(jī)器學(xué)習(xí)技術(shù)的LTE網(wǎng)優(yōu)參數(shù)自動(dòng)化設(shè)置與推薦系統(tǒng),程序自動(dòng)計(jì)算輸出的參數(shù)經(jīng)驗(yàn)取值,已基本能接近人工優(yōu)化的效果。
本文所述的工具建立了一套基于無(wú)線小區(qū)特征分析的參數(shù)配置取值自動(dòng)化分析和推薦系統(tǒng)。
通過(guò)本工具建立的現(xiàn)網(wǎng)優(yōu)秀參數(shù)配置經(jīng)驗(yàn)庫(kù)模型,以及個(gè)性化推薦系統(tǒng),可使一線優(yōu)化人員充分借鑒已充分優(yōu)化地區(qū)的LTE參數(shù)配置經(jīng)驗(yàn),以減少優(yōu)化人員工作量和技術(shù)水平要求,可快速輔助各地市網(wǎng)優(yōu)人員將新入網(wǎng)小區(qū)的參數(shù)配置質(zhì)量達(dá)到人工參數(shù)優(yōu)化經(jīng)驗(yàn)的水平。
[1] 周志華. 機(jī)器學(xué)習(xí)[M]. 北京: 清華大學(xué)出版社, 2016.
[2] Francesco Ricci. 推薦系統(tǒng):技術(shù)、評(píng)估及高效算法[M]. 李艷民, 等, 譯. 北京: 機(jī)械工業(yè)出版社, 2015.
[3] Dietmar Jannach. 推薦系統(tǒng)[M]. 蔣凡, 譯. 北京: 人民郵電出版社, 2013.
[4] 項(xiàng)亮. 推薦系統(tǒng)實(shí)踐[M]. 北京: 人民郵電出版社, 2012.