[劉洋 吳威 宋偉 林彬]
隨著大數(shù)據(jù)、云計算、智能化、平臺化的信息革命時代的到來,傳統(tǒng)網(wǎng)優(yōu)行業(yè)有著難以承受的痛:風(fēng)險大、效率低、效果不一?,F(xiàn)代通信行業(yè)的工作模式已經(jīng)逐漸向平臺化、系統(tǒng)化、自動化和智能化的模式轉(zhuǎn)變。安全、高效、全面、智能是未來通信行業(yè)發(fā)展的方向。隨著4G 網(wǎng)絡(luò)用戶的增長與網(wǎng)絡(luò)規(guī)模的擴大和無線網(wǎng)絡(luò)傳播環(huán)境的日趨復(fù)雜,LTE 網(wǎng)絡(luò)優(yōu)化難度增加。本文引入人工智能相關(guān)算法,介紹人工智能在場景識別及智能優(yōu)化中的應(yīng)用。
隨著中國移動從2G 到5G 不斷地演進(jìn)式的發(fā)展,目前所有的移動業(yè)務(wù)都是通過無線網(wǎng)接入,想要保持良好的網(wǎng)絡(luò)質(zhì)量,就需要不斷對網(wǎng)絡(luò)進(jìn)行大量的優(yōu)化調(diào)整,同時無線網(wǎng)絡(luò)中業(yè)務(wù)場景實時變化,從眾多KPI 指標(biāo)中判斷業(yè)務(wù)類形態(tài),工作量大、無法與話務(wù)模型實時匹配,優(yōu)化調(diào)整策略僅通過工程師個體經(jīng)驗難以保證質(zhì)量。通過智能算法引入,實現(xiàn)兩個維度的智能優(yōu)化策略。
(1)滿足場景識別、海量參數(shù)修改需求。例如在KPI 指標(biāo)惡化或者在大型會議、比賽、通信保障等特殊場景下,采用人工識別場景并修改參數(shù),效率較低。我們的產(chǎn)品通過CNN(卷積神經(jīng)網(wǎng)絡(luò))實現(xiàn)網(wǎng)絡(luò)畫像深度學(xué)習(xí),通過時間序列可以對高容量、大話務(wù)、CBD 商業(yè)區(qū)、高速、高校進(jìn)行快速準(zhǔn)確的智能網(wǎng)絡(luò)畫像,從而識別出網(wǎng)絡(luò)場景,自動匹配策略進(jìn)行參數(shù)自動修改,可節(jié)省大量工作并提高優(yōu)化精度。
(2)預(yù)測參數(shù)調(diào)整后指標(biāo)情況、推薦最優(yōu)策略。結(jié)合歷史數(shù)據(jù),通過多元線性歸算法對效果進(jìn)行預(yù)測,尋求最優(yōu)調(diào)整策略并執(zhí)行。擺脫了以往單純依靠人工經(jīng)驗的形式,使得網(wǎng)絡(luò)調(diào)整更科學(xué)、精確。
通過MR、話統(tǒng)指標(biāo)等數(shù)據(jù)進(jìn)行相關(guān)性分析并降維處理,利用PCA 主成份分析法將多維數(shù)據(jù)降至一維并繪制網(wǎng)絡(luò)模型,根據(jù)網(wǎng)絡(luò)模型繪制場景圖片,并使用CNN 卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練識別小區(qū)場景特征并進(jìn)行場景分類,場景識別過程如圖1 所示。
圖1 場景識別過程
聚類算法相關(guān)性分析:采用該算法完成了海量數(shù)據(jù)的精準(zhǔn)定位。通過協(xié)方差及相關(guān)性系數(shù)的計算,找出了最直接影響網(wǎng)絡(luò)狀況的幾類指標(biāo)。
“相關(guān)系數(shù)”正的協(xié)方差表達(dá)了正的相關(guān)性,負(fù)的協(xié)方差表達(dá)了負(fù)的相關(guān)性。對于同樣的兩個隨機變量來說,計算出的協(xié)方差越大,相關(guān)性越強。
以吞吐量等跟話務(wù)高相關(guān)的指標(biāo)為主,篩選出相關(guān)性高于90%相關(guān)字段。
降維算法PCA 主成分分析法:通過該算法計算出了話務(wù)模型矩陣(T=ABT其中A是元件矩陣,B是源數(shù)據(jù)。)。將龐大的數(shù)據(jù)量壓縮為一維數(shù)組,結(jié)合時間序列形成網(wǎng)絡(luò)畫像。
通過歸一化、球形、卡方檢驗通過后進(jìn)行PCA 降維。壓縮為一維數(shù)組,該數(shù)組為“話務(wù)模型因子”。
模型簡單理解是錄入數(shù)據(jù)后,模型輸出影響指標(biāo)因素多個矩陣。各個矩陣依次以影響大小排序(如圖2 所示)。一般取用影響最大的幾個(例如得分高于1)。圖2的情況僅有一個字段得分高于1。因此可以降為一維。(降為幾維是根據(jù)結(jié)果決定而不是事先決定。但是數(shù)據(jù)篩選時可以加以干涉,例如相關(guān)性分析。)
圖2 數(shù)據(jù)降維處理
將得到的元件矩陣帶回原先的數(shù)據(jù)中得出一維的“話務(wù)模型因子”
公式:話務(wù)模型因子T=ABT
其中A是元件矩陣,B是源數(shù)據(jù)。
如圖3 所示為例,該部分是以某一基站通過算法計算后得出的網(wǎng)絡(luò)畫像(與該圖像相似的基站約占試點區(qū)域總基站數(shù)的18%)。其網(wǎng)絡(luò)規(guī)律非常顯著并且常年保持該圖形分布。其規(guī)律分別在0~8 點期間以及20~24 點期間為低谷,8~20 點期間為相對高峰。該活動規(guī)律與寫字樓區(qū)域的活動規(guī)律類似(分為上班時間和下班時間)。因此將此類分布定義為“寫字樓型”方便理解記憶。
圖3 場景繪制樣例
通過話務(wù)模型,分析不同話務(wù)模型特征,并定義其對應(yīng)的場景類型,進(jìn)入深度學(xué)習(xí)網(wǎng)絡(luò)中需要剔除各類噪聲。(例如坐標(biāo)軸、數(shù)字、邊框,特征需要盡可能明顯。)大致類型分為:
①Break 故障型(通信行為全天幾乎為零);
② Office 寫字樓型(上班時間通信行為為高峰其余時間為低谷);
③Line 離散型(全天的通信行為處于震蕩式可以理解為待定);
④ Market 商場型(中午吃飯時段及晚上六點至九點處于通信行為高峰,其余時間為低谷);
⑤ Pub 酒吧型(夜晚及凌晨時間通信行為為高峰,其余時間為低谷);
⑥ Uptown 住宿區(qū)型(除去午夜凌晨時段外,其余時間都處于高峰的通信行為);
⑦ Village 鄉(xiāng)村型(全天有通信行為,但皆處于低谷);
試點的90%為以上類別的分布,其余10%類別歸入Line 離散型當(dāng)中。經(jīng)過各個月的抽檢,同一基站的圖形性質(zhì)不變。
期間會出現(xiàn)識別過程中圖片同時與其余類別趨于一致的問題。默認(rèn)交由深度學(xué)習(xí)網(wǎng)絡(luò)自動識別,由于類別間相似因此調(diào)整參數(shù)的策略誤差在可以接受的范圍內(nèi),場景繪制結(jié)果如圖4 所示。
圖4 場景繪制結(jié)果
CNN 可以用來識別位移、縮放及其它形式扭曲不變性的二維或三維圖像。CNN的特征提取層參數(shù)是通過訓(xùn)練數(shù)據(jù)學(xué)習(xí)得到的,所以其避免了人工特征提取,而是從訓(xùn)練數(shù)據(jù)中進(jìn)行學(xué)習(xí);其次同一特征圖的神經(jīng)元共享權(quán)值,減少了網(wǎng)絡(luò)參數(shù),這也是卷積網(wǎng)絡(luò)相對于全連接網(wǎng)絡(luò)的一大優(yōu)勢。共享局部權(quán)值這一特殊結(jié)構(gòu)更接近于真實的生物神經(jīng)網(wǎng)絡(luò)使CNN 在圖像處理、語音識別領(lǐng)域有著獨特的優(yōu)越性,另一方面權(quán)值共享同時降低了網(wǎng)絡(luò)的復(fù)雜性,且多維輸入信號(語音、圖像)可以直接輸入網(wǎng)絡(luò)的特點避免了特征提取和分類過程中數(shù)據(jù)重排的過程。
在實踐中,我們搭建CNN 卷積神經(jīng)網(wǎng)絡(luò)框架,以約10 萬張訓(xùn)練圖片,學(xué)習(xí)率0.000 1,批量大小15 完成60 000 次迭代后形成最終的深度學(xué)習(xí)模型。該模型能以高精度、高效率、全智能方式完成各大網(wǎng)絡(luò)畫像的場景識別,為智能優(yōu)化打下堅實的基礎(chǔ)。
訓(xùn)練數(shù)據(jù)來源于先前的策略經(jīng)驗積累,模型通過預(yù)測結(jié)果以及不斷獲取的現(xiàn)有網(wǎng)絡(luò)動態(tài)完成模型優(yōu)化以及策略庫的經(jīng)驗積累。最終通過預(yù)測實施的方式計算出各大場景各個時段各個人流量下的最佳的優(yōu)化策略。并結(jié)合場景識別的監(jiān)控模式實時完成參數(shù)自動調(diào)整。
第一步:根據(jù)優(yōu)秀網(wǎng)優(yōu)工程師經(jīng)驗設(shè)定每類場景常用優(yōu)化參數(shù)、調(diào)整步長和參數(shù)調(diào)整范圍,參數(shù)設(shè)置區(qū)間及步長如表1 所示。
表1 參數(shù)設(shè)置區(qū)間及步長
第二步:根據(jù)不同場景特征制定關(guān)聯(lián)指標(biāo)并設(shè)置相關(guān)權(quán)值。
表2 指標(biāo)健康度計算
低于基準(zhǔn)值得0 分,高于挑戰(zhàn)值的滿分,基準(zhǔn)值和挑戰(zhàn)值之間按照線性得分計算。指標(biāo)健康度計算如表2 所示(峰值利用率只有一個門限,大于等于50%得0 分,小于50%得滿分)。
多元回歸分析預(yù)測法,是指通過對兩個或兩個以上的自變量與一個因變量的相關(guān)分析,建立預(yù)測模型進(jìn)行預(yù)測的方法。當(dāng)自變量與因變量之間存在線性關(guān)系時,稱為多元線性回歸分析。
寫字樓類的最終得分的多元回歸方程:
多次迭代計算已知值便可求出所有的系數(shù)b,以及誤差范圍e。J函數(shù)是懲罰函數(shù)加了正則項。已知值指的是工程師判斷的結(jié)果。
通過不同參數(shù)組合數(shù)次迭代預(yù)測指標(biāo)變化情況,根據(jù)給定的指標(biāo)權(quán)限計算小區(qū)健康度得分,得分最優(yōu)的參數(shù)組合即為機器建議值,智能優(yōu)化過程如圖5 所示。
圖5 智能優(yōu)化過程
隨著人工智能在各個行業(yè)中的應(yīng)用,網(wǎng)優(yōu)智能化發(fā)展已實在必行,本文從場景識別和智能優(yōu)化方面進(jìn)入手,探討人工智能在網(wǎng)絡(luò)優(yōu)化中的應(yīng)用,并給出合理的算法和可行性,為后續(xù)人工智能在網(wǎng)絡(luò)優(yōu)化中大規(guī)模應(yīng)用提供思路。