郭華,張東林,徐維華,張航,陳超
(中國(guó)移動(dòng)通信集團(tuán)吉林有限公司,吉林 長(zhǎng)春 130033)
隨著4G/5G 網(wǎng)絡(luò)的不斷深入建設(shè),無線網(wǎng)絡(luò)運(yùn)維成本急劇上升,將人工智能技術(shù)與無線網(wǎng)絡(luò)運(yùn)維相結(jié)合成為了重要的解決途徑。目前業(yè)界在該方面的研究仍然處于探索階段,文獻(xiàn)[1] 探討了人工智能技術(shù)在異常數(shù)據(jù)診斷、指標(biāo)趨勢(shì)預(yù)測(cè)、小區(qū)擴(kuò)容等方面的應(yīng)用,文獻(xiàn)[2] 給出了機(jī)器學(xué)習(xí)在無線網(wǎng)絡(luò)規(guī)劃中的應(yīng)用,文獻(xiàn)[3] 梳理了人工智能當(dāng)前在通信領(lǐng)域的研究和應(yīng)用進(jìn)展,并給出了網(wǎng)絡(luò)智能化解決方案,文獻(xiàn)[4] 探討了多元線性回歸模型在5G 功耗建模中的應(yīng)用,文獻(xiàn)[5-7] 分別從流量預(yù)測(cè)、用戶感知速率預(yù)測(cè)、認(rèn)知無線網(wǎng)絡(luò)優(yōu)化等高階應(yīng)用方面進(jìn)行了研究,文獻(xiàn)[8] 和[9] 給出了人工智能技術(shù)在網(wǎng)絡(luò)運(yùn)維中遇到的困難,文獻(xiàn)[10] 和[11] 則進(jìn)行了人工智能在5G 網(wǎng)絡(luò)中的應(yīng)用探討。近年來,雖然在光無線網(wǎng)絡(luò)自治、資源分配、移動(dòng)性管理等方面進(jìn)行了研究[12-13],但是當(dāng)前基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)參數(shù)自優(yōu)化的研究與應(yīng)用仍然較少。
無線小區(qū)負(fù)載均衡[14]優(yōu)化是指在特定的無線環(huán)境下,通過無線參數(shù)調(diào)整等手段對(duì)同站內(nèi)具有一定覆蓋重疊度的小區(qū)實(shí)現(xiàn)流量均衡分擔(dān),是近年通信網(wǎng)絡(luò)感知優(yōu)化的重點(diǎn)方向?,F(xiàn)有的負(fù)載均衡優(yōu)化只能根據(jù)人工經(jīng)驗(yàn)逐個(gè)比對(duì)同扇區(qū)內(nèi)的負(fù)載不均小區(qū)對(duì)之間的相互關(guān)系,以制定參數(shù)調(diào)整方案,往往需要大量反復(fù)的手動(dòng)核查,準(zhǔn)確率、效率均無法有效提升。以吉林省通化、白山、遼源、長(zhǎng)春這四地市為例,每周2 000 個(gè)負(fù)載不均小區(qū)中需要反復(fù)關(guān)聯(lián)、核查、計(jì)算的十大類參數(shù)共計(jì)約35.7 萬條,數(shù)據(jù)量巨大,人工優(yōu)化已經(jīng)很難勝任。鑒于此,本文介紹了基于XGBoost(eXtreme Gradient Boosting,極限梯度提升樹)[15]集成學(xué)習(xí)方法和DNN(Deep Neutral Network,深度神經(jīng)網(wǎng)絡(luò))[16]的無線小區(qū)負(fù)載均衡參數(shù)自優(yōu)化原理以及實(shí)驗(yàn)實(shí)現(xiàn)。利用機(jī)器學(xué)習(xí)的自學(xué)習(xí)機(jī)制,實(shí)時(shí)自動(dòng)化輸出負(fù)載不均衡小區(qū)的主要均衡參數(shù),從而實(shí)現(xiàn)負(fù)載均衡的自優(yōu)化,使得工作效率顯著提高。
本文提出一種基于機(jī)器學(xué)習(xí)的負(fù)載均衡自優(yōu)化方案,利用XGBoost 算法以及DNN 網(wǎng)絡(luò)對(duì)負(fù)載均衡小區(qū)參數(shù)配置進(jìn)行建模學(xué)習(xí),然后自動(dòng)輸出負(fù)載不均小區(qū)優(yōu)化方案。整體流程方案如圖1 所示:
圖1 整體流程方案
主要流程如下:
(1)基于均衡小區(qū)的切換事件建模:采用XGBoost算法,以現(xiàn)網(wǎng)均衡小區(qū)的無線網(wǎng)絡(luò)特征數(shù)據(jù)作為輸入、均衡小區(qū)的切換事件配置作為學(xué)習(xí)目標(biāo),對(duì)XGBoost 模型進(jìn)行訓(xùn)練,這里切換事件配置主要包括A3/A4/A5 三類。
(2)負(fù)載不均小區(qū)切換事件預(yù)測(cè):基于上述訓(xùn)練模型,將待優(yōu)化的不均衡小區(qū)的無線網(wǎng)絡(luò)特征數(shù)據(jù)作為輸入,輸出不均衡小區(qū)對(duì)的切換事件配置,即對(duì)不均衡小區(qū)按A3/A4/A5 進(jìn)行分類,由此確定了切換事件。
(3)基于均衡小區(qū)的切換事件門限建模:在確定切換事件的基礎(chǔ)之上,采用全連接網(wǎng)絡(luò),以均衡小區(qū)的無線網(wǎng)絡(luò)特征、切換事件配置作為輸入,以各小區(qū)對(duì)應(yīng)的切換事件門限作為學(xué)習(xí)目標(biāo),對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,此步驟屬于多任務(wù)回歸問題。
(4)不均衡小區(qū)切換門限預(yù)測(cè):以待優(yōu)化的不均衡小區(qū)無線網(wǎng)絡(luò)特征以及切換事件作為輸入,輸出不均衡小區(qū)切換事件對(duì)應(yīng)的門限配置。
本文首先介紹如何對(duì)均衡小區(qū)的無線網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行特征選擇,然后分別針對(duì)負(fù)載均衡小區(qū)切換事件、負(fù)載均衡小區(qū)切換事件門限的建模過程以及預(yù)測(cè)進(jìn)行詳細(xì)描述。
無線小區(qū)的負(fù)載均衡參數(shù)配置需要考慮眾多網(wǎng)絡(luò)因素,如兩個(gè)負(fù)載小區(qū)的用戶數(shù)、流量、PRB 利用率、頻率、接通成功率、切換成功率、掉線率、MR、覆蓋距離等指標(biāo),以及兩個(gè)負(fù)載小區(qū)對(duì)間的共性因素,如兩個(gè)小區(qū)的方位角覆蓋偏差、小區(qū)對(duì)間切換次數(shù)、小區(qū)對(duì)切換成功率、同扇區(qū)小區(qū)數(shù)目、最近鄰距離等。
通過對(duì)吉林省通化、遼源、白山三地市負(fù)載均衡小區(qū)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行整理,按負(fù)載均衡小區(qū)定義關(guān)系,匹配小區(qū)對(duì)后得到網(wǎng)絡(luò)特征共計(jì)73 個(gè),采用卡方檢驗(yàn)法對(duì)特征進(jìn)行選擇[17],挑選對(duì)負(fù)載均衡影響最大的topN特征。卡方值計(jì)算公式如下:
其中,A為變量的觀測(cè)值;E為理論計(jì)算值。應(yīng)用到特征選擇,對(duì)于特征X與分類Y的卡方值,有:
其中,count(X)、count(Y)、count()、count() 分別表示包含特征X的頻次、包含分類目標(biāo)Y的頻次以及不包含特征X的頻次、不包含分類目標(biāo)Y的頻次。
這里取打分值在前90%的特征為最終的特征選擇結(jié)果,最終得到60 個(gè)主要特征,卡方得分值為1萬~30 萬,具體分布如圖2 所示:
圖2 特征得分分布
部分特征得分如表1 所示,基于特征選擇結(jié)果進(jìn)行后續(xù)的建模。
表1 部分特征得分表
小區(qū)負(fù)載均衡主要依靠調(diào)整小區(qū)對(duì)間互操作參數(shù)實(shí)現(xiàn),其中最重要的為切換調(diào)整,主要包括負(fù)載不均小區(qū)間的切換事件調(diào)整以及對(duì)應(yīng)的切換門限調(diào)整。具體參數(shù)如表2 所示:
表2 切換事件-對(duì)應(yīng)門限
(1)切換事件:取值包括A3/A4/A5 三類。
(2)切換門限:在確定切換事件的前提下,有各自對(duì)應(yīng)的門限參數(shù)。
本節(jié)采用XGBoost 實(shí)現(xiàn)切換事件的預(yù)測(cè),屬于分類問題。XGBoost 為GBDT[18]梯度提升樹的一種高效實(shí)現(xiàn),不同之處在于XGBoost 在目標(biāo)函數(shù)、樹節(jié)點(diǎn)分裂方式、特征離散化等細(xì)節(jié)進(jìn)行了諸多改進(jìn),無論執(zhí)行速度還是準(zhǔn)確率都有顯著提高。一般形式如下,假設(shè)第t次迭代需要訓(xùn)練的模型ft(x),則有:
表3 XGBoost參數(shù)配置
以吉林省通化市2021 年8 月份3 609 對(duì)負(fù)載均衡小區(qū)數(shù)據(jù)作為樣本數(shù)據(jù)。將樣本數(shù)據(jù)按8:2 比例劃分為訓(xùn)練集、測(cè)試集,對(duì)訓(xùn)練集數(shù)據(jù)依次按[0.1,0.325,0.55,0.775,1] 比例劃分,并進(jìn)行交叉驗(yàn)證。訓(xùn)練集、測(cè)試集準(zhǔn)確率學(xué)習(xí)曲線對(duì)比如圖3 所示,當(dāng)樣本數(shù)量達(dá)到1 500 以后,模型性能達(dá)到穩(wěn)定。
圖3 訓(xùn)練集、測(cè)試集學(xué)習(xí)曲線
進(jìn)一步用訓(xùn)練數(shù)據(jù)集對(duì)XGBoost 模型進(jìn)行訓(xùn)練,然后用測(cè)試集驗(yàn)證結(jié)果。A3/A4/A5 預(yù)測(cè)結(jié)果混淆矩陣如表4 所示,整體預(yù)測(cè)準(zhǔn)確率為97.37%。
表4 測(cè)試集混淆矩陣
利用XGBoost 庫(kù)的predict_proba 函數(shù)分別輸出A3/A4/A5 事件預(yù)測(cè)概率,并繪制對(duì)應(yīng)的ROC 曲線如圖4 所示,橫坐標(biāo)表示假陽(yáng)率,縱坐標(biāo)表示真陽(yáng)率,可見ROC曲線呈現(xiàn)出靠近左上角趨勢(shì)。用sckit-learn[19]的sklearn.metics.auc 函數(shù)分別計(jì)算圖4 中A3/A4/A5 ROC 曲線面積(即AUC 值)分別為98.16%、97.02%、97.02%,可見模型較為穩(wěn)定,具有較強(qiáng)的泛化能力。
圖4 A3/A4/A5分類ROC曲線
對(duì)XGBoost 模型中的樹結(jié)構(gòu)進(jìn)行繪制,為一個(gè)7 層的樹結(jié)構(gòu)模型,具體如圖5 所示。
圖5 XGBoost結(jié)構(gòu)圖
本節(jié)主要介紹采用全連接神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)負(fù)載均衡切換門限預(yù)測(cè),屬于回歸問題。定義一個(gè)具有2 個(gè)隱藏層的DNN 網(wǎng)絡(luò),可以擬合任何精度的平滑映射。
(1)輸入層:包含同扇區(qū)下小區(qū)對(duì)間的方位角60 個(gè)特征以及A3/A4/A5 某個(gè)切換事件之一,共計(jì)61 個(gè)節(jié)點(diǎn)。
(2)隱藏層:共計(jì)2 層,第一層20 個(gè)節(jié)點(diǎn),第二層5 個(gè)節(jié)點(diǎn),用以處理中間輸入。設(shè)輸入層節(jié)點(diǎn)為x1~xn,輸入xi到隱藏1 層鏈接權(quán)重為,則有:其中,f為隱藏層激活函數(shù),采用RELU 作為激活函數(shù)[9]。兩個(gè)隱藏層之間添加一個(gè)BatchNormalization[20]層,并設(shè)置Dropout=0.5[21],用以控制過擬合。
(3)輸出層:針對(duì)不同的事件門限預(yù)測(cè),不設(shè)置激活函數(shù),輸出節(jié)點(diǎn)數(shù)與A3/A4/A5 事件對(duì)應(yīng)的參數(shù)門限數(shù)分別一一對(duì)應(yīng),門限參數(shù)詳見表1。由此得到對(duì)應(yīng)的網(wǎng)絡(luò)結(jié)構(gòu)圖整體如圖6 所示:
圖6 網(wǎng)絡(luò)結(jié)構(gòu)圖
以吉林省通化、白山、遼源三地市2021 年8 月份8 536對(duì)負(fù)載均衡小區(qū)數(shù)據(jù)作為樣本數(shù)據(jù),對(duì)樣本數(shù)據(jù)集分別按A3/A4/A5 切換事件進(jìn)行劃分,得到基于A3 切換的小區(qū)對(duì)4 092 個(gè)、基于A4 切換的小區(qū)對(duì)2 070 個(gè)、基于A5切換的小區(qū)對(duì)2 374 個(gè)。
按訓(xùn)練樣本、測(cè)試樣本8:2 比例進(jìn)行數(shù)據(jù)集劃分,損失函數(shù)采用平均絕對(duì)誤差MAE,分別以A3/A4/A5 切換事件對(duì)應(yīng)的切換門限,包括A2 門限值、CIO 值、A4 門限值、A5 門限值為學(xué)習(xí)目標(biāo),最終得到對(duì)應(yīng)門限平均損失函數(shù)曲線如圖7 所示。當(dāng)?shù)螖?shù)達(dá)到100 次以后,訓(xùn)練、測(cè)試數(shù)據(jù)集損失曲線逐步趨于穩(wěn)定,A3/A4/A5 對(duì)應(yīng)的參數(shù)誤差波動(dòng)在2~4。
圖7 A3/A4/A5門限訓(xùn)練-測(cè)試誤差分布圖
以A4 切換事件為例,A4 事件相關(guān)聯(lián)的三個(gè)門限值:CIO 值、A2 門限值、A4 門限值的預(yù)測(cè)平均絕對(duì)誤差以及在現(xiàn)網(wǎng)中的取值范圍如表5 所示。可以發(fā)現(xiàn),相對(duì)于各類門限的現(xiàn)網(wǎng)取值范圍,預(yù)測(cè)誤差的波動(dòng)在可接受范圍之內(nèi),可以用于實(shí)際的優(yōu)化工作中。
表5 預(yù)測(cè)誤差與現(xiàn)網(wǎng)取值范圍
進(jìn)一步采用擬合優(yōu)度R2得分對(duì)模型進(jìn)行預(yù)測(cè)能力綜合評(píng)估,擬合優(yōu)度計(jì)算方法如式(6) 所示,R2≤1,當(dāng)R2越接近1,代表預(yù)測(cè)值與實(shí)際值越接近,預(yù)測(cè)效果就越好。
各切換事件對(duì)應(yīng)參數(shù)的擬合優(yōu)度值依次如表6 所示,R2值全部在0.6 以上,CIO 擬合優(yōu)度在0.6~0.7,切換門限擬合優(yōu)度全部在0.7~0.8,可見模型的擬合效果較好。
表6 各參數(shù)擬合優(yōu)度值
本文分別給出了負(fù)載均衡小區(qū)的均衡事件、門限的自優(yōu)化方法,包括網(wǎng)絡(luò)特征選擇、基于XGBoost 和深度學(xué)習(xí)網(wǎng)絡(luò)的負(fù)載均衡優(yōu)化原理以及實(shí)驗(yàn)結(jié)果。通過該方法可以在較高的準(zhǔn)確率下,實(shí)現(xiàn)對(duì)無線網(wǎng)絡(luò)負(fù)載均衡切換參數(shù)的建模學(xué)習(xí)。目前人工智能技術(shù)在此方向的應(yīng)用仍然較少,本文進(jìn)一步拓寬了AI 賦能無線網(wǎng)絡(luò)優(yōu)化的研究思路與方向。后續(xù)將進(jìn)一步融合其他方法以增強(qiáng)模型的表達(dá)能力,如加入知識(shí)圖譜用以描述小區(qū)間關(guān)系、加入強(qiáng)化學(xué)習(xí)用以實(shí)現(xiàn)獎(jiǎng)懲策略等,并擴(kuò)展應(yīng)用到無線網(wǎng)絡(luò)優(yōu)化的其他領(lǐng)域,如鄰區(qū)切換自優(yōu)化、小區(qū)選擇自優(yōu)化、功率設(shè)置自優(yōu)化等。