袁 江,沈佳成,居新星
(中國電信股份有限公司金華分公司,浙江 金華 321000)
隨著5G 牌照的發(fā)放,2021 年進(jìn)入我國5G 消費(fèi)者(2C)發(fā)展加速年,5G 移動(dòng)通信網(wǎng)絡(luò)處于高速發(fā)展階段,各運(yùn)營商5G 建設(shè)也步入高峰,競(jìng)爭(zhēng)非常激烈,全年新增約58 萬個(gè)5G 基站。與此同時(shí),5G 手機(jī)銷售占比也快速提升,如圖1 所示,預(yù)計(jì)2021 年底,5G 終端占總銷售終端的80%,2022—2024 年5G 快速成為主力軍,預(yù)計(jì)2024 年底5G 用戶占總移動(dòng)網(wǎng)用戶將達(dá)近80%,5G 終端數(shù)量的爆發(fā)式增長(zhǎng)必然帶動(dòng)5G 登網(wǎng)用戶大幅增加[1]。
圖1 5G 現(xiàn)狀與預(yù)測(cè)
圖2 為某省4G 和5G 用戶平均每月上網(wǎng)流量(Dataflow of usage,DoU)均值對(duì)比,可以看出,5G DoU 均值24G,相比4G 提升50%~80%,5G 的發(fā)展給運(yùn)營商帶來經(jīng)濟(jì)價(jià)值的提升。
圖2 4G 和5G DoU 均值對(duì)比
隨著5G 網(wǎng)絡(luò)建設(shè)、5G 終端發(fā)展、5G 用戶增多,讓用戶獲得良好的業(yè)務(wù)感知是運(yùn)營商關(guān)注的焦點(diǎn),也是競(jìng)爭(zhēng)中勝出的關(guān)鍵,這就需要一種成熟的指標(biāo)評(píng)估5G 用戶發(fā)展和體驗(yàn)情況,5G 分流比的概念呼之欲出。5G 分流比的提升一方面可以讓5G 用戶更多使用5G 網(wǎng)絡(luò),另一方面可以有效降低4G 的負(fù)荷[2]。某省的分流比數(shù)據(jù)如圖3 所示,5G 分流比僅占3%,與5G 用戶的終端占比還有很大的差距,然而當(dāng)前業(yè)界還沒有比較全面的評(píng)估提升5G 分流的方法和手段。本文基于運(yùn)營域(O 域)和業(yè)務(wù)域(B 域)數(shù)據(jù),采用隨機(jī)森林算法,從市場(chǎng)和網(wǎng)絡(luò)兩方面出發(fā),市場(chǎng)方面注重4G 至5G 用戶遷移,網(wǎng)絡(luò)方面?zhèn)戎攸c(diǎn)為提升駐留比,將分流比從3%提升至11.35%[3]。
圖3 5G 用戶、5G 終端、5G 流量對(duì)比
5G 分流比定義為:用戶產(chǎn)生的5G 網(wǎng)絡(luò)流量與非5G 網(wǎng)絡(luò)流量和5G 網(wǎng)絡(luò)流量之和的比例。分流比的提升與5G 終端滲透率、5G 開關(guān)打開比例、5G DoU 系數(shù)和5G 流量駐留比相關(guān),下文詳細(xì)論述了5G 分流比與市場(chǎng)側(cè)和網(wǎng)絡(luò)側(cè)的關(guān)系。
5G 分流比的計(jì)算方式為:
式中:5G 終端數(shù)量為a;非5G 終端數(shù)量為b;5G終端產(chǎn)生的5G 流量為c;5G 打開比例為g;打開開關(guān)的5G 終端DOU為DOU1;其余用戶DOU 為DOU0。
進(jìn)一步推導(dǎo):
式中:h為5G DOU 系數(shù),即為打開5G 開關(guān)的DOU與其他普通用戶的DOU的比,DOU1/DOU2。
進(jìn)一步推導(dǎo),引入5G 終端滲透率k,SA 滲透率k1,NSA 滲透率k2,
進(jìn)一步得到5G 分流比與終端滲透率的關(guān)系:
進(jìn)一步換算:
5G 駐留比用Z表示,開關(guān)開啟5G 終端產(chǎn)生的5G 流量比上開關(guān)開啟5G 終端產(chǎn)生的總流量,分為SA 流量駐留比Z1和NSA 流量駐留比Z2,推導(dǎo)駐留比關(guān)系為:
駐留比與終端滲透率的關(guān)系表示為:
B 域?yàn)闃I(yè)務(wù)域(business support system)的數(shù)據(jù)域。B 域有用戶數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù),比如用戶的消費(fèi)習(xí)慣、終端信息、平均每用戶收入(Average Revenue Per User,ARPU)的分組、業(yè)務(wù)內(nèi)容,業(yè)務(wù)受眾人群等。
O 域?yàn)檫\(yùn)營域(operation support system)的數(shù)據(jù)域,O 域有網(wǎng)絡(luò)數(shù)據(jù),比如信令、告警、故障、網(wǎng)絡(luò)資源等[4-5]。
根據(jù)數(shù)據(jù)分析,5G 分流比與5G 終端滲透率、5G 開關(guān)打開比例、5G DoU 系數(shù)和5G 流量駐留比相關(guān),分解推導(dǎo)為:
式中:T為SA 用戶占全網(wǎng)5G 用戶的比例。
式(8)中,5G 分流比與總體流量駐留比呈線性正相關(guān),流量駐留比提升多少倍,分流比相應(yīng)提升多少倍。5G 分流比與5G 終端滲透率、5G 開關(guān)打開比例都呈非線性正相關(guān),二者對(duì)5G分流比貢獻(xiàn)度一樣,推動(dòng)5G 開關(guān)打開與發(fā)展5G 終端用戶數(shù)作用等效。結(jié)合某運(yùn)營商本地?cái)?shù)據(jù)在可預(yù)見的將來,開關(guān)打開比例可提升1.5 倍左右,滲透率當(dāng)前基數(shù)還很低,可提升5 倍左右,可提升空間比較大,因此發(fā)展5G 終端提升滲透率是重點(diǎn)。5G 分流比與打開開關(guān)的5G 終端DoU 系數(shù)呈非線性正相關(guān),在用戶業(yè)務(wù)類型、行為習(xí)慣無明顯差異下,該系數(shù)一般在2 倍左右。
式(9)中,5G分流比與獨(dú)立5G用戶(standalone,SA)占比呈線性正相關(guān),SA 用戶占比越高,分流比越高;因此,發(fā)展用戶時(shí),重點(diǎn)要提升SA 駐留比。同理,SA 駐留比越高,分流比越高。
綜上所述,分流比的提升需要市場(chǎng)側(cè)加大精準(zhǔn)營銷力度,網(wǎng)絡(luò)側(cè)重點(diǎn)提升駐留;然而傳統(tǒng)的市場(chǎng)營銷僅僅考慮用戶行為并沒有結(jié)合網(wǎng)絡(luò)數(shù)據(jù),缺乏精準(zhǔn)性和效率性,5G 駐留比的提升當(dāng)前也沒有統(tǒng)一的方法和理論支撐。當(dāng)前運(yùn)營商同時(shí)擁有用戶數(shù)據(jù)(B 域)和網(wǎng)絡(luò)數(shù)據(jù)(O 域),如果能夠綜合考慮兩方面因素,分流比提升的節(jié)奏必然大大加快[6]。
本文綜合考慮B 域數(shù)據(jù)與O 域數(shù)據(jù),一方面結(jié)合換機(jī)用戶的終端、網(wǎng)絡(luò)行為及網(wǎng)絡(luò)體驗(yàn)3 個(gè)方向建模,通過算法挖掘4G 終端用戶的5G 換機(jī)潛力值,指引市場(chǎng)側(cè)加速5G 用戶發(fā)展;另外一方面,從4G工參、4G 測(cè)量報(bào)告(Measurement Report,MR)、5G 工參、5G MR、5G 話統(tǒng)出發(fā),結(jié)合市場(chǎng)用戶數(shù)據(jù),指引網(wǎng)絡(luò)側(cè)精準(zhǔn)建站和網(wǎng)絡(luò)優(yōu)化,提升駐留比[7-8]。
市場(chǎng)側(cè)5G 精準(zhǔn)營銷從換機(jī)用戶的終端、網(wǎng)絡(luò)行為及網(wǎng)絡(luò)體驗(yàn)3 個(gè)方向建模,涉及到用戶側(cè)B 域數(shù)據(jù)。其中,終端數(shù)據(jù)包括終端上市時(shí)間、價(jià)位、品牌;網(wǎng)絡(luò)行為可以分為視頻偏好用戶、游戲偏好用戶、網(wǎng)頁瀏覽偏好用戶、電話偏好用戶等;網(wǎng)絡(luò)體驗(yàn)可以分為上行感知速率、下行感知速率、DoU、語音質(zhì)量。綜合以上數(shù)據(jù)進(jìn)行建模實(shí)現(xiàn)4G高潛用戶的精準(zhǔn)識(shí)別。網(wǎng)絡(luò)側(cè)駐留比提升數(shù)據(jù)源包括4G MR 和5G MR,在5G 網(wǎng)絡(luò)中,MR 數(shù)據(jù)和4G網(wǎng)絡(luò)中類似,同樣也分為事件型和周期型MR,除了4G 中具有的參考信號(hào)接收功率(Reference Signal Received Power,RSRP)、跟蹤區(qū)(tracking area,TA)等信息外,還增加了波束信息及下行信號(hào)干擾噪聲比(signal to interference plus noise ratio,SINR)等信息,網(wǎng)絡(luò)側(cè)綜合以上數(shù)據(jù)對(duì)區(qū)域精細(xì)5G 價(jià)值建站判斷,實(shí)現(xiàn)精準(zhǔn)規(guī)劃建設(shè)輔助5G 網(wǎng)絡(luò)優(yōu)化,實(shí)現(xiàn)分流比提升[9]。
在之前的分析中,不管是市場(chǎng)側(cè)的數(shù)據(jù)還是網(wǎng)絡(luò)側(cè)的數(shù)據(jù)都是極為龐大,傳統(tǒng)的營銷模式和網(wǎng)絡(luò)規(guī)劃優(yōu)化并沒有綜合考慮B 域和O 域數(shù)據(jù),缺乏針對(duì)性和實(shí)時(shí)性。本文通過機(jī)器學(xué)習(xí)算法的數(shù)據(jù)分析方法建立精準(zhǔn)的高潛用戶識(shí)別模型和精準(zhǔn)規(guī)劃5G站點(diǎn)模型,將極大程度提升駐留比提升的效率。
隨機(jī)森林是一種比較新的機(jī)器學(xué)習(xí)模型(非線性基于樹的模型)集成學(xué)習(xí)方法。上世紀(jì)八十年代Breiman 等人發(fā)明了分類樹算法,該算法通過反復(fù)二分?jǐn)?shù)據(jù)進(jìn)行分類或回歸,計(jì)算量大大降低。2001年Breiman把分類樹組合成隨機(jī)森林,即在變量(列)的使用和數(shù)據(jù)(行)的使用上進(jìn)行隨機(jī)化,生成很多分類樹,再匯總分類樹結(jié)果。隨機(jī)森林在運(yùn)算量沒有顯著提高前提下提高了預(yù)測(cè)精度;此外,隨機(jī)森林對(duì)多元共線性不敏感,結(jié)果對(duì)缺失數(shù)據(jù)和非平衡數(shù)據(jù)比較穩(wěn)健,可以很好地預(yù)測(cè)多達(dá)幾千個(gè)解釋變量的作用[10]。隨機(jī)森林算法如圖4 所示。
如圖4 所示,隨機(jī)森林是由多個(gè)決策樹分類模型組合而成。這多個(gè)決策樹都由原始樣本有放回的隨機(jī)抽樣形成的新樣本訓(xùn)練而來,全量數(shù)據(jù)通過有放回的抽樣形成K個(gè)新樣本,并訓(xùn)練出K個(gè)決策樹模型。這K個(gè)決策樹即構(gòu)成了整個(gè)隨機(jī)森林。后續(xù),新樣本則會(huì)放入各個(gè)決策樹中進(jìn)行結(jié)果判斷,各個(gè)決策樹具有平等投票權(quán),根據(jù)多數(shù)原則最終決定模型輸出。在本文研究構(gòu)建的問題模型中,模型輸出即為判定該用戶是否為4G 高潛用戶和該柵格是否有價(jià)值進(jìn)行5G 規(guī)劃建設(shè)。
圖4 隨機(jī)森林算法
此次建模的主要目的是通過各字段數(shù)據(jù),預(yù)測(cè)出該用戶是否為4G 高潛用戶和該柵格是否有價(jià)值進(jìn)行5G 規(guī)劃建設(shè)。該問題屬于有監(jiān)督類學(xué)習(xí)中的分類問題,且具有數(shù)據(jù)體量大、數(shù)據(jù)字段多、各字段數(shù)據(jù)非線性分布的特點(diǎn);因此,在本次研究選擇隨機(jī)森林算法進(jìn)行模型構(gòu)建。
本次研究采取5 段式循環(huán)迭代的方式進(jìn)行。首先,將全網(wǎng)O 域和B 域數(shù)據(jù)進(jìn)行采集、計(jì)算和關(guān)聯(lián)形成原始分析數(shù)據(jù),得到可以輸入機(jī)器學(xué)習(xí)模型的規(guī)范化訓(xùn)練數(shù)據(jù);其次,導(dǎo)入隨機(jī)森林算法模型進(jìn)行訓(xùn)練,根據(jù)查準(zhǔn)率和查全率對(duì)模型進(jìn)行評(píng)估;最后,提煉模型中的經(jīng)驗(yàn)邏輯關(guān)系并指導(dǎo)下一次迭代分析。
市場(chǎng)策略的研究數(shù)據(jù)主要來源于某運(yùn)營商O 域和B 域數(shù)據(jù),市場(chǎng)側(cè)模型整體字段情況如表1 所示。
表1 研究數(shù)據(jù)字段表
本次研究的隨機(jī)森林模型通過R 語言進(jìn)行構(gòu)建,樣本采用市場(chǎng)側(cè)用戶B 數(shù)據(jù)與網(wǎng)絡(luò)側(cè)O 域數(shù)據(jù),將以上數(shù)據(jù)進(jìn)行組合生成1 000 組樣本數(shù)據(jù),其中訓(xùn)練集與測(cè)試集按照7:3 比例進(jìn)行分割,森林內(nèi)決策樹數(shù)量設(shè)置為500。整體模型預(yù)判項(xiàng)為4G 升級(jí)為5G 高潛用戶標(biāo)志,將除“高潛用戶”字段以外的數(shù)據(jù)作為模型的輸入,“高潛用戶”作為模型的輸出。將已有的市場(chǎng)數(shù)據(jù)導(dǎo)入隨機(jī)森林算法進(jìn)行訓(xùn)練,分析提煉12 個(gè)輸入項(xiàng)和是否高潛用戶之間的深層邏輯關(guān)系;然后以此邏輯關(guān)系指導(dǎo)下一次迭代過程[11]。
在市場(chǎng)側(cè)根據(jù)O 域和B 域數(shù)據(jù),通過隨機(jī)森林算法建立準(zhǔn)確的4G 到5G 用戶遷移模型,實(shí)現(xiàn)5G用戶數(shù)的提升,與此同時(shí),網(wǎng)絡(luò)也需要同步配合市場(chǎng)側(cè)的需求做好5G 駐留的優(yōu)化提升。5G 駐留比能夠比較客觀地反映5G 網(wǎng)絡(luò)質(zhì)量情況,提升5G 駐留比能夠有效提升用戶感知和運(yùn)營效益。網(wǎng)絡(luò)側(cè)以5G駐留比指標(biāo)為切入點(diǎn),從精準(zhǔn)規(guī)劃補(bǔ)點(diǎn)提升基礎(chǔ)網(wǎng)絡(luò)覆蓋,優(yōu)化4G 和5G 互操作策略兩個(gè)角度出發(fā)。
本文在5G 高價(jià)值建站區(qū)域的選取上,綜合O域和B 域數(shù)據(jù),考慮的關(guān)鍵要素如表2 所示。
表2 研究數(shù)據(jù)字段表
模型訓(xùn)練過程與市場(chǎng)策略相似,將除“5G 高價(jià)值建站標(biāo)識(shí)”字段以外的數(shù)據(jù)作為模型的輸入,“5G 高價(jià)值建站標(biāo)識(shí)”作為模型的輸出,將此導(dǎo)入隨機(jī)森林算法進(jìn)行訓(xùn)練,得出圍繞投資收益和用戶體驗(yàn)的精準(zhǔn)建站模型,從而精確識(shí)別5G 優(yōu)先建設(shè)區(qū)域,達(dá)到提升5G 流量提升分流比的目的。
網(wǎng)絡(luò)因素除了精準(zhǔn)規(guī)劃建站以外,4G 和5G 網(wǎng)絡(luò)互操作策略也影響駐留比,從而影響分流比。隨著5G 的商用部署及技術(shù)演進(jìn),聯(lián)通、電信網(wǎng)絡(luò)出現(xiàn)多制式、多頻點(diǎn)并存的情況,網(wǎng)絡(luò)結(jié)構(gòu)日益復(fù)雜,4G 和5G 網(wǎng)間移動(dòng)性策略及配置不統(tǒng)一、不合理導(dǎo)致用戶駐留5G 困難。此外,4G 和5G 網(wǎng)間互操作邊界多,場(chǎng)景復(fù)雜,現(xiàn)網(wǎng)如果存在配置不合理、電聯(lián)配置不一致的情況,將會(huì)導(dǎo)致用戶無法基于業(yè)務(wù)和5G 覆蓋迅速返回5G 網(wǎng)絡(luò);因此,合理的互操作參數(shù)設(shè)置將影響著用戶駐留網(wǎng)絡(luò),決定了5G 駐留比水平。
針對(duì)移動(dòng)市場(chǎng)飽和,結(jié)合O 域和B 域數(shù)據(jù),從換機(jī)用戶的終端、網(wǎng)絡(luò)行為及網(wǎng)絡(luò)體驗(yàn)3 個(gè)方向建模,并通過隨機(jī)森林算法深度挖掘4G 終端用戶的5G 換機(jī)潛力值,以加速5G 用戶發(fā)展。
從圖5可以看出,通過某城市數(shù)據(jù)分析,換出排名靠前4G 終端型號(hào)是iphone 7p 和iphone 6,2017 年的終端換出率最高,換出終端1000~3000 元價(jià)格分布是最高的。接下來對(duì)換出用戶的網(wǎng)絡(luò)行為及網(wǎng)絡(luò)體驗(yàn)做分析。
圖5 某城市4G 終端換出數(shù)據(jù)
從圖6 可以看出,視頻偏好用戶中換機(jī)用戶的400 KB 啟動(dòng)時(shí)延普遍高于不換機(jī)用戶。如圖7 所示游戲偏好用戶中換機(jī)用戶的下行RTT 時(shí)延波動(dòng)普遍高于不換機(jī)用戶。
圖6 視頻偏好用戶換機(jī)與不換機(jī)對(duì)比
圖7 游戲偏好用戶換機(jī)與不換機(jī)對(duì)比
基于已經(jīng)成功換機(jī)的254 個(gè)用戶數(shù)進(jìn)行模型建立,并將某城市的數(shù)據(jù)導(dǎo)入模型分析模型識(shí)別換機(jī)高潛用戶12.46 萬,其中真實(shí)換機(jī)用戶9.85 萬,準(zhǔn)確率79%[13],如圖8 所示,從2 月17 日到6 月15 日,某城市5G 活躍用戶數(shù)從1.83 萬提升至11.68 萬。
圖8 某城市5G 活躍用戶數(shù)變化
網(wǎng)絡(luò)側(cè)通過隨機(jī)森林算法模型建模,識(shí)別優(yōu)先建設(shè)區(qū)域,多維度特征分析識(shí)別高優(yōu)先級(jí)建設(shè)區(qū)域,綜合考慮價(jià)值終端、熱點(diǎn)業(yè)務(wù)、體驗(yàn)維度和口碑場(chǎng)景,如圖9。
圖9 多維度特征分析識(shí)別區(qū)域
如圖10 所示,根據(jù)模型輸出的高價(jià)值區(qū)域,以某區(qū)域柵格為例,當(dāng)前已規(guī)劃145 宏站,13 個(gè)微站,在現(xiàn)網(wǎng)共站址加站1 個(gè)宏站、38 個(gè)微站,新建站7個(gè)宏站、1 個(gè)微站。如圖11 所示,從2 月17 日到6月15 日區(qū)域內(nèi)5G 駐留比從9.31%提升至38.37%。
圖10 模型輸出規(guī)劃結(jié)果
圖11 駐留比提升效果
綜合市場(chǎng)策略和網(wǎng)絡(luò)策略,從圖12、圖13 中可以看出,從2 月份起整體5G 流量從4.03 TB 提升至54.61 TB,分流比從2%提升至11.35%。
圖12 5G 流量變化
圖13 分流比變化
本文基于B 域和O 域數(shù)據(jù)體量大、數(shù)據(jù)字段多、各字段數(shù)據(jù)非線性分布的特點(diǎn),采用隨機(jī)森林算法建立市場(chǎng)模型和網(wǎng)絡(luò)模型,準(zhǔn)確地將5G 分流比提升的工作精準(zhǔn)定位到用戶級(jí)。同時(shí)輔以網(wǎng)管、基站數(shù)據(jù)等O 域數(shù)據(jù),可以將用戶與網(wǎng)絡(luò)有機(jī)結(jié)合起來,實(shí)現(xiàn)5G 分流比的大幅度提升,極大地減少了4G 負(fù)荷,提升了5G 基站的利用率。