姚世立 鈕遠(yuǎn)
中國(guó)移動(dòng)通信集團(tuán)江蘇有限公司
5G是第五代移動(dòng)通信技術(shù)的簡(jiǎn)稱,作為4G通信技術(shù)的延伸,將在全社會(huì)數(shù)字化轉(zhuǎn)型進(jìn)程中擔(dān)負(fù)著不可替代的重要使命。就目前來(lái)看,5G在技術(shù)、標(biāo)準(zhǔn)等方面都取得了階段性的成果, 5G作為國(guó)家“新基建”的領(lǐng)頭羊,初期以運(yùn)營(yíng)商建設(shè)5G網(wǎng)絡(luò)基礎(chǔ)設(shè)施為主,帶動(dòng)5G上游產(chǎn)業(yè)鏈發(fā)展;隨著5G網(wǎng)絡(luò)基礎(chǔ)設(shè)施的完善,需要促進(jìn)個(gè)人信息消費(fèi)和垂直行業(yè)融合應(yīng)用的快速發(fā)展。據(jù)相關(guān)調(diào)研顯示,近80%的用戶希望在2021年之前用上5G網(wǎng)絡(luò)。國(guó)家有需要,人民有需求,讓更多的用戶升級(jí)5G網(wǎng)絡(luò),更快地使用5G網(wǎng)絡(luò),享受5G發(fā)展帶來(lái)的紅利,是本文研究的重點(diǎn)。
5G由技術(shù)為中心向用戶為中心轉(zhuǎn)變。5G網(wǎng)絡(luò)的主要優(yōu)勢(shì)在于:(1)熱點(diǎn)高容量,數(shù)據(jù)傳輸速率遠(yuǎn)遠(yuǎn)高于以往蜂窩網(wǎng)絡(luò),峰值速率可達(dá)到10Gbps;(2)低時(shí)延高可靠,空中接口時(shí)延水平控制在1ms以內(nèi);(3)低功耗大連接,超大網(wǎng)絡(luò)容量,提供千億設(shè)備的連接能力,滿足物聯(lián)網(wǎng)通信需求。
圖1為5G網(wǎng)絡(luò)交互示意圖,現(xiàn)網(wǎng)5G網(wǎng)絡(luò)采用NSA組網(wǎng)方案,終端與網(wǎng)絡(luò)交互主要分為以下四個(gè)步驟:(1)終端發(fā)起網(wǎng)絡(luò)附著請(qǐng)求,同時(shí)上報(bào)支持DCNR(Dual Connectivity E-UTRAN and NR,雙連接的演進(jìn)UMTS陸地?zé)o線接入網(wǎng)和新無(wú)線)雙連接能力;(2)網(wǎng)絡(luò)根據(jù)用戶簽約信息判斷是否允許該終端接入,如允許則與終端建立LTE承載;(3)LTE根據(jù)空口環(huán)境等觸發(fā)承載遷移,下行端口變更為5GNR;(4)終端通過(guò)LTE/5GNR收發(fā)數(shù)據(jù)。
圖1 5G網(wǎng)絡(luò)交互示意圖
從圖1可以看出,用戶使用5G網(wǎng)絡(luò)需要具備兩個(gè)基本條件:(1)5G網(wǎng)絡(luò)覆蓋;(2)終端具備接入5G網(wǎng)絡(luò)能力。
5G網(wǎng)絡(luò)建設(shè)是一個(gè)長(zhǎng)期過(guò)程,短期內(nèi)無(wú)法做到全覆蓋。為精準(zhǔn)識(shí)別可升級(jí)5G網(wǎng)絡(luò)用戶,需優(yōu)先開(kāi)展5G網(wǎng)絡(luò)覆蓋對(duì)用戶影響的研究工作。
按現(xiàn)有網(wǎng)絡(luò)流量分析,用戶對(duì)網(wǎng)絡(luò)需求主要集中在7: 00 -22: 00,5G網(wǎng)絡(luò)覆蓋影響度研究主要聚焦該時(shí)段。按使用場(chǎng)景將用戶上網(wǎng)時(shí)間切片,細(xì)分為工作日與假期,工作日細(xì)分為通勤、工作、居家。
用Wi表示5G網(wǎng)絡(luò)覆蓋影響度,用Pi表示5G時(shí)長(zhǎng)占比,用Si表示網(wǎng)絡(luò)使用感知系數(shù)。設(shè)5G網(wǎng)絡(luò)全覆蓋情況下,W=10,P≡1,S=10。
(1)5G時(shí)長(zhǎng)占比
通勤:上下班高峰時(shí)段,基站切換數(shù)大于閾值。P1=該時(shí)段5G時(shí)長(zhǎng)/總時(shí)長(zhǎng);
工作:基站覆蓋區(qū)域?qū)傩詾檗k公、商圈、學(xué)校等,基站切換數(shù)小于閾值。P2=該時(shí)段5G時(shí)長(zhǎng)/總時(shí)長(zhǎng);
居家:基站覆蓋區(qū)域?qū)傩詾榫用駞^(qū)、學(xué)校等,基站切換數(shù)小于閾值。P3=該時(shí)段5G時(shí)長(zhǎng)/總時(shí)長(zhǎng);
假期:周末、法定假日等。P4=該時(shí)段5G時(shí)長(zhǎng)/總時(shí)長(zhǎng)。(2)網(wǎng)絡(luò)使用感知權(quán)重
在不同使用場(chǎng)景下,用戶對(duì)5G網(wǎng)速及穩(wěn)定性需求存在差異。設(shè)網(wǎng)速需求總分5分,用戶對(duì)高網(wǎng)速需求越高得分越高;網(wǎng)絡(luò)穩(wěn)定性需求總分5分,用戶對(duì)網(wǎng)絡(luò)穩(wěn)定性要求越高得分越高。兩項(xiàng)得分相加得到該使用場(chǎng)景下網(wǎng)絡(luò)使用感知總得分。按S=10對(duì)總得分做歸一化,得到網(wǎng)絡(luò)使用感知權(quán)重:S1=1.2,S2=1.9,S3=3.1,S4=3.8。如表1所示。
表1 網(wǎng)絡(luò)使用感知權(quán)重
由此,通勤場(chǎng)景5G網(wǎng)絡(luò)覆蓋影響度為:
其他場(chǎng)景5G網(wǎng)絡(luò)覆蓋影響度類推,從而得到5G網(wǎng)絡(luò)覆蓋影響度計(jì)算公式:
在大數(shù)據(jù)的背景下,企業(yè)網(wǎng)絡(luò)平臺(tái)應(yīng)結(jié)合先進(jìn)的電子信息技術(shù),設(shè)立相應(yīng)的信息安全系統(tǒng),并定期對(duì)于安全系統(tǒng)進(jìn)行檢查,發(fā)現(xiàn)安全漏洞時(shí)應(yīng)及時(shí)進(jìn)行維護(hù),使其能夠?qū)ζ髽I(yè)的信息進(jìn)行實(shí)時(shí)保護(hù),還應(yīng)該將大數(shù)據(jù)信息庫(kù)進(jìn)行更新,保證數(shù)據(jù)庫(kù)中的信息安全,而政府應(yīng)該對(duì)于網(wǎng)絡(luò)信息安全設(shè)置相應(yīng)的法律規(guī)定,使信息泄露后能夠有法律保障,維護(hù)企業(yè)以及使用者的利益,從而保證網(wǎng)絡(luò)數(shù)據(jù)的安全,營(yíng)造綠色的網(wǎng)絡(luò)使用環(huán)境,促進(jìn)大數(shù)據(jù)時(shí)代進(jìn)行下一步的發(fā)展。
由上式可見(jiàn),W越高表示用戶主要活動(dòng)范圍內(nèi),5G網(wǎng)絡(luò)覆蓋及使用體驗(yàn)越好。因明細(xì)較多,這里不全部枚舉,挑選典型用戶展示如下。基于當(dāng)前5G網(wǎng)絡(luò)處于高速建設(shè)時(shí)期,以W=7為評(píng)判閾值,當(dāng)W≥7分時(shí),判定5G網(wǎng)絡(luò)覆蓋可滿足用戶日常使用需求。隨著5G網(wǎng)絡(luò)的建設(shè)發(fā)展,該評(píng)判閾值將隨之提高。如表2所示。
表2 5G網(wǎng)絡(luò)覆蓋影響度
用戶在5G網(wǎng)絡(luò)覆蓋范圍內(nèi),通過(guò)5G智能終端連接5G網(wǎng)絡(luò)。截至2020年2月底,國(guó)內(nèi)5G智能終端市場(chǎng)已初具規(guī)模,終端品牌超過(guò)40款。本節(jié)通過(guò)大數(shù)據(jù)技術(shù),對(duì)已升級(jí)5G智能終端用戶進(jìn)行分析,通過(guò)機(jī)器學(xué)習(xí)構(gòu)建升級(jí)5G智能終端用戶模型,精準(zhǔn)識(shí)別可升級(jí)5G智能終端用戶,以開(kāi)展智慧營(yíng)銷工作。
本研究屬于大數(shù)據(jù)預(yù)測(cè)分析中分類預(yù)測(cè)模型,分析目的為預(yù)測(cè)未進(jìn)行5G智能終端升級(jí)用戶在后續(xù)升級(jí)5G智能終端的概率。本研究可使用邏輯回歸、神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林建模。使用小規(guī)模數(shù)據(jù)模擬建模后,神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)精度優(yōu)于另兩種模型方案。
神經(jīng)網(wǎng)絡(luò)是一個(gè)非線性的數(shù)據(jù)建模工具集合。神經(jīng)元之間的連接賦予相關(guān)權(quán)重,訓(xùn)練算法在迭代過(guò)程中不斷調(diào)整這些權(quán)重,從而使預(yù)測(cè)誤差最小化并給出預(yù)測(cè)精度。多層感知器神經(jīng)網(wǎng)絡(luò)(MLP)包含多個(gè)隱藏層,可以發(fā)現(xiàn)更復(fù)雜的關(guān)系。本研究選用MLP為最終建模方案。
篩選已升級(jí)5G智能終端用戶(以下簡(jiǎn)稱5G用戶),為確保模型數(shù)據(jù)平衡防止過(guò)擬合,隨機(jī)提取等量級(jí)的非5G智能終端用戶(以下簡(jiǎn)稱非5G用戶)。按用戶特征信息提取樣本數(shù)據(jù),特征信息分類及細(xì)化見(jiàn)表3。
表3 用戶特征信息
為確保分析數(shù)據(jù)質(zhì)量,首先對(duì)樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。
(1)數(shù)據(jù)過(guò)濾:將樣本數(shù)據(jù)中與目標(biāo)變量無(wú)關(guān)的特征信息進(jìn)行剔除,保留用戶標(biāo)識(shí)(user_id)、年齡(age)、性別(sex)、月消費(fèi)(ARPU)、流量(DOU)、終端使用時(shí)長(zhǎng)(T_mon)、地市(area)7個(gè)特征信息,其中user_id僅作為記錄標(biāo)識(shí),不作為模型輸入。設(shè)定輸出觀測(cè)值result,當(dāng)用戶為5G用戶時(shí),result=1,否則result=0。
(3)數(shù)據(jù)分區(qū):在有監(jiān)督的機(jī)器學(xué)習(xí)中,數(shù)據(jù)集一般被分成培訓(xùn)集、測(cè)試集和驗(yàn)證集。培訓(xùn)集主要用來(lái)培訓(xùn)模型;測(cè)試集主要是測(cè)試已培訓(xùn)模型的分辨能力(識(shí)別率等)、推廣能力;驗(yàn)證集主要用于調(diào)整模型的超參數(shù),在神經(jīng)網(wǎng)絡(luò)中可以通過(guò)驗(yàn)證集選擇隱藏層神經(jīng)元的數(shù)量。分區(qū)數(shù)據(jù)均從樣本數(shù)據(jù)中隨機(jī)抽取,本研究按培訓(xùn)集50%、測(cè)試集40%、驗(yàn)證集10%分區(qū)。如圖2所示。
圖2 5G智能終端升級(jí)模型
MLP一般由一個(gè)輸入層,一個(gè)輸出層和若干個(gè)隱藏神經(jīng)元層組成。每一層由一個(gè)或多個(gè)神經(jīng)元互相連結(jié)。一個(gè)神經(jīng)元的輸出便是另一個(gè)神經(jīng)元的輸入。
本研究中輸入層:age、sex、ARPU、DOU、T_mon、area。
隱藏神經(jīng)元層:隱藏神經(jīng)元層與輸入層全連接。用xi表示輸入變量,用 ωi表示各輸入變量的加權(quán)系數(shù)(權(quán)值),用P表示加權(quán)求和,用y表示輸出。
隱藏神經(jīng)元層包括兩部分:(1)對(duì)輸入變量的加權(quán)求和;(2)對(duì)求和結(jié)果進(jìn)行“激活”得到輸出。定義輸入恒為1的權(quán)值為ω0,即權(quán)值也包含偏移量,則加權(quán)求和的公式為:
其中:
激活公式為:
MLP的目標(biāo)是使誤差最小。MLP的誤差可用平方誤差函數(shù)E表示。設(shè)樣本x有n個(gè)屬性,目標(biāo)值t有J種可能,則該MLP的輸入層(第一層)一共有n個(gè)神經(jīng)元,輸出層(第L層,設(shè)MLP一共有L層)一共有J個(gè)神經(jīng)元。樣本x經(jīng)過(guò)向前通路得到最終輸出,其中下標(biāo)表示y所在層的神經(jīng)元索引,上標(biāo)表示y所在的層。則該樣本的平方誤差為:
上式中的平方誤差函數(shù)除以2,是為了便于后面的求導(dǎo)運(yùn)算,因?yàn)樗挥绊懻`差的變化趨勢(shì)。yjL由上一層(即L-1層)所有神經(jīng)元的輸出經(jīng)加權(quán)激活后得到,而第L-1層神經(jīng)元又由第L-2層的所有神經(jīng)元輸出經(jīng)加權(quán)激活后得到,因此可以說(shuō)誤差E是全體權(quán)值ω的函數(shù),通過(guò)改變權(quán)值ω,就可以達(dá)到使誤差E最小的目的。
通過(guò)上述方法得到圖3中的神經(jīng)網(wǎng)絡(luò)模型。
圖3 神經(jīng)網(wǎng)絡(luò)模型
本模型輸出預(yù)測(cè)結(jié)果為1或0,模型輸出預(yù)測(cè)$N-result與觀測(cè)result相同時(shí)模型輸出準(zhǔn)確,各分區(qū)準(zhǔn)確率為:培訓(xùn)集準(zhǔn)確率75.88%,測(cè)試集準(zhǔn)確率75.69%,驗(yàn)證集準(zhǔn)確率75.81%,因模型輸出明細(xì)數(shù)據(jù)過(guò)多,這里不全部枚舉,部分模型輸出數(shù)據(jù)如圖4所示。
圖4 神經(jīng)網(wǎng)絡(luò)模型輸出
對(duì)模型輸出準(zhǔn)確率進(jìn)一步研究,對(duì)比觀測(cè)值與預(yù)測(cè)值發(fā)現(xiàn),觀測(cè)值result=1預(yù)測(cè)準(zhǔn)確率90.1%。本模型輸入樣本中5G用戶觀測(cè)值result=1確定且唯一;隨機(jī)抽取非5G用戶觀測(cè)值不確定,因模型需要定義result=0。本模型構(gòu)建初衷為預(yù)測(cè)result=0用戶轉(zhuǎn)變?yōu)閞esult=1用戶概率,因此本模型構(gòu)建符合預(yù)期。如圖5所示。
圖5 神經(jīng)網(wǎng)絡(luò)模型result分類
結(jié)合5G網(wǎng)絡(luò)覆蓋度影響度和升級(jí)5G智能終端模型,抽取當(dāng)月非5G用戶50萬(wàn)戶,經(jīng)模型演算后預(yù)測(cè)可升級(jí)為5G用戶共35萬(wàn)戶。如圖6所示。
圖6 預(yù)測(cè)模型輸出
鑒于疫情期間,盡量減少用戶到營(yíng)業(yè)廳接觸,預(yù)測(cè)輸出數(shù)據(jù)主要應(yīng)用在江蘇移動(dòng)掌上營(yíng)業(yè)廳,應(yīng)用周期為3周,應(yīng)用位置包括首頁(yè)Banner及5G新品專區(qū)。模型應(yīng)用后,用戶升級(jí)5G網(wǎng)絡(luò)成功率較模型應(yīng)用前有較大提升。隨著疫情解除,該模型將擴(kuò)展運(yùn)用于線下實(shí)體廳店,有助于進(jìn)一步提升成功率。如圖7所示。
圖7 掌上營(yíng)業(yè)廳應(yīng)用展示
在5G網(wǎng)絡(luò)大發(fā)展時(shí)期,為讓更多的用戶進(jìn)行網(wǎng)絡(luò)升級(jí),更快地使用到5G網(wǎng)絡(luò)。本文對(duì)已升級(jí)5G網(wǎng)絡(luò)用戶開(kāi)展分析,基于網(wǎng)絡(luò)覆蓋對(duì)用戶使用影響的先決條件,通過(guò)大數(shù)據(jù)機(jī)器學(xué)習(xí)分類算法構(gòu)建升級(jí)5G網(wǎng)絡(luò)模型。本模型在江蘇移動(dòng)掌上營(yíng)業(yè)廳APP開(kāi)展應(yīng)用,模型應(yīng)用較未應(yīng)用前,用戶升級(jí)5G網(wǎng)絡(luò)成功率有較大提升,后續(xù)該模型將擴(kuò)展應(yīng)用至線下實(shí)體廳店。因模型基于過(guò)去的數(shù)據(jù)進(jìn)行預(yù)測(cè),目前已知進(jìn)行5G網(wǎng)絡(luò)升級(jí)用戶量偏小,模型輸入量級(jí)在十萬(wàn)級(jí),模型輸出存在一定的誤差。隨著后續(xù)升級(jí)用戶群的擴(kuò)大,將進(jìn)一步對(duì)模型進(jìn)行優(yōu)化。