李宏輝,劉林華,李海彬/Li Honghui,Liu Linhua,Li Haibin
(1.中國聯(lián)合網(wǎng)絡(luò)通信有限公司內(nèi)蒙古自治區(qū)分公司 內(nèi)蒙古010010;2.中國聯(lián)合網(wǎng)絡(luò)通信有限公司網(wǎng)絡(luò)技術(shù)研究院 北京100048;3.中國聯(lián)合網(wǎng)絡(luò)通信有限公司網(wǎng)建部 北京100048)
隨著數(shù)據(jù)流量的增加、內(nèi)容的增多、應(yīng)用的豐富,移動互聯(lián)網(wǎng)用戶正呈現(xiàn)出爆發(fā)式增長的趨勢并逐漸步入大數(shù)據(jù)時代。運營商擁有海量的用戶通信數(shù)據(jù),通過對OSS 側(cè)和BSS 側(cè)數(shù)據(jù)的挖掘,從用戶、業(yè)務(wù)、終端等不同角度對網(wǎng)絡(luò)運行數(shù)據(jù)進(jìn)行多緯度分析,支撐網(wǎng)絡(luò)的規(guī)劃和建設(shè)。
基于KPI 指標(biāo)的網(wǎng)絡(luò)問題分析及規(guī)劃方法主要聚焦“網(wǎng)絡(luò)本身”,對端到端的用戶體驗關(guān)注不夠。移動互聯(lián)網(wǎng)大數(shù)據(jù)時代更應(yīng)聚焦“用戶體驗”,聚焦“人”的分布和活動。本文將以某省為例,通過對移動用戶上網(wǎng)流量詳細(xì)記錄(flow detail record,F(xiàn)DR)數(shù)據(jù)的挖掘分析,探索使用基于用戶分布和用戶感知的規(guī)劃方法,實現(xiàn)網(wǎng)絡(luò)能力與市場需求的精準(zhǔn)匹配。
(1)移動用戶上網(wǎng)流量詳細(xì)記錄數(shù)據(jù)
提取一周本地和外省漫入2G、3G的FDR。提取的FDR 數(shù)據(jù)字段見表1 所列。
(2)用戶簽約信息數(shù)據(jù)
提取最近用戶簽約及賬單信息,信息字段見表2所列。
(3)MR 數(shù)據(jù)
提取近一周的7×24 h小區(qū)級(含室分)的所有載波全業(yè)務(wù)周期性MR 數(shù)據(jù),7×24 h 內(nèi)MR 數(shù)據(jù)采集數(shù)量小于1 200 次的小區(qū)不納入統(tǒng)計分析。MR 數(shù)據(jù)需要包括統(tǒng)計時間、小區(qū)ID、小區(qū)經(jīng)緯度、RSCP 分布區(qū)間等信息。
表1 FDR 數(shù)據(jù)字段
表2 提取的用戶簽約及賬單數(shù)據(jù)字段
(4)用戶投訴數(shù)據(jù)
提取近半年經(jīng)優(yōu)化部門分析后的用戶有效投訴數(shù)據(jù),包括投訴點經(jīng)緯度、投訴原因、投訴次數(shù)。
3.1.1 高ARPU 值用戶分布
通過統(tǒng)計分析,某省近幾個月的3G用戶平均ARPU 值在100 元左右,因此將某省高ARPU用戶定義為月消費200 元以上的用戶。將用戶簽約及賬單信息表中的“IMSI 號碼”字段與本地網(wǎng)FDR 數(shù)據(jù)信息表中的“IMSI”字段關(guān)聯(lián),篩選出“6月出賬金額≥200 元”的用戶,并對相同小區(qū)下的用戶做去重處理,分析出一周忙時平均小區(qū)下的高ARPU用戶分布情況。高ARPU用戶分布區(qū)域如圖1所示,用戶分布統(tǒng)計見表3所列。
圖1 高ARPU 值用戶分布
表3 高ARPU用戶分布統(tǒng)計
覆蓋規(guī)劃策略: 建議在LTE 建網(wǎng)初期,優(yōu)先對≥30 個高ARPU用戶分布的小區(qū)進(jìn)行規(guī)劃建設(shè);密切關(guān)注≥10 個高ARPU用戶分布小區(qū)的3G MR弱覆蓋問題。
3.1.2 高流量用戶分布
高數(shù)據(jù)流量用戶是指數(shù)據(jù)流量使用排名在前30%的用戶。通過對本地網(wǎng)FDR 數(shù)據(jù)的一周忙時平均數(shù)據(jù)流量統(tǒng)計分析,篩選出數(shù)據(jù)業(yè)務(wù)流量在前30%的用戶及地理分布(LAC+CI),再對小區(qū)下的用戶進(jìn)行去重處理,分析出一周忙時平均小區(qū)下的高流量用戶分布情況。高流量用戶分布統(tǒng)計見表4 所列,用戶分布區(qū)域如圖2所示。
表4 高流量用戶分布統(tǒng)計
圖2 高流量用戶小區(qū)分布
覆蓋規(guī)劃策略: 建議在LTE 建網(wǎng)初期,優(yōu)先對≥20個高數(shù)量流量用戶的小區(qū)進(jìn)行規(guī)劃建設(shè);優(yōu)先解決≥20 個高流量用戶分布小區(qū)的3G MR 弱覆蓋問題。
3.1.3 高價值用戶分布
高價值用戶定義為:用戶簽約信息為鉆、金、銀等級的VIP用戶。
高價值用戶小區(qū)定義為:鉆、金、銀等級的VIP用戶分布的數(shù)量≥30 個用戶的小區(qū)。
將用戶簽約及賬單信息表中的“IMSI 號碼”字段與本地網(wǎng)FDR 數(shù)據(jù)信息表中的“IMSI”字段關(guān)聯(lián),篩選出“用戶等級=鉆、金、銀”的用戶,并對相同小區(qū)下的用戶做去重處理,分析出一周忙時平均小區(qū)下的高價值用戶分布情況。高價值用戶分布統(tǒng)計見表5 所列,用戶分布區(qū)域如圖3所示。
表5 高價值用戶小區(qū)統(tǒng)計
通過對高價值用戶小區(qū)的MR 弱覆蓋統(tǒng)計分析,市區(qū)、縣城、鄉(xiāng)鎮(zhèn)、行政村場景中的重要用戶小區(qū)弱覆蓋分別占了各自場景弱覆蓋小區(qū)29%、18%、3%、6%的比重。
覆蓋規(guī)劃策略:建議在LTE 建網(wǎng)初期,優(yōu)先對高價值用戶小區(qū)進(jìn)行規(guī)劃建設(shè);優(yōu)先解決高價值用戶小區(qū)的3G MR 弱覆蓋問題。
3.1.4 外省漫入用戶分布
通過分析一周平均忙時外省漫入2G、3G的FDR數(shù)據(jù),并對相同小區(qū)下的用戶做去重處理,得出外省漫入用戶的分布統(tǒng)計結(jié)果。外省漫入的用戶分布統(tǒng)計見表6 所列,用戶分布區(qū)域如圖4所示。
表6 外省漫入用戶場景分布統(tǒng)計
通過對漫入用戶分布和3G網(wǎng)絡(luò)覆蓋進(jìn)行對比分析,無3G 覆蓋而承載在2G網(wǎng)絡(luò)下的3G 漫游用戶所占各場景的比重如圖5所示。
覆蓋規(guī)劃策略:在旅游季節(jié),該省的2G、3G網(wǎng)絡(luò)承載了大量外省漫游用戶,漫入的3G用戶占該省3G數(shù)據(jù)業(yè)務(wù)使用用戶總數(shù)的14%,對全國3G網(wǎng)絡(luò)的品牌形象有較大影響;外省漫入用戶主要分布在市區(qū)和行政村,其次是道路,在行政村有71%的外省漫入3G用戶無3G網(wǎng)絡(luò)覆蓋。
建議如下:
①對行政村漫游用戶聚集的區(qū)域(2G小區(qū)下的3G用戶≥20)進(jìn)行3G網(wǎng)絡(luò)規(guī)劃,優(yōu)先考慮U900 建設(shè)方案。
②對通往重要景區(qū)(漫游用戶聚集度較高的區(qū)域)的交通路線進(jìn)行3G網(wǎng)絡(luò)全覆蓋規(guī)劃,優(yōu)先考慮U900 建設(shè)方案。
圖3 高價值用戶分布
圖4 外省漫入用戶分布
圖5 無3G網(wǎng)絡(luò)覆蓋的外省漫入3G用戶比重
③在LTE 建網(wǎng)初期對重要景區(qū)(3G小區(qū)下的漫游用戶數(shù)≥60)進(jìn)行規(guī)劃建設(shè)。
3.1.5 投訴用戶分布
用戶投訴能直接反映用戶的感知和用戶需求。通過對用戶投訴的區(qū)域位置、業(yè)務(wù)類型、主要問題以及投訴的用戶等級進(jìn)行分析,制定相應(yīng)的網(wǎng)絡(luò)覆蓋規(guī)劃和容量規(guī)劃策略,不僅能提升用戶感知,而且能根據(jù)用戶需求和用戶等級匹配相應(yīng)的網(wǎng)絡(luò)能力。
通過對該省用戶投訴數(shù)據(jù)中 “投訴的用戶號碼”和用戶簽約信息數(shù)據(jù)中的“手機(jī)號碼”關(guān)聯(lián),匹配用戶等級,并以此分析不同等級投訴用戶的分布。
由于覆蓋原因所引起的不同等級投訴用戶分布如圖6所示。
圖6 不同等級投訴用戶分布
該省VIP用戶的投訴占51%比重,其中,鉆石用戶投訴占2%、金牌用戶投訴占44%、銀牌用戶投訴占5%。通過MR 數(shù)據(jù)與投訴用戶分布的對比分析,投訴區(qū)域主要集中在市區(qū),主要原因為深度覆蓋不足,其中居民住宅小區(qū)內(nèi)的投訴占大部分比重。
覆蓋規(guī)劃策略:城區(qū)深度覆蓋不足是引起用戶投訴的主要原因,尤其是居民住宅小區(qū)內(nèi)VIP用戶對深度覆蓋的訴求。從建設(shè)成本以及覆蓋有效性角度考慮,建議對住宅區(qū)、城中村、校園、商業(yè)區(qū)等多排多棟建筑群場景采用室內(nèi)室外綜合的方式進(jìn)行規(guī)劃,優(yōu)先解決VIP用戶聚集度較高的住宅小區(qū)深度覆蓋問題。
3.1.6 終端分布
通過分析本地網(wǎng)一周忙時平均FDR 數(shù)據(jù),對相同小區(qū)下的用戶做去重處理,對應(yīng)該用戶的IMEI 號和地理位置(LAC+CI),可以得出不同能力的終端分布情況,見表7 所列。
表7 全省分場景的不同能力終端滲透率統(tǒng)計
該省U900 終端滲透率達(dá)到78%,DC 達(dá)到24%,LTE 為12%。從全省整體情況來看,DC 和LTE終端的滲透率不高,在一定程度上會影響用戶對感知速率的體驗;農(nóng)村3G用戶U900 終端滲透率超過70%,所以在終端支持度方面,具備U900網(wǎng)絡(luò)建設(shè)推廣條件。
在3G、4G 數(shù)據(jù)時代,用戶感知提升到了前所未有的高度,全球主流運營商普遍認(rèn)識到用戶感知是當(dāng)前網(wǎng)絡(luò)規(guī)劃和建設(shè)的核心問題,用戶體驗的滿意度將極大地影響終端用戶對網(wǎng)絡(luò)的忠誠度。
用戶的業(yè)務(wù)使用體驗與使用中的感知速率直接相關(guān)?;谟脩舾兄囊?guī)劃方法將增加保障用戶良好業(yè)務(wù)使用的感知速率指標(biāo),并建立小區(qū)級的業(yè)務(wù)類型、目標(biāo)速率、可承載用戶數(shù)之間的用戶感知模型關(guān)系,根據(jù)確立的小區(qū)級用戶感知模型來進(jìn)行網(wǎng)絡(luò)覆蓋規(guī)劃和容量規(guī)劃。
3.2.1 相關(guān)的計算方法
用戶感知模型的建立及分析以FDR 為數(shù)據(jù)源,下面將對各種涉及的指標(biāo)及計算方法、規(guī)則進(jìn)行說明。
①小區(qū)用戶單業(yè)務(wù)平均速率:小區(qū)在某統(tǒng)計時間段內(nèi),使用某種業(yè)務(wù)的平均用戶下行速率。
小區(qū)用戶單業(yè)務(wù)平均速率=average(統(tǒng)計時段內(nèi)各時間切點時的小區(qū)用戶單業(yè)務(wù)平均速率),每10 min 取1 次切點。
時間切點時的小區(qū)用戶單業(yè)務(wù)平均速率=average(n1用戶在該時間切點時某業(yè)務(wù)速率,n2用戶在該時間切點時某業(yè)務(wù)速率,……)。
②小區(qū)用戶綜合平均速率:小區(qū)在某統(tǒng)計時間段內(nèi),包含各種業(yè)務(wù)的平均每用戶下行速率。
小區(qū)用戶綜合業(yè)務(wù)平均速率= average(統(tǒng)計時段內(nèi)各時間切點時的小區(qū)用戶綜合平均速率),每10 min 取1 次切點。
時間切點時的小區(qū)用戶綜合平均速率=average(n1用戶在該時間切點時各業(yè)務(wù)速率之和,n2用戶在該時間切點時各業(yè)務(wù)速率之和,……)。
③用戶單業(yè)務(wù)保障速率:為保證用戶良好體驗,需提供給用戶的各種業(yè)務(wù)速率。
④用戶平均業(yè)務(wù)并發(fā)數(shù):小區(qū)在某統(tǒng)計時間段內(nèi),用戶平均并發(fā)使用不同業(yè)務(wù)的數(shù)量。
用戶平均業(yè)務(wù)并發(fā)數(shù)=average(統(tǒng)計時段內(nèi)各時間切點時的用戶平均業(yè)務(wù)并發(fā)數(shù)),每10 min 取1 次切點。
時間切點時的用戶平均業(yè)務(wù)并發(fā)數(shù)= average(n1用戶在該時間切點時使用不同業(yè)務(wù)數(shù)量,n2用戶在該時間切點時使用不同業(yè)務(wù)數(shù)量,……)。
⑤平均并發(fā)用戶數(shù):小區(qū)在某統(tǒng)計時間段內(nèi),并發(fā)使用業(yè)務(wù)的平均用戶數(shù)量。
小區(qū)平均并發(fā)用戶數(shù)= average(統(tǒng)計時段內(nèi)各時間切點時的平均并發(fā)用戶數(shù)),每10 min 取1 次切點。
⑥小區(qū)用戶目標(biāo)綜合平均速率:Σ(單業(yè)務(wù)保障速率×目標(biāo)業(yè)務(wù)時長占比)×用戶平均業(yè)務(wù)并發(fā)數(shù)。
3.2.2 用戶感知模型建立方法
用戶感知模型以小區(qū)級為顆粒度進(jìn)行建模,大體分為3 個步驟,如圖7所示。
圖7 用戶感知模型建模步驟
(1)識別業(yè)務(wù)類型
通過對FDR 數(shù)據(jù)分析,某省3G 數(shù)據(jù)業(yè)務(wù)主要類型有網(wǎng)頁瀏覽、流媒體、即時通信、文件下載、E-mail、P2P 業(yè)務(wù)。
(2)分析業(yè)務(wù)特征
通過對FDR 數(shù)據(jù)分析,某省3G 各類型數(shù)據(jù)業(yè)務(wù)時長及流量占比情況見表8 所列。
目前最主要的業(yè)務(wù)為網(wǎng)頁瀏覽,占業(yè)務(wù)總時長的66%和總流量的43%;即時通信占業(yè)務(wù)總時長的17%,但流量只占了3%的比例;流媒體也是重要業(yè)務(wù),其時長雖只占業(yè)務(wù)總時長的8%,但貢獻(xiàn)了42%的流量;文件下載時長占比5%,產(chǎn)生了11%的流量占比。
從業(yè)務(wù)時長和業(yè)務(wù)流量方面綜合考慮,該省Top4的業(yè)務(wù)為網(wǎng)頁瀏覽、即時通信、流媒體和文件下載業(yè)務(wù)。
(3)匹配小區(qū)的用戶目標(biāo)速率和承載用戶能力
用戶單業(yè)務(wù)保障速率的設(shè)定采用滾動和相對方式。統(tǒng)計分析現(xiàn)網(wǎng)目前主要業(yè)務(wù)的平均速率,并根據(jù)現(xiàn)網(wǎng)業(yè)務(wù)實際平均速率設(shè)定主要業(yè)務(wù)的保障速率。某省主要業(yè)務(wù)(Top4)保障速率設(shè)定見表9 所列。
匹配小區(qū)的用戶目標(biāo)速率和承載用戶能力,建立小區(qū)級的用戶感知模型,某省感知模型示例見表10 所列。
小區(qū)用戶目標(biāo)綜合平均速率=Σ(單業(yè)務(wù)保障速率×目標(biāo)業(yè)務(wù)時長占比)×用戶平均業(yè)務(wù)并發(fā)數(shù)。
小區(qū)可承載用戶數(shù)=小區(qū)用戶綜合平均速率≥小區(qū)用戶目標(biāo)綜合平均速率情況下,小區(qū)可承載的平均并發(fā)用戶數(shù)。
3.2.3 基于用戶感知模型的網(wǎng)絡(luò)覆蓋和容量規(guī)劃
(1)覆蓋規(guī)劃
基于用戶感知模型的覆蓋規(guī)劃流程如圖8所示。
通過分析一周忙時FDR 數(shù)據(jù),某省速率不達(dá)標(biāo)小區(qū)統(tǒng)計情況見表11 所列,其中的弱覆蓋問題小區(qū)與該省MR 數(shù)據(jù)對比分析,結(jié)果基本一致。
(2)容量規(guī)劃
可利用用戶感知模型進(jìn)行小區(qū)級的容量規(guī)劃或者進(jìn)行資源配置,其思路如下:WCDMA 載頻配置=小區(qū)吞吐率需求/小區(qū)實際能提供的吞吐率能力,其中:小區(qū)吞吐率需求=預(yù)測的小區(qū)目標(biāo)用戶數(shù)(小區(qū)并發(fā)用戶數(shù))×小區(qū)用戶目標(biāo)綜合平均速率; 或者WCDMA載頻配置=預(yù)測小區(qū)用戶數(shù)/小區(qū)模型所能承載的用戶數(shù)。當(dāng)WCDMA 載頻配置>3 時,可考慮LTE 建設(shè)。
容量規(guī)劃配置見表12 所列。
表8 全省3G 各類型數(shù)據(jù)業(yè)務(wù)時長及流量占比
表9 某省主要業(yè)務(wù)保障速率
表10 小區(qū)級用戶感知模型
表11 某省速率不達(dá)標(biāo)小區(qū)統(tǒng)計
圖8 基于用戶感知模型的覆蓋規(guī)劃流程
表12 容量規(guī)劃配置
在移動互聯(lián)網(wǎng)時代,用戶將更為關(guān)注對業(yè)務(wù)的使用體驗,這將給運營商無線網(wǎng)絡(luò)規(guī)劃方法及建設(shè)方式帶來新的挑戰(zhàn)。傳統(tǒng)的僅基于KPI 指標(biāo)的規(guī)劃方法不能滿足移動互聯(lián)網(wǎng)大數(shù)據(jù)時代以“KPI指標(biāo)”為基石、以“人”為核心、以“用戶感知”為導(dǎo)向的網(wǎng)絡(luò)資源配置需求。本文基于FDR 大數(shù)據(jù),從高ARPU用戶、高流量用戶、高價值用戶以及漫游用戶和終端幾方面對用戶的分布進(jìn)行了分析,并給出了相應(yīng)無線網(wǎng)絡(luò)規(guī)劃策略建議。此外,本文還通過對FDR 大數(shù)據(jù)分析,探討了小區(qū)級的用戶感知模型建立方法和基于感知模型的網(wǎng)絡(luò)覆蓋規(guī)劃和容量規(guī)劃方法。
1 Holma H,Toskala A.UMTS中的WCDMA:HSPA 演進(jìn)及LTE(第5 版).楊大成譯.北京:機(jī)械工業(yè)出版社,2008
2 王曉龍.WCDMA網(wǎng)絡(luò)專題優(yōu)化.北京:人民郵電出版社,2011
3 Pbilipp K Janert .數(shù)據(jù)之魅:基于開源工具的數(shù)據(jù)分析.黃權(quán),陸昌輝,鄒雪梅等譯.北京:清華大學(xué)出版社,2012
4 謝希仁.計算機(jī)網(wǎng)絡(luò)(第5 版).北京:電子工業(yè)出版社,2008