趙雁航,劉昌興,周 陽,馮 博,魏 迪
(中國(guó)移動(dòng)通信集團(tuán)吉林有限公司網(wǎng)絡(luò)優(yōu)化中心 吉林 長(zhǎng)春 130000)
在本次研究中,我們選取了影響用戶感知最為重要的視頻、語音、網(wǎng)絡(luò)三個(gè)維度來搭建用戶的感知評(píng)價(jià)體系,首先選取WGCNA(加權(quán)基因共表達(dá)網(wǎng)絡(luò)法)算法,從海量的用戶感知類指標(biāo)中選取能夠全面而又客觀的反映用戶感知情況的9項(xiàng)重點(diǎn)指標(biāo)(每個(gè)維度選取連接度最高的前3項(xiàng)),并利用熵權(quán)法分別賦予該9項(xiàng)指標(biāo)不同的權(quán)重,然后通過PCA(主成分分析)算法將每個(gè)維度的3項(xiàng)指標(biāo)降至一維,同理利用熵權(quán)法給每個(gè)維度賦予不同的權(quán)值,最終將維度權(quán)值和子項(xiàng)權(quán)值的乘積作為每項(xiàng)指標(biāo)的末端權(quán)值,然后通過k-means聚類算法來確定每一類指標(biāo)的感知得分的閾值,最終用單項(xiàng)得分乘以對(duì)應(yīng)權(quán)值得到單用戶的感知得分,通過用戶的感知得分確定出質(zhì)差用戶并進(jìn)行精準(zhǔn)營(yíng)銷,并通過關(guān)聯(lián)質(zhì)差用戶和網(wǎng)元定位出感知差問題小區(qū),從而進(jìn)行相對(duì)應(yīng)的網(wǎng)絡(luò)優(yōu)化措施,從而提升用戶感知[1]。
搭建用戶感知評(píng)價(jià)體系,第一步就是指標(biāo)的選取,所以當(dāng)面對(duì)海量的用戶感知類指標(biāo)時(shí),哪些指標(biāo)能夠客觀而又全面的代表用戶的真實(shí)感知情況是面臨的第一個(gè)問題,本文選取了WGCNA算法進(jìn)行指標(biāo)的選取,這是一種生物信息學(xué)的算法,其目的是探索基因網(wǎng)絡(luò)中的核心基因以及各基因之間的關(guān)系,以此來挑選核心基因,算法基于數(shù)據(jù)客觀計(jì)算得到指標(biāo)重要性(連接度表征重要性)從而進(jìn)行指標(biāo)選擇,指標(biāo)的重要性體現(xiàn)為該指標(biāo)的變化對(duì)網(wǎng)絡(luò)整體的影響,等于該指標(biāo)與網(wǎng)絡(luò)中其它每個(gè)指標(biāo)的全面相似性的總和。因此可以將基因模塊類比為用戶的感知指標(biāo)項(xiàng),將基因網(wǎng)絡(luò)類比為用戶感知指標(biāo)集合,于是挑選影響用戶感知核心指標(biāo)的過程,就可以類比為利用WGCNA算法尋找核心基因的過程,本文最終通過WGCNA算法為視頻、語音、網(wǎng)頁三個(gè)維度分別選取連接度最高的3項(xiàng)指標(biāo)。
選取完關(guān)鍵指標(biāo)之后,每個(gè)指標(biāo)的重要程度是不同的,哪些指標(biāo)影響程度大?哪些指標(biāo)影響程度小呢?在這里我們引入了信息論里面熵的概念,信息是系統(tǒng)有序程度的度量,而熵是系統(tǒng)無序程度的度量,那么對(duì)于某項(xiàng)指標(biāo)來說,就可以用其熵值來判斷其離散程度,指標(biāo)離散程度越大,該指標(biāo)對(duì)綜合評(píng)價(jià)體系的影響就越大,那么權(quán)重就越大。首先,通過PCA算法將每個(gè)維度的3項(xiàng)指標(biāo)降維至一維,通過熵權(quán)法確定出每個(gè)維度的維度權(quán)值,同理利用熵權(quán)法為同一個(gè)維度內(nèi)的不同指標(biāo)賦予不同的子項(xiàng)權(quán)值,最終每項(xiàng)指標(biāo)的末端權(quán)值即為維度權(quán)值和子項(xiàng)權(quán)值的乘積,本文選取了全省2萬用戶的話單數(shù)據(jù)作為樣本數(shù)據(jù),通過熵權(quán)法計(jì)算,最終得到各項(xiàng)指標(biāo)的權(quán)值詳情見表1。
表1 各項(xiàng)指標(biāo)的權(quán)值
利用K-Means聚類算法,設(shè)置4個(gè)聚類中心,將每個(gè)聚類中心作為一個(gè)數(shù)據(jù)切分點(diǎn),因此每個(gè)指標(biāo)均可劃分為5個(gè)得分區(qū)間,對(duì)應(yīng)的將用戶每個(gè)維度的指標(biāo)均劃分成5個(gè)級(jí)別,根據(jù)指標(biāo)的好壞,賦予基礎(chǔ)分1、2、3、4、5分,對(duì)于同一個(gè)得分區(qū)間內(nèi)的用戶,為了區(qū)分其感知的不同,再利用線性插值算法,讓離散的得分能連續(xù)化。
根據(jù)前文利用k-means聚類算法確定的每項(xiàng)指標(biāo)的子項(xiàng)得分,與對(duì)應(yīng)的指標(biāo)末端權(quán)值進(jìn)行乘積運(yùn)算,最終將9項(xiàng)指標(biāo)的得分進(jìn)行求和,從而得到單用戶的感知得分。本文通過對(duì)全省1800萬用戶進(jìn)行感知打分,根據(jù)用戶得分的分布情況,定義1周內(nèi)任意5d感知得分均小于2.5分的用戶為質(zhì)差用戶,從而得出全省26萬質(zhì)差用戶,然后根據(jù)用戶的話單信息對(duì)用戶和小區(qū)進(jìn)行相關(guān)關(guān)聯(lián),定位出2500多個(gè)感知差的問題小區(qū),經(jīng)過現(xiàn)場(chǎng)驗(yàn)證,問題小區(qū)命中率高達(dá)80.17%[2-3]。
本文主要是利用智能算法,對(duì)用戶感知類的多維指標(biāo)數(shù)據(jù),進(jìn)行了數(shù)據(jù)分析與挖掘。最終確立了一個(gè)客觀完善的用戶感知情況綜合評(píng)價(jià)體系。并進(jìn)一步的,利用機(jī)器學(xué)習(xí)算法,將感知情況與小區(qū)KPI指標(biāo)進(jìn)行了關(guān)聯(lián),找出了造成用戶感知情況差的關(guān)鍵KPI指標(biāo),為現(xiàn)網(wǎng)優(yōu)化工作提供了有力的支撐。