孟現(xiàn)鋒, 梁松柏, 徐 剛
(1.中國(guó)聯(lián)通鄭州市分公司,鄭州 450000; 2.中國(guó)聯(lián)通河南省分公司,鄭州 450000)
用戶對(duì)無(wú)線網(wǎng)絡(luò)感知越來(lái)越敏感,導(dǎo)致移網(wǎng)用戶投訴量居高不下. 與此同時(shí),如何快速識(shí)別移網(wǎng)投訴熱點(diǎn)區(qū)域,將有限的投資及設(shè)備資源投入到真正的投訴熱點(diǎn)區(qū)域,有效改善用戶感知,則是運(yùn)營(yíng)商十分關(guān)心的一個(gè)問(wèn)題[1]. 傳統(tǒng)方法是通過(guò)對(duì)某一個(gè)投訴位置的投訴數(shù)量累加,隨后進(jìn)行投訴量排名,將投訴量靠前的場(chǎng)景名稱確定為投訴熱點(diǎn). 而該方法的主要缺點(diǎn),一是無(wú)法有效去除噪聲點(diǎn),形成獨(dú)立成簇的投訴熱點(diǎn)區(qū)域;二是無(wú)法精細(xì)化地識(shí)別投訴熱點(diǎn)區(qū)域的邊框,投訴熱點(diǎn)區(qū)域通常為沒(méi)有明確邊界范圍的模糊區(qū)域;三是無(wú)法對(duì)網(wǎng)絡(luò)的規(guī)劃、建設(shè)、調(diào)整以及優(yōu)化提供有力的數(shù)據(jù)支撐. 各行業(yè)的熱點(diǎn)區(qū)域挖掘目前常用的方法是聚類算法[2-15]. 其中,DBSCAN算法(密度聚類)相較于其他聚類算法,對(duì)噪聲不敏感,無(wú)須設(shè)定類別數(shù)量,可以任意形狀成簇,適合投訴熱點(diǎn)區(qū)域識(shí)別.
針對(duì)投訴熱點(diǎn)區(qū)域網(wǎng)絡(luò)問(wèn)題的解決,對(duì)規(guī)劃方法和手段要求更高. 而網(wǎng)絡(luò)仿真軟件無(wú)法評(píng)估每一個(gè)投訴熱點(diǎn)區(qū)域的價(jià)值及建設(shè)優(yōu)先級(jí). 并且,傳統(tǒng)方法更多依賴于經(jīng)驗(yàn)判斷,考慮維度較單一,在解決方案的精準(zhǔn)性方面存在欠缺,不經(jīng)慎重評(píng)估便建設(shè)一個(gè)站點(diǎn),不僅無(wú)法針對(duì)性地解決實(shí)際需求,反而可能會(huì)帶來(lái)重疊覆蓋、越區(qū)覆蓋、干擾等嚴(yán)重問(wèn)題.
基于以上分析,本文結(jié)合DBSCAN 聚類和凸包算法,提出一種投訴熱點(diǎn)區(qū)域智能識(shí)別方法. 首先通過(guò)DBSCAN算法預(yù)處理歷史投訴數(shù)據(jù),聚類生成投訴熱點(diǎn)區(qū)域;然后,基于Graham掃描法求解投訴熱點(diǎn)區(qū)域邊界點(diǎn),并勾畫投訴熱點(diǎn)區(qū)域邊界;最后,基于投訴熱點(diǎn)區(qū)域網(wǎng)絡(luò)優(yōu)化模型,進(jìn)行網(wǎng)絡(luò)問(wèn)題分析定位,輸出投訴熱點(diǎn)解決方案.
針對(duì)移動(dòng)通信行業(yè)用戶歷史投訴數(shù)據(jù)集,投訴熱點(diǎn)區(qū)域智能識(shí)別與網(wǎng)絡(luò)評(píng)估流程如圖1所示. 首先,采用DBSCAN算法去除噪聲點(diǎn),快速地篩選出投訴熱點(diǎn)區(qū)域的簇集合;然后,基于凸包算法中的Graham掃描法求解投訴熱點(diǎn)區(qū)域邊界點(diǎn),并勾畫投訴熱點(diǎn)區(qū)域邊界;最后,基于投訴熱點(diǎn)區(qū)域網(wǎng)絡(luò)優(yōu)化模型,評(píng)估投訴熱點(diǎn)區(qū)域內(nèi)的網(wǎng)絡(luò)指標(biāo),輸出問(wèn)題解決方案.
圖1 總體流程Fig.1 Overall process
為有效解決投訴熱點(diǎn)網(wǎng)絡(luò)問(wèn)題,同時(shí)保證資源的精準(zhǔn)投放,在分析梳理影響網(wǎng)絡(luò)性能要素的基礎(chǔ)上,篩選出網(wǎng)絡(luò)運(yùn)營(yíng)、市場(chǎng)支撐、用戶感知三個(gè)維度的九項(xiàng)指標(biāo),建立投訴熱點(diǎn)區(qū)域網(wǎng)絡(luò)優(yōu)化模型. 具體結(jié)構(gòu)如圖2所示.
圖2 投訴熱點(diǎn)區(qū)域網(wǎng)絡(luò)優(yōu)化模型Fig.2 The network optimization model of complaint hot spot area
模型數(shù)據(jù)源包含價(jià)值微網(wǎng)格數(shù)據(jù)、基站工參數(shù)據(jù)、MR 數(shù)據(jù)、路測(cè)數(shù)據(jù)、友商競(jìng)對(duì)數(shù)據(jù)、市場(chǎng)簽報(bào)數(shù)據(jù)、集團(tuán)客戶數(shù)據(jù)、口碑場(chǎng)景數(shù)據(jù)、投訴數(shù)據(jù)等九種數(shù)據(jù). 數(shù)據(jù)定義見(jiàn)表1.
表1 指標(biāo)定義Tab.1 Index definitions
DBSCAN算法的基本思想就是計(jì)算某個(gè)eps半徑范圍內(nèi)采樣點(diǎn)的數(shù)量是否大于設(shè)定值min_samples. 其中eps和min_samples,分別限定算法的區(qū)域半徑和最少樣本點(diǎn)數(shù)量[16-19].
如圖3 所示,最小集合數(shù)量min_samples=4,表征一個(gè)簇內(nèi)至少包含4 個(gè)樣本點(diǎn). 其中A、B、C 在半徑eps 內(nèi)均互相可達(dá),可生成一個(gè)簇. 無(wú)法聚類成簇的點(diǎn)被作為噪聲點(diǎn),比如圖3 中的N點(diǎn).
圖3 DBSCAN算法示意Fig.3 Schematic diagram of DBSCAN algorithm
本文所分析數(shù)據(jù)源為Z市某運(yùn)營(yíng)商半年來(lái)的移動(dòng)通信投訴數(shù)據(jù). 數(shù)據(jù)樣例部分?jǐn)?shù)據(jù)如表2所示. 數(shù)據(jù)包含日期、受理號(hào)碼、經(jīng)度、緯度等數(shù)據(jù).
表2 數(shù)據(jù)樣例Tab.2 Data samples
取Z 市季度投訴數(shù)據(jù)地理化,從圖4 看到,投訴數(shù)據(jù)地理化無(wú)明顯簇狀分布特點(diǎn),需去噪處理.
圖4 投訴數(shù)據(jù)地理化分布Fig.4 Geographic distribution of complaint data
針對(duì)Z 市半年歷史投訴數(shù)據(jù)分析,結(jié)合投訴歷史數(shù)據(jù)人工統(tǒng)計(jì)經(jīng)驗(yàn),給出移動(dòng)通信網(wǎng)絡(luò)投訴熱點(diǎn)區(qū)域定義:半年內(nèi),200 m 范圍內(nèi)出現(xiàn)10 例及以上網(wǎng)絡(luò)質(zhì)量投訴. 即算法參數(shù)eps 設(shè)定為200,最小樣本點(diǎn)min_samples設(shè)定為10,聚類結(jié)果如圖5所示,聚類產(chǎn)生12個(gè)投訴熱點(diǎn)區(qū)域.
凸包概念:對(duì)于數(shù)據(jù)點(diǎn)集合(P1,P2,P3,…,Pn),求解一個(gè)最小凸多邊形P,P能夠完全包含數(shù)據(jù)點(diǎn)(圖6)[20].
圖6 投訴熱點(diǎn)區(qū)域邊界求解示意Fig.6 Solution of complaint hot area boundary
步驟一:將移動(dòng)通信網(wǎng)絡(luò)歷史投訴數(shù)據(jù)集中的點(diǎn)投射到直角坐標(biāo)系,Y軸中最小點(diǎn),即圖6中的P0點(diǎn),必定為凸包的一個(gè)頂點(diǎn),并以此作為坐標(biāo)的原點(diǎn),如圖6中的投訴點(diǎn)P0.
步驟二:以投訴點(diǎn)P0作為頂角,X軸作為一條邊,其他頂點(diǎn)與P0連接生成第三邊,夾角設(shè)為a.
步驟三:集合中的每個(gè)數(shù)據(jù)點(diǎn)與投訴點(diǎn)P0連線夾角a,通過(guò)夾角a大小的比較,排序各個(gè)數(shù)據(jù)點(diǎn). 很容易得知投訴點(diǎn)P1和投訴點(diǎn)P8必為凸包上的點(diǎn).
步驟四:將凸包上的點(diǎn)入棧,如投訴點(diǎn)P1入棧,并將投訴點(diǎn)P0與棧頂元素連接,例如P0P1. 依次判斷投訴點(diǎn)Pn在投訴點(diǎn)P0與棧頂連線L的左邊還是右邊. 如果投訴點(diǎn)Pn在左邊或在同一直線上時(shí),將它與棧頂元素相連,比如投訴點(diǎn)P2將與投訴P1連接.
步驟五:將新連接線段的坐標(biāo)與前一線段坐標(biāo)進(jìn)行叉積運(yùn)算,如果叉積結(jié)果為負(fù),則該投訴數(shù)據(jù)點(diǎn)一定是凸包上的頂點(diǎn),將其入棧,否則出棧.
步驟六:判斷棧頂數(shù)據(jù)點(diǎn),如果棧頂數(shù)據(jù)點(diǎn)是角度a最大的數(shù)據(jù)點(diǎn),則數(shù)據(jù)點(diǎn)即為凸包上的頂點(diǎn),凸包形成,算法執(zhí)行完畢. 否則繼續(xù)執(zhí)行步驟四.
基于Graham掃描法處理投訴熱點(diǎn)區(qū)域數(shù)據(jù),求解投訴熱點(diǎn)區(qū)域邊界,投訴熱點(diǎn)區(qū)域邊界如圖7所示.
圖7 投訴熱點(diǎn)區(qū)域邊界Fig.7 Boundary of complaint hotspot area
投訴熱點(diǎn)區(qū)域邊界確定后,基于投訴熱點(diǎn)區(qū)域網(wǎng)絡(luò)優(yōu)化模型,評(píng)估投訴熱點(diǎn)區(qū)域內(nèi)的網(wǎng)絡(luò)指標(biāo),輸出問(wèn)題解決方案.
以MR數(shù)據(jù)判斷面覆蓋,路測(cè)數(shù)據(jù)判斷線覆蓋,投訴數(shù)據(jù)判斷點(diǎn)覆蓋. 同時(shí),結(jié)合周圍無(wú)線環(huán)境、現(xiàn)網(wǎng)資源、站址資源,點(diǎn)線面聯(lián)合分析,實(shí)現(xiàn)網(wǎng)絡(luò)問(wèn)題的精準(zhǔn)定位,隨后匹配網(wǎng)絡(luò)問(wèn)題解決方案庫(kù),得出最優(yōu)解決方案,方案庫(kù)如圖8所示.
圖8 網(wǎng)絡(luò)問(wèn)題解決方案庫(kù)Fig.8 Network problem solution library
投訴熱點(diǎn)區(qū)域網(wǎng)絡(luò)問(wèn)題分析定位后,實(shí)行“先維優(yōu),后規(guī)建”的原則,網(wǎng)優(yōu)類問(wèn)題通過(guò)優(yōu)化手段解決,維護(hù)類問(wèn)題通過(guò)維護(hù)手段解決,建設(shè)類問(wèn)題輸出規(guī)劃建設(shè)方案. 方案確定后,將指標(biāo)量化,進(jìn)行加權(quán)評(píng)分,計(jì)算出投訴熱點(diǎn)區(qū)域解決方案的評(píng)估總分,進(jìn)行價(jià)值排序,輸出解決方案優(yōu)先級(jí)詳表,指導(dǎo)投訴熱點(diǎn)區(qū)域網(wǎng)絡(luò)問(wèn)題解決,見(jiàn)圖9. 各項(xiàng)指標(biāo)評(píng)分方法及分值如表3所示.
圖9 方案得分計(jì)算流程Fig.9 Program score calculation process
針對(duì)Z 市某運(yùn)營(yíng)商半年來(lái)的移動(dòng)通信網(wǎng)絡(luò)質(zhì)量投訴數(shù)據(jù),求解確定了12 個(gè)投訴熱點(diǎn)區(qū)域. 隨后,基于投訴熱點(diǎn)區(qū)域網(wǎng)絡(luò)優(yōu)化模型進(jìn)行問(wèn)題定位,并輸出解決方案,確定價(jià)值排名. 詳細(xì)的規(guī)建維優(yōu)方案如表4所示.
表4 問(wèn)題定位與解決方案Tab.4 Problem locations and solutions
投訴熱點(diǎn)2定位原因?yàn)樵搮^(qū)域主服務(wù)小區(qū)方位角不合理,基于MR數(shù)據(jù)求取最佳方位角140°,但工參數(shù)據(jù)庫(kù)中方位角為100°,調(diào)整前后指標(biāo)如表5所示. 從表5可見(jiàn),該區(qū)域網(wǎng)絡(luò)性能提升的同時(shí),投訴問(wèn)題有相應(yīng)改善.
表5 投訴熱點(diǎn)2優(yōu)化方案執(zhí)行前后指標(biāo)對(duì)比Tab.5 Comparison of indicators before and after the implementation of complaint hotspot 2 optimization scheme
相比較于人工篩選,基于DBSCAN聚類和凸包算法的投訴熱點(diǎn)區(qū)域智能識(shí)別方法能夠快速準(zhǔn)確識(shí)別出投訴熱點(diǎn)區(qū)域. 針對(duì)Z市某運(yùn)營(yíng)商半年來(lái)的移動(dòng)通信網(wǎng)絡(luò)質(zhì)量投訴數(shù)據(jù),求解確定了12個(gè)投訴熱點(diǎn)區(qū)域,并基于投訴熱點(diǎn)區(qū)域優(yōu)化模型,實(shí)現(xiàn)了投訴原因定位,輸出一點(diǎn)一策方案. 并針對(duì)其中一個(gè)投訴熱點(diǎn)區(qū)域,提取優(yōu)化方案執(zhí)行前后的網(wǎng)絡(luò)后臺(tái)指標(biāo)以及投訴數(shù)據(jù),該區(qū)域網(wǎng)絡(luò)性能提升的同時(shí),投訴問(wèn)題有相應(yīng)改善.