劉璐,陳睿杰,李嘉
研究與開(kāi)發(fā)
基于MDT重疊覆蓋度數(shù)據(jù)的NN-DBSCAN參數(shù)自適應(yīng)調(diào)優(yōu)研究
劉璐1,陳睿杰2,李嘉2
(1. 中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司重慶分公司,重慶 401121;2. 中國(guó)移動(dòng)通信集團(tuán)云南有限公司,云南 昆明 650228)
傳統(tǒng)網(wǎng)絡(luò)優(yōu)化中路測(cè)工作存在難以全量測(cè)試道路及樓宇、測(cè)試工作量大、工作效率低、周期長(zhǎng)、受人為因素影響等顯性缺點(diǎn),無(wú)法動(dòng)態(tài)關(guān)注每個(gè)區(qū)域網(wǎng)絡(luò)質(zhì)量情況,且常規(guī)測(cè)量報(bào)告(measurement report,MR)數(shù)據(jù)不具備定位信息,無(wú)法精確定位如重疊覆蓋度問(wèn)題發(fā)生位置。基于最小化路測(cè)(minimization drive test,MDT)精準(zhǔn)定位系統(tǒng)通過(guò)采集底層基站MDT數(shù)據(jù),并根據(jù)重疊覆蓋度算法輸出高重疊覆蓋度柵格,再通過(guò)自適應(yīng)最近鄰-具有噪聲的基于密度的聚類方法(-nearest neighbor density-based spatial clustering of applica-tions with noise,NN-DBSCAN)聯(lián)合算法解決了DBSCAN算法對(duì)參數(shù)設(shè)置敏感性問(wèn)題,并對(duì)問(wèn)題柵格進(jìn)行非監(jiān)督聚類,收斂問(wèn)題連片區(qū)域,通過(guò)小區(qū)采樣貢獻(xiàn)度進(jìn)行柵格區(qū)域映射,最終達(dá)到精準(zhǔn)調(diào)整全局最高優(yōu)先級(jí)(TOP)小區(qū),降低小區(qū)高重疊覆蓋度的目的。
NN-DBSCAN算法;MDT數(shù)據(jù);重疊覆蓋度;小區(qū)貢獻(xiàn)度
隨著近幾年網(wǎng)絡(luò)建設(shè)的大力發(fā)展,LTE業(yè)務(wù)量不斷增長(zhǎng)、網(wǎng)優(yōu)規(guī)模急劇擴(kuò)大,干擾問(wèn)題日益嚴(yán)重,網(wǎng)絡(luò)容量、覆蓋和質(zhì)量檢查矛盾日趨凸顯。LTE網(wǎng)絡(luò)主要以D/F頻段組網(wǎng),無(wú)法通過(guò)頻率規(guī)劃的方法精確有效降低同頻干擾,必須對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行調(diào)整與優(yōu)化。目前常規(guī)采用手段如路測(cè)、測(cè)量報(bào)告(measurement report,MR)數(shù)據(jù)和道路掃頻等數(shù)據(jù)進(jìn)行優(yōu)化,但由于路測(cè)數(shù)據(jù)獲取成本較高,MR數(shù)據(jù)未攜帶定位信息,掃頻數(shù)據(jù)也僅局限于道路,以及現(xiàn)網(wǎng)工參準(zhǔn)確性較差等,重疊覆蓋分析誤判較多,難以準(zhǔn)確定位和分析問(wèn)題,無(wú)法達(dá)到優(yōu)化預(yù)期效果。
最小化路測(cè)(minimization of drive test,MDT)技術(shù)功能主要通過(guò)擴(kuò)展現(xiàn)有無(wú)線資源管理(radio resource management,RRM)測(cè)量功能和跟蹤功能實(shí)現(xiàn),MDT數(shù)據(jù)測(cè)量及解析流程如圖1所示。
基站根據(jù)網(wǎng)管配置的MDT測(cè)量任務(wù)下發(fā)相關(guān)測(cè)量配置至終端UE,終端UE在滿足測(cè)量條件時(shí)測(cè)量并上報(bào)測(cè)量信息,包含參考信號(hào)接收功率(reference signal receiving power,RSRP)、參考信號(hào)接收質(zhì)量(reference signal receiving quality,RSRQ)等字段,最重要的是攜帶相關(guān)終端UE的定位信息(GPS經(jīng)度、緯度)[1],基站將收到的終端測(cè)量結(jié)果和基站自身的測(cè)量結(jié)果按數(shù)據(jù)標(biāo)準(zhǔn)要求上報(bào)至網(wǎng)管或MDT數(shù)據(jù)存儲(chǔ)處理服務(wù)器。
目前MDT支持的測(cè)量項(xiàng)主要包括3類,MDT支持測(cè)量項(xiàng)見(jiàn)表1。
重疊覆蓋問(wèn)題主要指在網(wǎng)絡(luò)拓?fù)淇臻g內(nèi),彼此存在深度交疊區(qū)域,如RSRP較好但SINR較差,或者多個(gè)小區(qū)間乒乓切換造成用戶感知差問(wèn)題,重疊覆蓋原因示意圖如圖2所示。
圖1 MDT數(shù)據(jù)測(cè)量及解析流程
表1 MDT支持測(cè)量項(xiàng)
圖2 重疊覆蓋原因示意圖
MDT柵格:采用目前主流GeoHash位置服務(wù)技術(shù),實(shí)現(xiàn)柵格定位普通精度為38 m×19 m及5 m× 5 m高精度的GIS渲染。
基于上述MDT柵格進(jìn)行高重疊覆蓋度柵格的計(jì)算,涉及以下指標(biāo)內(nèi)容:
(1)重疊覆蓋采樣點(diǎn):在基站服務(wù)小區(qū)RSRP≥?110 dBm,同時(shí)鄰區(qū)與主服小區(qū)RSRP的絕對(duì)差值在6 dB范圍內(nèi)的小區(qū)數(shù)量[2-3],即:|主服小區(qū)RSRP?鄰區(qū)RSRP|≤6 dB。
(2)柵格重疊覆蓋度:柵格重疊覆蓋度≥3的采樣點(diǎn)/柵格總采樣點(diǎn)×100%。
(3)高重疊覆蓋度柵格:柵格重疊覆蓋度≥15%,該閾值可根據(jù)實(shí)際情況進(jìn)行動(dòng)態(tài)調(diào)整。
重疊覆蓋度柵格內(nèi)小區(qū)采樣貢獻(xiàn)度:柵格內(nèi)總共有個(gè)小區(qū)覆蓋,其中,個(gè)小區(qū)重疊覆蓋采樣點(diǎn)共計(jì)個(gè),第N個(gè)小區(qū)的重疊覆蓋采樣點(diǎn)為n個(gè),則第N小區(qū)重疊覆蓋采樣貢獻(xiàn)度=n/。
傳統(tǒng)高重疊覆蓋問(wèn)題優(yōu)化主要是基于DT路測(cè)數(shù)據(jù)以及MR數(shù)據(jù)進(jìn)行渲染,呈現(xiàn)高重疊覆蓋區(qū)域,在獲取數(shù)據(jù)便捷性、成本性、時(shí)效性、精準(zhǔn)性上均劣于MDT數(shù)據(jù)評(píng)估分析效果。
傳統(tǒng)高重疊覆蓋優(yōu)化流程如圖3所示,傳統(tǒng)高重疊覆蓋優(yōu)化流程及判定分析方法均是側(cè)重尋優(yōu)單例問(wèn)題小區(qū),而本文主要是對(duì)傳統(tǒng)高重疊覆蓋問(wèn)題評(píng)估階段進(jìn)行改進(jìn)優(yōu)化,采用較為精準(zhǔn)的MDT數(shù)據(jù),并依據(jù)GeoHash算法形成柵格級(jí)數(shù)據(jù),通過(guò)目前較為成熟的NN與DBSCAN聯(lián)合非監(jiān)督機(jī)器學(xué)習(xí)算法,進(jìn)行高重疊覆蓋度柵格的聚類,在此問(wèn)題聚類區(qū)域進(jìn)一步計(jì)算TOP小區(qū)貢獻(xiàn)度,綜合性、全局性地調(diào)整TOP小區(qū)以實(shí)現(xiàn)最終尋優(yōu)目的。
由于目前密集城區(qū)高重疊覆蓋度問(wèn)題相對(duì)凸顯,且DBSCAN算法在樣本集的密度不均勻、聚類間距差相差很大時(shí)聚類質(zhì)量較差等原因,在分析場(chǎng)景上選取站間距較小、MDT高重疊覆蓋數(shù)據(jù)采樣的稀疏程度相似、簇密度數(shù)據(jù)差異不明顯的密集城區(qū)進(jìn)行研究。
圖3 傳統(tǒng)高重疊覆蓋優(yōu)化流程
(1)MDT測(cè)量采樣策略
考慮全省MR以及MDT數(shù)據(jù)測(cè)量項(xiàng)同時(shí)開(kāi)啟、數(shù)據(jù)服務(wù)器負(fù)荷因素,可以只開(kāi)啟以下基本測(cè)量項(xiàng)。
●全省開(kāi)啟IMM-MDT的M1測(cè)量(RSRP、RSRQ,由UE測(cè)量)。
●M2測(cè)量(PHR最大發(fā)射功率余量,由UE測(cè)量)。
●M3測(cè)量(RIP接收干擾功率測(cè)量,由eNB測(cè)量)。
●同時(shí)開(kāi)啟LOGGED-MDT以及RLF-MDT測(cè)量項(xiàng)。
(2)MDT采樣周期
全省每個(gè)月集中采樣10天,取最終全量并集數(shù)據(jù)。
(3)MDT補(bǔ)采數(shù)據(jù)機(jī)制
通過(guò)步驟(1)和步驟(2)中數(shù)據(jù)采集策略及采集周期可能會(huì)出現(xiàn)因廠商MDT服務(wù)器IP地址差異、服務(wù)器傳輸模式如SFTP但省端采集側(cè)配置為FTP等問(wèn)題出現(xiàn)數(shù)據(jù)采集不全的情況,所以需要針對(duì)上述原因補(bǔ)采MDT數(shù)據(jù)。
(4)MDT數(shù)據(jù)ETL策略
根據(jù)步驟(1)~步驟(3)獲取初步MDT數(shù)據(jù),經(jīng)IT支撐平臺(tái)進(jìn)行預(yù)處理,可輸出MDT采樣數(shù)據(jù),MDT采樣樣例數(shù)據(jù)見(jiàn)表2,按優(yōu)化經(jīng)驗(yàn)對(duì)該數(shù)據(jù)做進(jìn)一步數(shù)據(jù)分析處理。
●柵格總采樣點(diǎn)>5采樣點(diǎn)。
●柵格重疊覆蓋度>15%。
聯(lián)合上述兩個(gè)條件輸出對(duì)應(yīng)高重疊覆蓋度柵格作為研究候選對(duì)象柵格。
選取按第2.1節(jié)中條件過(guò)濾后的高重疊覆蓋度柵格,將柵格經(jīng)度、緯度通過(guò)編程工具進(jìn)行GIS渲染,并使用DBSCAN密度聚類算法將多個(gè)鄰近高重疊覆蓋度柵格聚為一類。
(1)DBSCAN密度聚類尋優(yōu)流程[4-5]如算法1所示。
算法1 DBSCAN密度聚類尋優(yōu)流程
輸入:數(shù)據(jù)源集(高重疊覆蓋度柵格)
表2 MDT采樣樣例數(shù)據(jù)
(2)實(shí)現(xiàn)經(jīng)典DBSCAN主要過(guò)程
高重疊覆蓋柵格簇群GIS渲染如下。
利用PlotClusterinResult(X,IDX1)函數(shù),可得出在超參數(shù)搜索半徑、MinPts擬合模型函數(shù),設(shè)置不同超參數(shù)的聚類效果如圖4所示。
由圖4可知,DBSCAN算法的搜索半徑、MinPts參數(shù)需要人為設(shè)定,聚類結(jié)果敏感度、準(zhǔn)確度受其超參數(shù)影響較大,需要在高重疊覆蓋干擾簇群范圍大小與噪點(diǎn)包含度進(jìn)行尋優(yōu)平衡,如干擾簇群搜索半徑過(guò)大,其涵蓋小區(qū)過(guò)多會(huì)導(dǎo)致干擾簇群內(nèi)小區(qū)貢獻(xiàn)度指標(biāo)被弱化,無(wú)法凸顯最嚴(yán)重干擾小區(qū);而干擾簇群搜索半徑過(guò)小可能會(huì)導(dǎo)致無(wú)法包含相近樣本,從而誤判為噪點(diǎn)情況,所以為降低減少人為干預(yù),需要進(jìn)行機(jī)器自適應(yīng)的DBSCAN超參數(shù)調(diào)優(yōu)的研究。
圖4 設(shè)置不同超參數(shù)的聚類效果
根據(jù)式(2)中密度閾值過(guò)大,可能會(huì)導(dǎo)致同簇群中內(nèi)部被劃分為多個(gè)集合;如密度閾值過(guò)小,則可能引起不同簇群集合間的合并,所以選取合適的密度閾值非常重要。-均值DBSCAN算法需要人為設(shè)定初始聚類中心,不能很好地解決聚類結(jié)果隨機(jī)性問(wèn)題;AF-DBSCAN算法需要選擇種子代表對(duì)象的數(shù)量,代表對(duì)象過(guò)多則無(wú)法發(fā)揮算法效率,過(guò)少則容易造成對(duì)象丟失,影響算法聚類質(zhì)量。為盡可能減少人為干預(yù),確保聚類效果,本文采用自適應(yīng)參數(shù)NN-DBSCAN算法構(gòu)建最小距離矩陣,并通過(guò)分析數(shù)據(jù)的NN的數(shù)學(xué)統(tǒng)計(jì)規(guī)律,尋優(yōu)密度閾值列表中的超參數(shù)取值,本文算法主要適用于低維且簇密度差異不明顯的數(shù)據(jù)集。
(1)確定搜索半徑具體算法思路有以下3個(gè)步驟。
步驟2 采用NN算法[8]及knnsearch函數(shù)[IDX,Dist]=knnsearch(a,b)遍歷計(jì)算每個(gè)柵格位置與其他柵格位置的距離,并將最小距離值存儲(chǔ)至Dist中,記錄其數(shù)據(jù)行號(hào)索引值存儲(chǔ)至IDX中。
尋優(yōu)策略執(zhí)行:輸入第2.2節(jié)的數(shù)據(jù),按照上述算法進(jìn)行步驟(1)~步驟(3)調(diào)優(yōu),并使用編程工具建模仿真,搜索半徑尋優(yōu)過(guò)程1和2分別如圖5、圖6所示。
由圖5可知,在第4個(gè)數(shù)據(jù)點(diǎn)處出現(xiàn)明顯數(shù)據(jù)凸起,說(shuō)明在第4~5個(gè)點(diǎn)處出現(xiàn)數(shù)值階躍現(xiàn)象。其在圖6曲線上則反映A、B兩點(diǎn)的拐點(diǎn)處縱坐標(biāo)階躍值最大,說(shuō)明該B點(diǎn)的縱坐標(biāo)為搜索半徑=0.004 49。
(2)確定MinPts值具體算法思路有以下3個(gè)步驟。
圖5 搜索半徑尋優(yōu)過(guò)程1
圖6 搜索半徑尋優(yōu)過(guò)程2
尋優(yōu)策略執(zhí)行:按上述確定MinPts值具體算法思路及步驟采用編程實(shí)現(xiàn),對(duì)不同取值曲線進(jìn)行圖形化渲染,MinPts參數(shù)尋優(yōu)過(guò)程如圖7可知,取離散值1,2,…,15等15條曲線基本形似,呈“前緩后陡”趨勢(shì)。
圖7 MinPts參數(shù)尋優(yōu)過(guò)程
圖8 自適應(yīng)KNN-DBSCAN聯(lián)合算法調(diào)優(yōu)聚類效果
(3)自適應(yīng)NN-DBSCAN聯(lián)合算法模型的實(shí)效性評(píng)估
●噪點(diǎn)率=noise噪點(diǎn)數(shù)/對(duì)象數(shù)。
●最大簇群內(nèi)TOP問(wèn)題小區(qū)貢獻(xiàn)度占比=最大簇群中高重疊覆蓋度柵格所轄TOP5小區(qū)的采樣點(diǎn)/最大簇群中高重疊覆蓋度柵格所有小區(qū)采樣點(diǎn)。
通過(guò)表3可知,在自適應(yīng)NN-DBSCAN聯(lián)合算法調(diào)優(yōu)層面,當(dāng)簇群C一定時(shí),噪點(diǎn)率越小越好;在實(shí)際網(wǎng)絡(luò)優(yōu)化層面,解決高重疊覆蓋小區(qū)需要以優(yōu)化最少小區(qū)為代價(jià)獲得最好收效,即最大簇群內(nèi)TOP問(wèn)題小區(qū)貢獻(xiàn)度的占比越高,該簇群的問(wèn)題小區(qū)收斂性越好。
實(shí)驗(yàn)組別9、10的噪點(diǎn)率最小,同為4.83%,而最大簇群內(nèi)TOP問(wèn)題小區(qū)貢獻(xiàn)度僅為38.97%;實(shí)驗(yàn)組別6、7、8最大簇群內(nèi)TOP問(wèn)題小區(qū)貢獻(xiàn)度同為59.32%,但噪點(diǎn)率依次為9.03%、13.24%、15.34%,均略高于實(shí)驗(yàn)組別9、10。另實(shí)驗(yàn)組別6與實(shí)驗(yàn)組別5在同為8個(gè)簇群前提下,雖然實(shí)驗(yàn)組別6比實(shí)驗(yàn)組別5噪點(diǎn)率稍劣于2.73%,但在最大簇內(nèi)TOP問(wèn)題小區(qū)貢獻(xiàn)度占比方面實(shí)驗(yàn)組別6大幅優(yōu)于實(shí)驗(yàn)組別5,領(lǐng)先幅度為20.60%。
表3 不同超參數(shù)設(shè)置下算法模型KPI驗(yàn)證結(jié)果
對(duì)MDT高重疊覆蓋度柵格基于NN-DBSCAN的聯(lián)合算法研究,利用編程工具對(duì)DBSCAN密度閾值Density參數(shù)中搜索半徑、MinPts兩個(gè)超參數(shù)進(jìn)行自適應(yīng)尋優(yōu),從而解決了該算法對(duì)參數(shù)設(shè)置敏感性問(wèn)題。結(jié)合實(shí)際網(wǎng)絡(luò)優(yōu)化工作特性,高效、快速構(gòu)建優(yōu)化區(qū)域內(nèi)高重疊覆蓋度簇群,精準(zhǔn)識(shí)別其簇群中TOP小區(qū),為一線生產(chǎn)提供有效的優(yōu)化解決方案,確保移動(dòng)用戶的良好感知體驗(yàn)。
[1] 譚鈺山, 周文金, 何延. 基于MDT數(shù)據(jù)的重疊覆蓋優(yōu)化思路及實(shí)踐[J]. 通訊世界, 2019, 26(12): 6-7.
TAN Y S, ZHOU W J, HE Y. Overlapping coverage optimization idea and practice based on MDT data[J]. Telecom World, 2019, 26(12): 6-7.
[2] 張吉, 趙夙, 朱曉榮. 基于大數(shù)據(jù)挖掘的LTE網(wǎng)絡(luò)重疊覆蓋優(yōu)化方法[J]. 南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版), 2020, 40(6): 92-99.
ZHANG J, ZHAO S, ZHU X R. Optimization method for overlapping coverage of LTE networks based on big data mining[J]. Journal of Nanjing University of Posts and Telecommunications (Natural Science Edition), 2020, 40(6): 92-99.
[3] 谷欣杏. LTE網(wǎng)絡(luò)覆蓋優(yōu)化及無(wú)線定位優(yōu)化算法的研究[D]. 北京: 北京郵電大學(xué), 2019.
GU X X. Research on LTE network coverage optimization and wireless positioning algorithm[D]. Beijing: Beijing University of Posts and Telecommunications, 2019.
[4] 宋金玉, 郭一平, 王斌. DBSCAN聚類算法的參數(shù)配置方法研究[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2019, 29(5): 44-48.
SONG J Y, GUO Y P, WANG B. Research on parameter configuration method of DBSCAN clustering algorithm[J]. Computer Technology and Development, 2019, 29(5): 44-48.
[5] 趙文, 夏桂書(shū), 茍智堅(jiān), 等. 一種改進(jìn)的DBSCAN算法[J]. 四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013, 36(2): 312-316.
ZHAO W, XIA G S, GOU Z J, et al. An improved DBSCAN algorithm[J]. Journal of Sichuan Normal University (Natural Science), 2013, 36(2): 312-316.
[6] 何正風(fēng). MATLAB在數(shù)學(xué)方面的應(yīng)用[M]. 北京: 清華大學(xué)出版社, 2012.
HE Z F. Application of MATLAB in mathematics[M]. Beijing: Tsinghua University Press, 2012.
[7] 李文杰, 閆世強(qiáng), 蔣瑩, 等. 自適應(yīng)確定DBSCAN算法參數(shù)的算法研究[J]. 計(jì)算機(jī)工程與應(yīng)用, 2019, 55(5): 1-7, 148.
LI W J, YAN S Q, JIANG Y, et al. Research on method of self-adaptive determination of DBSCAN algorithm parameters[J]. Computer Engineering and Applications, 2019, 55(5): 1-7, 148.
[8] 王紫薇, 徐凱, 侯益明. 基于不同距離公式的NN算法對(duì)鳶尾花的分類[J]. 無(wú)線互聯(lián)科技, 2021, 18(13): 105-106.
WANG Z W, XU K, HOU Y M. Classification of iris based onNN algorithm with different distance formulas[J]. Wireless Internet Technology, 2021, 18(13): 105-106.
[9] 周紅芳, 王鵬. DBSCAN算法中參數(shù)自適應(yīng)確定方法的研究[J].西安理工大學(xué)學(xué)報(bào), 2012, 28(3): 289-292.
ZHOU H F, WANG P. Research on adaptive parameters determination in DBSCAN algorithm[J]. Journal of Xi’an University of Technology, 2012, 28(3): 289-292.
Research on adaptive optimization ofNN-DBSCAN parameters based on MDT overlapping coverage data
LIU Lu1, CHEN Ruijie2, LI Jia2
1. Chongqing Branch of China Mobile Communications Group Design Institute Co., Ltd., Chongqing 401121, China 2. Yunnan Branch of China Mobile Communications Group Co., Ltd., Kunming 650228, China
In the traditional network optimization, the drive test (DT) work has obvious disadvantages, such as difficult to fully test roads and buildings, large test workload, low work efficiency, long cycle, affected by human factors, unable to dynamically pay attention to the network quality of each area, and the conventional measurement report (MR) data does not have positioning information, so it is impossible to accurately locate the location where the overlapping coverage problem occured. Based on minimization drive test (MDT), the precision positioning system collected the MDT data of the underlying base station and outputted the grid with high overlapping coverage according to the overlapping coverage algorithm. Then, the sensitivity of DBSCAN algorithm to parameter setting was solved through the adaptive-nearest neighbor density-based spatial clustering of applications with noise (NN-DBSCAN) joint algorithm. The problem grid was unsupervised clustered, the problem contiguous area was converged, and the grid area was mapped through the cell sampling contribution. Finally, the global top cell was accurately adjusted to optimize the high overlap coverage.
NN-DBSCAN algorithm, MDT data, overlapping coverage, cell contribution
TN929.5
A
10.11959/j.issn.1000?0801.2022010
2021?09?09;
2022?01?09
劉璐,18323064733@139.com
劉璐(1986?),男,中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司重慶分公司工程師、高級(jí)咨詢?cè)O(shè)計(jì)師,主要研究方向?yàn)闊o(wú)線網(wǎng)絡(luò)智能優(yōu)化。
陳睿杰(1987?),男,中國(guó)移動(dòng)通信集團(tuán)云南有限公司工程師,主要研究方向?yàn)榇髷?shù)據(jù)分析、AI、智慧運(yùn)維。
李嘉(1989?),男,現(xiàn)就職于中國(guó)移動(dòng)通信集團(tuán)云南有限公司,主要研究方向?yàn)榇髷?shù)據(jù)分析、AI、智慧運(yùn)維等。