盧 山
(中國移動通信集團山西有限公司,山西 太原 030032)
隨著移動互聯(lián)網(wǎng)的迅猛發(fā)展,基于位置的服務(wù)(LBS)廣泛應(yīng)用于人們的工作和生活之中。由于各種各樣的無線網(wǎng)絡(luò)信號充斥于人們的工作與生活空間,因此基于無線網(wǎng)絡(luò)信號獲取用戶位置日益成為的用戶定位領(lǐng)域的熱點課題[1],基于無線網(wǎng)絡(luò)信號獲取用戶位置的優(yōu)勢在于無線網(wǎng)絡(luò)信號具有泛在性且其部署成本較低。MR定位是較為新興的基于移動通信網(wǎng)絡(luò)的用戶定位方法。利用MR中的用戶終端接收周圍小區(qū)的場強,再通過數(shù)學(xué)模型推斷用戶位置,其平均定位精度可達50 m~100 m。MR指紋定位算法[2]是為網(wǎng)絡(luò)覆蓋區(qū)域的每個位置建立信號特征指紋,該特征指紋即從網(wǎng)絡(luò)角度代表用戶的位置,與網(wǎng)絡(luò)覆蓋的實際位置基本存在一一映射的關(guān)系,可以獲得較高的定位精度。該文以MR指紋定位技術(shù)為基礎(chǔ),賦能一個基于最小化路測( Over The Top, OTT;Minimization of Drive-Tests,MDT )訓(xùn)練數(shù)據(jù)的在線學(xué)習(xí)系統(tǒng),研究與構(gòu)建了一套具備在線學(xué)習(xí)能力的MR定位系統(tǒng)。MR智能定位系運行過程中可以實現(xiàn)對指紋模型參數(shù)、指紋模型參數(shù)自適應(yīng)工參變化以及定位算法參數(shù)進行自學(xué)習(xí)的功能,以弱化網(wǎng)絡(luò)變化或者無線環(huán)境變化對定位性能的影響。
移動通信網(wǎng)絡(luò)無處不在,只要用戶終端進行通信,就會產(chǎn)生信令數(shù)據(jù),而且可以零成本獲得這些信令數(shù)據(jù)。正是由于移動網(wǎng)絡(luò)及數(shù)據(jù)具有泛在性和低成本性的特點,因此研究基于移動網(wǎng)絡(luò)的用戶定位成為獲取用戶位置的熱點課題。OTT/MDT數(shù)據(jù)是一種帶有經(jīng)緯度坐標的消息(下文為位置消息),當(dāng)用戶終端執(zhí)行輔助全球衛(wèi)星定位系統(tǒng)(Assisted Global Positioning System,AGPS )業(yè)務(wù)、MDT業(yè)務(wù)或者導(dǎo)航業(yè)務(wù)時,會產(chǎn)生這類消息。MR是信令消息的一種,是用戶終端在執(zhí)行通信過程中周期性或者在事件觸發(fā)時上報給網(wǎng)絡(luò)的消息,其不僅包括時間、小區(qū)以及用戶標識信息,而且包括主服務(wù)小區(qū)和相鄰小區(qū)的場強信息。
OTT/MDT數(shù)據(jù)不僅包括時間、小區(qū)以及用戶標識信息,而且包括用戶的位置信息。該定位方法雖然只覆蓋極少數(shù)的用戶,但是能夠滿足指紋訓(xùn)練的需求。
基于時間、用戶標識、服務(wù)小區(qū)標識、MMEUeS1APId(4G)或者AMFUENGAPID(5G)將OTT/MDT與MR進行關(guān)聯(lián),生成帶位置坐標的MR數(shù)據(jù),將其作為定位系統(tǒng)的訓(xùn)練MR數(shù)據(jù)。
指紋(Fingerprint,F(xiàn)P)是對特定位置信號特征的刻畫,不同位置指紋的差異是指紋定位的基礎(chǔ),一個指紋一般由一個或多個信號特征模型(下文稱為Finger)組成。
柵格指紋利用柵格區(qū)域代表一個位置區(qū)域,柵格尺度為10 m×10 m,采用混合高斯模型(Gaussian Mixed Model,GMM)來描述柵格指紋??紤]到信號量(例如參考信號接收功率: Reference Signal Receiving Power,RSRP)在測量過程中會存在噪聲誤差(即在同一個位置信號量不是一個不變值,而是疊加了噪聲),因此該技術(shù)方案采用高斯分布N(μ、σ2)對Finger進行描述,其中μ是信號量的平均值,σ2是信號量的方差,即對訓(xùn)練數(shù)據(jù)中的每一個無線網(wǎng)絡(luò)信號的信號測量值進行高斯處理。
采用GMM模型來刻畫柵格指紋的原因是一個柵格中的MR信號量分布往往并不接近高斯分布,例如一個柵格中可能存在室內(nèi)和室外兩類訓(xùn)練MR數(shù)據(jù)。該技術(shù)方案默認混合高斯模型的分量為2個(也可以設(shè)置更多,具體看實際的信號復(fù)雜程度)。
混合高斯指紋模型如公式(1)所示,包括2個高斯分量的高斯指紋。
式中:fingeri為柵格指紋的第i個手指(Finger);menanij代表fingeri的第j個高斯分量的平均值;stdij代表fingerj的第j個高斯分量的標準方差;αij為每個高斯分量在混合高斯分布中所占的比重,;weighti為 每 個finger在Fingerprint中的權(quán)重,即對應(yīng)RSSI出現(xiàn)次數(shù)的歸一化值,且;Confidence1為finger的置信度,在指紋庫健康性監(jiān)測時會用到Confidence1,便于了解指紋庫的可靠性。
在生成混合高斯模型柵格指紋的過程中,首先,根據(jù)訓(xùn)練MR數(shù)據(jù)位置信息將MR數(shù)據(jù)映射到對應(yīng)的柵格;其次,通過期望最大化(Expectation Maximization Algorithm,EM)算法對柵格中的MR信號量進行分類,每類信號量分別生成對應(yīng)的高斯分量參數(shù),即生成了混合高斯柵格指紋。
MR指紋定位算法就是指紋匹配算法,主要采用樸素貝葉斯估計算法計算某MR在柵格中的概率值,取概率值最大的柵格,即為該MR所在的柵格位置,如公式(2)所示。
式中:P(MR)是邊際概率;P(GridA)為先驗概率;GridA代表柵格A;P(MR|GridA)為似然函數(shù),表示在已知柵格A的情況下,最可能出現(xiàn)MR的概率。
例如,下面是數(shù)據(jù)集中的第i個MR數(shù)據(jù)。
其中ecij和RSRPij分布是MRi的第i個小區(qū)標識和第j個信號場強。
由于混合高斯分布的形式如公式(3)、公式(4)所示。
式中:αk為每個高斯分量在混合高斯分布中所占的比重,;Θk為第k個高斯分量的參數(shù);yi為第i個RSRP值;uk為第k個高斯分量的均值;∑k為第k個高斯分量的協(xié)方差。
綜上可計算得P(MR|Gridi)(i=A,B,…)各個柵格的概率值,選取后驗概率最大的柵格,即為該MR的位置。
基于OTT/MDT MR訓(xùn)練數(shù)據(jù)的在線學(xué)習(xí)系統(tǒng)架構(gòu)圖如圖1所示。
圖1 基于OTT/MDT MR訓(xùn)練數(shù)據(jù)的在線學(xué)習(xí)系統(tǒng)架構(gòu)圖
其中位置回填是將OTT/MDT中的位置數(shù)據(jù)與MR中的信號場強信息進行關(guān)聯(lián),生成訓(xùn)練MR數(shù)據(jù)。
生成訓(xùn)練MR數(shù)據(jù)后可以實現(xiàn)指紋參數(shù)自適應(yīng)工參變化、指紋參數(shù)自學(xué)習(xí)以及定位算法參數(shù)自學(xué)習(xí)的功能。
利用訓(xùn)練MR數(shù)據(jù)對指紋參數(shù),即每個Finger的GMM參數(shù)(每個分量的平均值、標準方差和分量權(quán)重)進行訓(xùn)練。
由于不同類型的MR數(shù)據(jù)的可靠性不同,因此可以設(shè)置不同的權(quán)重因子來對數(shù)據(jù)進行區(qū)分,然后融合生成指紋。
考慮無線傳播環(huán)境是會變化的,網(wǎng)絡(luò)也是會變化的,因此MR收集時間距離定位時間點的時間越長,有效性越低,MR也需要用權(quán)重來區(qū)別。
為了簡化算法,且便于維護與優(yōu)化,只通過時間權(quán)重來區(qū)分2類數(shù)據(jù)(過往數(shù)據(jù)權(quán)重及本期數(shù)據(jù)權(quán)重)。初次構(gòu)建指紋庫時,只有本期權(quán)重,即權(quán)重為1。
利用收集的訓(xùn)練MR數(shù)據(jù)更新現(xiàn)有的GMM指紋的過程如下。
現(xiàn)假設(shè)某柵格號A有n條訓(xùn)練MR數(shù)據(jù),而現(xiàn)有的數(shù)據(jù)是以某小區(qū)eci1為主小區(qū)的所有MR數(shù)據(jù),所以該柵格A內(nèi)可能有多條MR數(shù)據(jù),但主小區(qū)均為eci1。數(shù)據(jù)如下。
現(xiàn)提取該柵格內(nèi)的所有小區(qū)及其對應(yīng)的電平(RSRP),得到的數(shù)據(jù)如下。
將歷史生成的上述電平數(shù)據(jù)以文件的形式保存下來,與新收集的電平數(shù)據(jù)合并,利用混合高斯分布生成每個finger的混合高斯指紋。
新建站、擴容以及PCI規(guī)劃等日常網(wǎng)絡(luò)運維會導(dǎo)致工程參數(shù)處于動態(tài)變化中。工程參數(shù)的變化會對指紋造成直接影響,導(dǎo)致前期生成的柵格指紋不能準確反映當(dāng)前的網(wǎng)絡(luò)覆蓋情況,甚至使柵格指紋完全失效。
因此,需要通過自學(xué)習(xí)算法讓柵格指紋庫快速、自動地適應(yīng)工程參數(shù)的變化,時刻為MR指紋定位提供一個可靠、準確的指紋信息。
柵格指紋自適應(yīng)更新。柵格指紋中的某ECI對應(yīng)的小區(qū)工程參數(shù)發(fā)生變化,則ECI對應(yīng)的Finger自動進行修正,以補償該變化,具體實現(xiàn)算法如下。
Finger中的指紋是由GMM生成的均值(mean)、方差(variance)和分量權(quán)重(prior)組成的。為了便于指紋更新,其附帶了生成指紋的中間結(jié)果
最新的訓(xùn)練MR數(shù)據(jù)更能夠反映當(dāng)前的位置信號特征,因此為了保證新的訓(xùn)練數(shù)據(jù)以較高的權(quán)重參與生成指紋的過程,舊數(shù)據(jù)隨著時間的流失在指紋生成中的效用也逐漸降低,在指紋生成中采用老化系數(shù)來對新舊數(shù)據(jù)進行加權(quán)處理,如公式(5)所示。
式中:α為老化系數(shù),α=0~1;Countn-1為該次指紋更新之前積累的 MR 個數(shù)。Countn為該次與之前通過老化處理后合并的MR個數(shù)。
該方案指紋匹配算法采用的是樸素貝葉斯()算法,其本身由最大似然、先驗概率和邊緣概率組成。該方案對先驗概率進行改造,構(gòu)造了均衡函數(shù)以控制先驗概率對匹配結(jié)果的影響。下文介紹使用訓(xùn)練MR數(shù)據(jù)對貝葉斯模型進行訓(xùn)練的過程。
3.5.1 先驗概率自學(xué)習(xí)
影響貝葉斯模型匹配效果的參數(shù)主要是公式(6)中先驗概率P(MR|GridA),該算法通過設(shè)計弱化函數(shù)對其進行均衡處理(弱化處理)。
說明:由于P(MR|GridA)本身是位于區(qū)間[0,1]的數(shù)值,因此通過將index設(shè)置為[0,1]可以弱化其對計算概率的影響,同時通過控制index的大小可以控制其弱化程度。
考慮到不同指紋Finger個數(shù)對先驗概率的要求不同,因此需要分別對不同F(xiàn)inger的MR進行訓(xùn)練。首先,設(shè)置目標函數(shù)。目標函數(shù)是根據(jù)對該平臺性能平均的指標來確定的,設(shè)置為實際位置與定位位置偏差≤100m的占比。每次迭代時,僅對index、index+0.1以及index-0.1設(shè)置值進行比較求最佳。
3.5.2 缺省標準差
對于小區(qū)ECI對應(yīng)的RSSI集合不能滿足構(gòu)建Gauss模型的情況,通過賦值缺省Default Gauss Variance建立Gauss模型??梢詫υ揈CI其他柵格的Gauss Variance進行加權(quán)平均得到,權(quán)值設(shè)為柵格距離的倒數(shù)。當(dāng)訓(xùn)練MR數(shù)據(jù)累積到一定門限(例如20個RSSI值)時,自動切換到標準高斯模型參數(shù)求解過程。
將MR智能定位系統(tǒng)投入山西移動日常生產(chǎn)中。下面是利用2019年4月和5月的定位結(jié)果對定位算法性能進行評估。選擇具有道路、居民區(qū)、商務(wù)區(qū)以及城中村等場景在內(nèi)的30 km2區(qū)域進行算法測試。
MR智能定位系統(tǒng)的在線學(xué)習(xí)能力通過自動調(diào)整系統(tǒng)參數(shù)來適應(yīng)數(shù)據(jù)和網(wǎng)絡(luò)環(huán)境的變化,在系統(tǒng)運行中具有提升定位精度和穩(wěn)定性的作用。
基于移動網(wǎng)絡(luò)進行用戶定位的挑戰(zhàn)在于移動網(wǎng)絡(luò)的自身變化和無線環(huán)境的變化都存在較大的不確定性,難以保證定位精度和定位性能。該技術(shù)方案構(gòu)建的 MR智能定位系統(tǒng)以建立GMM柵格指紋庫并利用樸素貝葉斯指紋匹配算法作為MR定位的基礎(chǔ)算法。在該基礎(chǔ)上,利用在線獲得的訓(xùn)練MR數(shù)據(jù)對指紋參數(shù)和樸素貝葉斯定位參數(shù)進行在線訓(xùn)練,確保算法模型參數(shù)能夠真實反映無線網(wǎng)絡(luò)自身的變化和無線網(wǎng)絡(luò)環(huán)境的變化,從而保證MR定位具有較高的精確性和穩(wěn)定性。