盧 山
(中國(guó)移動(dòng)通信集團(tuán)山西有限公司,山西 太原 030032)
隨著移動(dòng)互聯(lián)網(wǎng)的迅猛發(fā)展,基于位置的服務(wù)(LBS)廣泛應(yīng)用于人們的工作和生活之中。由于各種各樣的無(wú)線網(wǎng)絡(luò)信號(hào)充斥于人們的工作與生活空間,因此基于無(wú)線網(wǎng)絡(luò)信號(hào)獲取用戶(hù)位置日益成為的用戶(hù)定位領(lǐng)域的熱點(diǎn)課題[1],基于無(wú)線網(wǎng)絡(luò)信號(hào)獲取用戶(hù)位置的優(yōu)勢(shì)在于無(wú)線網(wǎng)絡(luò)信號(hào)具有泛在性且其部署成本較低。MR定位是較為新興的基于移動(dòng)通信網(wǎng)絡(luò)的用戶(hù)定位方法。利用MR中的用戶(hù)終端接收周?chē)^(qū)的場(chǎng)強(qiáng),再通過(guò)數(shù)學(xué)模型推斷用戶(hù)位置,其平均定位精度可達(dá)50 m~100 m。MR指紋定位算法[2]是為網(wǎng)絡(luò)覆蓋區(qū)域的每個(gè)位置建立信號(hào)特征指紋,該特征指紋即從網(wǎng)絡(luò)角度代表用戶(hù)的位置,與網(wǎng)絡(luò)覆蓋的實(shí)際位置基本存在一一映射的關(guān)系,可以獲得較高的定位精度。該文以MR指紋定位技術(shù)為基礎(chǔ),賦能一個(gè)基于最小化路測(cè)( Over The Top, OTT;Minimization of Drive-Tests,MDT )訓(xùn)練數(shù)據(jù)的在線學(xué)習(xí)系統(tǒng),研究與構(gòu)建了一套具備在線學(xué)習(xí)能力的MR定位系統(tǒng)。MR智能定位系運(yùn)行過(guò)程中可以實(shí)現(xiàn)對(duì)指紋模型參數(shù)、指紋模型參數(shù)自適應(yīng)工參變化以及定位算法參數(shù)進(jìn)行自學(xué)習(xí)的功能,以弱化網(wǎng)絡(luò)變化或者無(wú)線環(huán)境變化對(duì)定位性能的影響。
移動(dòng)通信網(wǎng)絡(luò)無(wú)處不在,只要用戶(hù)終端進(jìn)行通信,就會(huì)產(chǎn)生信令數(shù)據(jù),而且可以零成本獲得這些信令數(shù)據(jù)。正是由于移動(dòng)網(wǎng)絡(luò)及數(shù)據(jù)具有泛在性和低成本性的特點(diǎn),因此研究基于移動(dòng)網(wǎng)絡(luò)的用戶(hù)定位成為獲取用戶(hù)位置的熱點(diǎn)課題。OTT/MDT數(shù)據(jù)是一種帶有經(jīng)緯度坐標(biāo)的消息(下文為位置消息),當(dāng)用戶(hù)終端執(zhí)行輔助全球衛(wèi)星定位系統(tǒng)(Assisted Global Positioning System,AGPS )業(yè)務(wù)、MDT業(yè)務(wù)或者導(dǎo)航業(yè)務(wù)時(shí),會(huì)產(chǎn)生這類(lèi)消息。MR是信令消息的一種,是用戶(hù)終端在執(zhí)行通信過(guò)程中周期性或者在事件觸發(fā)時(shí)上報(bào)給網(wǎng)絡(luò)的消息,其不僅包括時(shí)間、小區(qū)以及用戶(hù)標(biāo)識(shí)信息,而且包括主服務(wù)小區(qū)和相鄰小區(qū)的場(chǎng)強(qiáng)信息。
OTT/MDT數(shù)據(jù)不僅包括時(shí)間、小區(qū)以及用戶(hù)標(biāo)識(shí)信息,而且包括用戶(hù)的位置信息。該定位方法雖然只覆蓋極少數(shù)的用戶(hù),但是能夠滿(mǎn)足指紋訓(xùn)練的需求。
基于時(shí)間、用戶(hù)標(biāo)識(shí)、服務(wù)小區(qū)標(biāo)識(shí)、MMEUeS1APId(4G)或者AMFUENGAPID(5G)將OTT/MDT與MR進(jìn)行關(guān)聯(lián),生成帶位置坐標(biāo)的MR數(shù)據(jù),將其作為定位系統(tǒng)的訓(xùn)練MR數(shù)據(jù)。
指紋(Fingerprint,F(xiàn)P)是對(duì)特定位置信號(hào)特征的刻畫(huà),不同位置指紋的差異是指紋定位的基礎(chǔ),一個(gè)指紋一般由一個(gè)或多個(gè)信號(hào)特征模型(下文稱(chēng)為Finger)組成。
柵格指紋利用柵格區(qū)域代表一個(gè)位置區(qū)域,柵格尺度為10 m×10 m,采用混合高斯模型(Gaussian Mixed Model,GMM)來(lái)描述柵格指紋??紤]到信號(hào)量(例如參考信號(hào)接收功率: Reference Signal Receiving Power,RSRP)在測(cè)量過(guò)程中會(huì)存在噪聲誤差(即在同一個(gè)位置信號(hào)量不是一個(gè)不變值,而是疊加了噪聲),因此該技術(shù)方案采用高斯分布N(μ、σ2)對(duì)Finger進(jìn)行描述,其中μ是信號(hào)量的平均值,σ2是信號(hào)量的方差,即對(duì)訓(xùn)練數(shù)據(jù)中的每一個(gè)無(wú)線網(wǎng)絡(luò)信號(hào)的信號(hào)測(cè)量值進(jìn)行高斯處理。
采用GMM模型來(lái)刻畫(huà)柵格指紋的原因是一個(gè)柵格中的MR信號(hào)量分布往往并不接近高斯分布,例如一個(gè)柵格中可能存在室內(nèi)和室外兩類(lèi)訓(xùn)練MR數(shù)據(jù)。該技術(shù)方案默認(rèn)混合高斯模型的分量為2個(gè)(也可以設(shè)置更多,具體看實(shí)際的信號(hào)復(fù)雜程度)。
混合高斯指紋模型如公式(1)所示,包括2個(gè)高斯分量的高斯指紋。
式中:fingeri為柵格指紋的第i個(gè)手指(Finger);menanij代表fingeri的第j個(gè)高斯分量的平均值;stdij代表fingerj的第j個(gè)高斯分量的標(biāo)準(zhǔn)方差;αij為每個(gè)高斯分量在混合高斯分布中所占的比重,;weighti為 每 個(gè)finger在Fingerprint中的權(quán)重,即對(duì)應(yīng)RSSI出現(xiàn)次數(shù)的歸一化值,且;Confidence1為finger的置信度,在指紋庫(kù)健康性監(jiān)測(cè)時(shí)會(huì)用到Confidence1,便于了解指紋庫(kù)的可靠性。
在生成混合高斯模型柵格指紋的過(guò)程中,首先,根據(jù)訓(xùn)練MR數(shù)據(jù)位置信息將MR數(shù)據(jù)映射到對(duì)應(yīng)的柵格;其次,通過(guò)期望最大化(Expectation Maximization Algorithm,EM)算法對(duì)柵格中的MR信號(hào)量進(jìn)行分類(lèi),每類(lèi)信號(hào)量分別生成對(duì)應(yīng)的高斯分量參數(shù),即生成了混合高斯柵格指紋。
MR指紋定位算法就是指紋匹配算法,主要采用樸素貝葉斯估計(jì)算法計(jì)算某MR在柵格中的概率值,取概率值最大的柵格,即為該MR所在的柵格位置,如公式(2)所示。
式中:P(MR)是邊際概率;P(GridA)為先驗(yàn)概率;GridA代表柵格A;P(MR|GridA)為似然函數(shù),表示在已知柵格A的情況下,最可能出現(xiàn)MR的概率。
例如,下面是數(shù)據(jù)集中的第i個(gè)MR數(shù)據(jù)。
其中ecij和RSRPij分布是MRi的第i個(gè)小區(qū)標(biāo)識(shí)和第j個(gè)信號(hào)場(chǎng)強(qiáng)。
由于混合高斯分布的形式如公式(3)、公式(4)所示。
式中:αk為每個(gè)高斯分量在混合高斯分布中所占的比重,;Θk為第k個(gè)高斯分量的參數(shù);yi為第i個(gè)RSRP值;uk為第k個(gè)高斯分量的均值;∑k為第k個(gè)高斯分量的協(xié)方差。
綜上可計(jì)算得P(MR|Gridi)(i=A,B,…)各個(gè)柵格的概率值,選取后驗(yàn)概率最大的柵格,即為該MR的位置。
基于OTT/MDT MR訓(xùn)練數(shù)據(jù)的在線學(xué)習(xí)系統(tǒng)架構(gòu)圖如圖1所示。
圖1 基于OTT/MDT MR訓(xùn)練數(shù)據(jù)的在線學(xué)習(xí)系統(tǒng)架構(gòu)圖
其中位置回填是將OTT/MDT中的位置數(shù)據(jù)與MR中的信號(hào)場(chǎng)強(qiáng)信息進(jìn)行關(guān)聯(lián),生成訓(xùn)練MR數(shù)據(jù)。
生成訓(xùn)練MR數(shù)據(jù)后可以實(shí)現(xiàn)指紋參數(shù)自適應(yīng)工參變化、指紋參數(shù)自學(xué)習(xí)以及定位算法參數(shù)自學(xué)習(xí)的功能。
利用訓(xùn)練MR數(shù)據(jù)對(duì)指紋參數(shù),即每個(gè)Finger的GMM參數(shù)(每個(gè)分量的平均值、標(biāo)準(zhǔn)方差和分量權(quán)重)進(jìn)行訓(xùn)練。
由于不同類(lèi)型的MR數(shù)據(jù)的可靠性不同,因此可以設(shè)置不同的權(quán)重因子來(lái)對(duì)數(shù)據(jù)進(jìn)行區(qū)分,然后融合生成指紋。
考慮無(wú)線傳播環(huán)境是會(huì)變化的,網(wǎng)絡(luò)也是會(huì)變化的,因此MR收集時(shí)間距離定位時(shí)間點(diǎn)的時(shí)間越長(zhǎng),有效性越低,MR也需要用權(quán)重來(lái)區(qū)別。
為了簡(jiǎn)化算法,且便于維護(hù)與優(yōu)化,只通過(guò)時(shí)間權(quán)重來(lái)區(qū)分2類(lèi)數(shù)據(jù)(過(guò)往數(shù)據(jù)權(quán)重及本期數(shù)據(jù)權(quán)重)。初次構(gòu)建指紋庫(kù)時(shí),只有本期權(quán)重,即權(quán)重為1。
利用收集的訓(xùn)練MR數(shù)據(jù)更新現(xiàn)有的GMM指紋的過(guò)程如下。
現(xiàn)假設(shè)某柵格號(hào)A有n條訓(xùn)練MR數(shù)據(jù),而現(xiàn)有的數(shù)據(jù)是以某小區(qū)eci1為主小區(qū)的所有MR數(shù)據(jù),所以該柵格A內(nèi)可能有多條MR數(shù)據(jù),但主小區(qū)均為eci1。數(shù)據(jù)如下。
現(xiàn)提取該柵格內(nèi)的所有小區(qū)及其對(duì)應(yīng)的電平(RSRP),得到的數(shù)據(jù)如下。
將歷史生成的上述電平數(shù)據(jù)以文件的形式保存下來(lái),與新收集的電平數(shù)據(jù)合并,利用混合高斯分布生成每個(gè)finger的混合高斯指紋。
新建站、擴(kuò)容以及PCI規(guī)劃等日常網(wǎng)絡(luò)運(yùn)維會(huì)導(dǎo)致工程參數(shù)處于動(dòng)態(tài)變化中。工程參數(shù)的變化會(huì)對(duì)指紋造成直接影響,導(dǎo)致前期生成的柵格指紋不能準(zhǔn)確反映當(dāng)前的網(wǎng)絡(luò)覆蓋情況,甚至使柵格指紋完全失效。
因此,需要通過(guò)自學(xué)習(xí)算法讓柵格指紋庫(kù)快速、自動(dòng)地適應(yīng)工程參數(shù)的變化,時(shí)刻為MR指紋定位提供一個(gè)可靠、準(zhǔn)確的指紋信息。
柵格指紋自適應(yīng)更新。柵格指紋中的某ECI對(duì)應(yīng)的小區(qū)工程參數(shù)發(fā)生變化,則ECI對(duì)應(yīng)的Finger自動(dòng)進(jìn)行修正,以補(bǔ)償該變化,具體實(shí)現(xiàn)算法如下。
Finger中的指紋是由GMM生成的均值(mean)、方差(variance)和分量權(quán)重(prior)組成的。為了便于指紋更新,其附帶了生成指紋的中間結(jié)果
最新的訓(xùn)練MR數(shù)據(jù)更能夠反映當(dāng)前的位置信號(hào)特征,因此為了保證新的訓(xùn)練數(shù)據(jù)以較高的權(quán)重參與生成指紋的過(guò)程,舊數(shù)據(jù)隨著時(shí)間的流失在指紋生成中的效用也逐漸降低,在指紋生成中采用老化系數(shù)來(lái)對(duì)新舊數(shù)據(jù)進(jìn)行加權(quán)處理,如公式(5)所示。
式中:α為老化系數(shù),α=0~1;Countn-1為該次指紋更新之前積累的 MR 個(gè)數(shù)。Countn為該次與之前通過(guò)老化處理后合并的MR個(gè)數(shù)。
該方案指紋匹配算法采用的是樸素貝葉斯()算法,其本身由最大似然、先驗(yàn)概率和邊緣概率組成。該方案對(duì)先驗(yàn)概率進(jìn)行改造,構(gòu)造了均衡函數(shù)以控制先驗(yàn)概率對(duì)匹配結(jié)果的影響。下文介紹使用訓(xùn)練MR數(shù)據(jù)對(duì)貝葉斯模型進(jìn)行訓(xùn)練的過(guò)程。
3.5.1 先驗(yàn)概率自學(xué)習(xí)
影響貝葉斯模型匹配效果的參數(shù)主要是公式(6)中先驗(yàn)概率P(MR|GridA),該算法通過(guò)設(shè)計(jì)弱化函數(shù)對(duì)其進(jìn)行均衡處理(弱化處理)。
說(shuō)明:由于P(MR|GridA)本身是位于區(qū)間[0,1]的數(shù)值,因此通過(guò)將index設(shè)置為[0,1]可以弱化其對(duì)計(jì)算概率的影響,同時(shí)通過(guò)控制index的大小可以控制其弱化程度。
考慮到不同指紋Finger個(gè)數(shù)對(duì)先驗(yàn)概率的要求不同,因此需要分別對(duì)不同F(xiàn)inger的MR進(jìn)行訓(xùn)練。首先,設(shè)置目標(biāo)函數(shù)。目標(biāo)函數(shù)是根據(jù)對(duì)該平臺(tái)性能平均的指標(biāo)來(lái)確定的,設(shè)置為實(shí)際位置與定位位置偏差≤100m的占比。每次迭代時(shí),僅對(duì)index、index+0.1以及index-0.1設(shè)置值進(jìn)行比較求最佳。
3.5.2 缺省標(biāo)準(zhǔn)差
對(duì)于小區(qū)ECI對(duì)應(yīng)的RSSI集合不能滿(mǎn)足構(gòu)建Gauss模型的情況,通過(guò)賦值缺省Default Gauss Variance建立Gauss模型??梢詫?duì)該ECI其他柵格的Gauss Variance進(jìn)行加權(quán)平均得到,權(quán)值設(shè)為柵格距離的倒數(shù)。當(dāng)訓(xùn)練MR數(shù)據(jù)累積到一定門(mén)限(例如20個(gè)RSSI值)時(shí),自動(dòng)切換到標(biāo)準(zhǔn)高斯模型參數(shù)求解過(guò)程。
將MR智能定位系統(tǒng)投入山西移動(dòng)日常生產(chǎn)中。下面是利用2019年4月和5月的定位結(jié)果對(duì)定位算法性能進(jìn)行評(píng)估。選擇具有道路、居民區(qū)、商務(wù)區(qū)以及城中村等場(chǎng)景在內(nèi)的30 km2區(qū)域進(jìn)行算法測(cè)試。
MR智能定位系統(tǒng)的在線學(xué)習(xí)能力通過(guò)自動(dòng)調(diào)整系統(tǒng)參數(shù)來(lái)適應(yīng)數(shù)據(jù)和網(wǎng)絡(luò)環(huán)境的變化,在系統(tǒng)運(yùn)行中具有提升定位精度和穩(wěn)定性的作用。
基于移動(dòng)網(wǎng)絡(luò)進(jìn)行用戶(hù)定位的挑戰(zhàn)在于移動(dòng)網(wǎng)絡(luò)的自身變化和無(wú)線環(huán)境的變化都存在較大的不確定性,難以保證定位精度和定位性能。該技術(shù)方案構(gòu)建的 MR智能定位系統(tǒng)以建立GMM柵格指紋庫(kù)并利用樸素貝葉斯指紋匹配算法作為MR定位的基礎(chǔ)算法。在該基礎(chǔ)上,利用在線獲得的訓(xùn)練MR數(shù)據(jù)對(duì)指紋參數(shù)和樸素貝葉斯定位參數(shù)進(jìn)行在線訓(xùn)練,確保算法模型參數(shù)能夠真實(shí)反映無(wú)線網(wǎng)絡(luò)自身的變化和無(wú)線網(wǎng)絡(luò)環(huán)境的變化,從而保證MR定位具有較高的精確性和穩(wěn)定性。