孫順遠 朱紅洲
(1.江南大學(xué)輕工過程先進控制教育部重點實驗室 無錫 214122)
(2.江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院 無錫 214122)
隨著WiFi[1]、藍牙[2]以及RFID[3]等技術(shù)的不斷發(fā)展,使得基于接收信號強度(RSS)的室內(nèi)定位技術(shù)迅速興起。但信號接入點(Access Point,AP)的信號由于電磁干擾、多徑效應(yīng)等原因易產(chǎn)生波動,且AP間存在信號干擾。傳統(tǒng)定位算法不能實現(xiàn)大型定位區(qū)域的高精度定位,因此降低計算復(fù)雜度、提高定位精度成為該文的主要研究方向。傳統(tǒng)的藍牙信標(biāo)不能提供到達時間差[4]或者到達角度差[5]等信息,因此選擇基于指紋定位方法最為有效,通過待測點與指紋庫之間近鄰信息或者相關(guān)度信息建立匹配關(guān)系,常用方法有K 近鄰[6]、分類模型算法[7]及神經(jīng)網(wǎng)絡(luò)[8]等方法。
離線階段采集指紋數(shù)據(jù)時,采用濾波的方式對RSS 進行處理,提高信號穩(wěn)定性[9]。針對定位區(qū)域過大帶來的誤差和計算復(fù)雜度的問題,文獻[10]提出對定位區(qū)域基于RSS 進行分區(qū)減小定位復(fù)雜度和誤差。文獻[11]對五種分區(qū)方法在不同場景中的定位效果進行對比,確定出不同方法適用的場景。文獻[12]提出基于余弦相似度改進歐式距離進行K-Means聚類分區(qū),縮小信號匹配范圍以減小定位誤差。文獻[13]提出一種基于湯普森檢驗理論的異常點剔除,減小信號聚類的錯誤物理分區(qū)。文獻[14]提出一種基于多元高斯混合模型的概率分類定位方法,有效的減小不同AP 之間的信號干擾,對每個RP建立分類模型,有效提高定位精度和穩(wěn)定性。文獻[15]提出一種基于概率的一對多支持向量機的融合定位方法,對區(qū)域中RP 建立概率分類模型,減小了定位誤差。
在復(fù)雜的定位區(qū)域中,上述的定位方法計算復(fù)雜度和定位誤差較高,故該文提出一種基于一對多支持向量機(OVRSVM)和多元高斯樸素貝葉斯模型(MVGNB)的概率加權(quán)融合方法(Probability Weighted Fusion Method Based On OVRSVM and MVGNB,WSGM)。該方法采用基于余弦相似度的改進K-Means 進行RP 聚類分區(qū),為減小信號異常點錯誤分區(qū),引入湯普森檢驗對物理坐標(biāo)進行校驗,剔除錯誤分區(qū)點。為了減小AP間信號的干擾,建立多元高斯貝葉斯模型的概率定位方法以減小AP 間信號干擾,但是單一的多元高斯的樸素貝葉斯模型精度難以達到期望精度,故加權(quán)融合一對多支持向量機的概率定位方法以提升定位精度,實現(xiàn)高精度、高穩(wěn)定的精細化室內(nèi)定位系統(tǒng)。
離線階段在目標(biāo)區(qū)域內(nèi)選取若干個參考點,采集該參考點位置的來自N個AP 的RSS、MAC 地址以及參考點實際坐標(biāo),并將其存入指紋庫中,指紋庫中包含APj,j=1,2,…,N和RPi,i=1,2,…,M以及每個AP 對應(yīng)的MACi,i=1,2,…,N,未采集到的數(shù)據(jù)記為-100dB,定義指紋庫為S={(x,y),mac,s},其中(x,y)i=(xi,yi)表示RPi處的坐標(biāo)位置,maci表示RPi處對應(yīng)AP的MAC 地址,si=[rssi,1,rssi,2,…,rssi,N]表示RPi處接收來自N個AP的接收信號強度。為減小計算量以及分區(qū)中AP 的數(shù)量,根據(jù)信號強度分布和物理連通性對目標(biāo)區(qū)域進分區(qū),劃分為K個子區(qū)域ck,k∈{1,2,…,K},分區(qū)指紋庫定義為Sk={(xk,yk),mack,sk}分區(qū)中坐標(biāo)標(biāo)簽定義為,表示在RPm處的位置標(biāo)簽在RPm處的信號強度為=,表示在第k個子區(qū)域中RPm處接收到來自N個AP 的RSS 數(shù)據(jù);待測點接收到的來自N個AP的RSS為st=[rss1,rss2,…,rssN]。
指紋數(shù)據(jù)庫由大量參考點組成,而目標(biāo)位置估計只依據(jù)其中部分參考點進行估計,為選取有效RP,根據(jù)RP信號分布情況以及物理坐標(biāo),采用改進K-Means 聚類算法將目標(biāo)區(qū)域劃分為多個子區(qū)域,將定位范圍縮小到每個子區(qū)域中。指紋庫中兩個參考點為si和sj,采用余弦相似度指紋數(shù)據(jù)和待測點進行距離度量:
若是RPi和RPj沒有相同的AP,則si和sj的相似度記為0。
根據(jù)聚類內(nèi)部RSS 相似度將RP 分為K類,記ck,k∈{1,2,…,K}為第k個類,其聚類準(zhǔn)則為
其中sk為ck的RSS均值,記為該類聚類中心,采用最大化類間相似度完成聚類。
在線階段,根據(jù)待測點st和指紋sj之間相似度,將st分類到相似度最高的類中,該類記為Qk,分類判據(jù)為
根據(jù)分類判據(jù)將待測點st劃分到Ck中,相似匹配縮小到更加精確的小區(qū)域中,進而提高定位精度,減小計算復(fù)雜度。
根據(jù)信號強度的分區(qū)中易出現(xiàn)物理異常點,該文根據(jù)標(biāo)準(zhǔn)湯普森理論[16]設(shè)定決策閾值τ,實現(xiàn)分區(qū)異常參考點的剔除,減小了異常點的定位結(jié)果的影響。計縱算坐定出標(biāo)義yk分 的中區(qū)均橫c值坐k內(nèi)標(biāo)為的xkR的,P標(biāo)均集準(zhǔn)值合差為坐為標(biāo)為,標(biāo),對準(zhǔn)c差k中為,的物理坐標(biāo)進行計算其決策值和為
式中Mk為分區(qū)ck中參考點數(shù)目,a是置信度,a越大,置信區(qū)間越寬,反之則越窄,服從t分布,可從t分布表查得,實現(xiàn)異常點的剔除。
根據(jù)對定位區(qū)域中AP 信號分析得,其信號強度s符合高斯分布,該文對處,接收來自Nk個AP 的信號以多元高斯概率分布進行建模,其多元高斯混合模型的概率密度函數(shù)定義為
其Mk中個sRk為S S在數(shù)分據(jù)區(qū),T ckk為中高接斯收模到型來元自素內(nèi)數(shù)N目k,個A為P的權(quán)重系數(shù),為多元高斯混合模型的參數(shù)布,的密度函數(shù)為,為均來值自是Nk,維協(xié)多方元差高為斯分的布高的斯第分t個混合元素,EM 算法是對多元高斯混合模型參數(shù)估計的行之有效的方法,子區(qū)域數(shù)據(jù)的對數(shù)似然函數(shù)為
多元高斯分布函數(shù)給出的是指紋數(shù)據(jù)的概率密度,根據(jù)貝葉斯準(zhǔn)則采用多元高斯分布函數(shù)擬合sk隸屬于的條件概率為
式中b為欄寬。在線定位階段,待測點為st=[rss1,rss2,…,rssN],根據(jù)聚類分區(qū)算法得出所屬的分區(qū),進而通過MVGNB 模型計算目標(biāo)屬于區(qū)域內(nèi)各個RP所屬的高斯模型的概率,子區(qū)域中RP數(shù)量為Mk,則后驗概率為
對st在i=1,2,…,Mk出的條件概率歸一化,得出輸出的后驗概率權(quán)重為
傳統(tǒng)的SVM 算法是一種二分類算法,不支持多分類問題,OVRSVM 多分類方法對于k(k>2)分類問題,把其中某一類作為一類,其余k-1 類視為一類,將k分類問題轉(zhuǎn)化為k個二分類問題,子區(qū)域中包含Mk個RP,故需要構(gòu)造Mk個SVM。將第i類數(shù)據(jù)記為正的,其余類別數(shù)據(jù)標(biāo)記為負的,但是正負樣本的不平衡易帶來總體效果較差。為了解決OVRSVM 中正負樣本不平衡的問題,使用兩個參數(shù)和分別加權(quán)正誤差和負誤差,第i個SVM求解過程為如下最優(yōu)化問題:
根據(jù)Platt提出的以Sigmod函數(shù)將SVM 模型的輸出映射到[0,1]內(nèi),得到OVRSVM 的后驗概率,即待測點st位于分區(qū)ck中處的概率為
其中Ak和Bk為參數(shù)值,通過求解參數(shù)集的最小負對數(shù)似然函數(shù)求得。
針對多元高斯的樸素貝葉斯模型和一對多支持支持向量機的各自不足之處,但是對定位坐標(biāo)lm,t和lo,t融合往往忽略了內(nèi)部的概率信息,該文提出一種基于概率加權(quán)的融合定位方法,根據(jù)兩種模型的輸出后驗概率和進行加權(quán)融合得出融合后驗概率為
其中λ1+λ2=1 且0 ≤λ1,λ2≤1,λ1和λ2為MVGNB和OVRSVM 的權(quán)重系數(shù),得出融合后待測點st的坐標(biāo)lt=(xt,yt)為
其中權(quán)重值λ1和λ2根據(jù)驗證集求得,通過最小化誤差函數(shù)進行求取
其中l(wèi)i為該分區(qū)驗證集中數(shù)據(jù)點的實際坐標(biāo),l1(si)和l2(si) 分別為 MVGNB 輸出坐標(biāo)lm,i和 OVRSVM輸出坐標(biāo)lo,i,Vk為驗證集中數(shù)據(jù)數(shù)目,進而得出最優(yōu)的權(quán)重值以實現(xiàn)位置坐標(biāo)融合。
實驗場景為江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院C 區(qū)一樓環(huán)形走廊中一段矩形區(qū)域,以該區(qū)域鄰邊作為x軸和y軸,該矩形走廊區(qū)域為2m×40m 的目標(biāo)區(qū)域,在線仿真階段,實驗選取MVGNB、OVRSVM、AdaBoost以及該文提出的WSGM算法對比分析,參數(shù)配置:t分布中置信度a=0.05,欄寬b=0.5,懲罰參數(shù)C=3.6,權(quán)重λ1和λ2根據(jù)最小化誤差損失函數(shù)求得。對AP在環(huán)境中信號分布分析、算法中RP聚類以及異常點效果分析,對四種算法定位精度以及采集網(wǎng)格大小進行對比分析,其算法聚類效果如圖1所示。
圖1 實驗場景聚類效果
基于指紋庫中RP的信號強度的余弦相似度完成聚類分區(qū),對矩形走廊區(qū)域中某AP 的信號分布進行分析,呈現(xiàn)高斯分布,但是也會出現(xiàn)一定的異常點,及出現(xiàn)概率較小的一些異常點,根據(jù)圖2 可知,OVRSVM 和WSGM 聚類后定位結(jié)果中90%的測試點定位誤差在1m 以內(nèi),而聚類前OVRSVM 和WSGM 的定位誤差在1m 以內(nèi)的只有20%和50%,定位效果較差。OVRSVM 和WSGM 算法聚類后最大定位誤差約為1.54m 左右,而聚類前定位誤差顯然均大于4m,定位結(jié)果波動較大,故加入聚類分區(qū)后,WSGM 算法能夠縮小測試點的定位區(qū)域,提高定位精度。
圖2 聚類分區(qū)前后定位精度對比
實際矩形走廊區(qū)域中信號的多徑效應(yīng)、電磁干擾會導(dǎo)致一些異常點的錯誤分區(qū),導(dǎo)致定位結(jié)果的較大波動,即由于信號強度的相似性聚類至同一分區(qū),但是物理坐標(biāo)并不在同一分區(qū)中,該文引入Thompson Tau理論完成對異常點的剔除,減小定位結(jié)果的跳變。根據(jù)MVGNB、OVRSVM、AdaBoost 以及WSGM 算法的異常點剔除前(Prior,P)和異常點剔除后(After,A)平均定位誤差進行對比,從表1可知,剔除聚類分區(qū)后的異常點,平均定位誤差得到有效的降低,平均定位誤差為0.4008m,相較于傳統(tǒng)算法提高27%以上。較好地解決由于信號聚類而帶來的錯誤的物理坐標(biāo)聚類問題,能夠彌補基于RSS 聚類分區(qū)的不足,解決物理坐標(biāo)的錯誤分區(qū),提高定位精度。
表1 異常點剔除前后的平均定位誤差/m
定位誤差選取誤差的箱型圖和累積誤差分布分析研究,對矩形走廊區(qū)域的200 組數(shù)據(jù)進行測試,實驗結(jié)果如圖3(a)和圖3(b)所示。從圖3(a)可知,該文提出的WSGM 算法相較于MVGNB、OVRSVM 和AdaBoost 算法具有更快的累計誤差速度,約97%的測試點誤差在1m以內(nèi),明顯定位精度高于其他三種算法。從圖3(b)可知,WSGM相較于其他三種定位算法,具有更低的誤差中位線,為0.3620m,AdaBoost也具有較低的誤差中位線,僅為0.3964m,但是誤差集中度較高,較差于WSGM算法。
在矩形走廊區(qū)域中以1m×1m 作為網(wǎng)格間距采集RP 來自不同AP 的信號強度,對4 種算法的網(wǎng)格間距以{1,2,3,4}進行實驗,分析網(wǎng)格間距對定位精度的影響,采用矩形走廊區(qū)域的200 組測試數(shù)據(jù)進行分析,實驗結(jié)果如如圖4 所示,可知1m×1m處定位精度最高,且隨著網(wǎng)格間距的增大,定位誤差隨之增大,相較于MVGNB、OVRSVM 和AdaBoost三種算法,該文提出的WSGM算法在四種網(wǎng)格間距下均有著較好的定位效果,進一步驗證WSGM算法的定位精度的提高。
圖4 不同網(wǎng)格間距的誤差對比
基于接收信號強度的加權(quán)概率融合的定位方法,采用余弦相似度進行改進K均值完成信號強度下的RP 聚類,采用湯普森檢驗理論完成對物理坐標(biāo)的校驗,剔除分區(qū)異常點以減小定位結(jié)果的波動,采用多元高斯的樸素貝葉斯模型以減小AP 間的信號干擾,融入一對多支持向量機概率定位方法以提高定位精度。實驗分析表明,該文提出的WSGM算法相較于傳統(tǒng)概率分類定位方法,定位精度、集中度顯著提升,構(gòu)建分區(qū)內(nèi)RP的概率分類模型,實現(xiàn)了對分區(qū)后的精細化定位,有效地提高了定位精度。但是一定在離線部分的數(shù)據(jù)更新仍然是論文未考慮的一部分方向,也是之后精細化定位中的研究方向。