陳銳志,錢 隆,牛曉光,徐詩豪,陳 亮,裘 超
1. 武漢大學(xué)測繪遙感信息工程國家重點實驗室,湖北 武漢 430079; 2. 武漢大學(xué)計算機(jī)學(xué)院,湖北 武漢 430072
人們有86.9%的時間是在室內(nèi)度過[1],80%的信息都與室內(nèi)位置關(guān)聯(lián)[2]。隨著城市化的不斷加速,室內(nèi)空間的面積總和飛速增加,高精度室內(nèi)定位技術(shù)對人們未來的生活起著至關(guān)重要的作用,是推動未來人工智能應(yīng)用的核心支撐之一。高精度室內(nèi)外無縫定位技術(shù)是支撐新型基礎(chǔ)設(shè)施建設(shè)和國家戰(zhàn)略需求的重要核心技術(shù)。我國北斗衛(wèi)星導(dǎo)航系統(tǒng)已于2020年7月31日實現(xiàn)全球覆蓋,正向著更泛在、更融合、更智能的綜合時空體系邁進(jìn)。綜合時空體系更泛在的目標(biāo)是融合其他非衛(wèi)星定位技術(shù),把北斗定位能力從室外拓展到室內(nèi),實現(xiàn)高精度的室內(nèi)外無縫定位。在開闊的室外環(huán)境,北斗已實現(xiàn)厘米級的高精度定位。因此,實現(xiàn)高精度的室內(nèi)定位技術(shù)已成為實現(xiàn)高精度室內(nèi)外無縫定位的主要挑戰(zhàn)?;谖恢玫姆?wù)(location based service,LBS)的大量需求與應(yīng)用已經(jīng)從室外轉(zhuǎn)向了室內(nèi)。因此,高精度室內(nèi)定位技術(shù)具有重要的社會價值和廣闊的應(yīng)用前景。
在市場需求和谷歌、蘋果和百度等國內(nèi)外互聯(lián)網(wǎng)巨頭的推動下,室內(nèi)高精度定位技術(shù)在“十三五”期間得到迅猛發(fā)展。這些技術(shù)中最具代表性的是谷歌推出的Wi-Fi RTT測距技術(shù)和蘋果推動的UWB定位技術(shù)[3]。此外,還有音頻定位技術(shù)、5G定位技術(shù)、藍(lán)牙測角技術(shù)和視覺定位技術(shù)等。
Wi-Fi RTT定位技術(shù)是由IEEE802.11協(xié)議工作組Task Group mc提出的基于測量終端到周圍基站距離的Wi-Fi通信協(xié)議的定位技術(shù)。該技術(shù)通過Wi-Fi終端與基站交互,利用定位信號的往返傳播,消除終端和基站的鐘差,實現(xiàn)高精度測距和1~2 m精度定位[4-6]。利用該技術(shù)定位時需要標(biāo)定和改正由系統(tǒng)硬件造成的終端-基站的系統(tǒng)測距偏差,目前市場上只有谷歌系列手機(jī)支持該功能。該技術(shù)與智能手機(jī)的內(nèi)置慣性傳感器融合,可以實現(xiàn)優(yōu)于1 m的定位精度。
UWB定位技術(shù)是蘋果手機(jī)支持的一種距離感知和定位技術(shù)[7]。小米[8]和三星[9]也在其手機(jī)上推廣這一技術(shù)。目前該技術(shù)在智能手機(jī)上只支持距離和方向感知,還沒有實現(xiàn)完善的定位系統(tǒng)。在理想室內(nèi)環(huán)境下,UWB具備10 cm測距精度和40 cm定位精度的能力[10]。其定位模式包括雙向測距(two way ranging,TWR)和到達(dá)時間差(time difference of arrival,TDoA)兩種。TWR定位模式與Wi-Fi RTT定位模式相似,其優(yōu)點是不需要時間同步,缺點是用戶數(shù)量受限制。TDoA定位模式可以克服用戶數(shù)量受限的缺點,但其代價是基站間需要高精度時間同步(亞納秒級)。TDoA的定位模式可細(xì)分為下行TDoA和上行TDoA。下行TDoA采用廣播模式,由終端定位,上行TDoA由終端發(fā)射信號,服務(wù)器端定位,其優(yōu)點是用戶終端功耗比下行TDoA模式更低,適用于標(biāo)簽等位置跟蹤設(shè)備。UWB是目前成熟度最高的高精度定位技術(shù)。
音頻定位技術(shù)是一種通過測量聲波傳播時間來計算信號發(fā)射端和接收端之間距離的定位技術(shù),其工作模式與全球衛(wèi)星導(dǎo)航系統(tǒng)(GNSS)定位相同,都是廣播模式,具有成本低、精度高、兼容性好等特點,為基于消費級智能手機(jī)的室內(nèi)定位提供了新的可能。音頻定位技術(shù)可利用智能手機(jī)的內(nèi)置麥克風(fēng),在無須改變現(xiàn)有手機(jī)的硬件的前提下,實現(xiàn)高精度定位。該技術(shù)具有精確測距、精準(zhǔn)定位和廣域覆蓋的優(yōu)點,具備12 cm的測距精度、50 cm的定位精度和50 m的信號覆蓋等能力[11-14]。
5G技術(shù)引入的大規(guī)模天線陣列、超密集組網(wǎng)等創(chuàng)新技術(shù)引發(fā)了大量基于5G信號的定位研究,主要包括基于上行信號的測距測角定位、基于接收信號強(qiáng)度的指紋定位和基于5G專用定位信號定位等研究方向。現(xiàn)有的5G定位研究以基于毫米波頻段為主,缺乏基于已廣泛商用部署的sub-6 GHz頻段的相關(guān)研究。此外,目前能夠取得米級到亞米級定位精度的5G定位研究大多限于仿真或者室外條件,實驗室環(huán)境下5G技術(shù)可支撐亞米級的測距精度和1~2 m的定位精度[15]。而對于實際室內(nèi)場景下的5G定位研究仍然非常有限,基于實際商用5G信號可大規(guī)模應(yīng)用的5G室內(nèi)定位方法依舊缺乏。
藍(lán)牙測角技術(shù)是通過天線陣列測量信號到達(dá)或發(fā)射方向的定位技術(shù)。藍(lán)牙5.1協(xié)議引入了高精度測角功能,使得該技術(shù)成為一項可支持大眾手機(jī)和低功耗的定位技術(shù),可廣泛用于手機(jī)導(dǎo)航、資產(chǎn)跟蹤和智慧醫(yī)療等領(lǐng)域。藍(lán)牙測角技術(shù)可以用于2D或3D定位,其定位精度取決天線陣列的安裝高度,從分米級到米級。當(dāng)天線陣列安裝高度低時,其定位精度高,但信號覆蓋范圍小。因此,藍(lán)牙測角技術(shù)不適合地下停車場等矮層高環(huán)境??朔嗦窂礁蓴_以及傳統(tǒng)算法存在的計算復(fù)雜度較高等問題是其面臨的挑戰(zhàn)。
視覺定位在自動駕駛和室內(nèi)機(jī)器人等算力強(qiáng)大的平臺上已經(jīng)得到廣泛推廣。同時定位與地圖構(gòu)建(simultaneous localization and mapping,SLAM)技術(shù)是高精度視覺定位的主流技術(shù),但由于對定位平臺的算力要求很高,在智能手機(jī)和可穿戴設(shè)備等移動平臺上還難以實現(xiàn)。基于單張照片的智能手機(jī)視覺定位技術(shù)也能夠?qū)崿F(xiàn)0.3 m的定位精度。視覺定位技術(shù)對定位環(huán)境的光照條件要求高,在夜間或光照不足的環(huán)境下難以應(yīng)用。此外,視覺定位技術(shù)對定位終端的算力要求高,巨大的計算量很難保證低功耗。
高精度室內(nèi)定位市場目前處于百花齊放、百家爭鳴的狀態(tài)。盡管在蘋果支持下,UWB技術(shù)在這場激烈的競爭中擁有一定的優(yōu)勢,但5G、音頻和藍(lán)牙測角等可支持所有大眾手機(jī)的技術(shù)會讓這場競爭更加精彩。室內(nèi)定位技術(shù)目前主要面臨定位精度低、成本高、信號覆蓋范圍小、定位系統(tǒng)泛化能力差等難題。多源融合定位是這些問題的主要解決方案之一,特別是融合低成本慣性傳感器與上述高精度定位技術(shù),形成低成本、高精度和廣覆蓋的解決方案。慣性傳感器是多源融合技術(shù)的核心定位源,對智能手機(jī)而言,這是一種無處不在、無時不有、成本最低、功耗最低和數(shù)據(jù)輸出頻率最高的定位源。其優(yōu)勢在多源融合方案里不言而喻。但由于受漂移誤差影響,常規(guī)慣導(dǎo)積分會帶來累積誤差的飆升,因此,基于步子探測(step detection)的PDR方法在行人導(dǎo)航定位中廣泛采納。PDR利用分析行人走路的動態(tài)信號特征計算步數(shù),再利用步行方向遞推行人的位置,這樣抑制積分誤差累積[16]。但是,由于用戶手機(jī)握持姿態(tài)的復(fù)雜性和手機(jī)慣性傳感器硬件的差異性,常規(guī)PDR在定位精度、手機(jī)泛化能力和多握持姿態(tài)支撐等方面有很多不足。
本文提出的基于數(shù)據(jù)驅(qū)動的PDR方法是一種基于深度學(xué)習(xí)的室內(nèi)定位新方法,該方法能夠從大型數(shù)據(jù)集中提取高級特征表示(速度矢量)并且不依賴于幾何積分理論[17-19]。通過采集大量行人行走的慣性傳感器數(shù)據(jù)與真實軌跡并制作成神經(jīng)網(wǎng)絡(luò)的輸入特征與標(biāo)簽,訓(xùn)練出一個擬合行人行走步態(tài)特征的網(wǎng)絡(luò)模型。該模型以慣性傳感器數(shù)據(jù)作為輸入,回歸出行人的速度增量,再通過積分推導(dǎo)出行人的運動軌跡。相比于傳統(tǒng)慣性導(dǎo)航算法和傳統(tǒng)PDR算法,基于數(shù)據(jù)驅(qū)動的PDR解決了雙積分問題,抑制了低廉慣性傳感器導(dǎo)致的誤差飛速累積的問題,同時釋放了行走時的各種約束。此外,通過將誤差參數(shù)添加至神經(jīng)網(wǎng)絡(luò)框架并進(jìn)行訓(xùn)練,可以預(yù)測運動變換及其方差,從而推斷預(yù)測結(jié)果的不確定性,進(jìn)而為后續(xù)的融合算法提供了不同預(yù)測段的置信度指標(biāo)。最后,通過結(jié)合不確定性和地磁穩(wěn)定性檢測算法,對神經(jīng)網(wǎng)絡(luò)PDR進(jìn)行航向校正,得到更為精準(zhǔn)的定位軌跡。
基于數(shù)據(jù)驅(qū)動的PDR與高精度定位技術(shù)通過擴(kuò)展卡爾曼濾波融合,實現(xiàn)一種數(shù)據(jù)與模型雙驅(qū)動的多源融合新范式。
如圖1所示,基于數(shù)-模結(jié)合的多源融合定位架構(gòu)涵蓋數(shù)字部分與模型部分。該架構(gòu)用于用戶終端定位。數(shù)字部分的核心內(nèi)容是一個基于深度學(xué)習(xí)的PDR神經(jīng)網(wǎng)絡(luò),而模型部分的主要內(nèi)容是一個耦合PDR神經(jīng)網(wǎng)絡(luò)和高精度音頻測距的拓展卡爾曼濾波器。
圖1 數(shù)模驅(qū)動多源融合定位架構(gòu)
(1) 數(shù)據(jù)驅(qū)動部分。借助智能手機(jī)或標(biāo)簽內(nèi)置的加速度計與陀螺儀的數(shù)據(jù)估計終端移動速度v=[vxvyvz]T。這部分將由一種基于深度學(xué)習(xí)的數(shù)據(jù)驅(qū)動方法實現(xiàn)。
(2) 模型驅(qū)動部分。將速度矢量與基于聲波的精確測距結(jié)果相結(jié)合,利用擴(kuò)展卡爾曼濾波估計用戶的位置、航向與速度。
由于慣性傳感器具有功耗低和數(shù)據(jù)更新頻率高的特點,在定位智能手機(jī)和可穿戴設(shè)備方面應(yīng)用廣泛。然而,低成本慣性傳感器(加速度計、陀螺儀和磁力計等)的測量結(jié)果容易受到漂移誤差的影響,如當(dāng)加速度直接被二次積分以計算位移時,誤差幾乎呈幾何級數(shù)增長。以慣性傳感器的測量值作為輸入,筆者采用了基于深度學(xué)習(xí)的方法估計行人的運動軌跡[20-22]。這是一種數(shù)據(jù)驅(qū)動的PDR方法,它與使用步子探測的模型驅(qū)動方法全然不同[16]。
PDR依靠慣性傳感器對行人的位置軌跡進(jìn)行推算跟蹤。傳統(tǒng)PDR主要使用步長模型公式估算步長、陀螺儀和磁力計估算方向,然后推算每一步的位置。由于步長模型需要根據(jù)行人特征進(jìn)行參數(shù)調(diào)整,而且方向估算需要限制手機(jī)的拿持姿態(tài),這導(dǎo)致傳統(tǒng)PDR無法在通用場景下使用。如圖2所示,數(shù)據(jù)驅(qū)動PDR基于數(shù)學(xué)推斷將概率神經(jīng)網(wǎng)絡(luò)覆寫為不確定性神經(jīng)網(wǎng)絡(luò)[23],使用經(jīng)過預(yù)處理的海量慣性傳感器數(shù)據(jù)與真實軌跡,訓(xùn)練出一個適應(yīng)不同姿態(tài)、不同行人的神經(jīng)網(wǎng)絡(luò)模型。該模型由慣性傳感器數(shù)據(jù)驅(qū)動,輸出相對位置和不確定性。由于PDR存在航向上的累積誤差,通過使用磁場穩(wěn)定性檢測算法,結(jié)合神經(jīng)網(wǎng)絡(luò)輸出的不確定性,在適當(dāng)?shù)臅r候進(jìn)行自動校正。
圖2 數(shù)據(jù)驅(qū)動PDR結(jié)構(gòu)
在將慣性傳感器數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)之前,需要對數(shù)據(jù)進(jìn)行預(yù)處理以降低數(shù)據(jù)的復(fù)雜度,以便網(wǎng)絡(luò)更好擬合行人行走模型。通過9軸傳感器數(shù)據(jù),使用文獻(xiàn)[24]提出的基于梯度下降的算法解算出姿態(tài)四元數(shù)后,利用姿態(tài)四元數(shù)將加速度和角速度從傳感器坐標(biāo)系轉(zhuǎn)換到導(dǎo)航坐標(biāo)系下。傳感器坐標(biāo)系下的向量aIMU可以通過式(1)轉(zhuǎn)換為導(dǎo)航坐標(biāo)系下的aINS
aINS=q×aIMU×q-
(1)
式中,q-表示四元數(shù)的共軛。
由于每條運動軌跡的初始坐標(biāo)系都不相同,而大部分實際定位應(yīng)用場景需要的是絕對的全球坐標(biāo)。因此,需要找到每個序列導(dǎo)航坐標(biāo)系和全球坐標(biāo)系的旋轉(zhuǎn)關(guān)系。通過四元數(shù)和姿態(tài)角,可以計算出導(dǎo)航坐標(biāo)系到全球坐標(biāo)系的旋轉(zhuǎn)關(guān)系。
四元數(shù)僅能用于對向量進(jìn)行旋轉(zhuǎn),而不能計算自身旋轉(zhuǎn)的角度,因此需要將其轉(zhuǎn)換為歐拉角。手機(jī)姿態(tài)角的定義的順序是〈z,x,y〉,即航向角、俯仰角和橫滾角。因此按這個順序把四元數(shù)轉(zhuǎn)變成歐拉角。導(dǎo)航坐標(biāo)系和全球坐標(biāo)系的Z軸是一致的,只存在水平面上Y軸的差別。因此取歐拉角與姿態(tài)角的航向角差值,將運動軌跡從導(dǎo)航坐標(biāo)系轉(zhuǎn)換到全球坐標(biāo)系。
傳統(tǒng)PDR算法基于陀螺儀和加速度計數(shù)據(jù)進(jìn)行二次積分得到位移量,存在較為嚴(yán)重的誤差累積問題,本文采用輕量級深度神經(jīng)網(wǎng)絡(luò)解決傳統(tǒng)慣性導(dǎo)航的誤差無限累積問題,利用ResNet18殘差神經(jīng)網(wǎng)絡(luò)框架學(xué)習(xí)慣性傳感器數(shù)據(jù)慣性跟蹤[20-22]。
傳統(tǒng)慣性導(dǎo)航系統(tǒng)的物理模型基于牛頓機(jī)制,低成本的慣性傳感器有較高的噪聲,而且航跡推導(dǎo)具有極強(qiáng)的連續(xù)性,因而在航跡推算過程中誤差會飛速累積。建立在估計步長和步長方向上的模型(如PDR)包含隱式運動模型,會因?qū)ο蟮牟叫辛?xí)慣或使用環(huán)境的改變而失效(例如坐下)??傊?,基于零速更新(zero velocity update,ZUPT)的慣性導(dǎo)航和基于步階的PDR類導(dǎo)航都會受到運動動力學(xué)和傳感器連接假設(shè)的限制,而深度學(xué)習(xí)方法能夠根據(jù)行人步行的周期性質(zhì)提取高級特征表示(速度矢量)并且不依賴于幾何理論。同時,基于ResNet18架構(gòu)的深度學(xué)習(xí)框架在一定程度上降低了計算復(fù)雜度,為部署至智能終端提供可能性。
本文采用滑動窗口的方法,提高神經(jīng)網(wǎng)絡(luò)預(yù)測的輸出率,通過使用固定大小的滑動窗口,慣性傳感器數(shù)據(jù)將被分為獨立的序列。序列的窗口大小n為200幀(1 s),滑動窗口步長為10幀。速度矢量由每個序列的深度神經(jīng)網(wǎng)絡(luò)預(yù)測,并通過合并鏈接模塊生成位置,當(dāng)前位置更新為之前的200幀。利用重疊窗口進(jìn)行預(yù)測更新,輸出頻率將提升至20 Hz,再通過低通濾波器進(jìn)一步處理速度矢量得出的位置,以平滑重建預(yù)測的軌跡。
本文采用公開標(biāo)準(zhǔn)數(shù)據(jù)集及自采數(shù)據(jù)集作為訓(xùn)練集和測試集,在訓(xùn)練階段隨機(jī)旋轉(zhuǎn)每個窗口的特征與標(biāo)簽,增強(qiáng)數(shù)據(jù)的航向無關(guān)性。訓(xùn)練目標(biāo)為最小化數(shù)據(jù)集提供的估計值和真實值之間的均方誤差,通過ADAM優(yōu)化器訓(xùn)練得到最佳參數(shù),學(xué)習(xí)率可定為1e-5,批次大小定為256。在GPU上訓(xùn)練完畢之后,能夠直接在本地終端和移動設(shè)備上應(yīng)用模型推算行人航跡。
深度神經(jīng)網(wǎng)絡(luò)導(dǎo)航一般通過預(yù)估值與真實值的均方誤差進(jìn)行評估,然而在實際部署時無法獲得真值軌跡,導(dǎo)致無法評估網(wǎng)絡(luò)預(yù)測的準(zhǔn)確度(即使該次預(yù)測偏差很大)。因此本文研究了深度學(xué)習(xí)慣性導(dǎo)航的不確定性,該不確定性表示深度神經(jīng)網(wǎng)絡(luò)模型輸出的置信度,不確定性估計可以量化信任模型預(yù)測的程度。通過將誤差參數(shù)添加至神經(jīng)網(wǎng)絡(luò)框架并進(jìn)行訓(xùn)練,可以預(yù)測運動變換及其方差,從而推斷預(yù)測結(jié)果的不確定性,進(jìn)而為后續(xù)的融合算法提供不同預(yù)測段的置信度指標(biāo)。將殘差網(wǎng)絡(luò)航跡推算框架拓展至貝葉斯模型,并基于數(shù)學(xué)推斷將概率網(wǎng)絡(luò)覆寫為不確定性網(wǎng)絡(luò),從而以無監(jiān)督的方式快速估計慣性導(dǎo)航的不確定性。
網(wǎng)絡(luò)預(yù)測的總不確定性被定義為σtotal=varp(y|x)(y),并根據(jù)不確定性來源被分為數(shù)據(jù)不確定性σdata和模型不確定性σmodel,數(shù)據(jù)不確定性表示網(wǎng)絡(luò)對于輸入數(shù)據(jù)的抗噪性能,模型不確定度表示網(wǎng)絡(luò)對于預(yù)測的置信程度。
不確定估計方案基于貝葉斯置信網(wǎng)絡(luò),借助期望傳播(expectation propagation,EP)框架,利用假設(shè)密度濾波(assumed density filtering,ADF)方法經(jīng)由數(shù)學(xué)推理對ResNet18通用的網(wǎng)絡(luò)層進(jìn)行了覆寫,不確定性網(wǎng)絡(luò)層定義如下。
定義1:對于任一網(wǎng)絡(luò)層z(i)=f(i)(z(i-1);θ(i)),其不確定性傳播層基于式(2)近似
(2)
不確定性網(wǎng)絡(luò)使初始化為1e-3量級的噪聲方差能夠在網(wǎng)絡(luò)中向前傳播,概率化深度模型的網(wǎng)絡(luò)層,最終網(wǎng)絡(luò)將得到均值及方差。對于單次傳播,均值μ代表網(wǎng)絡(luò)預(yù)測值,方差v代表初始噪聲前向傳播的最終輸出,即為數(shù)據(jù)不確定性。
對于模型不確定性,網(wǎng)絡(luò)通過蒙特卡洛采樣輸出期望及方差,固定激活層ReLU后的dropout層為training模式,參數(shù)將進(jìn)行隨機(jī)丟棄。初始化噪聲方差,與測試數(shù)據(jù)一起進(jìn)行傳播,得到若干組采樣預(yù)測值μ及對應(yīng)方差υ。通過定義2評估網(wǎng)絡(luò)對于輸出的置信度(即模型不確定性)。
定義2:網(wǎng)絡(luò)經(jīng)過若干次如定義1的傳播和蒙特卡洛采樣,可得若干組預(yù)測值及方差,記為μi、υi,模型不確定度計算見式(3),其中var代表方差計算。
σmodel=var(μi)
(3)
經(jīng)由蒙特卡洛采樣,數(shù)據(jù)不確定性可表示為若干次采樣預(yù)測值的均值,進(jìn)而網(wǎng)絡(luò)的總不確定度σtotal計算如下,其中mean表示均值計算
σdata=mean(υi)
(4)
σtotal=σdata+σmodel
(5)
直觀地,數(shù)據(jù)不確定性即為噪聲在網(wǎng)絡(luò)中的傳播結(jié)果,且在網(wǎng)絡(luò)層中與輸入數(shù)據(jù)互相影響。模型不確定度在丟棄參數(shù)的情況下可視為對網(wǎng)絡(luò)預(yù)測穩(wěn)定性的測試。網(wǎng)絡(luò)總不確定性的計算流程如圖3所示,采用不確定性網(wǎng)絡(luò)框架,避免了貝葉斯網(wǎng)絡(luò)的計算繁雜性,并可在不影響網(wǎng)絡(luò)結(jié)構(gòu)及輸出且無監(jiān)督的情況下給定網(wǎng)絡(luò)預(yù)測的置信度指標(biāo),從而為后續(xù)融合算法提供參考。
圖3 不確定性估計的計算流程
由于神經(jīng)網(wǎng)絡(luò)預(yù)測的軌跡存在航向上的累積誤差,并且該誤差無法通過模型消除,因此需要結(jié)合地磁信息校正軌跡。磁場信息中的航向角在直行時與身體方向有一定相關(guān)性。航向角與時間無關(guān),不受累計漂移的影響,它是一個絕對量,可以用來校正PDR軌跡。為了獲取穩(wěn)定的航向角信息,需要設(shè)計一個磁場穩(wěn)定性檢測算法篩選出穩(wěn)定可用的航向角。而神經(jīng)網(wǎng)絡(luò)輸出的不確定性則用于篩選出可用的行人身體方向。
同時,磁場強(qiáng)度也可以反映磁環(huán)境的穩(wěn)定性。將磁場強(qiáng)度的滑動標(biāo)準(zhǔn)差std作為確定磁場穩(wěn)定性的條件之一?;瑒哟翱诘拇笮≡O(shè)置為200幀(1 s)。將磁場的穩(wěn)定性定義為式(6)
(6)
通過直行序列,可以得到行人的身體方向與全球坐標(biāo)系的水平旋轉(zhuǎn)關(guān)系。而航向角又表示慣性傳感器坐標(biāo)系與全球坐標(biāo)系的水平旋轉(zhuǎn)關(guān)系。由于行走時人體處于一個周期運動狀態(tài),因此直行航向角幾乎都圍繞一個值波動。直接取直行航向角的平均值,發(fā)現(xiàn)它能很好地反映直行時的慣性傳感器水平朝向。用各直行序列平均航向角和平均神經(jīng)網(wǎng)絡(luò)PDR方向的差值代表磁場信息與身體方向的關(guān)聯(lián)量ci。
選取穩(wěn)定的磁場環(huán)境和低不確定性的直行序列上的關(guān)聯(lián)量作為錨點ca。如果不改變拿持手機(jī)的姿勢,每個直行序列關(guān)聯(lián)量應(yīng)該只會在小范圍內(nèi)波動。當(dāng)波動大于一定閾值時,可以認(rèn)定手機(jī)與人之間的相對水平姿態(tài)關(guān)系發(fā)生了較大改變,此時需要更新ca。之后利用ca計算直行序列的校正角φi
φi=sti×(ca-ci)
(7)
式中,sti為磁場的平均穩(wěn)定性。最后通過將神經(jīng)網(wǎng)絡(luò)PDR預(yù)測出的軌跡旋轉(zhuǎn)該校正角φi,即可實現(xiàn)對軌跡的自適應(yīng)校正。
與存在諸多限制的單數(shù)據(jù)源定位方法相比,將不同維度和屬性的數(shù)據(jù)緊耦互補通常能實現(xiàn)更佳的定位精度和穩(wěn)定度?;跀?shù)據(jù)驅(qū)動的PDR算法已在短時間內(nèi)給出了細(xì)粒度的相對動態(tài)信息,因而僅需輔以全局觀測信息,便可借助數(shù)學(xué)表達(dá)式構(gòu)建模型,提供絕對坐標(biāo)系下的位置服務(wù)。由于音頻TDoA是一種高精度、高隱私、高安全的定位技術(shù),且其具有兼容大眾智能手機(jī)與支持無限并發(fā)用戶數(shù)量等特點[11],因此本文以PDR和TDoA數(shù)據(jù)為例,給出了一類泛用的基于EKF框架的融合定位模型。
將數(shù)據(jù)驅(qū)動PDR采用的坐標(biāo)系稱為本地坐標(biāo)系L系(xL,yL,αL),并選取東北天坐標(biāo)系作為絕對坐標(biāo)系G系(eG,nG,αG),其中α表示航向,則系統(tǒng)待估狀態(tài)向量可描述為
(8)
式中,(ek,nk)為k時刻下目標(biāo)在G系下的東/北坐標(biāo);θk為L系相對于G系呈右手系的航向夾角,包含定位服務(wù)啟動瞬間兩坐標(biāo)系的初始偏角及傳感器的累計誤差偏角。通常,室內(nèi)行人的手機(jī)握持平均高度為1.2 m,且高程變化相對于平面坐標(biāo)變化對結(jié)果產(chǎn)生的影響更弱,因而系統(tǒng)狀態(tài)僅考慮了二維平面坐標(biāo)。在PDR數(shù)據(jù)的驅(qū)動下,系統(tǒng)的狀態(tài)轉(zhuǎn)移為
Wk
(9)
式中,Wk為均值為0、方差為Qk的過程噪聲;Δxk與Δyk分別為PDR于k-1歷元至k歷元間在本地坐標(biāo)系下的橫縱方向輸出位移增量。
參照文獻(xiàn)[12],本文的音頻TDoA估計采用了時分多址與頻分多址策略,形成了音頻Chirp信號網(wǎng)絡(luò)。每經(jīng)過約1 s的時間間隔,終端可解算出包含至少2個TDoA在內(nèi)的觀測數(shù)據(jù),通過幾何關(guān)系,觀測方程可寫為
(10)
(11)
式中,Kk為Kalman增益;Pk為誤差協(xié)方差;Zk為當(dāng)前歷元的真實觀測。
由于音頻TDoA觀測數(shù)據(jù)更新率僅為1 Hz,而PDR驅(qū)動的數(shù)據(jù)更新率可達(dá)20 Hz,因此只在TDoA更新的歷元執(zhí)行量測更新,其余歷元只需執(zhí)行狀態(tài)更新。
模型初始化對于濾波而言至關(guān)重要,它影響到算法能否快速收斂及后續(xù)定位的準(zhǔn)確性。本文將觀測信息與簡易粒子濾波器相結(jié)合計算終端的平面坐標(biāo)初值。觀測信息中蘊含的坐標(biāo)數(shù)據(jù)通常給出了終端可能所處的區(qū)域范圍,在該范圍內(nèi)均勻分布一定數(shù)量的粒子,通過重采樣操作,能夠以較少的迭代次數(shù)估計較高精度的初值。給定粒子屬性[eGnG]T,則粒子集被初始化為
(12)
式中,emin、emax、nmin,nmax為初始觀測信息劃定的區(qū)域邊界;l=1,2,…,N,N為粒子數(shù)目。音頻TDoA估計誤差整體服從正態(tài)分布[11],因此根據(jù)預(yù)測殘差ε,每個粒子的權(quán)重可寫為
(13)
(14)
(15)
本節(jié)首先描述數(shù)據(jù)驅(qū)動的PDR數(shù)據(jù)集構(gòu)建和其定位性能試驗,然后在兩個測試場景下分別設(shè)計了兩組試驗評價融合定位方法。其中一個小范圍場景如圖4(a)所示,該測試場景是武漢群光中心寫字樓里的一間辦公室,試驗區(qū)域約為147 m2,部署4個音頻基站;而另外一個大范圍場景是德清國際展覽中心1號展廳,試驗區(qū)域約為4688 m2,部署32個音頻基站?;鹃g通過433 MHz無線模塊進(jìn)行同步。試驗用手機(jī)型號為華為Nova 7(HarmonyOS 2)和小米Mi 10 Ultra(Android 10),手機(jī)搭載的運動傳感器(加速度計、陀螺儀)采樣率為200 Hz,音頻信號的采樣率為48 kHz。在小范圍場景試驗中,靜態(tài)試驗的參考真值由SNDWAY SW-80G激光測距儀測量提供;而在大范圍場景試驗中,軌跡標(biāo)志點的參考真值由Leica Nova TS60全站儀測量提供。在這兩個測試場景下,動態(tài)試驗均為試驗人員握持試驗手機(jī)沿設(shè)定的軌跡移動,本文方法的性能通過比較融合定位輸出的位置與真實軌跡的吻合程度來衡量。此外,本文將室內(nèi)定位市場上常用的UWB技術(shù)引入小范圍測試場景,用于對比在沒有數(shù)據(jù)驅(qū)動的背景下,即僅使用純觀測條件下,兩種技術(shù)采用相同軌跡的定位效果。
圖4 試驗場景和結(jié)果
數(shù)據(jù)集是數(shù)據(jù)驅(qū)動行人航跡推算的根本基石,本文通過高精度光學(xué)運動跟蹤系統(tǒng)和激光雷達(dá)SLAM系統(tǒng)采集運動序列的真實速度與方向,利用智能手機(jī)采集IMU數(shù)據(jù),對兩者進(jìn)行時間同步后用于訓(xùn)練行人航跡推算模型。為了反映日常使用中的各種情況,本文征集10名志愿者采集了包括平端、置于口袋(口袋較為緊,手機(jī)緊貼大腿)、置于手提包及置于手推車等不同手機(jī)姿態(tài)的IMU數(shù)據(jù),并包括停止、緩走、正常行走及快走等運動狀態(tài)。數(shù)據(jù)集總行程達(dá)144 km,總時間為41 h。在訓(xùn)練階段,混合部分公開數(shù)據(jù)集一同訓(xùn)練。
為了驗證數(shù)據(jù)驅(qū)動PDR的定位性能,本文采集了室內(nèi)典型運動場景下的數(shù)據(jù),然后用數(shù)據(jù)驅(qū)動PDR生成相應(yīng)的運動軌跡。圖5包含3種典型軌跡,分別為手機(jī)放褲兜中多轉(zhuǎn)彎行走、大范圍平端行走及直線180°轉(zhuǎn)彎的平端來回行走。同時與現(xiàn)有的兩種基于數(shù)據(jù)驅(qū)動的模型進(jìn)行比較。如圖5所示,IONet和RONIN存在航向漂移的問題,航向誤差會導(dǎo)致定位誤差越來越大。而本文提出的數(shù)據(jù)驅(qū)動PDR通過對不同姿態(tài)分別訓(xùn)練,并利用地磁信息對軌跡進(jìn)行相對航向校正,在不同手機(jī)姿態(tài)下都能保持較高的定位精度。
本試驗評價了數(shù)模融合定位模型的初始化性能,在大范圍測試場景中分別選取向東、向南和向西這3個方向的直線軌跡,給定默認(rèn)初始化航向角為90°,試驗當(dāng)本地坐標(biāo)系與絕對坐標(biāo)系之間的初始偏角分別為0°、90°和180°時(兩坐標(biāo)系初始偏角范圍對稱,偏角-90°與90°情況類似),本文模型的收斂性能。如圖6(a)所示,藍(lán)色圓圈實線為PDR模型更新時刻的軌跡結(jié)果,紅色加號實線為TDoA觀測更新時刻的軌跡結(jié)果,當(dāng)初始偏角為0°時,此時初始化航向角即為絕對坐標(biāo)系下的真實航向角,在開始移動后的一個觀測歷元內(nèi)收斂。如圖6(b)所示,當(dāng)初始偏角為90°時,在開始移動后的4個觀測歷元內(nèi)收斂。如圖6(c)所示,當(dāng)初始偏角為180°時,此時初始化航向角與真實航向角偏差最大,在開始移動后的6個觀測歷元內(nèi)收斂。通過這組試驗,本文模型均能在步行約5 m(6 s)內(nèi),實現(xiàn)航向估計狀態(tài)量的收斂。
圖6 定位模型初始化試驗軌跡結(jié)果
4.4.1 靜態(tài)定位試驗
本節(jié)在小范圍試驗場景下對融合定位方法的靜態(tài)精度進(jìn)行評估,如圖4(c)所示,在該試驗區(qū)域中設(shè)置15個靜態(tài)試驗點,使用SNDWAY SW-80G激光測距儀量測的位置作為真值基準(zhǔn),試驗人員使用手機(jī)分別在試驗點上采集約30 s的數(shù)據(jù),圖中藍(lán)色加號標(biāo)記為各試驗點位上融合定位結(jié)果。融合定位方法誤差統(tǒng)計結(jié)果見表1。
表1 定位誤差統(tǒng)計結(jié)果
4.4.2 動態(tài)定位試驗
本節(jié)試驗對融合定位方法的動態(tài)精度進(jìn)行評估,并在小范圍場景下對單一UWB動態(tài)定位,單一音頻定位和本文數(shù)模驅(qū)動融合定位結(jié)果進(jìn)行對比。試驗人員自然握持手機(jī),沿預(yù)先設(shè)置的軌跡勻速行走并記錄實時PDR模型輸出數(shù)據(jù)和音頻TDOA數(shù)據(jù)。對于UWB對比試驗,本文采用QORVO公司的DWM1001模塊作為UWB信號收發(fā)終端,根據(jù)官方提供的雙向測距例程[26],由試驗人員握持定位標(biāo)簽,沿同樣預(yù)先設(shè)置的軌跡勻速行走并記錄實時UWB距離觀測值。
圖4給出了動態(tài)定位試驗軌跡結(jié)果,紅色五角星代表音頻定位基站,紅色虛線為參考軌跡真值,黃色虛線為動態(tài)定位試驗軌跡,黃色加號標(biāo)記為動態(tài)定位輸出結(jié)果。圖4(a)和(b)分別為單一高精度定位源UWB和音頻在更新頻率為1 Hz下的定位輸出結(jié)果,由圖可以看出,在不使用慣性傳感器數(shù)據(jù)的條件下,音頻能夠?qū)崿F(xiàn)與UWB類似的定位精度。但是單一高精度定位源的動態(tài)軌跡雖然總體上能夠同參考軌跡保持吻合,但是受更新頻率和實際觀測條件的限制,在轉(zhuǎn)彎和定位信號覆蓋較差的區(qū)域,位置估計容易產(chǎn)生較大的偏差。圖4(c)展示了數(shù)模驅(qū)動融合定位的動態(tài)軌跡,由圖可以看出,在保持單一高精度定位源定位精度的基礎(chǔ)上,對上述動態(tài)定位精度較差的區(qū)域?qū)崿F(xiàn)了提升。圖4(d)則展示了在較為空曠的室內(nèi)場景下的定位效果。動態(tài)定位誤差通過將試驗軌跡切割為多段直線軌跡,然后分別統(tǒng)計各歷元定位結(jié)果同對應(yīng)參考軌跡的誤差來評估定位精度。動態(tài)定位試驗的累積分布函數(shù)(cumulative distribution function,CDF)結(jié)果如圖7(a)所示,統(tǒng)計數(shù)值結(jié)果見表1。由統(tǒng)計結(jié)果可以看出,本文所構(gòu)建的數(shù)模融合定位系統(tǒng)可同時兼容靜態(tài)與動態(tài),小范圍與大范圍場景,實現(xiàn)了RMSE優(yōu)于0.4 m以及更新頻率高于20 Hz的總體定位性能。由于大范圍場景下的音頻信號解算過程更為復(fù)雜且多變,因而相對于小范圍場景的定位精度有所下降,但仍然保持著小于1 m的誤差水平。此外,圖7(b)給出了模型參數(shù)動態(tài)調(diào)整的結(jié)果,由圖中可以看出本地坐標(biāo)系與絕對坐標(biāo)系航向夾角估計在經(jīng)歷短暫的初始化過程后,以±3°的平均誤差抑制了航向角的發(fā)散。數(shù)模驅(qū)動多源融合定位模型在保持高精度定位源定位精度優(yōu)勢的基礎(chǔ)上,極大提升了定位更新頻率,使得系統(tǒng)可用性得到了拓展。
圖7 數(shù)模融合定位誤差CDF及航向夾角估計θ
本文提出了一種基于數(shù)據(jù)與模型雙驅(qū)動的室內(nèi)多源融合定位新方法。在數(shù)據(jù)驅(qū)動部分,構(gòu)建一種基于深度學(xué)習(xí)的PDR神經(jīng)網(wǎng)絡(luò),訓(xùn)練加速度計和陀螺儀觀測量特征,學(xué)習(xí)行人步行速度矢量,精準(zhǔn)推算行人航跡。傳統(tǒng)PDR方案是以每步為單位,統(tǒng)計人的步頻和步長,PDR的位置更新頻率是在1.5~1.8 Hz,基于數(shù)據(jù)驅(qū)動的PDR可以學(xué)習(xí)人體邁步的全過程,以20 Hz速度矢量輸出,實現(xiàn)高頻PDR位置更新,充分發(fā)揮慣性傳感器數(shù)據(jù)更新率高的優(yōu)勢。在模型驅(qū)動部分,通過擴(kuò)展卡爾曼濾波,緊密耦合高精度音頻測距觀測量與PDR神經(jīng)網(wǎng)絡(luò)輸出的高頻速度矢量,以20 Hz的位置更新率,實現(xiàn)23 cm的定位精度。與傳統(tǒng)的純模型驅(qū)動融合定位方法相比,該方法在定位更新率、定位精度和定位穩(wěn)定性等方面,都具有明顯優(yōu)勢。