鄭秋菊,陳 欣
(重慶移通學(xué)院 通信與信息工程學(xué)院,重慶 401520)
當(dāng)前室內(nèi)定位方法中,基于慣性測量單元(Inertial Measurement Unit,IMU)的定位通過IMU測量得到的慣性數(shù)據(jù)可以求取人員的相對位置變化,從而對人員的當(dāng)前位置進(jìn)行更新。由于基于慣性的定位方式中所依賴的IMU傳感器有較好的自包含性(self-contained),不依賴于外部的各種測量數(shù)據(jù),因此基于慣性的人員定位方式也被稱為人員軌跡盲推(Pedestrian Dead Reckoning,PDR)。基于PDR的定位方法由于僅僅依賴于人員攜帶的IMU傳感器作為定位設(shè)備,不需要事先在定位區(qū)域部署設(shè)備,因此具有定位范圍廣、門檻低等優(yōu)點(diǎn),是當(dāng)前室內(nèi)定位領(lǐng)域中研究的熱點(diǎn)方法。
傳統(tǒng)的PDR定位方法可以分為混合定位與純PDR定位兩大類,其中混合定位指將PDR定位方式與其他的觀測信息如無線局域網(wǎng)(Wireless Local Area Network,WLAN)信息等進(jìn)行融合定位,從而提高單純PDR定位的精度;而純PDR方式僅僅依賴于慣性測量(一般包含磁力計(jì)測量輔助)進(jìn)行人員定位?;旌隙ㄎ活愋椭校捎谄淇扇诤系男畔⒎N類較多,信息的組合方式靈活,因此存在較多的方法[1-5]。該類方法雖然可以通過一系列信息融合工具,利用其他的輔助觀測信息對PDR的定位信息進(jìn)行修正,但是由于需要多種多樣的其他觀測信息,一定程度上降低了PDR定位的自包含性,限制了其在室內(nèi)環(huán)境中的部署應(yīng)用。
另一類方法為純的PDR定位方法,僅僅依賴IMU進(jìn)行定位。該類方法根據(jù)應(yīng)用情況的不同,也可分為兩類:足部PDR與非足部PDR。基于足部的PDR指在定位過程中,IMU置于人員的足部位置。該方式可利用人員行走過程中的先驗(yàn)?zāi)P?,即利用靜止區(qū)間(人員行走過程中足部貼地時(shí))的偽觀測信息對速度、位置、姿態(tài)等定位狀態(tài)量進(jìn)行濾波,從而減少慣性定位誤差積累。文獻(xiàn)[6-7]詳細(xì)描述了利用行走先驗(yàn)?zāi)P偷腜DR方法,并且驗(yàn)證了其相對慣性自由積分定位方式,能有效降低定位誤差。然而,將IMU置于足部進(jìn)行定位,應(yīng)用場景受到較大限制。隨著IMU、磁力計(jì)等硬件在智能手機(jī)上安裝的普及,在智能手機(jī)上實(shí)現(xiàn)PDR定位的基本條件已經(jīng)得到較好的滿足,因此非足部的PDR定位越來越成為當(dāng)前研究的熱點(diǎn)。非足部的PDR定位方法中,由于慣性漂移較大,無法進(jìn)行自由積分定位,因此采用間接定位的方法。通常來說,非足部PDR包含檢測慣性數(shù)據(jù)中的尖峰作為人員邁步的標(biāo)記(邁步檢測)、通過先驗(yàn)?zāi)P凸烙?jì)行走步長(步長估計(jì))、通過慣性數(shù)據(jù)積分進(jìn)行姿態(tài)估計(jì)(航向估計(jì))三個方面。當(dāng)前研究主要集中在人員攜帶智能手機(jī)在正常行走條件下的定位,如文獻(xiàn)[8]中假設(shè)手機(jī)放在隨行口袋中的定位、文獻(xiàn)[9]中通過固定的手持的PDR定位等。這些研究未考慮到實(shí)際情況中人員行為的復(fù)雜性,如由放口袋行走行為中變?yōu)槭殖?,以及隨意晃動行為等。在不同的行為條件下,若利用相同的定位模型,可導(dǎo)致定位精度的下降,甚至定位完全不可用。
本文提出一種非足部的PDR定位方法,主要可應(yīng)用于室內(nèi)定位中普遍并廣泛存在的應(yīng)用場景,即人員攜帶智能手機(jī)在室內(nèi)環(huán)境中進(jìn)行定位。該方法不依賴于除慣性數(shù)據(jù)外的其他信息,因此具有較好的自包含性。該方法利用基于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的深度學(xué)習(xí)進(jìn)行人員行為分類,并且根據(jù)分類結(jié)果(手持條件下、口袋中、自由晃動)設(shè)計(jì)不同的模型進(jìn)行邁步檢測、步長估計(jì)和航向估計(jì),從而形成人員軌跡盲推的PDR過程,對人員的位置進(jìn)行估計(jì)。由于該方法充分考慮了不同人員行為模式,因此相比于傳統(tǒng)的非足部PDR方法,其魯棒性更強(qiáng)。實(shí)測數(shù)據(jù)進(jìn)行的實(shí)驗(yàn)驗(yàn)證了本文所提方法在室內(nèi)環(huán)境中進(jìn)行定位的有效性,其行為識別正確率可以達(dá)到98%,相比于單一的手持定位方法和口袋隨行定位方法,其最終的定位精度分別提高了1.7 m和2.3 m。
本文提出的方法基本流程如圖1所示,將IMU測量得到的慣性數(shù)據(jù)(包含三自由度加速度、三自由度的角速度數(shù)據(jù))經(jīng)過基于長短時(shí)記憶(Long Short Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)進(jìn)行識別判斷,得到其行為識別結(jié)果。根據(jù)手持(人員手持手機(jī)行走)、口袋中(人員將手機(jī)放置于口袋中行走)、準(zhǔn)靜止(手機(jī)位置或姿態(tài)基本保持不變)三種不同的行為,分別設(shè)計(jì)不同的策略實(shí)現(xiàn)PDR算法中的邁步檢測、步長估計(jì)和航向估計(jì)等。由于該方法充分考慮了室內(nèi)定位中人員行走的不同行走情況,并且設(shè)計(jì)了合適的應(yīng)對策略,因此該方法相比于傳統(tǒng)的PDR定位方法穩(wěn)健性更好,更適合于實(shí)際的應(yīng)用。
圖1 本文方法框架流程
前文提到,本文通過三自由度加速度、三自由度的角速度數(shù)據(jù)作為行為識別的數(shù)據(jù)基礎(chǔ)。這些數(shù)據(jù)維度較高,共6維,因此難以通過人工提取明顯并且充分的特征用于分類。而基于神經(jīng)網(wǎng)絡(luò)的分類方法卻能夠從樣本中提出數(shù)據(jù)的更抽象、更深層次的特征,因此本文中用神經(jīng)網(wǎng)絡(luò)工具作為行為識別算法基礎(chǔ)。由于上述的六軸慣性數(shù)據(jù)本質(zhì)為時(shí)序數(shù)據(jù),為了更好地捕捉該時(shí)序數(shù)據(jù)的前后關(guān)聯(lián)信息,本文所用的神經(jīng)網(wǎng)絡(luò)為循環(huán)神經(jīng)網(wǎng)絡(luò)。在實(shí)際應(yīng)用中,用到了LSTM單元[10]。LSTM單元的加入使得神經(jīng)網(wǎng)絡(luò)具有記憶功能,并且相比于傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò),其計(jì)算復(fù)雜度更低,更容易被訓(xùn)練。
本文所用到行為識別網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示,預(yù)處理后的九自由度數(shù)據(jù)輸入到LSTM單元中,經(jīng)過卷積層、全連接層、LSTM層、全連接層和Softmax層,最后輸出識別為三種行為的概率。
圖2 基于LSTM的行為分類神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
在數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)前,需要對數(shù)據(jù)進(jìn)行歸一化處理,本文用到的歸一化處理的方式如下所示(能量歸一化):
(1)
(2)
(3)
式中:A、W和M分別表示加速度矢量、角速度矢量和磁場強(qiáng)度矢量,下標(biāo)i表示采樣點(diǎn)的序號,K表示單個樣本采樣點(diǎn)的數(shù)目,函數(shù)norm(·)表示求取平方和。歸一化后,樣本中的加速度、角速度和磁場強(qiáng)度的能量均為1,使得神經(jīng)網(wǎng)絡(luò)能夠適應(yīng)實(shí)際情況中數(shù)據(jù)能量劇烈變化的情況,有效提取序列中的特征。
該網(wǎng)絡(luò)中用到的訓(xùn)練損失為神經(jīng)網(wǎng)絡(luò)分類問題中用到的典型交叉熵?fù)p失:
(4)
(5)
式中:Ln表示上一層(即全連接層)的輸出,其輸出維度為類別的數(shù)目,此處為3。
通過神經(jīng)網(wǎng)絡(luò)識別了不同行為之后,應(yīng)當(dāng)設(shè)計(jì)不同的PDR定位模型適應(yīng)對應(yīng)的行為,從而提高定位精度。下式給出了PDR算法的基本原理:
(6)
式中:x和y分別表示導(dǎo)航坐標(biāo)系下的x軸和y軸對應(yīng)的坐標(biāo),下標(biāo)i表示步數(shù)的序號,li表示估計(jì)的第i步的歩長,θi表示第i步的航向估計(jì)。由上式可以看出,當(dāng)前歩的位置估計(jì)依賴于之前的位置估計(jì),因此在PDR定位中,定位誤差是隨時(shí)間積累的,特別是航向誤差,可能導(dǎo)致積累誤差迅速變大。同樣由上式可以看出,PDR定位最需要解決三個重要的子問題:一是邁步階測,即確定位置更新的時(shí)機(jī);二是歩長估計(jì),即確定上式中的li;三是航向或姿態(tài)估計(jì),即對θi的估計(jì)。下面根據(jù)手持、口袋中、準(zhǔn)靜止這三種不同的行為模式,提出解決上述三個子問題的策略。
1.2.1 邁步檢測
本文中采取傳統(tǒng)的邁步檢測算法,即通過測量得到加速度的模作為尖峰檢測的依據(jù):
(7)
通過模值作為邁步檢測的依據(jù),可以消除IMU姿態(tài)估計(jì)不準(zhǔn)確對邁步檢測精度的不利影響。為了減少加速度數(shù)據(jù)中廣泛存在的毛刺對尖峰檢測的影響,此處采用了均值濾波器對原始的模值進(jìn)行濾波(低通):
(8)
式中:M為平滑的點(diǎn)數(shù)。在手持模式和口袋模式中,由于新步的頻率與手機(jī)在口袋中還是手持無關(guān),因此在新步檢測中,采用相同的平滑點(diǎn)數(shù)。另外,在檢測時(shí),由于口袋模式相比于手持模式運(yùn)動更劇烈,因此口袋模式檢測門限大于手持模式,即λpocket>λhand;而準(zhǔn)靜止模式中,判斷IMU呈準(zhǔn)靜止?fàn)顟B(tài),因此不進(jìn)行邁步檢測。
1.2.2 步長估計(jì)
下面分別對手持模式下和口袋模式下不同的歩長估計(jì)模式進(jìn)行描述。在口袋模式下,手機(jī)所處的位置(即IMU的位置)與人員的質(zhì)心位置在距離上比較接近,可以直接利用如下的先驗(yàn)?zāi)P瓦M(jìn)行步長估計(jì)[8]:
(9)
式中:amax,v和amin,v分別表示加速度投影到導(dǎo)航坐標(biāo)系下后的垂直分量的最大值和最小值,K為先驗(yàn)的參數(shù)。該模型已經(jīng)被廣泛應(yīng)用于IMU在質(zhì)心處的定位,因此此處直接使用。
在手持模式中,采用另一先驗(yàn)?zāi)P瓦M(jìn)行歩長估計(jì):
l=h(afs+b)+c。
(10)
式中:h表示IMU的高度,a、b和c分別表示三個不同參數(shù),fs表示人員邁步的頻率。該歩長估計(jì)模型適用于IMU未處于人員質(zhì)心的情況。在準(zhǔn)靜止模式下,不需要進(jìn)行步長估計(jì)。
1.2.3 航向估計(jì)
由于PDR定位的誤差積累特性,航向估計(jì)在PDR定位中十分重要。在手持模式和口袋模式下,本文中的姿態(tài)或航向算法采用基于梯度下降法的姿態(tài)估計(jì),其基本原理如圖3所示。
圖3 基于梯度下降法的融合姿態(tài)估計(jì)
通過上述公式,可以融合加速度信息、角速度信息和磁場強(qiáng)度信息,按照梯度下降法的方式對姿態(tài)進(jìn)行更新,從而得到最新的航向。
而在準(zhǔn)靜止模式下,可以認(rèn)為IMU處于靜止?fàn)顟B(tài),可以充分利用該信息對IMU的姿態(tài)進(jìn)行修正。在IMU為靜止?fàn)顟B(tài)時(shí),測量得到的加速度僅包含重力加速度,因此可以估計(jì)出俯仰角φ和橫滾角σ:
(11)
(12)
式中:ax、ay和az分別表示IMU測量得到的三軸的加速度。在實(shí)際應(yīng)用中,可以取一段時(shí)間的平均值對俯仰角和橫滾角進(jìn)行求取,之后再利用俯仰角和橫滾角將IMU測量得到的磁場強(qiáng)度投影到導(dǎo)航坐標(biāo)系下:
(13)
式中:m表示磁場強(qiáng)度矢量,上標(biāo)n和b分別表示導(dǎo)航坐標(biāo)系和載體坐標(biāo)系。求出導(dǎo)航坐標(biāo)系下的磁場強(qiáng)度矢量后,可以根據(jù)下式對航向進(jìn)行更新:
(14)
本文利用采集到的慣性數(shù)據(jù)進(jìn)行行為識別,并且根據(jù)識別得到的不同結(jié)果設(shè)計(jì)不同的策略進(jìn)行人員定位。為了驗(yàn)證本文提出的方法,采用了實(shí)測的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。為了能夠更加貼近實(shí)際應(yīng)用的情況,在數(shù)據(jù)的采集上,與文獻(xiàn)[8]不同,并未使用高精度的慣性測量單元(IMU)進(jìn)行數(shù)據(jù)采集,而是通過商用的普通智能手機(jī)進(jìn)行采集。本文用到的智能手機(jī)平臺為小米Mix,并且在安卓系統(tǒng)下開發(fā)了軟件,對數(shù)據(jù)進(jìn)行采集。通過軟件對9軸慣性數(shù)據(jù)(三軸加速度、角速度、磁場強(qiáng)度)進(jìn)行存儲,從而生成對應(yīng)的人員行為識別數(shù)據(jù)集。如圖4所示,該數(shù)據(jù)集中采集到的三種不同行為的采樣樣本,其中不同的慣性數(shù)據(jù)用不同的線形進(jìn)行表示。本文中,所有的數(shù)據(jù)在1 s內(nèi)存在100個采樣點(diǎn),可以看出,準(zhǔn)靜止?fàn)顟B(tài)下容易被識別,但是手持行走與口袋行走較難進(jìn)行區(qū)別。
(a)手持
在行為識別數(shù)據(jù)集中,總計(jì)采集了200條數(shù)據(jù),這些數(shù)據(jù)條目的時(shí)間長度在2~10 min之間。在行為識別中,不能將數(shù)據(jù)條目直接作為神經(jīng)網(wǎng)絡(luò)的輸入,仍需進(jìn)行進(jìn)一步的處理。本文將不同的條目劃分為固定長度、帶重疊的時(shí)間窗,時(shí)間窗的長度設(shè)置為1.28 s,共128個采樣點(diǎn)(方便深度學(xué)習(xí))。因此,在行為識別的樣本中,每個樣本的維度為128×6。這些樣本中,三種標(biāo)簽的樣本(手持行走、口袋行走與準(zhǔn)靜止)分別占了所有樣本中大致相同的比例(1/3)。在行為識別網(wǎng)絡(luò)的訓(xùn)練過程中,隨機(jī)選取了60%的樣本作為訓(xùn)練數(shù)據(jù),余下的40%為測試數(shù)據(jù)。
圖5顯示了本文的行為識別識別率曲線,可以看出,在訓(xùn)練迭代的次數(shù)達(dá)到約1 000時(shí)識別率基本穩(wěn)定,達(dá)到了約98%。
圖5 行為識別率曲線
圖6給出了本文的識別率混淆矩陣,可以看出,準(zhǔn)靜止?fàn)顟B(tài)能夠被完全識別,手持行走行為中約3%被識別為口袋行走,而口袋行走中約2%被識別為手持行走,雖然存在一定的錯誤概率,但是由于行為混淆的可能性較低,因此對后續(xù)的定位影響較小。
圖6 行為識別混淆矩陣
為了能夠測試本文方法的定位效果,除了采集行為識別和測試的樣本外,還采集了額外的軌跡樣本,進(jìn)行定位效果的對比。該實(shí)驗(yàn)在辦公樓的空曠大廳的實(shí)際環(huán)境進(jìn)行測試,通過標(biāo)尺測量得到邊長分別為14 m和15 m的矩形軌跡,并對軌跡在地面進(jìn)行了標(biāo)記。在測試中,同樣利用小米Mix手機(jī),對9軸慣性數(shù)據(jù)(三軸加速度、角速度、磁場強(qiáng)度)進(jìn)行采集存儲。測試中,從原點(diǎn)沿著標(biāo)記的軌跡行走,最后再回到原點(diǎn)。行走過程中,包含了文中所述的手持行走、口袋行走與準(zhǔn)靜止?fàn)顟B(tài),對真實(shí)的人員行走場景進(jìn)行模擬。圖7顯示了本文方法生成的定位軌跡、單一的手持定位軌跡和口袋隨行定位軌跡??梢钥闯?,本文提出的方法產(chǎn)生的定位軌跡與真實(shí)軌跡最為接近,其回到起點(diǎn)的誤差為0.5 m,相比于單一的手持定位和口袋隨行定位的誤差分別下降了1.7 m和2.3 m,證明了本文方法的有效性。
圖7 不同方法軌跡對比
PDR方法利用IMU得到的慣性估計(jì)量按照先驗(yàn)定位模型對人員的軌跡進(jìn)行估計(jì),然而在實(shí)際應(yīng)用中,由于人員行走狀態(tài)多樣,套用相同的先驗(yàn)定位模型誤差較大。本文首先通過深度行為識別對人員的行走狀態(tài)進(jìn)行識別,可以識別出常見的三種狀態(tài)(手持行走、口袋行走和準(zhǔn)靜止?fàn)顟B(tài)),再根據(jù)不同的行走狀態(tài)設(shè)計(jì)策略進(jìn)行定位。通過智能手機(jī)的實(shí)測數(shù)據(jù)集對深度行為識別網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并且進(jìn)行定位實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明了本文方法的有效性,其行為識別正確率達(dá)到了98%,并且在矩形行走回到起點(diǎn)的誤差為0.5m,相比于單一的手持定位誤差和口袋隨行的定位誤差分別下降了1.7 m和2.3 m。