趙圣健,朱 翠,王雅妮
(北京信息科技大學(xué) 信息與通信工程學(xué)院,北京100101)
隨著基于位置服務(wù)(location-based services,LBS)業(yè)務(wù)的不斷發(fā)展,全球定位系統(tǒng)(global positioning system,GPS)和蜂窩移動通信系統(tǒng)可以在室外環(huán)境中提供較為準(zhǔn)確的定位服務(wù),但其傳輸信號無法穿透墻體進(jìn)入室內(nèi),無法提供準(zhǔn)確的室內(nèi)定位服務(wù)。與此同時,大型醫(yī)院、大型圖書館、地下停車場、大型商場等場所,都需要較為精確的位置服務(wù),人們對室內(nèi)位置服務(wù)的需求變得日益迫切[1]。
典型的室內(nèi)定位技術(shù)包括:無線局域網(wǎng)定位、藍(lán)牙定位、紅外定位、超聲波定位、超寬帶定位和射頻識別(radio frequency identification,RFID)定位[2]。與其他定位技術(shù)相比,RFID具有抗干擾及穿透能力強(qiáng)、定位范圍廣等優(yōu)勢具有良好的適應(yīng)性[3],且因定位速度快、成本低、非視距(non-line-of-sight,NLOS)等特點被廣泛應(yīng)用于應(yīng)急救援、資產(chǎn)管理、人員跟蹤等領(lǐng)域[4-6]。
近年來,隨著人工智能的快速發(fā)展,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法被廣泛應(yīng)用于各個領(lǐng)域。合適的機(jī)器學(xué)習(xí)算法應(yīng)用于室內(nèi)定位系統(tǒng),能夠有效地提高定位精度、增強(qiáng)系統(tǒng)魯棒性和降低成本[7]。常見的機(jī)器學(xué)習(xí)算法有支持向量機(jī)(support vector machines,SVM)、K-近鄰、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、樸素貝葉斯、決策樹以及隨機(jī)森林等[8-9]。其中SVM處理小樣本、非線性問題時具有較好的性能,但高維空間的復(fù)雜性則會帶來較大的計算量和存儲空間等問題[10]。K-近鄰算法在定位過程中要對數(shù)據(jù)庫中所有的樣本數(shù)據(jù)進(jìn)行計算,當(dāng)數(shù)據(jù)量過大時會造成計算量過大的問題,無法實現(xiàn)實時定位[11]。ANN模型能適應(yīng)噪聲數(shù)據(jù)進(jìn)行訓(xùn)練,具有良好的數(shù)據(jù)擬合能力,但前期需要大量數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)模型來調(diào)整其權(quán)值、閾值等參數(shù),訓(xùn)練成本非常高[12]?;谪惾~斯分類算法定位具有計算量小、可處理多分類問題等優(yōu)勢,但它是建立在條件相互獨立假設(shè)基礎(chǔ)上的,實際應(yīng)用中目標(biāo)特征之間不可能絕對地獨立,會影響實際定位效果[13]。通過決策樹算法進(jìn)行定位分類準(zhǔn)確率較高,建樹分類過程具有較好的可視化效果,但建樹過深、分支過多容易造成過擬合。而隨機(jī)森林作為一系列決策樹的集成學(xué)習(xí)算法,繼承了決策樹的多種優(yōu)勢,且其隨機(jī)性也提高了模型的泛化能力,降低了過擬合[14-16]風(fēng)險。在多領(lǐng)域研究中發(fā)現(xiàn),隨機(jī)森林分類模型通常優(yōu)于回歸模型,尤其在解決大量樣本、具有高維度特征或多分類問題時被研究者們廣泛應(yīng)用[17]。
基于以上分析,本文針對基于RFID的收發(fā)分離室內(nèi)定位系統(tǒng),設(shè)計了隨機(jī)森林分類算法,該方法適用于較大空間內(nèi)二維放置的、具有多維度特征的貨物放置區(qū)域定位。仿真結(jié)果表明,在20 m×20 m的空間內(nèi),均分為16個5 m×5 m的區(qū)域,每隔0.1 m一個采樣點,40 000個采樣點的區(qū)域預(yù)測準(zhǔn)確率可達(dá)93%,可以滿足實際應(yīng)用中針對區(qū)域定位的需求。
RFID是一種非接觸式自動識別技術(shù),可以快速讀寫、長期跟蹤管理,因而在智能識別領(lǐng)域受到廣泛關(guān)注。傳統(tǒng)的RFID定位系統(tǒng)由閱讀器和RFID標(biāo)簽組成。RFID標(biāo)簽具有唯一的標(biāo)識符(ID),附著在定位目標(biāo)上。當(dāng)目標(biāo)進(jìn)入閱讀器天線工作范圍內(nèi),閱讀器和標(biāo)簽通過電磁場耦合的方式實現(xiàn)數(shù)據(jù)通信。
RFID系統(tǒng)依據(jù)其工作頻率可分為低頻、高頻、超高頻和微波4個頻段。低頻和高頻系統(tǒng)基于電感耦合的基本原理,通信距離較短;超高頻和微波系統(tǒng)基于電磁耦合反向散射原理,通信距離較長。其中超高頻RFID系統(tǒng)憑借通信距離遠(yuǎn)、通信速率快及天線尺寸小等優(yōu)勢被廣泛應(yīng)用。
RFID標(biāo)簽可分為無源、有源和半有源3種。無源RFID標(biāo)簽通過閱讀器發(fā)射的信號為內(nèi)部芯片的工作提供能量,信號能量達(dá)到其工作的激勵門限,芯片即可發(fā)射帶有ID和位置信息的信號;有源RFID標(biāo)簽依靠本身電池主動發(fā)射射頻信號,其通信距離遠(yuǎn),但壽命短且成本較高;半有源RFID標(biāo)簽本身也有電池提供芯片的工作能量,但須閱讀器信號來激活其發(fā)射信號。其中有源和半有源RFID標(biāo)簽僅用于少數(shù)貴重物品的管理,無源RFID標(biāo)簽憑借成本低、壽命長等優(yōu)勢被廣泛使用。
傳統(tǒng)的RFID室內(nèi)定位系統(tǒng)中,閱讀器天線發(fā)射無線信號激勵無源RFID標(biāo)簽并接收標(biāo)簽反射的信號,對天線頻率帶寬有較高的要求。閱讀器天線收發(fā)分離的應(yīng)用使RFID室內(nèi)定位系統(tǒng)可實現(xiàn)收發(fā)信號解耦,抑制了收發(fā)信號之間的干擾,同時大大降低了系統(tǒng)的成本。
本文采用的RFID收發(fā)分離定位系統(tǒng)包括多個信號發(fā)射器、超高頻無源RFID標(biāo)簽和信號接收器。信號發(fā)射器負(fù)責(zé)發(fā)射無線信號,RFID標(biāo)簽在信號覆蓋范圍內(nèi)被激活后發(fā)送帶有信息的無線射頻信號,信號接收器接收并處理被激活標(biāo)簽的反射信號進(jìn)行定位。一個典型的RFID收發(fā)分離定位系統(tǒng)如圖1所示,3個發(fā)射器依次激勵目標(biāo)標(biāo)簽,接收端接收到被激活標(biāo)簽的反射信號。下行鏈路(信號從發(fā)射器到標(biāo)簽)和上行鏈路(信號從標(biāo)簽到接收器)分別用虛線和實線表示。
圖1 基于RFID的收發(fā)分離室內(nèi)定位系統(tǒng)
本文針對較大空間中多個區(qū)域內(nèi)的所有目標(biāo)進(jìn)行區(qū)域定位。為了覆蓋定位空間中所有位置,須部署多個信號發(fā)射器,因此每個目標(biāo)將有一個多維的信號強(qiáng)度特征。基于以上分析,針對較大空間、大量樣本、高維度特征且多分類的情況,本文選擇隨機(jī)森林分類算法進(jìn)行目標(biāo)的區(qū)域定位。
隨機(jī)森林是基于集成學(xué)習(xí)的思想對多棵決策樹投票決定分類結(jié)果的一種算法,它的基本單元是決策樹。假設(shè)現(xiàn)有數(shù)據(jù)集擁有N個樣本,M個特征。每棵樹建立時,從N個訓(xùn)練樣本中以有放回抽樣的方式隨機(jī)取樣形成訓(xùn)練集(即bagging取樣),再從訓(xùn)練集數(shù)據(jù)的M個特征中隨機(jī)選擇m個特征作為樹的分類節(jié)點,其中m 圖2 隨機(jī)森林算法 當(dāng)空間中包含區(qū)域較多,即數(shù)據(jù)集有較多分類時,由于室內(nèi)多徑及噪聲的影響,隨機(jī)森林預(yù)測結(jié)果易出現(xiàn)分類差別較大的情況。通過仿真發(fā)現(xiàn),一層隨機(jī)森林錯誤分類中,有些目標(biāo)預(yù)測結(jié)果與實際放置區(qū)域相差較遠(yuǎn),區(qū)域定位準(zhǔn)確率并不能滿足實際需要。因此,本文提出了一種兩層隨機(jī)森林分類模型,有效地消除了定位區(qū)域差別較大的情況,并提高了空間內(nèi)的總體區(qū)域定位準(zhǔn)確率。 算法流程如圖3所示: 圖3 兩層隨機(jī)森林分類模型預(yù)測流程 對比一層的隨機(jī)森林分類模型,兩層隨機(jī)森林模型的優(yōu)勢在于當(dāng)定位空間較大、分類區(qū)域較多時,通過使用第一層分類模型,得到準(zhǔn)確的區(qū)域粗定位之后,再使用該區(qū)域的第二層分類模型定位目標(biāo)的實際放置區(qū)域,可以大幅提高分類準(zhǔn)確率;缺點是增加了模型數(shù)量,提高了訓(xùn)練成本。因此本文所提出的基于兩層隨機(jī)森林模型的分類方法適合用于定位空間較大、分類區(qū)域較多情況下的區(qū)域定位。 為了驗證RFID收發(fā)分離系統(tǒng)及兩層隨機(jī)森林模型分類方法的有效性,搭建了仿真環(huán)境,通過與傳統(tǒng)三點定位方法及一層隨機(jī)森林分類模型的對比,驗證方法的準(zhǔn)確性和有效性。 仿真環(huán)境設(shè)置如下:定位空間大小為20 m×20 m×5 m(長×寬×高),空間包含16個5 m×5 m的放置區(qū)域,空間內(nèi)每隔0.1 m布置一個采樣點(標(biāo)簽),總共40 000個采樣點均勻分布。區(qū)域分布如圖4所示,16種顏色表示16個區(qū)域內(nèi)的標(biāo)簽;空間均勻部署9個信號發(fā)射器,相鄰間隔為10 m,空間正中央部署信號接收器,高度均為5 m;無源RFID標(biāo)簽高度為1 m,定位場景如圖5所示。傳輸信號的頻率為920 MHz;信號發(fā)射器的信號強(qiáng)度為33 dB;信號發(fā)射器、RFID標(biāo)簽及信號接收器的增益分別設(shè)置為6 dB、2 dB、6 dB。標(biāo)簽和接收器的靈敏度分別為-15 dB和-101 dB;調(diào)制損耗為-20 dB;地板反射系數(shù)為-0.8;當(dāng)標(biāo)簽不在可讀區(qū)域時,接收器的接收信號強(qiáng)度(received signal strength,RSS)設(shè)置為-100 dB。 圖4 空間區(qū)域分布 圖5 收發(fā)器位置部署 在兩層分類模型定位過程中,第一層模型將目標(biāo)粗定位于4個大區(qū)域A、B、C、D中,再通過第二層分類模型,將目標(biāo)定位于大區(qū)域中的4個子區(qū)域1、2、3、4中,從而實現(xiàn)整個空間內(nèi)的區(qū)域定位,兩層區(qū)域劃分如圖6所示。 圖6 區(qū)域劃分 對空間內(nèi)40 000個采樣點分別使用三點定位方法、一層隨機(jī)森林分類模型和兩層隨機(jī)森林分類模型進(jìn)行區(qū)域定位,區(qū)域分類準(zhǔn)確率分別為66.06%、86.93%和92.82%,定位效果分別如圖7~9所示。 由圖可知,隨機(jī)森林分類效果明顯優(yōu)于傳統(tǒng)基于信號強(qiáng)度的三點定位方法。圖8和圖9相比可以發(fā)現(xiàn),一層隨機(jī)森林分類模型的預(yù)測結(jié)果中,出現(xiàn)定位區(qū)域偏差較大的情況,如有些實際放置于A1區(qū)域中的目標(biāo),定位區(qū)域是D4。而圖9中這種情況出現(xiàn)次數(shù)顯著減少,且放置區(qū)域預(yù)測的錯誤結(jié)果大多為其原本放置區(qū)域周圍較近的區(qū)域,由此降低了獲取目標(biāo)的難度,這種誤差在大多數(shù)實際應(yīng)用中是可以接受的。因此基于兩層隨機(jī)森林模型的分類方法提高了目標(biāo)區(qū)域定位的準(zhǔn)確率,可以滿足實際應(yīng)用的需求。 圖8 一層隨機(jī)森林模型 圖9 兩層隨機(jī)森林模型 針對大型室內(nèi)環(huán)境中的多分類區(qū)域定位的問題,本文提出了一種基于兩層隨機(jī)森林的RFID收發(fā)分離室內(nèi)定位方法。利用第一層隨機(jī)森林對目標(biāo)標(biāo)簽進(jìn)行較為準(zhǔn)確的粗定位,再根據(jù)粗定位的結(jié)果選擇對應(yīng)的第二層隨機(jī)森林模型進(jìn)行最終的區(qū)域定位。較一層隨機(jī)森林分類模型,雖增加了模型數(shù)量,一定程度增加了訓(xùn)練成本,但以較小的訓(xùn)練成本為代價獲得了更為準(zhǔn)確的區(qū)域定位性能,解決了部分采樣點預(yù)測區(qū)域與真實區(qū)域差別較大的問題,滿足實際應(yīng)用的需求。由于真實室內(nèi)環(huán)境中存在的噪聲和多徑干擾會影響接收信號強(qiáng)度,未來將在實際倉儲空間內(nèi)部署設(shè)備進(jìn)行實際測量并試驗該方法的定位性能,以實現(xiàn)大型制造業(yè)、大型商場等行業(yè)對貨物的位置監(jiān)管和存取。2.2 基于兩層隨機(jī)森林的分類模型
3 仿真結(jié)果與分析
4 結(jié)束語