陳承隆,邱志成,杜啟亮,田聯(lián)房,林 斌,李 淼
1.華南理工大學(xué) 機(jī)械與汽車工程學(xué)院,廣州510640
2.華南理工大學(xué) 自主系統(tǒng)與網(wǎng)絡(luò)控制教育部重點(diǎn)實(shí)驗(yàn)室,廣州510640
3.華南理工大學(xué) 珠?,F(xiàn)代產(chǎn)業(yè)創(chuàng)新研究院,廣東 珠海519170
4.廣州地鐵設(shè)計(jì)研究院股份有限公司,廣州510010
5.日立電梯(廣州)自動(dòng)扶梯有限公司,廣州510660
近年來(lái),隨著人工智能技術(shù)飛速發(fā)展,作為人工智能技術(shù)結(jié)晶的智能機(jī)器人行業(yè)也迎來(lái)新的契機(jī),越來(lái)越智能的機(jī)器人被應(yīng)用于社會(huì)生活的方方面面,如超市導(dǎo)購(gòu)、快遞分揀、酒店前臺(tái)引導(dǎo)、智能送餐、變電站巡檢[1]等。而這些機(jī)器人功能的基礎(chǔ)都需要精確的位置信息才能夠完成,因此機(jī)器人全局定位和定位失效恢復(fù)功能就顯得極其重要。
目前室內(nèi)機(jī)器人的全局定位恢復(fù)功能的實(shí)現(xiàn)主要分為四種方案:基于激光雷達(dá)二維點(diǎn)云的匹配定位[2-4]、基于WLAN 和位置指紋的定位[1]、基于文本的圖像檢索定位[5]和基于圖像內(nèi)容檢索[6-15]的定位。其中基于激光雷達(dá)的匹配定位使用貝葉斯濾波框架[3]將定位問(wèn)題轉(zhuǎn)換為了概率分布問(wèn)題,在小型室內(nèi)地圖中比基于WLAN和位置指紋的定位效果更加穩(wěn)健,但是在區(qū)域有動(dòng)態(tài)目標(biāo)和地圖中有對(duì)稱房間的情況下定位容易失敗?;赪LAN 和位置指紋的定位則是通過(guò)信號(hào)衰減理論模型將接收到的信號(hào)強(qiáng)度和能量損耗轉(zhuǎn)化為傳播距離的方法,在無(wú)噪聲干擾的實(shí)驗(yàn)室環(huán)境下表現(xiàn)較好,但在實(shí)際環(huán)境中容易受到環(huán)境噪聲干擾,精度下降嚴(yán)重。基于文本的圖像檢索需要人工構(gòu)建圖像的文本描述,對(duì)于小型數(shù)據(jù)集比較適用,但是因?yàn)槿藗冸y以用文字全面描述整個(gè)圖像的內(nèi)容而導(dǎo)致查詢精度并不高。對(duì)于基于圖像內(nèi)容檢索的定位,又分為全局特征向量匹配和局部特征向量匹配[16],其中局部特征向量的生成需要人工構(gòu)建感興趣區(qū)域,容易受到人為認(rèn)知局限性的影響,而全局特征向量更好地利用了卷積神經(jīng)網(wǎng)絡(luò)能夠提取深層特征的特性,能夠提取到人工難以找到的細(xì)節(jié)特征,從而在高相似數(shù)據(jù)集中具有較高的魯棒性。提取特征向量后通過(guò)特征匹配方法在圖像數(shù)據(jù)庫(kù)中找到與查詢圖像最相似圖像的位置標(biāo)簽作為查詢圖像的位置,此方法因其較高的準(zhǔn)確性被廣泛應(yīng)用于定位問(wèn)題中,但其在弱光以及缺少特征情況下仍表現(xiàn)不佳。
室內(nèi)環(huán)境中,不僅是相近地點(diǎn)的全景圖像具有很高的相似性,而且對(duì)于空間隔離的全景圖像有時(shí)候也表現(xiàn)為極高的相似性,所以在室內(nèi)僅使用攝像頭一種傳感器進(jìn)行重定位是非常困難的。充分利用機(jī)器人上多種傳感器的信息是解決機(jī)器人全局定位[17]的主流方向。
針對(duì)上述定位方法存在的查詢準(zhǔn)確率低的問(wèn)題,本文提出了多階段多傳感器自適應(yīng)調(diào)整的全局重定位方法,包括重定位引導(dǎo)階段、粗定位階段和精定位階段三個(gè)子階段。下面分別介紹各個(gè)階段及具體流程。
整體流程分為在線定位和離線訓(xùn)練兩個(gè)部分,如圖1所示,離線階段通過(guò)改進(jìn)的Netvlad網(wǎng)絡(luò)訓(xùn)練獲取模型參數(shù)并保存模型,以供在線定位階段使用。在線定位階段首先獲取激光雷達(dá)的實(shí)時(shí)信息,根據(jù)障礙物信息以一定規(guī)則引導(dǎo)機(jī)器人到達(dá)空曠區(qū)域,然后旋轉(zhuǎn)拍攝離散的全景圖像,將圖像輸入Netvlad[18]網(wǎng)絡(luò)進(jìn)行圖像查詢,計(jì)算相似性排名,如果相似性得分都小于閾值則判定查詢失敗,返回引導(dǎo)階段,否則將得到的粗略的定位信息作為蒙特卡洛定位的初值繼續(xù)迭代定位,經(jīng)過(guò)一段時(shí)間粒子不收斂則判定為定位失敗,返回引導(dǎo)階段,否則認(rèn)為定位成功。
圖1 全局重定位流程圖
在整個(gè)流程中引導(dǎo)過(guò)程十分重要,它是整個(gè)方法形成閉環(huán)的關(guān)鍵過(guò)程,一定程度上提高了重定位系統(tǒng)的穩(wěn)定性。
首先將激光雷達(dá)障礙物信息按照角度均分為8 個(gè)區(qū)域,每個(gè)區(qū)域中心軸為區(qū)域主方向,統(tǒng)計(jì)每個(gè)區(qū)域內(nèi)障礙物平均距離,以機(jī)器人當(dāng)前位置為圓心,1 m 為半徑,與平均距離最遠(yuǎn)的區(qū)域的主方向相交點(diǎn)為目標(biāo)點(diǎn),如果目標(biāo)點(diǎn)在障礙物上(不可達(dá))或者接近障礙物,則將半徑縮小為0.5 m。最后將機(jī)器人引導(dǎo)至目標(biāo)點(diǎn),在定位失敗后重復(fù)此過(guò)程直至定位成功。
Netvlad是Relja等人提出的一種快速高效的針對(duì)室外的大規(guī)模地點(diǎn)識(shí)別方法,其使用了Vlad(Vector of Locally Aggregated Descriptors)編碼技術(shù),即使用聚合后的局部特征表示全局特征的編碼方法。Netvlad 考慮了離散全景圖像之間的空間信息,可以從任意一張或多張圖片中快速準(zhǔn)確地進(jìn)行地點(diǎn)識(shí)別,并使用了軟分配和更多的可訓(xùn)練參數(shù),得到的特征向量描述對(duì)于視角和光照變化具有很高的魯棒性,原始論文中的實(shí)驗(yàn)也證明了這一點(diǎn)。
Netvlad 卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程是求解和優(yōu)化特征提取網(wǎng)絡(luò)輸出的N×D(N=W×H)維特征圖描述符中K×D 個(gè)聚類中心的位置和每個(gè)描述符對(duì)所屬類中心貢獻(xiàn)的權(quán)重,統(tǒng)計(jì)特征圖描述符與聚類中心之間的帶權(quán)重殘差和作為圖像描述向量,使得其與查詢圖像之間歐幾里德距離最小的圖像之間的描述向量的相似度最高,而與遠(yuǎn)離查詢圖像的圖像之間的描述向量相似度最小。其中使用圖像的拍攝地點(diǎn)來(lái)作為訓(xùn)練過(guò)程中的弱監(jiān)督標(biāo)簽,判定正負(fù)樣本規(guī)則使用歐幾里德距離函數(shù)。網(wǎng)絡(luò)結(jié)構(gòu)[18]如圖2 所示,輸入圖像尺寸為640×480,基礎(chǔ)網(wǎng)絡(luò)為VGG-16[19],使用了VGG-16的前13個(gè)卷積層,最終輸出特征圖尺寸為W×H×D(20×15×512),在VGG-16特征圖輸出后接入Netvlad層。在Netvlad中輸入N(W×H)個(gè)D 維局部描述符,將聚類算法獲得的K×D 個(gè)聚類中心作為參數(shù),計(jì)算N 個(gè)特征點(diǎn)與聚類中心的帶權(quán)重殘差和作為圖像描述矩陣V 的元素,最終將V 轉(zhuǎn)換成矢量形式并歸一化作為圖像的特征描述向量輸出。矩陣V 元素計(jì)算公式為:
式中,Xi是特征圖輸入,xi(j )第j 維的第i 個(gè)描述符,ck(j )為第j 維的第k 個(gè)聚類中心,是每個(gè)xi(j )描述符對(duì)第k 個(gè)聚類中心的貢獻(xiàn)權(quán)重。軟分配權(quán)重計(jì)算公式為:
式中,wk=2αck,bk=-α‖ ck‖2,α是一個(gè)正常數(shù),用來(lái)控制權(quán)重對(duì)距離的響應(yīng)程度,ck是第j維第k個(gè)聚類中心。軟分配函數(shù)是Netvlad 卷積神經(jīng)網(wǎng)絡(luò)與原始的Vlad 方法的核心區(qū)別,因?yàn)樵糣lad 方法使用的是硬分配函數(shù),權(quán)重分配非1 即0,即應(yīng)分配函數(shù)不可微,無(wú)法參與誤差反向傳播,一般使用提取到的特征向量送入SVM、Random Forest等分類器訓(xùn)練。而Netvlad將權(quán)重分配函數(shù)換成了可微分函數(shù),又將聚類中心ck解耦成wk、bk、ck三個(gè)可訓(xùn)練參數(shù),比傳統(tǒng)方法更具有靈活性。
Netvlad 網(wǎng)絡(luò)中損失函數(shù)使用了弱監(jiān)督的三元組排序損失,即,對(duì)于每個(gè)查詢圖像q都從數(shù)據(jù)庫(kù)中找到一組正樣本圖像和一組負(fù)樣本圖像,如果查詢圖像q 與最匹配的一個(gè)正樣本的地點(diǎn)標(biāo)簽之間的歐幾里德距離小于其與所有負(fù)樣本之間的歐幾里德距離,則損失為0,反之,則按照距離差值進(jìn)行損失懲罰。匹配度最高的唯一正樣本圖像則根據(jù)歐幾里德距離最小原則在一組正樣本圖像中進(jìn)行挑選,選取后三元組為,其中為:
總損失函數(shù)為:
圖2 原始Netvlad網(wǎng)絡(luò)結(jié)構(gòu)圖
歐幾里德距離和連通域距離對(duì)比如圖3 所示,圖中圓點(diǎn)為數(shù)據(jù)集圖像采集點(diǎn),實(shí)線長(zhǎng)度為歐幾里德距離,虛線長(zhǎng)度為連通域距離,兩點(diǎn)之間只有實(shí)線則兩種距離相等。如果使用歐幾里德距離判定1 號(hào)位置的正樣本圖像,則3 號(hào)地點(diǎn)圖像會(huì)被判定為正樣本,然而3 號(hào)地點(diǎn)由于和1 號(hào)地點(diǎn)隔著墻體,圖像相似度必然會(huì)很低,在訓(xùn)練過(guò)程中會(huì)產(chǎn)生錯(cuò)誤懲罰,影響模型收斂速度和穩(wěn)定性,同理2 號(hào)點(diǎn)的正樣本中會(huì)包含4 號(hào)點(diǎn)。如果使用連通域距離,1 號(hào)點(diǎn)的正樣本則不會(huì)選擇3 號(hào)點(diǎn),而是2 號(hào)點(diǎn),2 號(hào)點(diǎn)的最匹配圖像則會(huì)選擇6 號(hào)點(diǎn)。在負(fù)樣本選擇中,3 號(hào)和4 號(hào)點(diǎn)會(huì)被分配到1 號(hào)和2號(hào)點(diǎn)的負(fù)樣本中。本文將正樣本選擇標(biāo)準(zhǔn)中計(jì)算量較大的歐幾里德距離計(jì)算改為矩陣元素值查詢,但稍微增大了存儲(chǔ)空間,在室內(nèi)環(huán)境下的數(shù)據(jù)集中能夠提高算法的穩(wěn)定性。
圖3 歐幾里德距離和連通域距離對(duì)比圖
VGG-16 網(wǎng)絡(luò)是由16 個(gè)卷積層和3 個(gè)全連接層組成,整個(gè)網(wǎng)絡(luò)全部統(tǒng)一使用3×3 的卷積核,共有16 個(gè)權(quán)重層,包含參數(shù)1.38 億個(gè)。VGG-16 網(wǎng)絡(luò)具有訓(xùn)練參數(shù)眾多,計(jì)算量大,網(wǎng)絡(luò)深度較淺,提取特征層級(jí)較淺,收斂速度較慢等缺點(diǎn),而Resnet-50 由于引入了殘差結(jié)構(gòu)使得深層網(wǎng)絡(luò)不容易發(fā)生退化問(wèn)題,與具有相同參數(shù)量和計(jì)算量的線性網(wǎng)絡(luò)結(jié)構(gòu)相比能夠提取到更加深層的特征,減小了模型的復(fù)雜度,提高了模型的檢測(cè)識(shí)別率和收斂速度。鑒于上述優(yōu)點(diǎn),本文將Netvlad 中提取特征的主干網(wǎng)絡(luò)替換為Resnet-50,改進(jìn)后的Netvlad 主干網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示,網(wǎng)絡(luò)輸入仍是640×480,新的特征圖提取層為Resnet-50 中的Conv2_x、Conv3_x、Conv4_x 和Conv5_x,最終輸出特征圖尺寸為20×15×512,去掉Resnet-50 最后的均值池化層和全連接層,添加1×1卷積層conv6,步長(zhǎng)為1,輸出通道為512。
傳統(tǒng)的蒙特卡洛定位在一定程度上可以解決全局定位和機(jī)器人綁架問(wèn)題,一般通過(guò)添加隨機(jī)粒子嘗試恢復(fù)位姿,這個(gè)方法會(huì)大量增加無(wú)貢獻(xiàn)粒子的數(shù)目,容易導(dǎo)致算法收斂性變慢或者耗盡計(jì)算機(jī)內(nèi)存,且只能小概率恢復(fù)定位。本文結(jié)合庫(kù)爾貝克-萊布勒散度[4](Kullback-Leibler Divergence,KLD)采樣,以及自適應(yīng)蒙特卡洛算法。由圖像查詢得到的粗定位地點(diǎn)位置作為自適應(yīng)蒙特卡羅定位的初始隨機(jī)抽樣種子。將按照高斯分布產(chǎn)生的粒子,作為初始位置,可以明顯提高位姿恢復(fù)的概率。
KLD 是一個(gè)描述兩個(gè)概率分布差的測(cè)量值,其大小能夠反映粒子群當(dāng)前分布和真實(shí)分布之間的偏差。根據(jù)偏差變化大小可以判定機(jī)器人是否定位丟失和被綁架,并以此為標(biāo)準(zhǔn)動(dòng)態(tài)的增加或減少粒子數(shù),時(shí)刻保證使用最少的粒子獲得當(dāng)前分布對(duì)真實(shí)分布的最優(yōu)近似。最小的KLD粒子數(shù)為:
圖4 改進(jìn)后的Resnet-50結(jié)構(gòu)
其中,Nb表示樣本占用的子空間數(shù);ε 是目標(biāo)分布誤差的最大值;1-δ 表示誤差小于ε 的概率。當(dāng)生成的粒子數(shù)大于Nkld時(shí),可以停止采樣過(guò)程。
本文使用輪式機(jī)器人作為移動(dòng)平臺(tái),如圖5 所示,在機(jī)器人頂部中心位置安裝有舵機(jī)和攝像機(jī),舵機(jī)只有一個(gè)俯仰自由度,偏航自由度由移動(dòng)平臺(tái)提供。攝像機(jī)分辨率設(shè)置為640×480,在距地面37 cm 處安裝了一個(gè)單線激光雷達(dá),掃描角度360°,角分辨率0.5°,幀率為10 幀/s。具體設(shè)備如表1所示。
圖5 實(shí)驗(yàn)硬件平臺(tái)
表1 移動(dòng)平臺(tái)設(shè)備組成
為了對(duì)比原始模型和改進(jìn)Netvlad 網(wǎng)絡(luò)模型的區(qū)別,基于圖5 所介紹的實(shí)驗(yàn)平臺(tái),本文在Ubuntu 操作系統(tǒng)下結(jié)合ROS軟件框架實(shí)現(xiàn)了以上所述基于改進(jìn)Netv‐lad 卷積神經(jīng)網(wǎng)絡(luò)的室內(nèi)機(jī)器人全局重定位方法。算法運(yùn)行環(huán)境如表2所示。
全局定位范圍大小為30 m×60 m 的室內(nèi)區(qū)域,包含6 個(gè)房間和1 條走廊,為保證定位精度,數(shù)據(jù)采集點(diǎn)間隔為2 m,拍攝起始角度為全局地圖y 軸方向,多數(shù)選擇室內(nèi)過(guò)道中間區(qū)域?yàn)椴杉c(diǎn),訓(xùn)練集共采集108 個(gè)地點(diǎn)圖像,共864 張圖像,測(cè)試集共采集42 個(gè)地點(diǎn)。數(shù)據(jù)集的格式制作為標(biāo)準(zhǔn)的Pittsburgh 數(shù)據(jù)集格式,每個(gè)地點(diǎn)圖像包括以機(jī)器人為圓心的圓上均勻的8個(gè)方向的8張圖像,作為離散化的全景圖像,由于特征向量的提取考慮了同一個(gè)地點(diǎn)離散圖像之間的空間信息,所以不需要人工標(biāo)注和拼接成全景圖像。圖6 顯示了華南理工大學(xué)3號(hào)樓2 層和部分實(shí)驗(yàn)室室內(nèi)區(qū)域的柵格地圖,分辨率為5 cm×5 cm。圖中選擇性的顯示了測(cè)試集中4 個(gè)地點(diǎn)的圖像,同一個(gè)地點(diǎn)僅顯示第一張圖像,黑色箭頭為圖像拍攝方向。
表2 軟件環(huán)境
圖6 華南理工大學(xué)3號(hào)樓2層?xùn)鸥竦貓D
在6.2 節(jié)所述的數(shù)據(jù)集上分別使用原始的Netvlad模型和改進(jìn)的Netvlad 模型進(jìn)行訓(xùn)練,訓(xùn)練采用SGD 優(yōu)化方法,動(dòng)量因子設(shè)置為0.9,圖像批處理大小設(shè)置為12,聚類算法中心數(shù)k 為64,初始學(xué)習(xí)率為0.001,如果模型訓(xùn)練10 個(gè)周期內(nèi)性能不再提升,則將學(xué)習(xí)率減半,20個(gè)周期內(nèi)性能不再提升,則停止訓(xùn)練。如果根據(jù)圖像相似度查詢得到的前N 個(gè)預(yù)測(cè)地點(diǎn)中任意一個(gè)在以查詢圖像真實(shí)地點(diǎn)為圓心1 m 為半徑的圓內(nèi),角度誤差在22.5°以內(nèi),則認(rèn)為查詢結(jié)果正確。文中定義TOP@N為根據(jù)相似度查詢得到的前N 個(gè)圖像。對(duì)于圖像查詢一般使用精確率對(duì)模型進(jìn)行評(píng)價(jià),精確率定義為查詢正確地點(diǎn)數(shù)目和查詢地點(diǎn)總數(shù)的比值。對(duì)比實(shí)驗(yàn)分別訓(xùn)練4個(gè)模型:原始Netvlad(VGG-16)、單獨(dú)添加連通域距離改進(jìn)的Netvlad 模型(VGG-16+AStar)、單獨(dú)引入殘差網(wǎng)絡(luò)改進(jìn)的Netvlad 模型(Resnet-50)和同時(shí)加入兩種改進(jìn)的Netvlad 模型(Resnet-50+AStar),模型訓(xùn)練損失及測(cè)試集精確率如圖7(a)~(d)所示,損失曲線x軸已做歸一化,曲線平滑因子0.744。
圖7 (a) VGG-16+AStar和Resnet-50損失曲線
圖7 (b) VGG-16和Resnet-50+AStar損失曲線
圖7 (c) VGG-16+AStar和Resnet-50精確率
圖7 (d) VGG-16和Resnet-50+AStar精確率
由訓(xùn)練過(guò)程中的損失曲線可知,未加入連通域距離的模型損失震蕩幅值范圍較大,未引入殘差網(wǎng)絡(luò)的模型的最終損失值較高,由精確率曲線可知,兩種改進(jìn)均可提高模型收斂速度和精確率,且當(dāng)TOP@N 為1 時(shí)引入連通域距離后模型精確率提升了1.323%,引入殘差網(wǎng)絡(luò)后模型精確率提升了3.287%,當(dāng)TOP@N 為4 時(shí)引入連通域距離后模型精確率提升了3.529%,引入殘差網(wǎng)絡(luò)后模型精確率提升了8.541%,故加入連通域距離的改進(jìn)可以抑制室內(nèi)場(chǎng)景模型的錯(cuò)誤懲罰,加快模型收斂,引入殘差網(wǎng)絡(luò)可以提高模型的判別能力。
本文模型可以兼容每個(gè)地點(diǎn)的查詢圖像小于8 張的情況,以簡(jiǎn)化重定位復(fù)雜度,但會(huì)損失部分精確率。為了全面評(píng)價(jià)4個(gè)模型定位精確率在1 m范圍內(nèi)和角度誤差范圍內(nèi)的精確率,故對(duì)測(cè)試集42 個(gè)地點(diǎn)進(jìn)行精確率測(cè)試。在測(cè)試集中選取10 個(gè)地點(diǎn)分別使用4 個(gè)模型對(duì)每個(gè)地點(diǎn)進(jìn)行50 次查詢,為了獲得最佳查詢性能每個(gè)地點(diǎn)查詢圖像固定為8 張圖像,TOP@N 為4,測(cè)試結(jié)果如表3所示。
表3 平均精確率結(jié)果
根據(jù)表3 可知,加入連通域距離后4 個(gè)模型精確率在TOP@N 為1 時(shí)平均提升了1.7%,為4 時(shí)平均提升了3.2%,引入殘差網(wǎng)絡(luò)后模型精確率在TOP@N 為1 時(shí)平均提升了2.9%,為4 時(shí)平均提升了8.0%。同時(shí)加入兩種改進(jìn)后模型在TOP@N 為1 時(shí)精確率提升了4.6%,為4 時(shí)提升了11.2%。基于圖像查詢的重定位雖然可以幫助機(jī)器人定位,但定位準(zhǔn)確率會(huì)隨著定位精度的提高呈指數(shù)型下降,隨著TOP@N 的減小而下降。故為了提高機(jī)器人定位精度,本文選擇按照?qǐng)D像相似度排名給予查詢出的地點(diǎn)標(biāo)簽相應(yīng)權(quán)重,權(quán)重系數(shù)為4∶3∶2∶1[17],按照?qǐng)D像標(biāo)簽和權(quán)重系數(shù)分配自適應(yīng)蒙特卡洛定位算法中初始粒子的分布位置和數(shù)量。
根據(jù)上一節(jié)測(cè)試結(jié)果,本節(jié)實(shí)驗(yàn)選擇原始Netvlad模型(VGG-16)和改進(jìn)的Netvlad 模型(Resnet-50+AStar)做對(duì)比,本文采用TOP@N 為4作為本節(jié)實(shí)驗(yàn)設(shè)定,在實(shí)驗(yàn)過(guò)程中機(jī)器人每旋轉(zhuǎn)45°拍攝一張環(huán)境圖像。本文在實(shí)現(xiàn)了整個(gè)全局重定位系統(tǒng)的基礎(chǔ)上,對(duì)全局重定位和綁架問(wèn)題進(jìn)行了測(cè)試。測(cè)試流程如圖8 所示,其中A 至B 段為人工操控機(jī)器人行走階段,B 至C 段為機(jī)器人綁架路線,在C 點(diǎn)由機(jī)器人自行判定定位丟失,這種情況下需要系統(tǒng)進(jìn)行機(jī)器人全局定位,由改進(jìn)的圖像粗定位模塊提供初始位姿,將排名前5 的地點(diǎn)按照上一節(jié)中的權(quán)重向自適應(yīng)蒙特卡洛系統(tǒng)注入1 000 個(gè)初始粒子,經(jīng)過(guò)引導(dǎo)階段和圖像查詢定位以及自適應(yīng)蒙特卡洛精定位過(guò)程,在D點(diǎn)成功定位。
圖8 機(jī)器人重定位流程圖
圖9 原始模型和改進(jìn)模型全局定位誤差圖
圖9 顯示了兩種模型在TOP@N 為4 情況下的全局重定位誤差,在a 段機(jī)器人從B 點(diǎn)被綁架至10 m 外的C點(diǎn),3 s 后啟動(dòng)全局重定位,b 段從12 s 開(kāi)始引導(dǎo)機(jī)器人前進(jìn)1 m,原地旋轉(zhuǎn)并拍攝8張查詢圖像,c段從第21.5 s開(kāi)始圖像查詢,原始Netvlad 模型經(jīng)過(guò)e 段在第49.8 s 完成圖像查詢粗定位過(guò)程,粗定位誤差為1.63 m,由于粗定位誤差較大,經(jīng)過(guò)f 段在第66.7 s 定位收斂,而改進(jìn)的Netvlad 模型經(jīng)過(guò)a、b 段在第21.5 s 完成查詢圖像拍攝,然后經(jīng)過(guò)c 段在第38.5 s 完成粗定位過(guò)程,粗定位平均誤差為0.9 m,最后經(jīng)過(guò)d 段在第48.8 s 全局定位收斂。原始Netvlad 模型提取特征時(shí)比改進(jìn)的Netvlad 模型的參數(shù)量大,故粗定位過(guò)程要慢11.3 s,其因?yàn)檎`差較大,精定位過(guò)程收斂要比改進(jìn)的Netvlad 模型慢6.6 s,粗定位誤差過(guò)大容易引起二次全局重定位,定位時(shí)間將會(huì)翻倍。故從整體上看,改進(jìn)的Netvlad 模型要優(yōu)于原始Netvlad模型。
針對(duì)室內(nèi)移動(dòng)機(jī)器人的全局定位和綁架問(wèn)題,本文提出一種利用激光雷達(dá)信息預(yù)先引導(dǎo),再利用改進(jìn)的Netvlad 卷積神經(jīng)網(wǎng)絡(luò)圖像查詢進(jìn)行粗定位,最后利用粗定位得到的位置作為初始位置進(jìn)行自適應(yīng)蒙特卡洛定位的閉環(huán)定位方法。本文方案使用聚合的局部特征作為全局特征表示,比人工標(biāo)注感興趣區(qū)域方法的特征表征能力更強(qiáng),對(duì)于環(huán)境高度相似的數(shù)據(jù)集具有更高的魯棒性,并省去了繁雜的圖像標(biāo)注工作,實(shí)驗(yàn)效果滿足要求,故本方案能夠有效解決室內(nèi)移動(dòng)機(jī)器人的全局定位和和綁架問(wèn)題。但系統(tǒng)對(duì)于動(dòng)態(tài)場(chǎng)景的適應(yīng)性還有待進(jìn)一步研究,對(duì)于多個(gè)場(chǎng)景下機(jī)器人自適應(yīng)性問(wèn)題,可以使用由大型室內(nèi)數(shù)據(jù)集訓(xùn)練的有一定泛化能力的通用模型,省去離線訓(xùn)練階段,但是有針對(duì)性的訓(xùn)練則精確率會(huì)更高。