韓雨薇 鄭安迪 朱俞竹 王璐瑤 董明澤
摘? 要:該文采用了在移動(dòng)機(jī)器人定位中應(yīng)用較為廣泛的粒子濾波器算法,該算法基于蒙特卡洛方法,將捕捉機(jī)器人位姿狀態(tài)的問題轉(zhuǎn)化為概率問題,該文介紹了貝葉斯濾波理論的推導(dǎo)過程,以及由其發(fā)展而來的貝葉斯重要性采樣理論,然后簡要概括了如何利用重采樣方法優(yōu)化了采樣粒子的權(quán)值,進(jìn)而得到較優(yōu)的粒子權(quán)值。該理論在目標(biāo)追蹤及機(jī)器人定位等領(lǐng)域中應(yīng)用較為廣泛。
關(guān)鍵詞:粒子濾波? 蒙特卡洛? 機(jī)器人定位? 貝葉斯濾波理論
中圖分類號(hào):TP242.6? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ?文章編號(hào):1672-3791(2020)12(b)-0012-03
Abstract: This article adopted has been widely applied in mobile robot localization and the particle filter algorithm, the algorithm based on monte carlo method, to capture the state of the robot pose problem into a probability problem, this paper introduced the derivation process of the theory of bayesian filtering, and by the development of bayesian importance sampling theory, and then briefly summarizes how heavy sampling method was used to optimize the weights of sample particle, then get the optimal weights of particles. The theory has been widely used in target tracking and robot positioning.
Key Words: Particle filter; Monte Carlo; Robot positioning; Bayesian filtering theory
近年來隨著信息化時(shí)代的來臨,人工智能行業(yè)飛速發(fā)展,這也加快了機(jī)器人技術(shù)的發(fā)展進(jìn)程。移動(dòng)機(jī)器人占到很大一部分,而定位則在移動(dòng)機(jī)器人中起著至關(guān)重要的作用,該文基于蒙特卡洛方法的粒子濾波器簡要探究移動(dòng)機(jī)器人定位算法問題。
1? 粒子濾波
1.1 貝葉斯濾波原理
貝葉斯濾波即借助已知的觀測(cè)數(shù)據(jù)求計(jì)算后驗(yàn)概率,即用先前經(jīng)驗(yàn)總結(jié)預(yù)測(cè)先驗(yàn)密度,進(jìn)而求出系統(tǒng)動(dòng)態(tài)轉(zhuǎn)移密度,然后利用C-K方程進(jìn)行預(yù)測(cè),代入Bayesian更新公式,然后得出更新后的條件概率密度,重新代入系統(tǒng)狀態(tài)轉(zhuǎn)移密度。整個(gè)過程的核心為“預(yù)測(cè)-修正”的一個(gè)迭代過程。具體過程如下[2]。
(1)預(yù)測(cè)。由系統(tǒng)動(dòng)態(tài)轉(zhuǎn)移密度在未知k時(shí)刻觀測(cè)值,得到先驗(yàn)密度到先驗(yàn)密度的預(yù)測(cè)。
若我們假定k-1時(shí)刻,已知,對(duì)于一階Markov過程(即(k-1)時(shí)的概率只與(k-2)時(shí)有關(guān)),驗(yàn)證下面的概率密度函數(shù):
等號(hào)兩端對(duì)(k-1)積分得C-K方程:
由此獲取不含有k時(shí)刻觀測(cè)值的先驗(yàn)密度,該先驗(yàn)密度可以通過系統(tǒng)的狀態(tài)轉(zhuǎn)移概率來計(jì)算。
(2)更新。即由系統(tǒng)觀測(cè)模型,在獲得k時(shí)刻的觀測(cè)值z(mì)k后實(shí)現(xiàn)先驗(yàn)概率密度至后驗(yàn)概率密度的推導(dǎo)。
1.2 粒子濾波
粒子濾波算法(Bootstrap算法)是一種源于Monte Carlo思想的遞推貝葉斯濾波算法,即以某事件出現(xiàn)的頻率來指代該事件的概率。核心為利用一系列大量采樣的加權(quán)和表示后驗(yàn)概率密度,來近似積分運(yùn)算,進(jìn)而可以簡便分析非線性動(dòng)態(tài)系統(tǒng)。也稱蒙特卡洛模擬方法或貝葉斯重要性采樣。
1.3 貝葉斯重要性采樣
該算法是從已知的、較方便采樣的分布中采樣,通過對(duì)分布的采樣粒子點(diǎn)進(jìn)行加權(quán)來近似,簡單來講就是再定義的數(shù)學(xué)期望[3]。具體如下:
從式(11)可知,借助得到的樣本和與相關(guān)量進(jìn)行估計(jì)。前提是可以計(jì)算,進(jìn)而推測(cè),雖然分布未知,但能夠借助下面式子近似表示:
在基礎(chǔ)粒子濾波算法中,根據(jù)觀測(cè)數(shù)據(jù)估量后驗(yàn)概率密度時(shí),每當(dāng)加入新另一個(gè)的觀測(cè)變量的值時(shí)都要再次對(duì)整個(gè)序列的粒子權(quán)值進(jìn)行計(jì)算,序貫性重要采樣方法采用了統(tǒng)計(jì)學(xué)中較為著名的序貫分析方法,首先進(jìn)行粒子采樣,在加入另一個(gè)的觀測(cè)變量的值時(shí)生成新的權(quán)值和。這樣就能夠?qū)篁?yàn)概率進(jìn)行一系列的遞推估算來得到較為可靠的概率值。度和計(jì)算機(jī)計(jì)算存儲(chǔ)資源的消耗有很大的影響,所以,網(wǎng)格參數(shù)的選取至關(guān)重要。綜合考慮了對(duì)計(jì)算結(jié)果的精度要求和計(jì)算機(jī)的性能,該文最終采用默認(rèn)網(wǎng)格化的大小,采用綜合曲率劃分網(wǎng)格,以提高網(wǎng)格化質(zhì)量。
1.4 重采樣
但在序貫性重要采樣中存在較為重要的較大的問題就是權(quán)值退化現(xiàn)象,重采樣方法則可以有限減弱這一問題的影響,實(shí)質(zhì)為減少或舍棄權(quán)值較小的粒子而復(fù)制較大的粒子,最后將粒子權(quán)值設(shè)置為合適值。
2? 粒子濾波定位算法
粒子濾波定位算法的核心即為上述粒子濾波原理,在機(jī)器人定位過程中,跟蹤“有利”的變量,即不同時(shí)間機(jī)器人的位置,初始時(shí)大量采樣,接著在不同時(shí)刻進(jìn)行貝葉斯濾波的“預(yù)測(cè)-更新”的迭代過程,然后利用重采樣對(duì)粒子軌跡修正,最后得到機(jī)器人位置狀況的最優(yōu)狀態(tài)估計(jì)。
3 結(jié)語
該文介紹了貝葉斯濾波及由其發(fā)展而來的粒子濾波理論,以及為了解決其中采樣步驟粒子權(quán)值退化問題而采用的重采樣方法,進(jìn)而得出了基于粒子濾波原理的移動(dòng)機(jī)器人定位簡要過程。相信在未來隨著人工智能產(chǎn)業(yè)的飛速發(fā)展,粒子濾波理論將會(huì)更多地被應(yīng)用到機(jī)器人行業(yè)以及其他目標(biāo)追蹤及控制行業(yè)。
參考文獻(xiàn)
[1] 姜毅,唐善政.移動(dòng)機(jī)器人定位算法研究與仿真[J].農(nóng)業(yè)裝備與車輛工程,2019,57(7):50-54.
[2] 徐陽揚(yáng),楊科鋒,趙艷.基于貝葉斯濾波的機(jī)器人定位評(píng)估技術(shù)[J].電子設(shè)計(jì)工程,2019,27(17):10-13,18.
[3] 林慶,王新.基于改進(jìn)的粒子濾波算法的目標(biāo)跟蹤[J].信息技術(shù),2017(10):88-92.
[4] 昝孟恩,周航,韓丹,等.粒子濾波目標(biāo)跟蹤算法綜述[J].計(jì)算機(jī)工程與應(yīng)用,2019,55(5):8-17,59.
[5] 張廷軍,郭毅鋒,黃麗敏.改進(jìn)重采樣的移動(dòng)機(jī)器人SLAM算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2019,40(11):3276-3281.
[6] 馬兆南,裴騰達(dá),張浩.一種改進(jìn)的粒子濾波目標(biāo)跟蹤算法[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào):自然科學(xué)版,2016,35(9):978-982.