摘 要: 目標(biāo)跟蹤是粒子濾波算法在處理非線性問題的一種典型應(yīng)用,但由于在線處理能力或傳輸條件的限制,實(shí)際應(yīng)用中往往無法對(duì)多個(gè)傳感器數(shù)據(jù)同時(shí)處理。據(jù)此,給出了一種基于多傳感器選優(yōu)的粒子濾波算法。假設(shè)每個(gè)時(shí)刻可以處理一個(gè)測(cè)量數(shù)據(jù),該算法先采用加權(quán)的概率密度函數(shù)來評(píng)價(jià)每個(gè)傳感器獲得的測(cè)量值,并用粒子濾波對(duì)概率密度函數(shù)的加權(quán)進(jìn)行實(shí)時(shí)更新,基于最大熵標(biāo)準(zhǔn)來選取最優(yōu)測(cè)量數(shù)據(jù)進(jìn)行處理。同時(shí),最大熵標(biāo)準(zhǔn)保證了最優(yōu)似然函數(shù)分布最寬,從而緩解粒子衰竭問題。通過數(shù)值仿真實(shí)驗(yàn)證明,該算法可以選擇最優(yōu)觀測(cè)數(shù)據(jù)進(jìn)行處理,有效降低多傳感器測(cè)量中粒子濾波在線實(shí)時(shí)處理性能的要求,也較好地緩解了粒子濾波的“衰竭”問題。
關(guān)鍵詞: 粒子濾波; 最大熵; 傳感器選擇; 粒子衰竭
中圖分類號(hào): TN911.6?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2014)01?0024?03
0 引 言
隨著計(jì)算機(jī)性能的大幅度提升,以貝葉斯理論為基礎(chǔ)的粒子濾波算法為非線性問題的解析解決提供了一條重要途徑,目標(biāo)跟蹤則是其在非線性模型跟蹤中的一個(gè)典型應(yīng)用。在很多工程實(shí)踐中,大規(guī)模分布式傳感器有利于提高跟蹤精度,由于在線處理能力或傳輸條件的限制,使得數(shù)據(jù)往往不能在線實(shí)時(shí)處理。此外,粒子的退化現(xiàn)象嚴(yán)重制約了粒子濾波算法的發(fā)展,直到重采樣思想的提出,解決了粒子退化問題,粒子濾波才迅速發(fā)展起來。重采樣為了獲得一個(gè)相對(duì)集中的后驗(yàn)概率分布,將權(quán)重低的采樣點(diǎn)用權(quán)重高的點(diǎn)來替換,但這樣卻易導(dǎo)致了“粒子衰竭”現(xiàn)象的出現(xiàn),即在濾波過程中只將少數(shù)幾個(gè)甚至一個(gè)粒子進(jìn)行復(fù)制,使得用于描述后驗(yàn)概率密度的粒子不充分,限制了算法追蹤某些具有極低權(quán)值的狀態(tài)的能力。
據(jù)此,本文提出了一種多傳感器選優(yōu)的粒子濾波算法。該方法可以有效地利用多個(gè)觀測(cè)值,根據(jù)狀態(tài)向量離散分布的最大熵標(biāo)準(zhǔn),選擇一個(gè)最優(yōu)觀測(cè)數(shù)據(jù)進(jìn)行處理。一方面大大降低了實(shí)際應(yīng)用對(duì)粒子濾波在線實(shí)時(shí)處理性能的要求,另一方面,最大熵標(biāo)準(zhǔn)也較好地緩解了“粒子衰竭”問題。
1 粒子濾波算法
粒子濾波在計(jì)算上常采用序貫蒙特卡洛方法來實(shí)現(xiàn),即用一組隨機(jī)或已知某種分布的樣本來描述估計(jì)量的概率分布,再根據(jù)得到的測(cè)量值,通過重要性函數(shù)對(duì)各樣本點(diǎn)的權(quán)值大小進(jìn)行調(diào)整,以該帶權(quán)值的樣本序列來逼近真實(shí)的后驗(yàn)概率分布,從而序貫更新狀態(tài)。
假定系統(tǒng)狀態(tài)空間模型如下(分別是狀態(tài)方程和測(cè)量方程):
[xt=fxt-1+εt-1yt=hxt+νt] (1)
其中,狀態(tài)模型[f·]和觀測(cè)模型[h·]都是已知的且可以為非線性系統(tǒng),[εt-1]和[νt]為互不相關(guān)的過程噪聲和測(cè)量噪聲。狀態(tài)方程反映了系統(tǒng)的狀態(tài)轉(zhuǎn)移概率[p(xtxt-1)],測(cè)量方程則反映了似然概率[p(ytxt)。]用[Xt=x1,x2,…,xt,][Yt=y1,y2,…,yt]分別表示[t]時(shí)刻的狀態(tài)序列和觀測(cè)值序列。
在此模型的基礎(chǔ)上,為了獲得后驗(yàn)概率密度[p(xtyt),]粒子數(shù)量為[N]的序貫蒙特卡洛算法可以分為以下步驟:
(1) 初始化:在[t=0]時(shí)刻,對(duì)[i=1,2,…,N]采樣[xi0~][px0],其中[px0]為先驗(yàn)概率。
(2) 重要性采樣:根據(jù)觀測(cè)值序列確定重要性函數(shù)[qxtxit-1,y1:t],然后進(jìn)行重要性采樣:
[xit~qxtxit-1,y1:t]
(3) 根據(jù)采樣結(jié)果調(diào)整權(quán)值,并歸一化:
[ωik=ωik-1pytxitpxitxit-1qxitxit-1,y1:tωit=ωitj=1Nωjt] (2)
(4) 重新采樣:根據(jù)歸一化后的權(quán)值[ωit]對(duì)粒子進(jìn)行優(yōu)劣替換,得到更接近后驗(yàn)分布的樣本[xit]。
(5) 經(jīng)過反復(fù)逼近,估計(jì)量的后驗(yàn)概率分布可以表示為:
[pxty1:t≈i=1Nωitδxt-xitj=1Nωjt] (3)
由于不依賴于平穩(wěn)和高斯的假想,粒子濾波對(duì)處理非平穩(wěn)非高斯問題有較好的效果。
2 多傳感器選優(yōu)的粒子濾波算法
從粒子濾波算法中可知,似然函數(shù)[p(ytxit)]是基于測(cè)量噪聲的概率密度函數(shù)[pvt],其一般為窄帶分布。同時(shí),粒子值[xit],[i=1,2,…,N]是依賴于過程噪聲概率密度函數(shù)[pεt-1]。如果[pεt-1]分布較寬,用于生成預(yù)測(cè)結(jié)果[p(ytxit)]的預(yù)測(cè)值[h(xit)]也將服從一個(gè)較寬的分布,從而導(dǎo)致式(2)得出的權(quán)值趨于不均勻,即大多數(shù)權(quán)值接近零,而極少數(shù)接近觀測(cè)值的粒子將賦予非常大的權(quán)值。K.Diriakidis在高斯分布下對(duì)類似情況進(jìn)行了證明[1]。這樣,在重采樣環(huán)節(jié),只有極少數(shù)權(quán)值大的粒子被選擇作為新的粒子供下輪使用。
此外,假設(shè)有兩個(gè)粒子[xi1t,][xi2t,]根據(jù)中值定理,其在測(cè)量空間中的距離可以通過式(4)計(jì)算:
[ht(xi1t)-ht(xi2t)=?ht(ηt)(xi1t-xi2t)] (4)
其中[ηt]是連接[xi1t]和[xi1t]線段上的點(diǎn),則對(duì)[?ht]的范數(shù)有較小敏感度的觀測(cè)值可以更好地緩解粒子衰竭。
在多傳感器情況下,觀測(cè)空間[yt∈Rm]可以描述為:
[yk=Y1,t?YM,t=h1,t(xt)?hM,t(xt)+vt] (5)
式中:[Y1,t∈Rm1,…,YM,t∈RmM]為分解的若干個(gè)子空間。狀態(tài)向量[xt]可以通過任意一個(gè)子系統(tǒng)[yt∈Rm1]觀測(cè)到。
如引言所述,由于傳輸或者在線處理的限制,假設(shè)單位時(shí)刻只有一個(gè)子空間的數(shù)據(jù)將會(huì)被用于計(jì)算并估計(jì)狀態(tài)向量。為了緩解粒子衰竭,在蒙特卡洛計(jì)算中應(yīng)減少權(quán)值接近零的粒子數(shù),確保中等權(quán)值的粒子數(shù)最多。
基于似然函數(shù)的分布分析,為了保證有足夠多中等權(quán)值的粒子,所選傳感器子系統(tǒng)[Ys,t]的后驗(yàn)概率密度函數(shù)[p(xtyt,s,Yt-1)]應(yīng)該有一個(gè)緩的峰。換句話說,從緩解“粒子衰竭”的角度,最佳傳感器子系統(tǒng)可以產(chǎn)生一個(gè)最寬邊的后驗(yàn)概率分布。后驗(yàn)分布的寬度可以采用有條件熵測(cè)量,如下:
[Hxtyt,s,Yt-1=E-log p(xtyt,s,Yt-1)yt,s,Yt-1] (6)
式中:[E]表示數(shù)學(xué)期望;[s=1,2,…,M]表示子空間的個(gè)數(shù)。
近似蒙特卡洛方法的離散原理,式(6)可以寫成以下形式:
[Hxtyt,s,Yt-1=-j=1Nwsj,tlogwsj,t] (7)
其中[wsj,t]表示基于第[s]個(gè)傳感器子系統(tǒng)計(jì)算出的權(quán)值。而有最寬概率分布(最大熵)的傳感器可通過下面標(biāo)準(zhǔn)得出:
[maxsH(xtyt,s,Yt-1)] (8)
最大熵標(biāo)準(zhǔn)選擇出的傳感器子系統(tǒng),對(duì)[?ht]的范數(shù)有較弱的敏感性,從而保證狀態(tài)變量是一個(gè)寬分布。
3 仿真實(shí)驗(yàn)
為了檢驗(yàn)本文方法的有效性,選擇以下經(jīng)典仿真算例,其狀態(tài)轉(zhuǎn)移方程為:
[xt=xt-12+25xt-11+x2t-1+8cos(1.2t)+vt-1] (9)
假設(shè)通過兩個(gè)傳感器進(jìn)行測(cè)量,其觀測(cè)方程分別為:
[yt,1=(xt)220+vt,1] (10)
[yt,2=(xt)220+vt,2] (11)
令觀測(cè)噪聲均為零均值的高斯噪聲,且其相關(guān)矩陣滿足:
[Q=2000.2]
因?yàn)樵肼曈绊懙牟煌?,[y1]的干擾量為[y2]的10倍。根據(jù)本文和最大熵標(biāo)準(zhǔn),易知第二個(gè)傳感器應(yīng)該被選為最優(yōu)子系統(tǒng)。
首先給出狀態(tài)隨時(shí)間變化的關(guān)系,如圖1所示。圖2,圖3分別是兩個(gè)傳感器(子系統(tǒng))得到的觀測(cè)數(shù)據(jù)。
圖1 狀態(tài)空間隨時(shí)間變化關(guān)系
圖2 第一路傳感器得到觀測(cè)隨時(shí)間變化
設(shè)定初始粒子數(shù)為200,對(duì)兩路觀測(cè)分別用粒子濾波進(jìn)行狀態(tài)空間的估計(jì),結(jié)果見圖4和圖5。從結(jié)果中可以看出,最優(yōu)子系統(tǒng)的估計(jì)結(jié)果明顯優(yōu)于噪聲影響更大的測(cè)量回路(估計(jì)值與原始狀態(tài)的差異)。而經(jīng)本文提出的算法以及最大熵標(biāo)準(zhǔn)計(jì)算可知,在傳感器子系統(tǒng)1和2的選擇中,最大熵標(biāo)準(zhǔn)得到的平均值為1.9。進(jìn)一步給出最優(yōu)回路估計(jì)過程中,離散分布的粒子數(shù)隨時(shí)間變化曲線如圖6所示,可以看出離散分布的粒子隨著狀態(tài)估計(jì)并沒有明顯的收斂趨勢(shì),本文方法對(duì)粒子濾波的“衰竭”問題有著良好的緩解作用。
圖3 第二路傳感器得到觀測(cè)隨時(shí)間變化
圖4 第一路子系統(tǒng)狀態(tài)估計(jì)結(jié)果
圖5 第二路子系統(tǒng)狀態(tài)估計(jì)結(jié)果
圖6 最優(yōu)傳感器估計(jì)中離散粒子數(shù)目的變化趨勢(shì)
4 結(jié) 論
通過[H(xtyt,s,Yt-1)]和[?ht]之間數(shù)學(xué)關(guān)系的建立,本文給出了一種基于粒子濾波的多傳感器數(shù)據(jù)選優(yōu)、在線處理算法。從理論分析和仿真實(shí)驗(yàn)驗(yàn)證,該算法不僅有效實(shí)現(xiàn)了選優(yōu)在線計(jì)算,并且較好地緩解了“粒子衰竭”問題。本文對(duì)于解決粒子濾波的“衰竭”問題以及多傳感器目標(biāo)跟蹤、信息融合等領(lǐng)域有著潛在的理論和工程實(shí)用價(jià)值。
參考文獻(xiàn)
[1] KIRIAKIDIS K. Nonlinear modeling by interpolation between linear dynamics and its application in control [J]. Journal of Dynamic Systems Measurement and Control?transactions of The Asme, 2007, 129(6): 813?824.
[2] 楊可,傅忠謙,王劍亭,等.多目標(biāo)濾波中的多傳感器概率假設(shè)密度算法[J].電子與信息學(xué)報(bào),2012,34(6):1368?1373.
[3] 宋強(qiáng),熊偉,何友.多傳感器多目標(biāo)系統(tǒng)誤差融合估計(jì)算法[J].北京航空航天大學(xué)學(xué)報(bào),2012,38(6):835?840.
[4] OSHMAN Y. Optimal sensor selection strategy for discrete?time state estimators [J]. IEEE Transactions on Aerospace and Electronic Systems, 1994, 30(2): 307?314.
[5] ARULAMPALAM M S, MASKELL S, GORDON N, et al. A tutorial on particle filters for online nonlinear/non?Gaussian Bayesian tracking [J]. IEEE Transactions on Signal Processing, 2002, 50(2): 174?188.
[6] ZHENG Hua, PEI Cheng?ming, LIU Dong?lai. Efficient frequencies estimation using bayesian approach for parsimonious time?varying auto?regressions [C]// Proceedings of the 2010 2nd International Conference on Future Computer and Communication. Wuhan, China: ICFCC, 2010, 2: 489?493.