馮 雨
(西安航空職業(yè)技術(shù)學(xué)院 通用航空學(xué)院,西安 710000)
隨著人工智能、 自動(dòng)駕駛等技術(shù)的興起與發(fā)展,目標(biāo)跟蹤算法的研究越來(lái)越受到更多學(xué)者的關(guān)注與探索[1],目前已被廣泛應(yīng)用于安防監(jiān)控[2]、無(wú)人車(chē)追蹤[3]、機(jī)器人導(dǎo)航[4]等諸多領(lǐng)域。 對(duì)于機(jī)動(dòng)目標(biāo),跟蹤最大的挑戰(zhàn)是目標(biāo)發(fā)生機(jī)動(dòng)時(shí),其運(yùn)動(dòng)模型與前一時(shí)刻會(huì)發(fā)生較大的偏差,因此,通常很難用單一的模型來(lái)表示機(jī)動(dòng)目標(biāo)的運(yùn)動(dòng)[5]。一種常用的方法是采用基于多模型的方法對(duì)機(jī)動(dòng)目標(biāo)進(jìn)行跟蹤[6]。這些方法中的模型并行運(yùn)行,從而描述目標(biāo)運(yùn)動(dòng)的不同方面。其中,交互式多模型(interacting multiple model,IMM)算法被廣泛認(rèn)為是最有效的動(dòng)態(tài)方法之一[7]。 它使用一組不同的運(yùn)動(dòng)模型,并假定模型集中包含了目標(biāo)可能的真實(shí)運(yùn)動(dòng)模型。 該算法基于跳變馬爾可夫系統(tǒng)框架并采用了一個(gè)轉(zhuǎn)移概率已知的馬爾可夫鏈,來(lái)完成運(yùn)動(dòng)模型的切換[8]。 現(xiàn)已經(jīng)被證明能以較低的復(fù)雜度實(shí)現(xiàn)高精度的機(jī)動(dòng)目標(biāo)跟蹤[9]。
此外,為了進(jìn)一步提高目標(biāo)的跟蹤精度,多傳感器融合跟蹤由于其能充分各個(gè)傳感器的有效信息,可實(shí)現(xiàn)更準(zhǔn)確、可靠的目標(biāo)狀態(tài)估計(jì)[10]。 對(duì)于分布式融合算法具有低通信需求以及高的可靠性等特點(diǎn)。 但與集中式方法相比,它也更具挑戰(zhàn)性[11]。 例如不同傳感器共同的過(guò)程噪聲、 先驗(yàn)信息等原因,導(dǎo)致了局部估計(jì)誤差的互相關(guān)性。 而計(jì)算局部估計(jì)之間的相關(guān)性,往往具有較高的計(jì)算代價(jià)[12]。為了解決該問(wèn)題,相關(guān)性未知的協(xié)方差交叉算法通過(guò)擴(kuò)大局部估計(jì)協(xié)方差,來(lái)避免復(fù)雜的相關(guān)性的計(jì)算[13]。另外,還可以采用信息去相關(guān)方法來(lái)解決局部估計(jì)之間的相關(guān)性問(wèn)題[14]。 但這些方法大多是針對(duì)非機(jī)動(dòng)目標(biāo)的融合跟蹤情況。
基于以上討論,本文提出了一種新的基于IMM的自適應(yīng)分布式融合算法,實(shí)行了狀態(tài)估計(jì)與量測(cè)信息的融合。 首先,利用多個(gè)模型估計(jì)本地傳感器測(cè)量的累積信息,然后將這些累積信息與遠(yuǎn)端傳感器的目標(biāo)狀態(tài)估計(jì)進(jìn)行融合,并利用去相關(guān)算法來(lái)處理局部估計(jì)之間的相關(guān)性,從而實(shí)現(xiàn)機(jī)動(dòng)目標(biāo)的融合跟蹤。 最后通過(guò)仿真實(shí)驗(yàn)對(duì)比并驗(yàn)證了提出算法的有效性。
目前單傳感器和多傳感器跟蹤與融合已經(jīng)得到了廣泛的研究。 根據(jù)傳感器個(gè)數(shù),以及信號(hào)的處理方式的不同,文獻(xiàn)[15]總結(jié)了目標(biāo)跟蹤過(guò)程中實(shí)現(xiàn)融合的3 種方式:
(1)不同傳感器間航跡到航跡的融合;
(2)不同傳感器間同步的量測(cè)到量測(cè)的融合;
(3)集中式的異步量測(cè)融合。
本文主要研究并提出了另一種更符合實(shí)際應(yīng)用的融合方式,即遠(yuǎn)端傳感器獲得的航跡與本地傳感器測(cè)量信息的融合。 如圖1 所示,其中遠(yuǎn)端傳感器R 和本地傳感器L 分別提供目標(biāo)狀態(tài)估計(jì)和本地量測(cè)信息。 傳感器R 獲得的航跡由IMM 估計(jì)器生成,傳輸?shù)絃 傳感器的信息是每個(gè)時(shí)間周期的最終狀態(tài)及其誤差協(xié)方差。
圖1 狀態(tài)估計(jì)與量測(cè)信息融合框架Fig.1 State estimation and measurement information fusion framework
對(duì)于局部狀態(tài)估計(jì)和量測(cè)信息的融合,提出采用信息去相關(guān)方法進(jìn)行實(shí)現(xiàn)。 由于當(dāng)前時(shí)間的遠(yuǎn)端傳感器S 的測(cè)量信息目標(biāo)的狀態(tài)估計(jì)無(wú)關(guān)。 因此,可將進(jìn)行了去相關(guān)的遠(yuǎn)端傳感器的新信息與本地傳感器的測(cè)量數(shù)據(jù)融合。 在時(shí)刻tk(k 為遠(yuǎn)端傳感器R 估計(jì)的時(shí)間索引),進(jìn)行解相關(guān)信息狀態(tài)向量和相信的協(xié)方差矩陣可通過(guò)如下公式計(jì)算:
其中:
式中:f[·]為狀態(tài)轉(zhuǎn)移函數(shù);F[·]為f[·]的雅可比矩陣;Q[·]為過(guò)程噪聲的協(xié)方差。 可以看出解相關(guān)需要在式(3)和式(4)中從時(shí)間tk-1到tk的預(yù)測(cè)步驟。 當(dāng)遠(yuǎn)端傳感器S 中使用單模型卡爾曼濾波器且狀態(tài)轉(zhuǎn)移函數(shù)已知時(shí),信息去相關(guān)效果較好。
當(dāng)傳感器R 獲得的狀態(tài)估計(jì)在傳感器L 的tk時(shí)刻被接收到時(shí),它應(yīng)該被所有在tk之前,傳感器L獲得量測(cè)數(shù)據(jù)進(jìn)行更新,以便所有來(lái)自傳感器L 的量測(cè)信息都可以用于融合航跡的生成。 但顯然這是不切實(shí)際的,因?yàn)殡S著時(shí)間的積累,傳感器網(wǎng)絡(luò)往往無(wú)法存儲(chǔ)所有過(guò)去的測(cè)量信息。 因此,需要將截至?xí)r間tk-1的傳感器L 測(cè)量值的累積信息進(jìn)行計(jì)算,并將其標(biāo)記為(tk-1)。 當(dāng)收到傳感器R 的狀態(tài)估計(jì)(tk|tk)時(shí),先用累積信息(tk-1)(表示從開(kāi)始到時(shí)間tk-1的傳感器L 的測(cè)量值信息)更新,再用新得到的傳感器L 獲得的測(cè)量值ZL(tk,1),…,ZL(tk,nk)更新,假設(shè)從時(shí)間tk-1到tk的測(cè)量的數(shù)量為nk。融合處理完成后,進(jìn)行信息去相關(guān)處理,計(jì)算傳感器L測(cè)量值的累積信息(tk)(將在下一個(gè)時(shí)間周期中使用)。 去相關(guān)可通過(guò)如下公式進(jìn)行計(jì)算:
其中:
分別是最終融合的信息矩陣和向量。 并且:
分別為傳感器R 獲得的狀態(tài)信息矩陣和狀態(tài)向量。
在這一節(jié),將上述融合方法擴(kuò)展到多個(gè)模型,從而實(shí)現(xiàn)多傳感器的自適應(yīng)機(jī)動(dòng)目標(biāo)融合跟蹤。 其數(shù)據(jù)處理框架如圖2 所示。
圖2 機(jī)動(dòng)目標(biāo)跟蹤數(shù)據(jù)處理框架Fig.2 Data processing framework for maneuvering target tracking
式中:j 為模型指標(biāo);f[·]和h[·]分別為狀態(tài)轉(zhuǎn)移函數(shù)和量測(cè)函數(shù);t 為當(dāng)前時(shí)間;v(·)和w(·)為均值為零的高斯白噪聲,其相應(yīng)的協(xié)方差分別為Q(·)和R(·)。 這些模型可以與傳感器R 中IMM 估計(jì)器中使用的模型相同,也可以不同。
結(jié)合圖2,本文提出的基于多模型的局部狀態(tài)估計(jì)與量測(cè)信息的融合算法的基本流程如下:
(1)本地傳感器L 中不同模型累計(jì)信息(即開(kāi)始到tk-1時(shí)刻的信息)的混合。首先,將模型j=1,…,m 的信息轉(zhuǎn)化為狀態(tài)空間對(duì)應(yīng)的狀態(tài)估計(jì)即相應(yīng)的協(xié)方差,其計(jì)算公式如下:
根據(jù)標(biāo)準(zhǔn)IMM 混合算法的基礎(chǔ)上對(duì)各個(gè)模型的狀態(tài)估計(jì)和協(xié)方差進(jìn)行混合。 混合后,相應(yīng)的狀態(tài)及其誤差協(xié)方差分別為其中j=1,…,m。
為了便于后續(xù)的融合,將混合狀態(tài)重新轉(zhuǎn)換為信息空間,其相應(yīng)的表達(dá)式如下:
(2)將通過(guò)式(1)獲得的傳感器L 的累積測(cè)量信息與傳感器R 的狀態(tài)估計(jì)進(jìn)行融合。 首先,基于模型j,將由傳感器R 獲得的目標(biāo)局部狀態(tài)估計(jì)及其誤差協(xié)方差逆推到前一時(shí)刻,即tk-1,其逆推公式如下:
將上述逆推的狀態(tài)與傳感器L 在tk-1時(shí)刻的混合累積信息融合,即:
其中:
并將融合后的信息轉(zhuǎn)換為狀態(tài)空間為
然后根據(jù)運(yùn)動(dòng)模型,預(yù)測(cè)當(dāng)前時(shí)刻即tk時(shí)刻的融合狀態(tài)以及相應(yīng)的協(xié)方差:
(3)將上述獲得的預(yù)測(cè)的狀態(tài)估計(jì)和協(xié)方差與傳感器L 獲得量測(cè)信息ZL(tk,i)進(jìn)行融合,并獲得更新的模型概率μj(tk,i)。 然后將基于模型的融合狀態(tài)及其誤差協(xié)方差和模態(tài)概率賦值為
然后將所有基于模型的狀態(tài)進(jìn)行組合,組合過(guò)程與標(biāo)準(zhǔn)IMM 濾波器的組合方式相同。組合后狀態(tài)k)及其誤差協(xié)方差PF(tk)是當(dāng)前時(shí)刻的最終輸出。
(4)計(jì)算模型j=1,…,m 時(shí),在tk時(shí)刻傳感器L的測(cè)量值的累計(jì)信息,其表達(dá)式如下:
式中:IR(tk|tk)和tk|tk)分別是PR(tk|tk)和tk|tk)對(duì)應(yīng)的信息矩陣和向量分別是和對(duì)應(yīng)的信息矩陣和狀態(tài)向量。為了方便將上述提出的方法記為基于交互式多模型的自適應(yīng)融合(IMM-AF)。
為了驗(yàn)證本文提出算法的有效性,在Matlab 平臺(tái)上進(jìn)行仿真實(shí)驗(yàn)。 并將本文提出的方法與單傳感器R 以及文獻(xiàn)[15]提出的航跡到航跡的融合(T2TF)方法進(jìn)行對(duì)比。 目標(biāo)運(yùn)動(dòng)的真實(shí)軌跡如圖3 所示。
圖3 目標(biāo)真實(shí)軌跡Fig.3 Real target trajectory
真實(shí)速度為75 m/s 的目標(biāo)在起始位置為(100 m,100 m)處沿正東方向45°的方向做勻速運(yùn)動(dòng),持續(xù)45 s 后以4°/s 的速度做勻速圓周運(yùn)動(dòng),并持續(xù)30 s,最后又按照勻速運(yùn)動(dòng)運(yùn)行45 s。 遠(yuǎn)端傳感器R 和本地傳感器L 的位置坐標(biāo)分別為:(-2000 m,-1000 m),(4000 m,0 m)。 通過(guò)300 次的蒙特卡洛實(shí)驗(yàn)獲得3種方法的位置和速度的均方根誤差,分別如圖4 和圖5 所示。
圖4 位置均方根誤差Fig.4 Root mean square error of position
圖5 速度均方根誤差Fig.5 Root mean square error of velocity
由圖4 可知,在跟蹤的位置誤差方面,當(dāng)目標(biāo)發(fā)生機(jī)動(dòng)時(shí),誤差會(huì)出現(xiàn)短時(shí)間的增加,這是由于目標(biāo)機(jī)動(dòng)時(shí),目標(biāo)運(yùn)動(dòng)模型發(fā)生變化所導(dǎo)致,隨著IMM 算法中模型概率自適應(yīng)的變化,其誤差會(huì)迅速下降,這說(shuō)明了IMM 算法的有效性。此外,在跟蹤的整個(gè)過(guò)程中, 可以明顯看出本文提出的IMM-AF 方法明顯優(yōu)于單傳感器以及T2TM 方法。
由圖5 可知,在跟蹤速度誤差方面,當(dāng)在目標(biāo)發(fā)生機(jī)動(dòng)的較短的時(shí)間內(nèi),本文提出的方法與T2TM方法性能類(lèi)似,但能夠更快速地收斂,并明顯優(yōu)于其他兩種算法。 由此也證明了本文提出算法的有效性。
本文主要研究了多傳感器機(jī)動(dòng)目標(biāo)的融合跟蹤問(wèn)題,并提出了一種基于IMM 的自適應(yīng)融合跟蹤算法,即IMM-AF。該方法使用多個(gè)模型的累積測(cè)量信息來(lái)融合遠(yuǎn)端傳感器通過(guò)IMM 濾波器獲得的狀態(tài)估計(jì)以及和本地傳感器的累計(jì)量測(cè)信息。 這兩個(gè)傳感器中使用的多個(gè)模型可以相同,也可以不同。 在過(guò)程中,利用信息去相關(guān)的方法消除傳感器之間的相關(guān)性。 仿真結(jié)果表明,本文提出的方法能夠顯著提高目標(biāo)跟蹤的精度。