高 爽 欒小麗 趙順毅 劉 飛
由于測量手段的不同,導(dǎo)致量測數(shù)據(jù)具有不同 的特征,如常規(guī)傳感器量測數(shù)據(jù)與在線分析儀數(shù)據(jù)相比,雖然采樣速率高,但數(shù)據(jù)精度較低[1-3];對于飛航導(dǎo)彈而言,高采樣速率的慣導(dǎo)數(shù)據(jù)短期動態(tài)品質(zhì)好,而雙星定位系統(tǒng)在較長的時間內(nèi),可以提供精度較高的位置信息[4].因此,為了獲得更精確的狀態(tài)估計值,在立足常規(guī)量測值時,如何更好地利用輔助量測數(shù)據(jù)引起了國內(nèi)外學(xué)者的廣泛關(guān)注.其中,融合策略是一種常見的方法,如航跡融合方法[5](Track to track fusion,TTF) 利用相關(guān)性對不同濾波器的估計值進(jìn)行融合,并廣泛應(yīng)用于信息融合領(lǐng)域.后來,各種延伸的融合估計方法被陸續(xù)提出[6].然而,上述融合策略局限于各類傳感器采樣周期一致的情況,當(dāng)采樣速率不同時,估計策略往往在常規(guī)量測的基礎(chǔ)上,利用額外的量測數(shù)據(jù)對其進(jìn)行修正.換言之,額外量測值僅僅是錦上添花.鑒于此,學(xué)者們提出了不同額外信息利用策略來提升狀態(tài)估計效果[7-9].如文獻(xiàn)[10]提出當(dāng)慢速率數(shù)據(jù)可獲得時,利用數(shù)據(jù)融合的方法將不同量測數(shù)據(jù)下獲得的估計值進(jìn)行融合.進(jìn)一步,最優(yōu)融合策略[11]也被用來處理不同量測數(shù)據(jù)下卡爾曼濾波器獲得的估計值,針對最優(yōu)求解困難的問題,文獻(xiàn)[12-13]從智能學(xué)習(xí)的角度提出了新的優(yōu)化策略.在此基礎(chǔ)上,文獻(xiàn)[14]考慮到噪聲參數(shù)的不確定性,利用修正后的卡爾曼濾波器估計值進(jìn)行融合,并分析了其收斂性.另一方面,考慮到多率量測信息之間噪聲的相關(guān)性,文獻(xiàn)[15]采用矩陣加權(quán)的方法,提出了最小方差意義下的分布式融合估計策略.進(jìn)一步,文獻(xiàn)[16]將噪聲信息從高斯分布推廣到 t 分布以增強(qiáng)估計性能的魯棒性.
除了上述針對單一模態(tài)系統(tǒng)在多率量測下的狀態(tài)估計,近年來,隨機(jī)多模態(tài)系統(tǒng)在多率量測下的狀態(tài)估計也取得了很大進(jìn)展.文獻(xiàn)[17]將TTF 融合方法從單一模態(tài)系統(tǒng)拓展到跳變系統(tǒng),然而,其融合權(quán)重依賴于協(xié)方差矩陣.后來,文獻(xiàn)[18-19]利用一致性理論,在多模型框架下提出了分布式融合策略.文獻(xiàn)[20]則提出了一種基于融合預(yù)測的交互多模型算法,通過修改交互多模型算法 (The interacting multiple model,IMM)融合預(yù)測來最小化噪聲和低數(shù)據(jù)率的影響.文獻(xiàn)[21]在高斯混合概率假設(shè)的濾波框架下,提出了多級協(xié)同的融合方法.針對多個局部無序量測數(shù)據(jù),基于最優(yōu)線性無偏估計,文獻(xiàn)[22]提出了一種具有多個任意階躍滯后的最優(yōu)集中估計算法.文獻(xiàn)[23]提出了一種連續(xù)多速率采樣數(shù)據(jù)融合方法設(shè)計網(wǎng)絡(luò)濾波器,解決多傳感器異步采樣難題.另一方面,基于H∞策略的魯棒交互式多模型算法也陸續(xù)被提出[24-26],這些文獻(xiàn)采用最優(yōu)信息融合準(zhǔn)則實(shí)現(xiàn)不同量測信息下的融合.另外一種可行的思路是借鑒變結(jié)構(gòu)多模型估計思想[27-28],將慢速率量測的估計值作為一種新的模態(tài)嵌入到多模型框架中.雖然上述融合策略可以借助于額外信息,從不同角度為多率量測下的狀態(tài)估計提供了可能,但其本質(zhì)是對估計結(jié)果的折衷與加權(quán),即額外信息的利用并沒有改變狀態(tài)估計器的本質(zhì)結(jié)構(gòu),更無法量化慢速率輔助量測信息對估計精度的影響.
因此,本文針對具有多率量測信息的隨機(jī)跳變系統(tǒng),從遷移學(xué)習(xí)的角度設(shè)計一種新的交互多模型估計器.該方法利用源域?yàn)V波器處理緩慢、不規(guī)則采樣且不易獲得的高精度輔助量測數(shù)據(jù),而通過目標(biāo)域?yàn)V波器處理快速、規(guī)則采樣和無延遲的常規(guī)量測數(shù)據(jù).同時,利用平滑策略實(shí)現(xiàn)源域慢速率輔助量測信息到目標(biāo)域快速率數(shù)據(jù)的知識遷移.然后,通過定義利用常規(guī)量測數(shù)據(jù)獲得的待估計狀態(tài)的后驗(yàn)概率與引入高精度輔助量測數(shù)據(jù)獲得的待估計狀態(tài)的后驗(yàn)概率之間差異性度量方法,求解最優(yōu)的貝葉斯遷移估計器,實(shí)現(xiàn)輔助信息的充分利用,提高了估計精度.本文的創(chuàng)新點(diǎn)和貢獻(xiàn)主要體現(xiàn)在以下4 個方面:1) 不同于融合策略,在遷移估計器的結(jié)構(gòu)中,嵌入了遷移平滑步,實(shí)現(xiàn)輔助量測信息有效利用的同時,解決多率量測下的貝葉斯估計難題;2) 利用平滑策略不僅架起了源域?yàn)V波器與目標(biāo)域?yàn)V波器之間知識傳遞的橋梁,也將貝葉斯遷移學(xué)習(xí)拓展到多率量測下的狀態(tài)估計領(lǐng)域;3) 設(shè)計的遷移濾波器能同時學(xué)習(xí)源域和目標(biāo)域中包含的知識,可以提高估計精度;4) 構(gòu)建了輔助量測數(shù)據(jù)與估計性能之間的解析關(guān)系,可以定量評價源域數(shù)據(jù)的引入對估計性能的影響.
考慮如下馬爾科夫跳變系統(tǒng),并假設(shè)系統(tǒng)可以獲得多種量測數(shù)據(jù),以圖1 中的兩種為例.
圖1 多率量測過程 (實(shí)線表示真實(shí)狀態(tài),虛線表示目標(biāo)域量測 (在線快速率數(shù)據(jù)),點(diǎn)表示源域量測 (離線化驗(yàn)數(shù)據(jù)),其采樣時間可能不規(guī)律)Fig.1 Multiple source measurements of the process with different sampling rates (Solid lines are true states,and dashed lines represent target measurements.Dots denote source measurements,whose sample time may be irregular)
本文的任務(wù)是在快速率、規(guī)則但不精確的量測情況下,輔以慢速率、不規(guī)則但更精確的源域數(shù)據(jù),設(shè)計遷移貝葉斯估計器,對系統(tǒng) (1)~(3) 的狀態(tài)進(jìn)行估計.假設(shè)源域?yàn)V波器處理慢速率輔助量測數(shù)據(jù),目標(biāo)域?yàn)V波器處理常規(guī)快速率量測數(shù)據(jù),由于源域數(shù)據(jù)yS,k比目標(biāo)域量測數(shù)據(jù)yk更加精確,故源域噪聲方差RS,k比目標(biāo)域噪聲方差Rk小.同時,通過遷移估計,將源域?yàn)V波器提取的知識遷移到目標(biāo)貝葉斯濾波器,實(shí)現(xiàn)估計精度的提升.
在貝葉斯估計中,后驗(yàn)概率密度函數(shù) (Probability density function,PDF) 提供了狀態(tài)變量的完整描述[29],因此根據(jù)系統(tǒng)的量測數(shù)據(jù)Yk={y0,···,yk},貝葉斯估計的任務(wù)是計算后驗(yàn)概率函數(shù)p(xk,rk|Yk). 基于此,本文利用概率分布FS刻畫從源域?yàn)V波器遷移的知識,因此,任務(wù)轉(zhuǎn)變成求解給定源域知識下的后驗(yàn)分布,即
根據(jù)貝葉斯公式,條件后驗(yàn)分布計算如下
其中,∝表示正比符號,本文假設(shè)遷移知識的形式為源域?yàn)V波器中量測邊緣分布,即約束似然函數(shù)為
因此,知識遷移后的后驗(yàn)分布為
利用KL (Kullback-Leibler) 散度量化引入源域數(shù)據(jù)的修正分布與貝葉斯后驗(yàn)分布之間的距離[30-31],即在知識約束的集合內(nèi)對濾波分布進(jìn)行優(yōu)化求解
從式 (9) 的遷移修正步可以看出,貝葉斯遷移中知識遷移的形式為遷移源域?yàn)V波器中量測邊緣分布而非源域量測數(shù)據(jù),可用下式計算
由于慢速率源域量測數(shù)據(jù)稀疏,式 (11) 中上一時刻的源域?yàn)V波器后驗(yàn)分布難以獲得.且直接利用上一時刻目標(biāo)域的估計值代替并不能獲得滿意的結(jié)果.因此,如何近似求解源域一步滯后估計值是實(shí)現(xiàn)遷移的關(guān)鍵.本文利用平滑策略結(jié)合源域當(dāng)前時刻可獲得估計值與目標(biāo)域上一時刻的估計值,即用平滑分布近似代替源域?yàn)V波器后驗(yàn)分布進(jìn)一步推導(dǎo)可得
注1.不同于傳統(tǒng)處理當(dāng)前與未來量測值的平滑策略,本文所提平滑策略結(jié)合源域與目標(biāo)域?yàn)V波器的估計值,獲取待遷移的估計值.
基于上述分析,面對多率量測信息時,針對馬爾科夫跳變系統(tǒng),可設(shè)計如圖2 所示的遷移估計器結(jié)構(gòu),混合交互步與IMM 形式一致,即
圖2 遷移交互多模型估計器結(jié)構(gòu)圖Fig.2 Basic operation diagram of the transfer interacting multiple model state estimator
為了定量分析源域數(shù)據(jù)的引入對估計性能的影響,本節(jié)利用影響力函數(shù)[32-33]來刻畫源域數(shù)據(jù)遷移對估計性能的影響,量化源域數(shù)據(jù)的引入對估計精度影響的程度.定義損失函數(shù)如下
根據(jù)附錄D 提供的推導(dǎo),源域數(shù)據(jù)對估計精度的影響力值可由下式計算得到
圖3 展示了源域數(shù)據(jù)的引入對遷移估計器的影響力函數(shù) (Influence function,IF) 曲線和均方根誤差 (Root mean square errors,RMSEs) 曲線,可以看出IF 曲線變化趨勢與RMSEs 趨勢一致,即影響力函數(shù)可以有效地用于量化源域數(shù)據(jù)引入后對估計精度的影響,在對估計性能進(jìn)行定量分析的同時,也為源域數(shù)據(jù)質(zhì)量的評價提供了新的手段,可以有效避免負(fù)遷移.
圖3 源域數(shù)據(jù)對遷移估計器的影響力曲線Fig.3 The influence function of source measurements on the transfer state estimator
本節(jié)利用運(yùn)動目標(biāo)跟蹤例子來說明所提遷移交互多模型估計算法 (Transfer interacting multiple model state estimator,IMM-TF) 的有效性,并與如下3 種方法進(jìn)行對比:1) 交互多模型算法 (Interacting multiple model,IMM),該算法沒有源域數(shù)據(jù)遷移,在這里作為基準(zhǔn);2) 交互多模型融合算法(Interacting multiple model fusion,IMM-FU),該算法是多模型下的TTF 常規(guī)融合方法;3) 變結(jié)構(gòu)交互多模型算法[34](Variable structure interacting multiple model,VSIMM),該方法把利用源域數(shù)據(jù)得到的估計值作為新的模態(tài)嵌入到IMM 結(jié)構(gòu)中.基于蒙特卡洛采樣計算的RMSEs作為估計性能指標(biāo).假設(shè)目標(biāo)的加速度根據(jù)有限狀態(tài)馬爾科夫鏈演化,動力學(xué)方程可描述為
在仿真中,源域量測數(shù)據(jù)與目標(biāo)域量測數(shù)據(jù)的比例為3:5.基于400 次蒙特卡洛仿真,圖4 給出了不同算法下的均方根誤差,可以看出,IMM-TF 估計性能明顯優(yōu)于IMM、IMM-FU和VSIMM 算法.
圖4 不同算法在運(yùn)動目標(biāo)跟蹤中的均方根誤差Fig.4 RMSEs of different algorithms for the moving target tracking
此外,本文分析了源域數(shù)據(jù)數(shù)量和質(zhì)量對估計性能的影響,表1 展示了估計精度隨著源域數(shù)據(jù)比重的增加而增加,說明該方法具有正遷移特性.在圖5 中,本文用不同的量測噪聲方差RS刻畫源域數(shù)據(jù)質(zhì)量,讓RS從{0.1,1,10,100,1 000}中取值,分別對應(yīng)5 種情況,圖中以位置估計效果為例,可以看出當(dāng)RS<R時,即源域數(shù)據(jù)質(zhì)量高于目標(biāo)域數(shù)據(jù)質(zhì)量時,源域數(shù)據(jù)質(zhì)量越高,遷移效果越好,當(dāng)源域數(shù)據(jù)質(zhì)量低于目標(biāo)域數(shù)據(jù)質(zhì)量時,遷移效果甚至不如IMM.圖6 進(jìn)一步展示了利用本文所提的基于影響力值的遷移估計器算法 (Influence function transfer state estimator,IF-TF) 可以有效避免負(fù)遷移的產(chǎn)生,當(dāng)源域數(shù)據(jù)質(zhì)量較差時,該算法根據(jù)影響力值自動濾除該源域數(shù)據(jù),提高算法的魯棒性.
表1 不同數(shù)量的源域數(shù)據(jù)遷移后的 RMSEsTable 1 Average RMSEs (per sample) of IMM-TF in the presence of different amount source measurements
圖5 源域數(shù)據(jù)質(zhì)量對遷移估計器算法性能的影響Fig.5 Demonstration of the performance of IMM-TF in the presence of source measurements of different quality
圖6 基于影響力值的遷移估計器算法性能Fig.6 Demonstration of the performance of IF-TF
針對多率量測背景下跳變系統(tǒng)的狀態(tài)估計問題,本文提出了一種遷移交互多模型估計算法,并利用平滑策略推導(dǎo)了知識遷移的形式,設(shè)計了遷移平滑估計器結(jié)構(gòu),實(shí)現(xiàn)了對輔助源域數(shù)據(jù)的有效利用.同時,通過構(gòu)建源域量測數(shù)據(jù)與估計性能之間的解析關(guān)系,定量分析了源域量測數(shù)據(jù)的引入對估計性能的影響.仿真結(jié)果表明,本文所提出的遷移估計器IMM-TF 優(yōu)于VSIMM、IMM和IMM-FU,同時避免了負(fù)遷移的產(chǎn)生.由于從源域到目標(biāo)域的可遷移性和可遷移程度對估計性能起著重要的作用,因此在該框架下如何定義和設(shè)計可遷移程度仍然是開放問題.
附錄A.推導(dǎo)式(9)
將式 ( 5)和式 ( 7) 代入式 ( 8) 得到
附錄B.推導(dǎo)式(13)、式(14)
附錄C.推導(dǎo)式(20)~式(23)
附錄D.推導(dǎo)式(33)
根據(jù)影響力函數(shù)式 (30),進(jìn)一步推導(dǎo)如下