亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Cauchy-Schwarz散度的多傳感器控制

        2020-06-16 01:05:20楊小軍
        計算機技術(shù)與發(fā)展 2020年6期
        關(guān)鍵詞:散度后驗濾波器

        吳 莎,楊小軍

        (長安大學(xué) 信息工程學(xué)院,陜西 西安 710064)

        0 引 言

        多目標(biāo)跟蹤多傳感器技術(shù)無論在軍事領(lǐng)域還是在民事領(lǐng)域均有廣泛的應(yīng)用,它可用于探測、跟蹤和攻擊、機器視覺等[1-2]。隨著目標(biāo)的增多,多傳感器對于目標(biāo)的跟蹤相較于單傳感器有著明顯的優(yōu)勢,它對于目標(biāo)信息的獲取有著重大的意義,提高了對目標(biāo)狀態(tài)估計的精確性和系統(tǒng)的可信度。由于通信和計算的限制,需要把每個傳感器控制在適當(dāng)?shù)奈恢?,使整個系統(tǒng)達到最優(yōu)。那么對于諸多傳感器采取合適的決策成為必要解決的問題。在大多數(shù)目標(biāo)跟蹤場景中,可以通過對傳感器的位置、方向等工作方式及參數(shù)進行調(diào)控而獲得不同的量測數(shù)據(jù),從而提高傳感器檢測目標(biāo)的能力和系統(tǒng)的估計性能,實現(xiàn)整體系統(tǒng)優(yōu)化。

        1997年隨機有限集(random finite set,RFS)的提出,避免了多目標(biāo)跟蹤航跡關(guān)聯(lián)的復(fù)雜問題,它允許多傳感器多目標(biāo)濾波適應(yīng)統(tǒng)一的隨機集框架進行數(shù)據(jù)融合[3]。其最大優(yōu)勢是可以將多目標(biāo)跟蹤和傳感器控制統(tǒng)一描述為一個貝葉斯框架下部分可觀測的馬爾可夫決策過程(partially observed Markov decision process,POMDP)[4]。但RFS不能對目標(biāo)進行唯一標(biāo)識,進而Vo等學(xué)者在2013年提出帶標(biāo)簽隨機有限集(labeled random finite set,LRFS)的概念,并且提出了廣義帶標(biāo)簽的多伯努利(generalized labeled Multi-Bernoulli filter,GLMB)濾波器。δ-廣義帶標(biāo)簽的多伯努利(δ-GLMB)和帶標(biāo)簽的多伯努利(LMB)濾波器都是GLMB濾波器的特殊形式,GLMB和δ-GLMB因含有多組分量從而在迭代過程中呈指數(shù)形式增長導(dǎo)致計算復(fù)雜的問題,而LMB濾波器在定義中只包含一組組件,所以其在迭代過程中的假設(shè)分量呈線性增長,有效地解決了GLMB和δ-GLMB計算難的問題。由于LMB濾波器計算效率高,精確地產(chǎn)生目標(biāo)航跡而得到廣泛應(yīng)用。

        多傳感器管理是通過優(yōu)化決策對傳感器進行配置。評價函數(shù)是產(chǎn)生決策集的重要指標(biāo)[5],評價函數(shù)可大致分為成本函數(shù)和回報函數(shù):成本函數(shù)主要包括估計目標(biāo)勢方差[6]、勢和狀態(tài)后驗期望誤差(PEECS)[7]、最優(yōu)子模式分配(OSPA)距離[8]。成本函數(shù)在單目標(biāo)跟蹤中能發(fā)揮其性能,但在多目標(biāo)跟蹤中仍有一定挑戰(zhàn)?;貓蠛瘮?shù)是基于信息論的,在目標(biāo)跟蹤領(lǐng)域,基于信息論的傳感器控制的主要目的是為了通過與目標(biāo)環(huán)境的相互作用以減少目標(biāo)環(huán)境的不確定性,這種不確定性可以用信息熵來定性描述[9]。回報函數(shù)最常用一些信息散度,如Rényi散度、Kullback-Leibler(KL)散度和Cauchy-Schwarz(CS)散度。Hoang等人推導(dǎo)出兩種泊松點過程混合物的柯西-施瓦茨散度的封閉形式[10],因此與基于信息論的其他散度相比,CS散度在數(shù)學(xué)計算上更加簡單。文獻[11]的結(jié)果顯示CS和KL雖具有相似的計算趨勢,但CS的計算要快得多,特別是在維度高的情況下更高效,故選取CS散度作為評價函數(shù)對于多傳感器管理的研究更為合適。

        對于多目標(biāo)跟蹤多傳感器控制問題,傳感器的管理決策需要信息融合結(jié)果的支持,并通過對傳感器資源的合理調(diào)度來提高信息融合的質(zhì)量和效率[12]。廣義交叉協(xié)方差(GCI)被廣泛地應(yīng)用于分布式多傳感器多目標(biāo)跟蹤中,但其存在標(biāo)簽不一致的問題。在文獻[13-14]中解決此問題的方法是將目標(biāo)的標(biāo)簽在融合時去掉從而避免標(biāo)簽不一致帶來的影響。未帶標(biāo)簽的后驗密度進行GCI融合確實避免了標(biāo)簽對GCI信息融合的影響,但是因為去掉了標(biāo)簽而不能產(chǎn)生跟蹤軌跡,因此文獻[15]提出了魯棒GCI融合(R-GCI),保留后驗密度的標(biāo)簽,在不丟失目標(biāo)軌跡的情況下對信息進行融合但卻不會因標(biāo)簽的錯誤匹配對GCI融合產(chǎn)生影響,通過融合后的密度使傳感器的數(shù)據(jù)得到有效結(jié)合,實現(xiàn)了對目標(biāo)更好的估計[16]。

        文中在LMB濾波器框架下,通過選用最優(yōu)傳感器控制決策對目標(biāo)進行更加精確的跟蹤。首先敘述了預(yù)備知識:LMB濾波器、Cauchy-Schwarz散度、R-GCI多目標(biāo)密度融合準(zhǔn)則;然后講述LMB濾波器和CS散度的SMC執(zhí)行并給出多傳感器管理的具體算法步驟;最后通過仿真驗證了提出的算法的有效性。

        1 預(yù)備知識和問題描述

        1.1 LMB濾波器

        LMB濾波器可以實現(xiàn)目標(biāo)跟蹤的要求,首先,對RFS加入標(biāo)簽將目標(biāo)的狀態(tài)擴展為X={(xi,i)}(i=1,2,…,|X|),xi∈,i∈,為目標(biāo)狀態(tài)空間,是標(biāo)簽空間,|·|表示目標(biāo)的勢。LMB RFS可以用參數(shù){(r,p(·):∈)}完全表示,這里的r∈[0,1]是目標(biāo)標(biāo)簽的存在概率,p(·)是目標(biāo)狀態(tài)的概率密度函數(shù)。LMB RFS密度如下:

        (1)

        其中:

        (2)

        (3)

        (4)

        1.2 柯西-施瓦茲(CS)散度

        CS散度是基于內(nèi)積的柯西-施瓦茲不等式的對稱量測距離[18-19],其描述的是兩個密度函數(shù)f(x)和g(x)之間信息含量的差異性。CS散度的定義如下:

        (5)

        其中,f(X)和g(X)分別表示目標(biāo)預(yù)測密度和目標(biāo)后驗密度,上式的積分是集積分。

        Hong等人在文獻[19]中提出泊松點過程的CS散度并證明了兩個泊松點過程之間的CS散度是它們各自強度函數(shù)之間距離的平方的一半,兩個泊松點過程的CS散度的公式表達為:

        (6)

        其中,G1和G2分別是泊松點過程預(yù)測密度和更新密度的強度函數(shù),K表示單目標(biāo)狀態(tài)的(超體積)測量單位。上述公式是計算兩個帶標(biāo)簽多伯努利密度之間的CS散度的基礎(chǔ),在第二部分會給出CS散度的具體計算。

        1.3 LMB多目標(biāo)概率密度的魯棒GCI融合

        Mahler提出次優(yōu)的廣義交叉協(xié)方差(generalized covariance intersection,GCI)準(zhǔn)則以解決最優(yōu)融合準(zhǔn)則在實際中計算昂貴且公共信息計算難的問題。GCI準(zhǔn)則如下:

        (7)

        其中,ωi是恒定權(quán)重,表示在融合過程中強調(diào)傳感器i的強度。式(7)中的后驗密度是未帶標(biāo)簽的,文獻[15]提出了帶標(biāo)簽后驗密度的魯棒GCI融合準(zhǔn)則。

        文獻[15]先定義了多標(biāo)簽的聯(lián)合條件概率密度:

        (8)

        帶標(biāo)簽的融合后驗密度為:

        (9)

        (10)

        (11)

        多目標(biāo)的狀態(tài)是由N個傳感器進行觀測,每個傳感器返回一組量測值,Zi是第i個傳感器返回的量測,量測空間為,設(shè)累積的量測集為:

        Ik=(Z1,…,ZN)∈

        (12)

        多傳感器控制問題可以轉(zhuǎn)化為部分可觀測馬爾可夫決策過程(POMDP),POMDP定義為一個6元組:

        Ψ={,,f(·|·),,g(·|·),R(u1,…,uN)}

        (13)

        在控制問題上,目標(biāo)函數(shù)R(u1,…,uN)采用CS散度,CS散度是用預(yù)測和后驗多目標(biāo)密度距離之間的關(guān)系表示的:

        R(u1,…,uN)=DCS(π+,πs,u)

        (14)

        其中,π+是融合預(yù)測密度,πs,u是融合后驗密度。最優(yōu)決策集是通過最大化目標(biāo)函數(shù)的期望值:

        (15)

        2 基于SMC的多目標(biāo)多傳感器控制問題求解

        文獻[20]中討論了三種抵消未來量測不確定性的方法,預(yù)測理想量測集(predicted ideal measurement set,PIMS)是其中能更好地產(chǎn)生傳感器管理決策的方法。故選用PIMS作為更新步驟中所需的假設(shè)量測。對于每個決策ui∈,利用每個狀態(tài)估計產(chǎn)生無噪聲和無雜波的量測,這樣的一組量測作為PIMS,用表示:

        (16)

        2.1 LMB濾波器的SMC執(zhí)行

        多目標(biāo)后驗密度f(X|Z)可以通過一組隨機粒子Xj進行近似,每個粒子都有合適的權(quán)重。目標(biāo)的帶標(biāo)簽多伯努利密度π={r,p},目標(biāo)的狀態(tài)密度p(x)可以用一組粒子集進行近似:

        (17)

        其中,J是目標(biāo)采樣的粒子數(shù)目;ω是每個粒子的權(quán)重;δY(X)是狄利克雷函數(shù),當(dāng)X=Y時等于1,其他等于0。下面介紹LMB濾波器用SMC實現(xiàn)的預(yù)測和更新方程。

        預(yù)測:在這里考慮目標(biāo)的存活和新生兩種,所以LMB預(yù)測多目標(biāo)密度的參數(shù)可以表示為:

        (18)

        其中:

        (19)

        (20)

        ηS()=〈pS(·,),p(·)〉

        (21)

        更新:傳感器i將相應(yīng)的控制決策u∈和理想量測集應(yīng)用于濾波器更新,更新的LMB密度為:

        (22)

        根據(jù)文獻[22]得出的LMB更新方程,LMB密度的各個參數(shù)如下:

        (23)

        (24)

        其中:

        (25)

        (26)

        (27)

        (28)

        (29)

        2.2 基于SMC的R-GCI融合

        (30)

        將式(29)帶入式(13)和式(14)中,用粒子表示融合參數(shù):

        (31)

        (32)

        (33)

        2.3 CS散度的SMC實現(xiàn)

        結(jié)合上面LMB預(yù)測和更新方程對CS散度進行SMC執(zhí)行。預(yù)測和更新的LMB強度函數(shù)為:

        (34)

        (35)

        對多目標(biāo)后驗分布最有效的近似是多目標(biāo)分布的一階矩[22]。文獻[9]證明了關(guān)于兩個多伯努利強度函數(shù)的CS散度的公式表達,由此得出兩個LMB密度的CS散度公式:

        (36)

        根據(jù)δ函數(shù)的積分特性,回報函數(shù)為:

        (37)

        采用逼近之后,問題(15)最優(yōu)決策的求解為:

        (38)

        其中,M是采樣的粒子數(shù)。

        綜上所述,由于積分計算難的問題,采用SMC逼近融合密度和CS散度以對最優(yōu)決策進行求解,問題(15)的算法總結(jié)如下。

        算法1:濾波器迭代、融合和多傳感器控制算法。

        Step1:根據(jù)式(14)~式(17)的預(yù)測步進行預(yù)測:預(yù)測

        Step2:計算回報函數(shù):

        (1)對于每個粒子X(j)∈T和控制決策(u1,…,uN)∈,計算理想量測集:

        (2)根據(jù)式(19)~式(25)更新LMB,并保存后驗參數(shù)和粒子:

        (3)對于每個粒子X(j)∈T,每一個控制決策(u1,…,uN)∈的R-GCI融合:

        (4)計算每個回報函數(shù):DCS(π+,πu)→R(j)(u1,…,uN)。

        求解最優(yōu)問題(38)是對N個傳感器并行求解,這是一個NP難的問題,計算復(fù)雜度隨著傳感器個數(shù)的增加而呈指數(shù)增加,求解有很大的挑戰(zhàn)。而局部迭代搜索[23]是多項式難的問題,在實際中是可行的。故采用局部迭代搜索的方法尋找次優(yōu)解。

        算法2:局部迭代搜索算法。

        Step1:選擇一組初始決策。

        Step2:在初始解的鄰域內(nèi)搜索更好的解。

        (3)將余下的傳感器重復(fù)(1)、(2)的操作,直到所有的傳感器都重新選擇決策;

        (4)對每一個傳感器的決策都進行選擇,直到窮舉完每個傳感器的最大決策數(shù),選取使回報函數(shù)最大的決策集。

        3 仿真分析

        pB=diag([50; 50; 50; 50; 6(pi/180)]T)2。

        傳感器測量的是具有噪聲的極坐標(biāo)矢量形式:

        其中,σD=10 000 m控制檢測概率的速率隨著范圍增大而減小。目標(biāo)的存活概率pS,k(x)=0.98,單位體積的平均雜波數(shù)目λc=12。

        傳感器平臺以8 m/s的恒定速度移動,但在預(yù)先指定的決策時間改變航向。每個傳感器允許的控制集合是ui=[-1800,-1500,…,00,…,1500,1800],樣本數(shù)量為M=103,測試場景由三個目標(biāo)和兩個傳感器組成,觀測時間是60 s,用兩個傳感器對三個目標(biāo)進行跟蹤,每個傳感器每隔10 s做一次決策,10 s內(nèi)傳感器保持當(dāng)前運動方向不變,每次時間末重新決策,考慮是否改變傳感器的運動方向,在仿真時間60 s內(nèi),每個傳感器共做6次決策。局部濾波器是LMB濾波器,每個節(jié)點的GCI融合權(quán)重選取0.5。

        圖1 目標(biāo)的真實運動軌跡

        如圖1所示,目標(biāo)的起始和結(jié)束分別用○和△符號表示,每個目標(biāo)的出生和死亡時間不同,分別在圖中標(biāo)注,圖中兩個傳感器所在位置為初始位置。

        圖2 傳感器運動軌跡

        如圖2所示,帶箭頭的線為兩個傳感器的運動軌跡;由圖可看出兩個傳感器靠近目標(biāo)運動,可知,提出的控制方法可以做出傳感器靠近目標(biāo)運動的正確決策。

        如圖3所示,對目標(biāo)的跟蹤性能,局部迭代的搜索法尋找的次優(yōu)解與窮舉法的最優(yōu)解的性能相近,而隨機決策對應(yīng)的OSPA距離峰值時間滯后且誤差大。所以,當(dāng)傳感器數(shù)量多且難以計算時,用局部迭代搜索法替代窮舉法是可行的。

        圖3 OSPA距離對比

        4 結(jié)束語

        對多傳感器多目標(biāo)跟蹤問題,文中提出一種多傳感器最優(yōu)控制策略。選擇CS散度作為系統(tǒng)性能評價函數(shù),通過最大化回報函數(shù)實現(xiàn)多個傳感器的最優(yōu)控制。在隨機有限集框架下,采用LMB濾波器獲得多目標(biāo)的航跡估計,并且基于保留標(biāo)簽的R-GCI融合準(zhǔn)則對多傳感器多目標(biāo)航跡估計進行分布式融合?;赟MC逼近,得到多目標(biāo)概率密度之間CS散度的數(shù)值求解,并且給出基于SMC的LMB濾波器和R-GCI融合地逼近執(zhí)行。在此基礎(chǔ)上提出一種基于局部迭代搜索的傳感器控制策略的次優(yōu)算法。后續(xù)工作包括尋找更加有效的多傳感器航跡融合方法和優(yōu)化算法。

        猜你喜歡
        散度后驗濾波器
        基于無擾濾波器和AED-ADT的無擾切換控制
        帶勢加權(quán)散度形式的Grushin型退化橢圓算子的Dirichlet特征值的上下界
        基于對偶理論的橢圓變分不等式的后驗誤差分析(英)
        具有部分BMO系數(shù)的非散度型拋物方程的Lorentz估計
        貝葉斯統(tǒng)計中單參數(shù)后驗分布的精確計算方法
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        開關(guān)電源EMI濾波器的應(yīng)用方法探討
        電子制作(2018年16期)2018-09-26 03:26:50
        H型群上一類散度形算子的特征值估計
        一種基于最大后驗框架的聚類分析多基線干涉SAR高度重建算法
        H?rmander 向量場上散度型拋物方程弱解的Orlicz估計
        亚洲熟女乱综合一区二区| 亚洲av成人一区二区三区网址| 亚洲AⅤ无码国精品中文字慕 | 欧美黑人xxxx又粗又长| 最新国产av无码专区亚洲| 久久香蕉成人免费大片| 国产极品视觉盛宴在线观看| 中文字幕视频二区三区| 手机在线观看av资源| 日韩精品真人荷官无码| 毛片24种姿势无遮无拦| 日韩精品网| 亚洲av色香蕉第一区二区三区| 亚洲国产区中文在线观看| 999zyz玖玖资源站永久| 久久久无码人妻精品无码| 国产精品福利影院| 被暴雨淋湿爆乳少妇正在播放| 日韩一区二区中文字幕| 亚洲av福利院在线观看| 免费国产裸体美女视频全黄| 亚洲欧美精品91| 亚洲中文字幕女同一区二区三区| 国产精品久久国产精麻豆| 亚洲图片自拍偷图区| 午夜无码伦费影视在线观看| 国产日韩欧美网站| av毛片在线播放网址| 精品成人av人一区二区三区| 国产精品偷窥熟女精品视频| 国产午夜福利在线播放| 一本一本久久a久久精品综合| 久久成人精品国产免费网站| 日韩中文字幕版区一区二区三区| 精品国内在视频线2019| 欧美变态口味重另类在线视频| 国产va免费精品高清在线观看| 丰满人妻无奈张开双腿av| 日本一区二区三区光视频 | 久久精品熟女亚洲av香蕉| 人妻体内射精一区二区三四|