孟凡琨,巨永鋒,文常保
長(zhǎng)安大學(xué) 電子與控制工程學(xué)院,西安 710064
隨機(jī)網(wǎng)格回歸Monte Carlo雙UAVs最優(yōu)目標(biāo)協(xié)調(diào)跟蹤*
孟凡琨+,巨永鋒,文常保
長(zhǎng)安大學(xué) 電子與控制工程學(xué)院,西安 710064
針對(duì)多個(gè)無(wú)人機(jī)(unmanned aerial vehicle,UAV)執(zhí)行基于視覺(jué)的目標(biāo)跟蹤的最佳協(xié)調(diào)問(wèn)題,提高不可預(yù)知的地面目標(biāo)的最佳結(jié)合點(diǎn)的視覺(jué)測(cè)量效果,提出了一種基于隨機(jī)網(wǎng)格回歸Monte Carlo的UAV最優(yōu)目標(biāo)跟蹤策略。首先,通過(guò)無(wú)人機(jī)動(dòng)力學(xué)和目標(biāo)動(dòng)力學(xué)分析,獲得雙UAV情況下的隨機(jī)最優(yōu)協(xié)調(diào)控制目標(biāo);其次,針對(duì)提出的控制目標(biāo),引入Monte Carlo求解方案,同時(shí)為解決標(biāo)準(zhǔn)Monte Carlo方案中存在的狀態(tài)空間維度較高,計(jì)算復(fù)雜且精度不高的問(wèn)題,利用隨機(jī)網(wǎng)格方式構(gòu)建回歸Monte Carlo方案,實(shí)現(xiàn)UAV的最優(yōu)協(xié)調(diào)控制;最后,通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了所提方法的有效性。
隨機(jī)網(wǎng)格;回歸Monte Carlo;無(wú)人機(jī)(UAV);目標(biāo)跟蹤
近幾十年來(lái),無(wú)人機(jī)(unmanned aerial vehicle,UAV)得到廣泛研究并獲得極大進(jìn)展[1-2]。在各種無(wú)人機(jī)應(yīng)用中,目標(biāo)跟蹤是最常見且最重要的應(yīng)用。無(wú)人機(jī)可用于森林防火、軍事和攝影等多種實(shí)用領(lǐng)域,特別是在軍事領(lǐng)域,無(wú)人機(jī)聯(lián)合導(dǎo)彈的跟蹤打擊技術(shù)是發(fā)展的前沿方向,也是無(wú)人機(jī)跟蹤定位的研究趨勢(shì)。在實(shí)用領(lǐng)域,多數(shù)無(wú)人機(jī)采用的是結(jié)構(gòu)形式,對(duì)此這里以結(jié)構(gòu)無(wú)人機(jī)作為研究對(duì)象,而控制策略則是結(jié)構(gòu)無(wú)人機(jī)目標(biāo)跟蹤定位研究的重點(diǎn)[3-4]。
在目前研究中,采用時(shí)間連續(xù)的反饋控制策略是UAV進(jìn)行目標(biāo)跟蹤的主要控制和優(yōu)化策略。例如文獻(xiàn)[5]假定UAV為結(jié)構(gòu),同時(shí)假定無(wú)人機(jī)以平穩(wěn)速度和固定加速度進(jìn)行飛行,并給出閉環(huán)穩(wěn)定性,但以上結(jié)論是以特定約束為前提,不具有普遍性。文獻(xiàn)[6]推導(dǎo)獲得轉(zhuǎn)向穩(wěn)定控制律和引導(dǎo)分段控制律,實(shí)現(xiàn)航向角穩(wěn)定控制,但是所提模型須符合設(shè)定的目標(biāo)速度,也就是目標(biāo)必須是可視的條件。文獻(xiàn)[7]利用進(jìn)化計(jì)算方法對(duì)UAV跟蹤問(wèn)題進(jìn)行近似求解,獲得UAV目標(biāo)跟蹤的時(shí)空優(yōu)化,但應(yīng)用的前提條件是輸入符合連續(xù)二階特征。文獻(xiàn)[8]對(duì)UAV目標(biāo)跟蹤輸入數(shù)據(jù)進(jìn)行在線控制,并采用Kalman濾波實(shí)現(xiàn)UAV目標(biāo)狀態(tài)的實(shí)時(shí)更新,同時(shí)結(jié)合Markov過(guò)程對(duì)目標(biāo)跟蹤進(jìn)行決策求解,約束條件是UAV以恒速飛行。文獻(xiàn)[9]利用Markov過(guò)程,對(duì)旋轉(zhuǎn)速度進(jìn)行平面控制,并利用隨機(jī)優(yōu)化方法對(duì)問(wèn)題進(jìn)行求解,限制條件是連續(xù)平穩(wěn)飛行軌跡。文獻(xiàn)[10]利用視覺(jué)圖像構(gòu)建結(jié)構(gòu)無(wú)人機(jī)伺服控制系統(tǒng),并利用航向角對(duì)狀態(tài)進(jìn)行反饋,實(shí)現(xiàn)橫向動(dòng)力的擴(kuò)充控制,該算法實(shí)現(xiàn)的前提是目標(biāo)的可視性良好。文獻(xiàn)[11]基于無(wú)人機(jī)被動(dòng)視覺(jué)對(duì)地面車輛目標(biāo)進(jìn)行定位跟蹤,但要求其運(yùn)行軌跡為水平近似圓形,并且輸入須符合一階建模特征,同時(shí)對(duì)于機(jī)械特性一階模型構(gòu)造過(guò)于簡(jiǎn)單,不利于真實(shí)情況的準(zhǔn)確反應(yīng)。
上述算法均須滿足特定假設(shè),例如輸入必須滿足階次特征,這會(huì)導(dǎo)致輥的動(dòng)力學(xué)特征被忽視;運(yùn)動(dòng)目標(biāo)必須以恒定速度運(yùn)動(dòng),這在實(shí)際中是不可能的;目標(biāo)必須是可以看見的,當(dāng)出現(xiàn)大霧等極端天氣情況下,跟蹤效果受限;UAV運(yùn)行軌跡符合近似圓或正弦軌跡,也不現(xiàn)實(shí)。這些假設(shè)制約了無(wú)人機(jī)的應(yīng)用效果。同時(shí),上述研究中均未考慮多無(wú)人機(jī)的協(xié)調(diào)跟蹤問(wèn)題,不利于目標(biāo)跟蹤精度的提升。針對(duì)此問(wèn)題,本文提出基于隨機(jī)網(wǎng)格回歸Monte Carlo的UAV最優(yōu)目標(biāo)跟蹤算法,主要貢獻(xiàn)如下:(1)通過(guò)無(wú)人機(jī)動(dòng)力學(xué)和目標(biāo)動(dòng)力學(xué)分析,獲得UAV的隨機(jī)最優(yōu)協(xié)調(diào)控制目標(biāo);(2)引入Monte Carlo求解方案,并利用隨機(jī)網(wǎng)格方式構(gòu)建回歸Monte Carlo(regression Monte Carlo,RMC)方案,實(shí)現(xiàn)UAV的最優(yōu)協(xié)調(diào)控制。
2.1 無(wú)人機(jī)動(dòng)力學(xué)
每個(gè)無(wú)人機(jī)都假設(shè)有自動(dòng)駕駛儀,通過(guò)內(nèi)部反饋回路實(shí)現(xiàn)角度、速度和高度的期望設(shè)定。在所提模型中,無(wú)人機(jī)j在固定速度sj和恒定高度hj下飛行。跟蹤過(guò)程中,需要測(cè)量的無(wú)人機(jī)信息有無(wú)人機(jī)j的水平位置(xj,yj)∈R2、航向ψj∈S1和轉(zhuǎn)角?j∈S1,通過(guò)東-北地球坐標(biāo)系進(jìn)行測(cè)量。在后者坐標(biāo)系中,x軸指向機(jī)鼻,y軸指向機(jī)體右翼,z軸構(gòu)成右手坐標(biāo)系。
根據(jù)確定性的連續(xù)時(shí)間模型構(gòu)建無(wú)人機(jī)隨機(jī)離散時(shí)間運(yùn)動(dòng)模型[12]:
如圖1描述,從高逼真度飛行模擬器中對(duì)滾動(dòng)軌跡采樣,并生成Np滾角軌跡?i(τ,r,u)集合Φ(r,u),其中i∈{1,2,…,Np},τ∈[0,Ts]。
其中,αg為重力加速度;f(?,u)為輥動(dòng)力學(xué)函數(shù),可表示為f(?,u)=-α?(?-u),α?>0。此時(shí),1/α?>0,可視為相應(yīng)自動(dòng)駕駛儀控制回路的時(shí)間常數(shù),令實(shí)際轉(zhuǎn)角?趨近于設(shè)定值u。然而,可用更詳細(xì)模型對(duì)輥動(dòng)力學(xué)表述,對(duì)輥角度設(shè)定值u施加二次零階保持器(zero-order holder,ZOH),并利用飛機(jī)6自由度模型獲得飛行模擬器的高保真輥軌跡。在采樣過(guò)程中,假設(shè)u∈C,其中:
Fig.1 Monte Carlo simulation of sample rolling trajectory圖1 樣本滾動(dòng)軌跡的蒙特卡羅模擬
為使飛機(jī)模型更逼真,引入速度s的隨機(jī)性,其隨機(jī)分布中心值為μs,分布區(qū)間為,其中σs為分布的標(biāo)準(zhǔn)偏差。
在給定當(dāng)前狀態(tài)ξ和輥設(shè)定u情況下,這種建模技術(shù)允許生成下一個(gè)狀態(tài)ξ′的樣本ξ-(i,u)。具體講,樣本ξ-(i,u)的前3個(gè)元素是下式的隱式解:
式中,?i(τ,r,u)在集合Φ(r,u)內(nèi)隨機(jī)選取,并且選取概率相等。樣本ξ-(i,u)的第4個(gè)元素是確定的,并可簡(jiǎn)化為r?(i,u)=u。無(wú)人機(jī)的位置和航向具有兩個(gè)隨機(jī)性來(lái)源:在輥角軌跡采集捕獲的隨機(jī)性輥動(dòng)角和隨機(jī)性飛行速度。
2.2 目標(biāo)動(dòng)力學(xué)
假定目標(biāo)的狀態(tài)η按照Markov決策過(guò)程演變。目標(biāo)運(yùn)動(dòng)的狀態(tài)轉(zhuǎn)移概率函數(shù)pg(η′|η)可隱式定義。目標(biāo)被假定為在地面上行駛的完整車輛,具有轉(zhuǎn)向和加速能力。目標(biāo)測(cè)量信息包含平面位置(xg,yg)∈R2,行駛方向ψg∈S1和行駛速度v∈R≥0,其中平面位置和行駛速度可通過(guò)測(cè)量無(wú)人機(jī)與目標(biāo)的距離和歐拉角,利用簡(jiǎn)單的三角函數(shù)定理進(jìn)行計(jì)算。狀態(tài)η可定義為[13]:
其中,ω和a分別為拐彎速度和控制輸入加速度。對(duì)于給定的正標(biāo)量α、和,目標(biāo)加速度a來(lái)自對(duì)稱的三角形分布的時(shí)間間隔。目標(biāo)的拐彎速率ω分布在對(duì)稱三角支持區(qū)間,其中,滿足。
考慮目標(biāo)為中心的狀態(tài)空間Z,其維度為n=9。對(duì)于j∈{1,2},利用τj表示無(wú)人機(jī)j的相對(duì)位置:
同時(shí),定義無(wú)人機(jī)j相對(duì)于目標(biāo)的姿態(tài)pj:= (τj,ψr,j)∈R2×[-π,π),其中:
式中,函數(shù)atan2是四象限反切線函數(shù)。狀態(tài)向量z∈Z?R9可表示為:
其中,rj和v分別表示無(wú)人機(jī)j的離散化輥角和目標(biāo)速度。
2.3 隨機(jī)最優(yōu)控制目標(biāo)
定位誤差通過(guò)無(wú)人機(jī)j與目標(biāo)間的三維距離dj在地面上得到放大。無(wú)人機(jī)j的誤差協(xié)方差可表示為,協(xié)方差。歐拉角序列θj∈R3描述無(wú)人機(jī)j的傳感器姿態(tài)。利用無(wú)人機(jī)獨(dú)立測(cè)量采集的與目標(biāo)的距離和歐拉角信息,并根據(jù)式(12)計(jì)算獲得狀態(tài)向量z,同時(shí)根據(jù)文獻(xiàn)[14]計(jì)算獲得誤差協(xié)方差Pj,進(jìn)而可對(duì)融合后的定位誤差協(xié)方差P進(jìn)行計(jì)算[14]:
其中,j表示無(wú)人機(jī)編號(hào),j=1,2。誤差協(xié)方差的特點(diǎn)如圖2所示。融合的協(xié)方差由3個(gè)自由度決定,即目標(biāo)和無(wú)人機(jī)分離角的平面距離是隱式定義的:
其中,相對(duì)平面位置τj∈R2,可利用式(10)進(jìn)行計(jì)算。為實(shí)現(xiàn)P相關(guān)估計(jì)誤差最小化,使用隨機(jī)最優(yōu)控制問(wèn)題的目標(biāo)函數(shù)是:
式(15)中“trace()”函數(shù)為Matlab工具箱中的跡函數(shù),用于求取二維方陣的跡,即該方陣對(duì)角線上元素之和,可最大限度地減少融合誤差橢圓主要和次要軸的方差總和。則隨機(jī)最優(yōu)控制問(wèn)題是確定最優(yōu)反饋控制策略::Z→C2,k∈{0,1,…,K-1},最小化目標(biāo)為:
其中,zk=z(kTs);K∈N;E[·]表示期望;g[·]可根據(jù)式(15)計(jì)算;z0,z1,…,zK是根據(jù)轉(zhuǎn)移概率p(z′|z,u)的馬爾可夫決策過(guò)程;反饋控制律為uk=μ*k(zk)。狀態(tài)轉(zhuǎn)移概率p(z′|z,u)等價(jià)于p(zk+1|zk,uk)。
Fig.2 Individual error ellipse coordinate chart圖2 個(gè)別誤差橢圓坐標(biāo)圖
3.1 動(dòng)態(tài)規(guī)劃Monte Carlo求解方案
利用Markov性質(zhì)對(duì)價(jià)值函數(shù)進(jìn)行動(dòng)態(tài)優(yōu)化,其價(jià)值狀態(tài)轉(zhuǎn)移過(guò)程可定義為[14]:
式中,q表示給定的量化函數(shù):
式中,s∈Rn,有限集合X?Rn。查找任意狀態(tài)z∈Zz的最佳命令uk,有。
這種方法適用于較小的隨機(jī)最優(yōu)控制問(wèn)題,如單無(wú)人機(jī)目標(biāo)跟蹤情況下,狀態(tài)維數(shù)n為5。然而,這樣的方法對(duì)于狀態(tài)空間較大時(shí)不可行,如對(duì)應(yīng)兩個(gè)無(wú)人機(jī)情況下,其中n=9。
3.2 回歸Monte Carlo求解策略
利用Q值理論進(jìn)行算法設(shè)計(jì)[15]:
如前所述,狀態(tài)空間Monte Carlo量化方法是在每個(gè)點(diǎn)z上使用多個(gè)Monte Carlo模擬方式進(jìn)行點(diǎn)估算,算法所需的計(jì)算復(fù)雜度較高,而本文回歸Monte Carlo方法,基于Q值理論進(jìn)行模擬路徑構(gòu)建,降低了Monte Carlo模擬求解數(shù)量,以提高目標(biāo)控制效率。
在所提算法中,在時(shí)間k=K-1處產(chǎn)生“噪音”的實(shí)例,對(duì)應(yīng)于連續(xù)成本Qk-1(z,u),及特定的控制作用u∈U。連續(xù)成本可表示為:
其中,每個(gè)是在時(shí)間k以時(shí)間K-1處的點(diǎn)z(i)∈Z為起始的蒙特卡羅樣本狀態(tài),并對(duì)每個(gè)點(diǎn)應(yīng)用控制律u。時(shí)刻K-1的近似最優(yōu)控制律為:
3.3 隨機(jī)網(wǎng)格回歸目標(biāo)跟蹤
在傳統(tǒng)RMC算法中,隨機(jī)網(wǎng)格Z對(duì)應(yīng)一個(gè)集合的模擬路徑,其中i∈{1,2,…,M},其初始控制策略為,初始狀態(tài)為。因此,在傳統(tǒng)RMC中,Z是時(shí)間相關(guān)量,并且在時(shí)刻k等于。這種情形下,初始控制律對(duì)預(yù)測(cè)精度影響較大。隨機(jī)網(wǎng)格分區(qū)示例見圖3。
Fig.3 Partition strategy圖3 分區(qū)策略
令I(lǐng)l?{1,2,…,M}表示屬于隨機(jī)網(wǎng)格分區(qū)l的粒子索引子集,其中|Il|=m=M/Np。此外,對(duì)于Il= {i1,i2,…,im},有。這里qi是樣本路徑成本。此外,令,其中用于評(píng)估在分區(qū)l中的每個(gè)點(diǎn)z(i)的二次基函數(shù)。假設(shè)回歸方程形式為:
這里,ε(l)∈Rm是分區(qū)l中的殘差向量;1m×1為長(zhǎng)度是m的單位向量;是在回歸中確定的系數(shù)。為使回歸系數(shù)魯棒性更強(qiáng),應(yīng)盡量減少:
偽代碼1隨機(jī)網(wǎng)格回歸Monte Carlo目標(biāo)跟蹤
上述算法在計(jì)算過(guò)程中,存在一個(gè)嵌套循環(huán),其計(jì)算復(fù)雜度為O(KlbN)。其中K為回歸Monte Carlo求解策略中隨機(jī)選取的樣本點(diǎn)數(shù)量,N為總的樣本點(diǎn)數(shù)量。而狀態(tài)空間標(biāo)準(zhǔn)Monte Carlo量化方法的計(jì)算復(fù)雜度為O(NlbN)。顯然改進(jìn)后的算法在計(jì)算復(fù)雜度上要優(yōu)于原始算法。
4.1 算法跟蹤實(shí)驗(yàn)
本文研究在兩無(wú)人機(jī)情況下目標(biāo)跟蹤的最佳協(xié)調(diào)控制問(wèn)題。在Matlab/Simulink環(huán)境下,進(jìn)行跟蹤控制數(shù)值仿真。實(shí)驗(yàn)過(guò)程共包含4個(gè)子程序模塊:無(wú)人機(jī)動(dòng)力學(xué)計(jì)算模塊、目標(biāo)動(dòng)力學(xué)計(jì)算模塊、隨機(jī)最優(yōu)目標(biāo)控制律計(jì)算模塊和隨機(jī)網(wǎng)格回歸目標(biāo)跟蹤模塊。控制流程如圖4所示。有關(guān)參數(shù)設(shè)置見表1和表2所示。
Fig.4 Optimal coordination control problem圖4 最佳協(xié)調(diào)控制問(wèn)題
Table 1 Motion parameters of random target表1 隨機(jī)目標(biāo)運(yùn)動(dòng)參數(shù)
Table 2 Random parameters in UAV dynamics表2 無(wú)人機(jī)動(dòng)力學(xué)中的隨機(jī)參數(shù)
每個(gè)分區(qū)在二次回歸過(guò)程中有36個(gè)自由度,連續(xù)狀態(tài)空間χ的維數(shù)為7。正則化參數(shù)λ的作用是在過(guò)程噪聲中添加魯棒性,λ∈[3,10]。分區(qū)的總數(shù)是,根據(jù)對(duì)稱性,對(duì)于320以上的分區(qū)Q值不需重復(fù)估計(jì),因此隨機(jī)網(wǎng)格X的大小為M= 320×104。
樣本軌跡1實(shí)驗(yàn)為了突出最佳軌跡的關(guān)鍵特征,這里提供一個(gè)有代表性的樣本軌跡如圖5(a)所示,相應(yīng)的性能參數(shù)如圖5(b)所示。圖中T為目標(biāo)軌跡,A1為無(wú)人機(jī)1的跟蹤軌跡,A2為無(wú)人機(jī)2的跟蹤軌跡。
Fig.5 Sample trajectory characteristics圖5 樣本軌跡特征
根據(jù)圖5(a),最佳軌跡包括正弦和軌道軌跡,后者不一定是圍繞目標(biāo)運(yùn)動(dòng)的。在仿真開始時(shí),一個(gè)無(wú)人機(jī)正在執(zhí)行一個(gè)“S”旋轉(zhuǎn)(正弦模式),而另一個(gè)是執(zhí)行一個(gè)循環(huán)。無(wú)人機(jī)切換角色和執(zhí)行相同的聯(lián)合動(dòng)作前,兩個(gè)無(wú)人機(jī)的相位循環(huán),然后進(jìn)行了階段性的“輪換”。根據(jù)圖5(b),距離協(xié)調(diào)變得明顯,距離曲線的峰值交替出現(xiàn)。圖5(b)第二插圖表明,無(wú)人機(jī)不保持正交視角,因?yàn)樵讦?90°情況下曲線不發(fā)生擾動(dòng)。然而,當(dāng)無(wú)人機(jī)間距離較大時(shí),有利于從正交的視角進(jìn)行目標(biāo)跟蹤。
樣本軌跡2實(shí)驗(yàn)選擇無(wú)人機(jī)連續(xù)拐彎軌跡進(jìn)行實(shí)驗(yàn)。在樣本軌跡1中因?yàn)楣諒澬问竭^(guò)大,雖然協(xié)調(diào)跟蹤效果不錯(cuò),但是無(wú)人機(jī)2跟蹤效果不佳。對(duì)此,樣本軌跡2選取更為普遍的連續(xù)拐彎軌跡進(jìn)行實(shí)驗(yàn)。假定無(wú)人機(jī)跟蹤目標(biāo)共存在4次拐彎,且無(wú)回旋,初始位置(1.45×105,1.2×105),初始速度(-100,100)。假定目標(biāo)在0~23 s內(nèi)作勻速直線運(yùn)動(dòng);在24~42 s內(nèi)為勻角速ω=4.77°s拐彎;在43~62 s內(nèi)為勻速直線運(yùn)動(dòng);在63~86 s內(nèi)為勻角速ω=6.56°s拐彎;在87~99 s內(nèi)為勻速直線運(yùn)動(dòng);在100~119 s內(nèi)為勻角速ω= -5.96°s拐彎;在120~149 s內(nèi)為勻速直線運(yùn)動(dòng);在150~174 s內(nèi)為勻角速ω=5.38°s拐彎。雙無(wú)人機(jī)的目標(biāo)協(xié)調(diào)跟蹤軌跡及跟蹤誤差如圖6、圖7所示。
Fig.6 Target coordination tracking圖6 目標(biāo)協(xié)調(diào)跟蹤
Fig.7 Tracking error圖7 跟蹤誤差
根據(jù)圖6、圖7可知,在運(yùn)動(dòng)軌跡簡(jiǎn)化后,兩個(gè)無(wú)人機(jī)的協(xié)調(diào)跟蹤效果得到明顯改善,均可實(shí)現(xiàn)較為精確的控制效果,并且具有很小的跟蹤誤差。
為橫向?qū)Ρ人惴ㄐ阅?,下面將選取難度更大的樣本1作為實(shí)驗(yàn)對(duì)象,進(jìn)行算法性能對(duì)比驗(yàn)證。
4.2 跟蹤效果對(duì)比
為驗(yàn)證所提控制策略優(yōu)勢(shì),選取文獻(xiàn)[11]和文獻(xiàn)[13]作為對(duì)比算法,對(duì)比其在樣本軌跡1上的協(xié)調(diào)跟蹤效果。因?yàn)樵跍y(cè)試過(guò)程中,所采用的對(duì)比算法均執(zhí)行15 min以上的飛行跟蹤測(cè)試,所以這里選取15 min的測(cè)試窗口進(jìn)行測(cè)試數(shù)據(jù)統(tǒng)計(jì)分析。表3所示為選取的幾種對(duì)比算法的有關(guān)參數(shù)對(duì)比情況。
Table 3 Test window statistical results表3 測(cè)試窗口統(tǒng)計(jì)結(jié)果
根據(jù)表3數(shù)據(jù)可知,在仰角?指標(biāo)上,本文算法在最大仰角和最低仰角上均要小于選取的文獻(xiàn)[11]和文獻(xiàn)[13]兩種對(duì)比算法。并且其仰角?偏差也要小于兩種對(duì)比算法。這表明所提算法在兩個(gè)無(wú)人機(jī)配合和數(shù)據(jù)融合使用上要優(yōu)于選取的單無(wú)人機(jī)方法,其可基于較小的機(jī)身調(diào)整實(shí)現(xiàn)更為準(zhǔn)確的目標(biāo)跟蹤,跟蹤過(guò)程更為穩(wěn)定。在跟蹤距離偏差均值上,本文算法所示兩個(gè)無(wú)人機(jī)也要優(yōu)于選取的對(duì)比算法,表明其跟蹤精度更高。
因?yàn)楸疚乃惴ㄔ趯?duì)跟蹤目標(biāo)函數(shù)進(jìn)行設(shè)計(jì)時(shí),考慮到兩個(gè)無(wú)人機(jī)的協(xié)調(diào)問(wèn)題,所以兩個(gè)無(wú)人機(jī)跟蹤效果應(yīng)該是相互補(bǔ)充的。為驗(yàn)證這種協(xié)調(diào)性,選取文獻(xiàn)[14]算法對(duì)兩個(gè)無(wú)人機(jī)進(jìn)行控制,與本文無(wú)人機(jī)跟蹤過(guò)程兩個(gè)無(wú)人機(jī)跟蹤距離ρ1和ρ2的聯(lián)合概率密度分布對(duì)比情況,如圖8所示。
根據(jù)圖8實(shí)驗(yàn)數(shù)據(jù)可知,在兩個(gè)無(wú)人機(jī)協(xié)調(diào)配合上,本文算法的配合效果要優(yōu)于文獻(xiàn)[14]的對(duì)比算法。從圖8(b)可以看出,該算法控制下的兩個(gè)無(wú)人機(jī)呈現(xiàn)較明顯的反相關(guān)性,當(dāng)一個(gè)無(wú)人機(jī)距離目標(biāo)較近時(shí),另一個(gè)無(wú)人機(jī)則離目標(biāo)較遠(yuǎn),這體現(xiàn)了較強(qiáng)的配合性,達(dá)到了設(shè)計(jì)目標(biāo)。
Fig.8 Joint probability density distribution of two UAVs圖8 兩個(gè)無(wú)人機(jī)聯(lián)合概率密度分布
本文提出了基于隨機(jī)網(wǎng)格回歸Monte Carlo的UAV最優(yōu)目標(biāo)跟蹤策略。首先給出了UAV情況下的隨機(jī)最優(yōu)協(xié)調(diào)控制目標(biāo);然后利用隨機(jī)網(wǎng)格方式構(gòu)建回歸Monte Carlo方案,實(shí)現(xiàn)UAV的最優(yōu)協(xié)調(diào)控制。實(shí)驗(yàn)結(jié)果驗(yàn)證了所提方法在跟蹤效果和協(xié)調(diào)配合上的優(yōu)勢(shì)。
由于這項(xiàng)工作的目的是為了減少基于視覺(jué)的位置測(cè)量誤差,從而實(shí)現(xiàn)更準(zhǔn)確的目標(biāo)狀態(tài)重建,今后研究方向是采用更為先進(jìn)的算法,如利用粒子濾波算法,在目標(biāo)運(yùn)行的狀態(tài)空間中尋找一組隨機(jī)樣本對(duì)條件后驗(yàn)概率密度進(jìn)行近似。然后利用最優(yōu)控制率實(shí)現(xiàn)無(wú)人機(jī)的最優(yōu)控制,從而獲得無(wú)人機(jī)運(yùn)行狀態(tài)同目標(biāo)運(yùn)行狀態(tài)的最小方差估計(jì)。這種粒子濾波的隨機(jī)樣本方式可降低跟蹤計(jì)算復(fù)雜性。
[1]Peng Xiaodong,Zhang Tiemin,Li Jiyu,et al.An attitude estimation algorithm for small unmanned aerial vehicle based on sensor calibration and fusion[J].Journal of Automation, 2015,41(4):854-860.
[2]Peng Xiaodong,Zhang Tiemin,Li Jiyu,et al.Field calibration method for three axis digital MEMS accelerometer[J]. Vibration,Test and Diagnosis,2014,34(3):544-548.
[3]Liu Xiaofeng,Guan Zhiwei,Song Yuqing,et al.An optimization model of UAV route planning for road segment surveillance[J].Journal of Central South University,2014,21 (6):2501-2510.
[4]Yong S J,Ju Y Y,Kwon O J.Numerical investigation of prop-rotor and tail-wing aerodynamic interference for a tilt-rotor UAV configuration[J].Journal of Mechanical Science and Technology,2014,28(7):2609-2617.
[5]Zhao Shiyu,Lin Feng,Peng Kemao,et al.Vision-aided estimation of attitude,velocity,and inertial measurement bias for UAV stabilization[J].Journal of Intelligent&Robotic Systems,2016,81(3):531-549.
[6]Song B D,Kim J,Kim J W,et al.Persistent UAV service: an improved scheduling formulation and prototypes of system components[J].Journal of Intelligent&Robotic Systems,2014,74(1):221-232.
[7]Kim M H,Baik H,Lee S.Resource welfare based task allocation for UAV team with resource constraints[J].Journal of Intelligent&Robotic Systems,2015,77(3):611-627.
[8]Hu Xiaoxuan,Chen Yi,Luo He.Robust decision making for UAV air-to-ground attack under severe uncertainty[J]. Journal of Central South University,2015,22(11):4263-4273.
[9]Araguás G,Paz C,Gaydou D,et al.Quaternion-based orientation estimation fusing a camera and inertial sensors for a hovering UAV[J].Journal of Intelligent&Robotic Systems,2015,77(1):37-53.
[10]Peng Cheng,Bai Yue,Gong Xun,et al.Modeling and robust backstepping sliding mode control with adaptive RBFNN for a novel coaxial eight-rotor UAV[J].IEEE/CAA Journal ofAutomatica Sinica,2015,2(1):56-64.
[11]Lin L,Goodrich M A.Hierarchical heuristic search using a Gaussian mixture model for UAV coverage planning[J]. IEEE Transactions on Cybernetics,2014,44(12):2532-2544.
[12]Chen Yikai,Wang Chaofu.Electrically small UAV antenna design using characteristic modes[J].IEEE Transactions on Antennas and Propagation,2014,62(2):535-545.
[13]Nemra A,Aouf N.Robust INS/GPS sensor fusion for UAV localization using SDRE nonlinear filtering[J].IEEE Sensors Journal,2010,10(4):789-798.
[14]Quintero S A P,Papi F,Klein D J,et al.Optimal UAV coordination for target tracking using dynamic programming [C]//Proceedings of the 49th IEEE Conference on Decision and Control,Atlanta,USA,Dec 15-17,2010.Piscataway, USA:IEEE,2010:4541-4546.
[15]Sun Haibo,Zhou Rui,Zou Li,et al.Heterogeneous multi UAV distributed cooperative target tracking under the condition of limited communication and measurement[J].Journal ofAeronautical Science,2011,36(2):299-310.
附中文參考文獻(xiàn):
[1]彭孝東,張鐵民,李繼宇,等.基于傳感器校正與融合的農(nóng)用小型無(wú)人機(jī)姿態(tài)估計(jì)算法[J].自動(dòng)化學(xué)報(bào),2015,41 (4):854-860.
[2]彭孝東,張鐵民,李繼宇,等.三軸數(shù)字MEMS加速度計(jì)現(xiàn)場(chǎng)標(biāo)定方法[J].振動(dòng)、測(cè)試與診斷,2014,34(3):544-548.
[15]孫海波,周銳,鄒麗,等.通信和測(cè)量受限條件下異構(gòu)多UAV分布式協(xié)同目標(biāo)跟蹤方法[J].航空學(xué)報(bào),2011,36 (2):299-310.
MENG Fankun was born in 1989.He is a Ph.D.candidate at Chang'an University.His research interests include control theory and application,etc.
孟凡琨(1989—),男,長(zhǎng)安大學(xué)博士研究生,主要研究領(lǐng)域?yàn)榭刂评碚摷捌鋺?yīng)用等。
JU Yongfeng was born in 1962.He is a professor and Ph.D.supervisor at Chang'an University.His research interests include traffic control and management,etc.
巨永鋒(1962—),男,博士,長(zhǎng)安大學(xué)教授、博士生導(dǎo)師,主要研究領(lǐng)域?yàn)榻煌刂婆c管理等。
WEN Changbao was born in 1976.He is a professor and M.S.supervisor at Chang'an University.His research interests include signal processing and detection device,etc.
文常保(1976—),男,博士,長(zhǎng)安大學(xué)教授、碩士生導(dǎo)師,主要研究領(lǐng)域?yàn)樾盘?hào)處理技術(shù),檢測(cè)裝置等。
Stochastic Mesh Regression Monte Carlo Based UAVs Optimal Target Tracking*
MENG Fankun+,JU Yongfeng,WEN Changbao
School of Electronic and Control Engineering,Chang'an University,Xi'an 710064,China
+Corresponding author:E-mail:mengfnkn@163.com
In order to solve the optimal coordination problem of visual target tracking for unmanned aerial vehicles (UAVs),and improve the visual measurement result in the best combination of unpredictable target on the ground,this paper presents the stochastic mesh regression Monte Carlo based UAVs optimal target tracking algorithm.Firstly,the stochastic optimal coordinated control target is obtained by the analysis of UAV dynamics and target dynamics.Secondly, for the control objectives,the Monte Carlo method is introduced,and the random grid based regression Monte Carlo scheme is also designed to solve the high state space dimension of the standard Monte Carlo scheme,so as to solve the complex calculation and low precision,which can realize UAVs optimal coordinated control.Finally,simulation experiments are carried out to verify the effectiveness of the proposed method.
random grid;regression Carlo Monte;unmanned aerial vehicle(UAV);target tracking
10.3778/j.issn.1673-9418.1606053
A
:TP391
*The National Natural Science Foundation of China under Grant No.61473047(國(guó)家自然科學(xué)基金);the Fundamental Research Funds for the Central Universities of China under Grant No.2014G3322008(中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金).
Received 2016-06,Accepted 2016-09.
CNKI網(wǎng)絡(luò)優(yōu)先出版:2016-09-08,http://www.cnki.net/kcms/detail/11.5602.TP.20160908.1045.016.html
MENG Fankun,JU Yongfeng,WEN Changbao.Stochastic mesh regression Monte Carlo based UAVs optimal target tracking.Journal of Frontiers of Computer Science and Technology,2017,11(3):450-458.