孟凡琨,巨永鋒,文常保
長安大學 電子與控制工程學院,西安 710064
隨機網(wǎng)格回歸Monte Carlo雙UAVs最優(yōu)目標協(xié)調(diào)跟蹤*
孟凡琨+,巨永鋒,文常保
長安大學 電子與控制工程學院,西安 710064
針對多個無人機(unmanned aerial vehicle,UAV)執(zhí)行基于視覺的目標跟蹤的最佳協(xié)調(diào)問題,提高不可預知的地面目標的最佳結(jié)合點的視覺測量效果,提出了一種基于隨機網(wǎng)格回歸Monte Carlo的UAV最優(yōu)目標跟蹤策略。首先,通過無人機動力學和目標動力學分析,獲得雙UAV情況下的隨機最優(yōu)協(xié)調(diào)控制目標;其次,針對提出的控制目標,引入Monte Carlo求解方案,同時為解決標準Monte Carlo方案中存在的狀態(tài)空間維度較高,計算復雜且精度不高的問題,利用隨機網(wǎng)格方式構(gòu)建回歸Monte Carlo方案,實現(xiàn)UAV的最優(yōu)協(xié)調(diào)控制;最后,通過仿真實驗驗證了所提方法的有效性。
隨機網(wǎng)格;回歸Monte Carlo;無人機(UAV);目標跟蹤
近幾十年來,無人機(unmanned aerial vehicle,UAV)得到廣泛研究并獲得極大進展[1-2]。在各種無人機應用中,目標跟蹤是最常見且最重要的應用。無人機可用于森林防火、軍事和攝影等多種實用領(lǐng)域,特別是在軍事領(lǐng)域,無人機聯(lián)合導彈的跟蹤打擊技術(shù)是發(fā)展的前沿方向,也是無人機跟蹤定位的研究趨勢。在實用領(lǐng)域,多數(shù)無人機采用的是結(jié)構(gòu)形式,對此這里以結(jié)構(gòu)無人機作為研究對象,而控制策略則是結(jié)構(gòu)無人機目標跟蹤定位研究的重點[3-4]。
在目前研究中,采用時間連續(xù)的反饋控制策略是UAV進行目標跟蹤的主要控制和優(yōu)化策略。例如文獻[5]假定UAV為結(jié)構(gòu),同時假定無人機以平穩(wěn)速度和固定加速度進行飛行,并給出閉環(huán)穩(wěn)定性,但以上結(jié)論是以特定約束為前提,不具有普遍性。文獻[6]推導獲得轉(zhuǎn)向穩(wěn)定控制律和引導分段控制律,實現(xiàn)航向角穩(wěn)定控制,但是所提模型須符合設定的目標速度,也就是目標必須是可視的條件。文獻[7]利用進化計算方法對UAV跟蹤問題進行近似求解,獲得UAV目標跟蹤的時空優(yōu)化,但應用的前提條件是輸入符合連續(xù)二階特征。文獻[8]對UAV目標跟蹤輸入數(shù)據(jù)進行在線控制,并采用Kalman濾波實現(xiàn)UAV目標狀態(tài)的實時更新,同時結(jié)合Markov過程對目標跟蹤進行決策求解,約束條件是UAV以恒速飛行。文獻[9]利用Markov過程,對旋轉(zhuǎn)速度進行平面控制,并利用隨機優(yōu)化方法對問題進行求解,限制條件是連續(xù)平穩(wěn)飛行軌跡。文獻[10]利用視覺圖像構(gòu)建結(jié)構(gòu)無人機伺服控制系統(tǒng),并利用航向角對狀態(tài)進行反饋,實現(xiàn)橫向動力的擴充控制,該算法實現(xiàn)的前提是目標的可視性良好。文獻[11]基于無人機被動視覺對地面車輛目標進行定位跟蹤,但要求其運行軌跡為水平近似圓形,并且輸入須符合一階建模特征,同時對于機械特性一階模型構(gòu)造過于簡單,不利于真實情況的準確反應。
上述算法均須滿足特定假設,例如輸入必須滿足階次特征,這會導致輥的動力學特征被忽視;運動目標必須以恒定速度運動,這在實際中是不可能的;目標必須是可以看見的,當出現(xiàn)大霧等極端天氣情況下,跟蹤效果受限;UAV運行軌跡符合近似圓或正弦軌跡,也不現(xiàn)實。這些假設制約了無人機的應用效果。同時,上述研究中均未考慮多無人機的協(xié)調(diào)跟蹤問題,不利于目標跟蹤精度的提升。針對此問題,本文提出基于隨機網(wǎng)格回歸Monte Carlo的UAV最優(yōu)目標跟蹤算法,主要貢獻如下:(1)通過無人機動力學和目標動力學分析,獲得UAV的隨機最優(yōu)協(xié)調(diào)控制目標;(2)引入Monte Carlo求解方案,并利用隨機網(wǎng)格方式構(gòu)建回歸Monte Carlo(regression Monte Carlo,RMC)方案,實現(xiàn)UAV的最優(yōu)協(xié)調(diào)控制。
2.1 無人機動力學
每個無人機都假設有自動駕駛儀,通過內(nèi)部反饋回路實現(xiàn)角度、速度和高度的期望設定。在所提模型中,無人機j在固定速度sj和恒定高度hj下飛行。跟蹤過程中,需要測量的無人機信息有無人機j的水平位置(xj,yj)∈R2、航向ψj∈S1和轉(zhuǎn)角?j∈S1,通過東-北地球坐標系進行測量。在后者坐標系中,x軸指向機鼻,y軸指向機體右翼,z軸構(gòu)成右手坐標系。
根據(jù)確定性的連續(xù)時間模型構(gòu)建無人機隨機離散時間運動模型[12]:
如圖1描述,從高逼真度飛行模擬器中對滾動軌跡采樣,并生成Np滾角軌跡?i(τ,r,u)集合Φ(r,u),其中i∈{1,2,…,Np},τ∈[0,Ts]。
其中,αg為重力加速度;f(?,u)為輥動力學函數(shù),可表示為f(?,u)=-α?(?-u),α?>0。此時,1/α?>0,可視為相應自動駕駛儀控制回路的時間常數(shù),令實際轉(zhuǎn)角?趨近于設定值u。然而,可用更詳細模型對輥動力學表述,對輥角度設定值u施加二次零階保持器(zero-order holder,ZOH),并利用飛機6自由度模型獲得飛行模擬器的高保真輥軌跡。在采樣過程中,假設u∈C,其中:
Fig.1 Monte Carlo simulation of sample rolling trajectory圖1 樣本滾動軌跡的蒙特卡羅模擬
為使飛機模型更逼真,引入速度s的隨機性,其隨機分布中心值為μs,分布區(qū)間為,其中σs為分布的標準偏差。
在給定當前狀態(tài)ξ和輥設定u情況下,這種建模技術(shù)允許生成下一個狀態(tài)ξ′的樣本ξ-(i,u)。具體講,樣本ξ-(i,u)的前3個元素是下式的隱式解:
式中,?i(τ,r,u)在集合Φ(r,u)內(nèi)隨機選取,并且選取概率相等。樣本ξ-(i,u)的第4個元素是確定的,并可簡化為r?(i,u)=u。無人機的位置和航向具有兩個隨機性來源:在輥角軌跡采集捕獲的隨機性輥動角和隨機性飛行速度。
2.2 目標動力學
假定目標的狀態(tài)η按照Markov決策過程演變。目標運動的狀態(tài)轉(zhuǎn)移概率函數(shù)pg(η′|η)可隱式定義。目標被假定為在地面上行駛的完整車輛,具有轉(zhuǎn)向和加速能力。目標測量信息包含平面位置(xg,yg)∈R2,行駛方向ψg∈S1和行駛速度v∈R≥0,其中平面位置和行駛速度可通過測量無人機與目標的距離和歐拉角,利用簡單的三角函數(shù)定理進行計算。狀態(tài)η可定義為[13]:
其中,ω和a分別為拐彎速度和控制輸入加速度。對于給定的正標量α、和,目標加速度a來自對稱的三角形分布的時間間隔。目標的拐彎速率ω分布在對稱三角支持區(qū)間,其中,滿足。
考慮目標為中心的狀態(tài)空間Z,其維度為n=9。對于j∈{1,2},利用τj表示無人機j的相對位置:
同時,定義無人機j相對于目標的姿態(tài)pj:= (τj,ψr,j)∈R2×[-π,π),其中:
式中,函數(shù)atan2是四象限反切線函數(shù)。狀態(tài)向量z∈Z?R9可表示為:
其中,rj和v分別表示無人機j的離散化輥角和目標速度。
2.3 隨機最優(yōu)控制目標
定位誤差通過無人機j與目標間的三維距離dj在地面上得到放大。無人機j的誤差協(xié)方差可表示為,協(xié)方差。歐拉角序列θj∈R3描述無人機j的傳感器姿態(tài)。利用無人機獨立測量采集的與目標的距離和歐拉角信息,并根據(jù)式(12)計算獲得狀態(tài)向量z,同時根據(jù)文獻[14]計算獲得誤差協(xié)方差Pj,進而可對融合后的定位誤差協(xié)方差P進行計算[14]:
其中,j表示無人機編號,j=1,2。誤差協(xié)方差的特點如圖2所示。融合的協(xié)方差由3個自由度決定,即目標和無人機分離角的平面距離是隱式定義的:
其中,相對平面位置τj∈R2,可利用式(10)進行計算。為實現(xiàn)P相關(guān)估計誤差最小化,使用隨機最優(yōu)控制問題的目標函數(shù)是:
式(15)中“trace()”函數(shù)為Matlab工具箱中的跡函數(shù),用于求取二維方陣的跡,即該方陣對角線上元素之和,可最大限度地減少融合誤差橢圓主要和次要軸的方差總和。則隨機最優(yōu)控制問題是確定最優(yōu)反饋控制策略::Z→C2,k∈{0,1,…,K-1},最小化目標為:
其中,zk=z(kTs);K∈N;E[·]表示期望;g[·]可根據(jù)式(15)計算;z0,z1,…,zK是根據(jù)轉(zhuǎn)移概率p(z′|z,u)的馬爾可夫決策過程;反饋控制律為uk=μ*k(zk)。狀態(tài)轉(zhuǎn)移概率p(z′|z,u)等價于p(zk+1|zk,uk)。
Fig.2 Individual error ellipse coordinate chart圖2 個別誤差橢圓坐標圖
3.1 動態(tài)規(guī)劃Monte Carlo求解方案
利用Markov性質(zhì)對價值函數(shù)進行動態(tài)優(yōu)化,其價值狀態(tài)轉(zhuǎn)移過程可定義為[14]:
式中,q表示給定的量化函數(shù):
式中,s∈Rn,有限集合X?Rn。查找任意狀態(tài)z∈Zz的最佳命令uk,有。
這種方法適用于較小的隨機最優(yōu)控制問題,如單無人機目標跟蹤情況下,狀態(tài)維數(shù)n為5。然而,這樣的方法對于狀態(tài)空間較大時不可行,如對應兩個無人機情況下,其中n=9。
3.2 回歸Monte Carlo求解策略
利用Q值理論進行算法設計[15]:
如前所述,狀態(tài)空間Monte Carlo量化方法是在每個點z上使用多個Monte Carlo模擬方式進行點估算,算法所需的計算復雜度較高,而本文回歸Monte Carlo方法,基于Q值理論進行模擬路徑構(gòu)建,降低了Monte Carlo模擬求解數(shù)量,以提高目標控制效率。
在所提算法中,在時間k=K-1處產(chǎn)生“噪音”的實例,對應于連續(xù)成本Qk-1(z,u),及特定的控制作用u∈U。連續(xù)成本可表示為:
其中,每個是在時間k以時間K-1處的點z(i)∈Z為起始的蒙特卡羅樣本狀態(tài),并對每個點應用控制律u。時刻K-1的近似最優(yōu)控制律為:
3.3 隨機網(wǎng)格回歸目標跟蹤
在傳統(tǒng)RMC算法中,隨機網(wǎng)格Z對應一個集合的模擬路徑,其中i∈{1,2,…,M},其初始控制策略為,初始狀態(tài)為。因此,在傳統(tǒng)RMC中,Z是時間相關(guān)量,并且在時刻k等于。這種情形下,初始控制律對預測精度影響較大。隨機網(wǎng)格分區(qū)示例見圖3。
Fig.3 Partition strategy圖3 分區(qū)策略
令I(lǐng)l?{1,2,…,M}表示屬于隨機網(wǎng)格分區(qū)l的粒子索引子集,其中|Il|=m=M/Np。此外,對于Il= {i1,i2,…,im},有。這里qi是樣本路徑成本。此外,令,其中用于評估在分區(qū)l中的每個點z(i)的二次基函數(shù)。假設回歸方程形式為:
這里,ε(l)∈Rm是分區(qū)l中的殘差向量;1m×1為長度是m的單位向量;是在回歸中確定的系數(shù)。為使回歸系數(shù)魯棒性更強,應盡量減少:
偽代碼1隨機網(wǎng)格回歸Monte Carlo目標跟蹤
上述算法在計算過程中,存在一個嵌套循環(huán),其計算復雜度為O(KlbN)。其中K為回歸Monte Carlo求解策略中隨機選取的樣本點數(shù)量,N為總的樣本點數(shù)量。而狀態(tài)空間標準Monte Carlo量化方法的計算復雜度為O(NlbN)。顯然改進后的算法在計算復雜度上要優(yōu)于原始算法。
4.1 算法跟蹤實驗
本文研究在兩無人機情況下目標跟蹤的最佳協(xié)調(diào)控制問題。在Matlab/Simulink環(huán)境下,進行跟蹤控制數(shù)值仿真。實驗過程共包含4個子程序模塊:無人機動力學計算模塊、目標動力學計算模塊、隨機最優(yōu)目標控制律計算模塊和隨機網(wǎng)格回歸目標跟蹤模塊??刂屏鞒倘鐖D4所示。有關(guān)參數(shù)設置見表1和表2所示。
Fig.4 Optimal coordination control problem圖4 最佳協(xié)調(diào)控制問題
Table 1 Motion parameters of random target表1 隨機目標運動參數(shù)
Table 2 Random parameters in UAV dynamics表2 無人機動力學中的隨機參數(shù)
每個分區(qū)在二次回歸過程中有36個自由度,連續(xù)狀態(tài)空間χ的維數(shù)為7。正則化參數(shù)λ的作用是在過程噪聲中添加魯棒性,λ∈[3,10]。分區(qū)的總數(shù)是,根據(jù)對稱性,對于320以上的分區(qū)Q值不需重復估計,因此隨機網(wǎng)格X的大小為M= 320×104。
樣本軌跡1實驗為了突出最佳軌跡的關(guān)鍵特征,這里提供一個有代表性的樣本軌跡如圖5(a)所示,相應的性能參數(shù)如圖5(b)所示。圖中T為目標軌跡,A1為無人機1的跟蹤軌跡,A2為無人機2的跟蹤軌跡。
Fig.5 Sample trajectory characteristics圖5 樣本軌跡特征
根據(jù)圖5(a),最佳軌跡包括正弦和軌道軌跡,后者不一定是圍繞目標運動的。在仿真開始時,一個無人機正在執(zhí)行一個“S”旋轉(zhuǎn)(正弦模式),而另一個是執(zhí)行一個循環(huán)。無人機切換角色和執(zhí)行相同的聯(lián)合動作前,兩個無人機的相位循環(huán),然后進行了階段性的“輪換”。根據(jù)圖5(b),距離協(xié)調(diào)變得明顯,距離曲線的峰值交替出現(xiàn)。圖5(b)第二插圖表明,無人機不保持正交視角,因為在γ=90°情況下曲線不發(fā)生擾動。然而,當無人機間距離較大時,有利于從正交的視角進行目標跟蹤。
樣本軌跡2實驗選擇無人機連續(xù)拐彎軌跡進行實驗。在樣本軌跡1中因為拐彎形式過大,雖然協(xié)調(diào)跟蹤效果不錯,但是無人機2跟蹤效果不佳。對此,樣本軌跡2選取更為普遍的連續(xù)拐彎軌跡進行實驗。假定無人機跟蹤目標共存在4次拐彎,且無回旋,初始位置(1.45×105,1.2×105),初始速度(-100,100)。假定目標在0~23 s內(nèi)作勻速直線運動;在24~42 s內(nèi)為勻角速ω=4.77°s拐彎;在43~62 s內(nèi)為勻速直線運動;在63~86 s內(nèi)為勻角速ω=6.56°s拐彎;在87~99 s內(nèi)為勻速直線運動;在100~119 s內(nèi)為勻角速ω= -5.96°s拐彎;在120~149 s內(nèi)為勻速直線運動;在150~174 s內(nèi)為勻角速ω=5.38°s拐彎。雙無人機的目標協(xié)調(diào)跟蹤軌跡及跟蹤誤差如圖6、圖7所示。
Fig.6 Target coordination tracking圖6 目標協(xié)調(diào)跟蹤
Fig.7 Tracking error圖7 跟蹤誤差
根據(jù)圖6、圖7可知,在運動軌跡簡化后,兩個無人機的協(xié)調(diào)跟蹤效果得到明顯改善,均可實現(xiàn)較為精確的控制效果,并且具有很小的跟蹤誤差。
為橫向?qū)Ρ人惴ㄐ阅?,下面將選取難度更大的樣本1作為實驗對象,進行算法性能對比驗證。
4.2 跟蹤效果對比
為驗證所提控制策略優(yōu)勢,選取文獻[11]和文獻[13]作為對比算法,對比其在樣本軌跡1上的協(xié)調(diào)跟蹤效果。因為在測試過程中,所采用的對比算法均執(zhí)行15 min以上的飛行跟蹤測試,所以這里選取15 min的測試窗口進行測試數(shù)據(jù)統(tǒng)計分析。表3所示為選取的幾種對比算法的有關(guān)參數(shù)對比情況。
Table 3 Test window statistical results表3 測試窗口統(tǒng)計結(jié)果
根據(jù)表3數(shù)據(jù)可知,在仰角?指標上,本文算法在最大仰角和最低仰角上均要小于選取的文獻[11]和文獻[13]兩種對比算法。并且其仰角?偏差也要小于兩種對比算法。這表明所提算法在兩個無人機配合和數(shù)據(jù)融合使用上要優(yōu)于選取的單無人機方法,其可基于較小的機身調(diào)整實現(xiàn)更為準確的目標跟蹤,跟蹤過程更為穩(wěn)定。在跟蹤距離偏差均值上,本文算法所示兩個無人機也要優(yōu)于選取的對比算法,表明其跟蹤精度更高。
因為本文算法在對跟蹤目標函數(shù)進行設計時,考慮到兩個無人機的協(xié)調(diào)問題,所以兩個無人機跟蹤效果應該是相互補充的。為驗證這種協(xié)調(diào)性,選取文獻[14]算法對兩個無人機進行控制,與本文無人機跟蹤過程兩個無人機跟蹤距離ρ1和ρ2的聯(lián)合概率密度分布對比情況,如圖8所示。
根據(jù)圖8實驗數(shù)據(jù)可知,在兩個無人機協(xié)調(diào)配合上,本文算法的配合效果要優(yōu)于文獻[14]的對比算法。從圖8(b)可以看出,該算法控制下的兩個無人機呈現(xiàn)較明顯的反相關(guān)性,當一個無人機距離目標較近時,另一個無人機則離目標較遠,這體現(xiàn)了較強的配合性,達到了設計目標。
Fig.8 Joint probability density distribution of two UAVs圖8 兩個無人機聯(lián)合概率密度分布
本文提出了基于隨機網(wǎng)格回歸Monte Carlo的UAV最優(yōu)目標跟蹤策略。首先給出了UAV情況下的隨機最優(yōu)協(xié)調(diào)控制目標;然后利用隨機網(wǎng)格方式構(gòu)建回歸Monte Carlo方案,實現(xiàn)UAV的最優(yōu)協(xié)調(diào)控制。實驗結(jié)果驗證了所提方法在跟蹤效果和協(xié)調(diào)配合上的優(yōu)勢。
由于這項工作的目的是為了減少基于視覺的位置測量誤差,從而實現(xiàn)更準確的目標狀態(tài)重建,今后研究方向是采用更為先進的算法,如利用粒子濾波算法,在目標運行的狀態(tài)空間中尋找一組隨機樣本對條件后驗概率密度進行近似。然后利用最優(yōu)控制率實現(xiàn)無人機的最優(yōu)控制,從而獲得無人機運行狀態(tài)同目標運行狀態(tài)的最小方差估計。這種粒子濾波的隨機樣本方式可降低跟蹤計算復雜性。
[1]Peng Xiaodong,Zhang Tiemin,Li Jiyu,et al.An attitude estimation algorithm for small unmanned aerial vehicle based on sensor calibration and fusion[J].Journal of Automation, 2015,41(4):854-860.
[2]Peng Xiaodong,Zhang Tiemin,Li Jiyu,et al.Field calibration method for three axis digital MEMS accelerometer[J]. Vibration,Test and Diagnosis,2014,34(3):544-548.
[3]Liu Xiaofeng,Guan Zhiwei,Song Yuqing,et al.An optimization model of UAV route planning for road segment surveillance[J].Journal of Central South University,2014,21 (6):2501-2510.
[4]Yong S J,Ju Y Y,Kwon O J.Numerical investigation of prop-rotor and tail-wing aerodynamic interference for a tilt-rotor UAV configuration[J].Journal of Mechanical Science and Technology,2014,28(7):2609-2617.
[5]Zhao Shiyu,Lin Feng,Peng Kemao,et al.Vision-aided estimation of attitude,velocity,and inertial measurement bias for UAV stabilization[J].Journal of Intelligent&Robotic Systems,2016,81(3):531-549.
[6]Song B D,Kim J,Kim J W,et al.Persistent UAV service: an improved scheduling formulation and prototypes of system components[J].Journal of Intelligent&Robotic Systems,2014,74(1):221-232.
[7]Kim M H,Baik H,Lee S.Resource welfare based task allocation for UAV team with resource constraints[J].Journal of Intelligent&Robotic Systems,2015,77(3):611-627.
[8]Hu Xiaoxuan,Chen Yi,Luo He.Robust decision making for UAV air-to-ground attack under severe uncertainty[J]. Journal of Central South University,2015,22(11):4263-4273.
[9]Araguás G,Paz C,Gaydou D,et al.Quaternion-based orientation estimation fusing a camera and inertial sensors for a hovering UAV[J].Journal of Intelligent&Robotic Systems,2015,77(1):37-53.
[10]Peng Cheng,Bai Yue,Gong Xun,et al.Modeling and robust backstepping sliding mode control with adaptive RBFNN for a novel coaxial eight-rotor UAV[J].IEEE/CAA Journal ofAutomatica Sinica,2015,2(1):56-64.
[11]Lin L,Goodrich M A.Hierarchical heuristic search using a Gaussian mixture model for UAV coverage planning[J]. IEEE Transactions on Cybernetics,2014,44(12):2532-2544.
[12]Chen Yikai,Wang Chaofu.Electrically small UAV antenna design using characteristic modes[J].IEEE Transactions on Antennas and Propagation,2014,62(2):535-545.
[13]Nemra A,Aouf N.Robust INS/GPS sensor fusion for UAV localization using SDRE nonlinear filtering[J].IEEE Sensors Journal,2010,10(4):789-798.
[14]Quintero S A P,Papi F,Klein D J,et al.Optimal UAV coordination for target tracking using dynamic programming [C]//Proceedings of the 49th IEEE Conference on Decision and Control,Atlanta,USA,Dec 15-17,2010.Piscataway, USA:IEEE,2010:4541-4546.
[15]Sun Haibo,Zhou Rui,Zou Li,et al.Heterogeneous multi UAV distributed cooperative target tracking under the condition of limited communication and measurement[J].Journal ofAeronautical Science,2011,36(2):299-310.
附中文參考文獻:
[1]彭孝東,張鐵民,李繼宇,等.基于傳感器校正與融合的農(nóng)用小型無人機姿態(tài)估計算法[J].自動化學報,2015,41 (4):854-860.
[2]彭孝東,張鐵民,李繼宇,等.三軸數(shù)字MEMS加速度計現(xiàn)場標定方法[J].振動、測試與診斷,2014,34(3):544-548.
[15]孫海波,周銳,鄒麗,等.通信和測量受限條件下異構(gòu)多UAV分布式協(xié)同目標跟蹤方法[J].航空學報,2011,36 (2):299-310.
MENG Fankun was born in 1989.He is a Ph.D.candidate at Chang'an University.His research interests include control theory and application,etc.
孟凡琨(1989—),男,長安大學博士研究生,主要研究領(lǐng)域為控制理論及其應用等。
JU Yongfeng was born in 1962.He is a professor and Ph.D.supervisor at Chang'an University.His research interests include traffic control and management,etc.
巨永鋒(1962—),男,博士,長安大學教授、博士生導師,主要研究領(lǐng)域為交通控制與管理等。
WEN Changbao was born in 1976.He is a professor and M.S.supervisor at Chang'an University.His research interests include signal processing and detection device,etc.
文常保(1976—),男,博士,長安大學教授、碩士生導師,主要研究領(lǐng)域為信號處理技術(shù),檢測裝置等。
Stochastic Mesh Regression Monte Carlo Based UAVs Optimal Target Tracking*
MENG Fankun+,JU Yongfeng,WEN Changbao
School of Electronic and Control Engineering,Chang'an University,Xi'an 710064,China
+Corresponding author:E-mail:mengfnkn@163.com
In order to solve the optimal coordination problem of visual target tracking for unmanned aerial vehicles (UAVs),and improve the visual measurement result in the best combination of unpredictable target on the ground,this paper presents the stochastic mesh regression Monte Carlo based UAVs optimal target tracking algorithm.Firstly,the stochastic optimal coordinated control target is obtained by the analysis of UAV dynamics and target dynamics.Secondly, for the control objectives,the Monte Carlo method is introduced,and the random grid based regression Monte Carlo scheme is also designed to solve the high state space dimension of the standard Monte Carlo scheme,so as to solve the complex calculation and low precision,which can realize UAVs optimal coordinated control.Finally,simulation experiments are carried out to verify the effectiveness of the proposed method.
random grid;regression Carlo Monte;unmanned aerial vehicle(UAV);target tracking
10.3778/j.issn.1673-9418.1606053
A
:TP391
*The National Natural Science Foundation of China under Grant No.61473047(國家自然科學基金);the Fundamental Research Funds for the Central Universities of China under Grant No.2014G3322008(中央高?;究蒲袠I(yè)務費專項資金).
Received 2016-06,Accepted 2016-09.
CNKI網(wǎng)絡優(yōu)先出版:2016-09-08,http://www.cnki.net/kcms/detail/11.5602.TP.20160908.1045.016.html
MENG Fankun,JU Yongfeng,WEN Changbao.Stochastic mesh regression Monte Carlo based UAVs optimal target tracking.Journal of Frontiers of Computer Science and Technology,2017,11(3):450-458.