寇立偉 項(xiàng) 基
近年來(lái),多移動(dòng)機(jī)器人的協(xié)同控制得到了越來(lái)越廣泛的研究與應(yīng)用[1?5].和單一機(jī)器人相比,多移動(dòng)機(jī)器人能夠執(zhí)行更加復(fù)雜的任務(wù),同時(shí)對(duì)外部環(huán)境的變化有更強(qiáng)的魯棒性.典型的多移動(dòng)機(jī)器人協(xié)同控制主要包括包絡(luò)控制[6]、主從編隊(duì)控制[7]、環(huán)形運(yùn)動(dòng)控制等.本文主要研究非完整約束下的多移動(dòng)機(jī)器人的包圍控制問(wèn)題,旨在設(shè)計(jì)一種協(xié)同控制器,不考慮具體的編隊(duì)形狀同時(shí)能夠保證移動(dòng)目標(biāo)指數(shù)收斂到多移動(dòng)機(jī)器人構(gòu)成的凸包內(nèi)部.
目前,已有一些完整、系統(tǒng)的包圍控制研究成果.如文獻(xiàn)[8]采用圖論和動(dòng)態(tài)系統(tǒng)理論研究了一階積分型機(jī)器人的包圍控制問(wèn)題;文獻(xiàn)[9]利用復(fù)鄰接矩陣方法設(shè)計(jì)了一種分布式包圍控制器.但是,以上控制策略無(wú)法擴(kuò)展到受非完整約束的多移動(dòng)機(jī)器人系統(tǒng).非完整系統(tǒng)控制的難點(diǎn)在于,不存在任何連續(xù)的靜態(tài)狀態(tài)反饋控制律使其穩(wěn)定到平衡點(diǎn)[10].然而,文獻(xiàn)[11]指出如果選擇合適的坐標(biāo)平移,非完整系統(tǒng)能夠滿足輸出反饋線性化條件,使得控制器設(shè)計(jì)更加簡(jiǎn)潔.該方法已經(jīng)廣泛應(yīng)用在機(jī)器人、水面船等各類非完整系統(tǒng)的控制器設(shè)計(jì)中[12?13].
另一方面,多移動(dòng)機(jī)器人的包圍控制問(wèn)題可認(rèn)為是環(huán)形運(yùn)動(dòng)控制的擴(kuò)展.環(huán)形運(yùn)動(dòng)控制在包圍目標(biāo)點(diǎn)的同時(shí),圍繞目標(biāo)點(diǎn)做等角度的圓周運(yùn)動(dòng).文獻(xiàn)[14]考慮靜止目標(biāo),研究了在聯(lián)合連通圖條件下的環(huán)形運(yùn)動(dòng)控制.文獻(xiàn)[15]考慮了速度約束下的非完整移動(dòng)機(jī)器人的環(huán)形運(yùn)動(dòng)控制.在實(shí)際工程應(yīng)用中,感興趣的目標(biāo)點(diǎn)經(jīng)常隨著時(shí)間不斷變化.文獻(xiàn)[16?17]研究了多小車對(duì)常速移動(dòng)目標(biāo)的環(huán)形包圍;文獻(xiàn)[18]研究了目標(biāo)速度時(shí)變情況下的環(huán)形包圍控制.
以上文獻(xiàn)都要求事先指定編隊(duì)形狀或是相鄰機(jī)器人之間、機(jī)器人和目標(biāo)點(diǎn)之間的相對(duì)距離/角度.然而,考慮實(shí)際復(fù)雜時(shí)變的外部環(huán)境,不可能對(duì)其事先指定.而且對(duì)于時(shí)效性較強(qiáng)的包圍控制,將目標(biāo)包圍在機(jī)器人構(gòu)成的凸包內(nèi)部是其首要任務(wù),例如軍事領(lǐng)域中對(duì)敵方目標(biāo)的包圍打擊等.基于以上考慮,文獻(xiàn)[19]提出了一種新的目標(biāo)包圍控制策略,該策略能夠使目標(biāo)收斂到多智能體構(gòu)成的凸包內(nèi)部,并且無(wú)需指定包圍隊(duì)形.
在文獻(xiàn)[19]的基礎(chǔ)上,本文研究了受非完整約束的多移動(dòng)機(jī)器人的移動(dòng)目標(biāo)包圍控制問(wèn)題.通過(guò)坐標(biāo)偏置,為移動(dòng)機(jī)器人設(shè)計(jì)輸出反饋線性化控制器,并引入障礙函數(shù)和自適應(yīng)項(xiàng)實(shí)現(xiàn)障礙規(guī)避和對(duì)移動(dòng)目標(biāo)的速度估計(jì).和文獻(xiàn)[19]相比,本文一方面將單積分系統(tǒng)擴(kuò)展到了受非完整約束的多移動(dòng)機(jī)器人系統(tǒng),另一方面將靜止目標(biāo)擴(kuò)展到了未知常速移動(dòng)的目標(biāo).主要貢獻(xiàn):1) 控制器可使多移動(dòng)機(jī)器人包圍移動(dòng)目標(biāo),使其指數(shù)收斂至移動(dòng)機(jī)器人所構(gòu)成的凸包內(nèi)部;2) 引入障礙函數(shù)保證了機(jī)器人之間的障礙規(guī)避;3) 引入自適應(yīng)項(xiàng)實(shí)現(xiàn)了對(duì)移動(dòng)目標(biāo)的速度估計(jì);4) 利用局部線性化方法研究了多移動(dòng)機(jī)器人系統(tǒng)方位角動(dòng)態(tài)的穩(wěn)定性.
文中,N={1,2,···,n},n代表移動(dòng)機(jī)器人個(gè)數(shù),本文假設(shè)n ≥3.?θ ∈R,R(θ)=[τ(θ),ν(θ)],τ(θ)=[cos(θ),sin(θ)]T,ν(θ)=[?sin(θ),cos(θ)]T.給定任一n維向量x∈Rn,∥x∥=[|x1|,|x2|,···,|xn|]T,∥x∥代表模長(zhǎng).給定任意兩個(gè)向量xi和xj,xij:=xi ?xj.xi ?xj(xi xj) 表示xi, k 考慮如下n個(gè)移動(dòng)機(jī)器人運(yùn)動(dòng)學(xué)模型 ri=[xi,yi]T表示世界坐標(biāo)系下機(jī)器人i的幾何中心,θi代表機(jī)器人的方位角.ui=[ui,ωi]T代表機(jī)器人的獨(dú)立控制輸入,其中ui和ωi分別代表機(jī)器人的縱向線速度和旋轉(zhuǎn)角速度. 定義多移動(dòng)機(jī)器人的位置分布r=[r1,r2,···,rn]和相應(yīng)多移動(dòng)機(jī)器人構(gòu)成的凸包: 其中,r0表示目標(biāo)的位置,v0表示運(yùn)動(dòng)目標(biāo)的未知常值速度.目標(biāo)點(diǎn)和凸包距離定義如下: 顯然,當(dāng)且僅當(dāng)r0∈co(r),Pr0(r)=0.該結(jié)果表示實(shí)現(xiàn)了移動(dòng)目標(biāo)包圍控制目標(biāo). 本文選取移動(dòng)機(jī)器人i縱軸正前方,距離機(jī)器人幾何中心δ遠(yuǎn)的點(diǎn)作為偏置點(diǎn)(第2 節(jié)分析表明相對(duì)ui滿足輸出反饋線性化條件),如圖1所示.此外,本文采用最近鄰居規(guī)則來(lái)確定機(jī)器人i的鄰居節(jié)點(diǎn).機(jī)器人i的鄰居節(jié)點(diǎn)可由以下集合Ni表示 圖1 目標(biāo)包圍示意圖Fig.1 Illustration of target fencing 由于目標(biāo)速度v0未知,本文引入自適應(yīng)項(xiàng)vi對(duì)v0進(jìn)行估計(jì).結(jié)合第1.1 節(jié)機(jī)器人i的局部測(cè)量信息,本文研究的移動(dòng)目標(biāo)包圍控制問(wèn)題可總結(jié)如下. 考慮多移動(dòng)機(jī)器人系統(tǒng)(1)和目標(biāo)動(dòng)態(tài)(2),設(shè)計(jì)帶有速度估計(jì)器vi的控制器ui,例如 使得閉環(huán)系統(tǒng)滿足以下三個(gè)性質(zhì): 1)目標(biāo)指數(shù)收斂到多移動(dòng)機(jī)器人構(gòu)成的凸包內(nèi)部,即limt→∞Pr0(r(t))=0; 2)機(jī)器人之間的碰撞可以避免,即∥rij(t)∥>d,?t ≥0,ij ∈N; 3) 速度估計(jì)器vi漸近收斂到目標(biāo)速度v0,即limt→∞vi(t)=v0. 本節(jié)首先利用輸出反饋線性化方法推導(dǎo)出多移動(dòng)機(jī)器人的移動(dòng)目標(biāo)包圍控制策略,然后利用Lyapunov 理論對(duì)整個(gè)閉環(huán)系統(tǒng)進(jìn)行了嚴(yán)格的收斂性分析. 由式(1)可知,機(jī)器人i動(dòng)態(tài)滿足如下約束: Frobenius 定理表明該約束不可積,因此該約束是典型的非完整約束,不滿足反饋線性化的條件,無(wú)法通過(guò)線性化的方法設(shè)計(jì)控制器.文獻(xiàn)[10]進(jìn)一步指出,不存在任何連續(xù)的靜態(tài)狀態(tài)反饋控制律使該系統(tǒng)穩(wěn)定到平衡點(diǎn).為克服以上缺點(diǎn),本文選取移動(dòng)機(jī)器人i縱軸正前方,距離機(jī)器人幾何中心δ遠(yuǎn)的點(diǎn)作為偏置點(diǎn)(如圖1 所示).由幾何關(guān)系可知,該點(diǎn)與機(jī)器人幾何中心滿足=ri+τ(θ)δ,該點(diǎn)隨時(shí)間微分可得 式中,常數(shù)矩陣Q=diag{1,δ }. 由于R(θi)Q為可逆矩陣,表明輸出相對(duì)于輸入ui相對(duì)階為1,滿足輸出反饋線性化條件[20]. 定義誤差向量 該向量隨時(shí)間微分可得 由于無(wú)法獲取移動(dòng)目標(biāo)的速度信息,本文利用速度估計(jì)器對(duì)其估計(jì).控制器設(shè)計(jì)如下 定理 1.考慮多移動(dòng)機(jī)器人系統(tǒng)(1) 和移動(dòng)目標(biāo)動(dòng)態(tài)(2),其中移動(dòng)目標(biāo)以未知常速運(yùn)動(dòng).假設(shè)移動(dòng)機(jī)器人位置在初始時(shí)刻滿足∥rij(0)∥>d,ij ∈N,則當(dāng)參數(shù)δ足夠小時(shí),多移動(dòng)機(jī)器人系統(tǒng)在控制器(8)的作用下可以實(shí)現(xiàn)移動(dòng)目標(biāo)的包圍控制,同時(shí)整個(gè)閉環(huán)系統(tǒng)滿足性質(zhì)1)~3).此外,多移動(dòng)機(jī)器人的方位角可以漸近收斂到目標(biāo)的移動(dòng)方向. 由上述分析可知,控制器可以實(shí)現(xiàn)多移動(dòng)機(jī)器人對(duì)移動(dòng)目標(biāo)的包圍控制,但并未考慮包圍控制過(guò)程中移動(dòng)機(jī)器人方位角的穩(wěn)定性.從實(shí)際應(yīng)用考慮,移動(dòng)機(jī)器人方位角的穩(wěn)定性對(duì)包圍控制的效果有重要意義. 當(dāng)閉環(huán)系統(tǒng)實(shí)現(xiàn)性質(zhì)1)~3)時(shí),由控制器(8)可知ui=Q?1R?1(θi)v0,其元素形式為: 定義能量函數(shù)V(θi)=1?cos(θi ?θ0)∈L∞.該函數(shù)對(duì)時(shí)間求導(dǎo)可得 注 2.盡管本文設(shè)計(jì)的多移動(dòng)機(jī)器人系統(tǒng)的協(xié)同包圍控制器針對(duì)的是以未知常速運(yùn)動(dòng)的移動(dòng)目標(biāo),但該控制器亦適用于靜止目標(biāo).因?yàn)殪o止目標(biāo)的速度一直保持為0,亦屬于特殊的 “未知常速運(yùn)動(dòng)”的移動(dòng)目標(biāo).針對(duì)靜止目標(biāo),控制器(8)可以保證閉環(huán)系統(tǒng)滿足性質(zhì)1)~3),同時(shí)實(shí)現(xiàn)機(jī)器人位置和方位角的收斂.但和一般未知常速移動(dòng)目標(biāo)(即速度不為0 的常速移動(dòng)目標(biāo))相比,靜止目標(biāo)沒(méi)有移動(dòng)方向的概念,也可認(rèn)為靜止目標(biāo)的移動(dòng)方向是任意的.對(duì)于靜止目標(biāo)的協(xié)同包圍任務(wù),本文的控制器不保證機(jī)器人的方位角最終會(huì)收斂到什么方向. 本節(jié)以5個(gè)移動(dòng)機(jī)器人為例,驗(yàn)證控制器的有效性.給定機(jī)器人的初始位置ri(0)=20[cos(2(i ?1)π/5),sin(2(i?1)π/5)]T,i∈{1,2,3,4,5};初始方位角θ1(0)=θ2(0)=0,θ3(0)=π/2,θ4(0)=2π/3,θ5(0)=π.移動(dòng)目標(biāo)的初始位置r0(0)=[0,?40]T,移動(dòng)速度v0=[3,1]T.給定控制器參數(shù)K=diag{0.5,0.5}以及 (δ,μ,d)=(0.1,25,15). 圖2 繪制了目標(biāo)包圍控制中多移動(dòng)機(jī)器人的運(yùn)動(dòng)軌跡.其中淺藍(lán)色虛線表示目標(biāo)的運(yùn)動(dòng)軌跡,多邊形表示移動(dòng)機(jī)器人在t={0,15,30,45,60}s 時(shí)刻所構(gòu)成的凸多邊形,箭頭表示機(jī)器人在相應(yīng)時(shí)刻的位置和方位角.平均位置誤差e? 隨時(shí)間變化的曲線如圖3 所示,由圖3 可知隨時(shí)間變化e? 會(huì)收斂到0.結(jié)合第2 節(jié)收斂性分析可知,目標(biāo)包圍控制的性質(zhì)1)能夠?qū)崿F(xiàn).任意兩個(gè)機(jī)器人之間的相對(duì)距離變化如圖4 所示.由圖4 易知,機(jī)器人間的相對(duì)距離始終保持∥rij(t)∥>d,ij ∈N,因此整個(gè)目標(biāo)包圍控制可以保證障礙規(guī)避. 圖2 目標(biāo)包圍控制中多移動(dòng)機(jī)器人的軌跡Fig.2 Trajectories of multiple mobile robots during target fencing control 圖3 平均位置誤差Fig.3 Time evolution of the average position error 圖4 機(jī)器人 i 和 j 之間的相對(duì)距離Fig.4 Time evolution of the relative distance between robot i and robot j 此外,速度估計(jì)曲線隨時(shí)間變化如圖5 所示,由圖5 可知速度估計(jì)會(huì)漸近收斂到目標(biāo)速度,即limt→∞vi(t)=v0.圖6 繪制了機(jī)器人在世界坐標(biāo)系下的速度隨時(shí)間變化曲線,由圖6 可知該速度漸近收斂到目標(biāo)速度.圖7 繪制了機(jī)器人的方位角隨時(shí)間變化的曲線,由圖7 易知所有機(jī)器人的方位角都可漸近收斂到目標(biāo)的移動(dòng)方向. 圖5 速度估計(jì)Fig.5 Time evolution of the velocity estimation 圖6 機(jī)器人在世界坐標(biāo)系下的速度Fig.6 The robots' velocity in terms of global frame of reference 圖7 機(jī)器人的方位角Fig.7 The robots' bearing angle 本文研究了非完整約束下多移動(dòng)機(jī)器人系統(tǒng)的移動(dòng)目標(biāo)包圍控制問(wèn)題.控制器基于輸出反饋線性化方法,并且無(wú)需事先指定包圍隊(duì)形.基于Lyapunov 穩(wěn)定性理論對(duì)整個(gè)閉環(huán)系統(tǒng)作了嚴(yán)格的收斂性分析.仿真結(jié)果驗(yàn)證了該控制器可以實(shí)現(xiàn)指數(shù)包圍控制、機(jī)器人間的障礙規(guī)避、對(duì)移動(dòng)目標(biāo)未知速度的有效估計(jì)以及機(jī)器人的方位角能夠漸近收斂到目標(biāo)的移動(dòng)方向.1.1 系統(tǒng)建模
1.2 問(wèn)題描述
2 主要結(jié)果
2.1 控制器設(shè)計(jì)
2.2 收斂性分析
3 數(shù)值仿真
4 結(jié)論