趙學(xué)遠(yuǎn),周紹磊,祁亞輝,王帥磊
(中國(guó)人民解放軍海軍航空大學(xué),山東 煙臺(tái) 264001)
近年來(lái),隨著無(wú)人機(jī)技術(shù)的發(fā)展和多智能體系統(tǒng)控制廣泛的應(yīng)用前景,使得無(wú)人機(jī)編隊(duì)在軍事和民用領(lǐng)域都早已嶄露頭角,至今已經(jīng)取得了大量的研究成果[1,2],無(wú)人機(jī)系統(tǒng)隨著工作量的提高和難度的提升,無(wú)人機(jī)數(shù)量逐漸增多,因此對(duì)編隊(duì)的控制提出了更高的要求[3]。目前相對(duì)成熟并運(yùn)用較為廣泛的控制方法有虛擬結(jié)構(gòu)法[4]、leader-follower法[5]、基于行為法[6]。
眾多學(xué)者在多智能體系統(tǒng)的一致性問(wèn)題方面的研究,為無(wú)人機(jī)編隊(duì)控制提供了新的解決思路,使得多無(wú)人機(jī)系統(tǒng)僅僅依靠鄰居無(wú)人機(jī)的信息就能夠形成編隊(duì)。文獻(xiàn)[7]利用了一種基于一致性反饋線性化的方法實(shí)現(xiàn)了多無(wú)人機(jī)系統(tǒng)快速形成編隊(duì),并且所形成的編隊(duì)為時(shí)變編隊(duì)。文獻(xiàn)[8]利用一致性控制器解決了異構(gòu)多智能體系統(tǒng)的編隊(duì)控制問(wèn)題,文獻(xiàn)[9]通過(guò)設(shè)計(jì)一致性控制器,使得多無(wú)人機(jī)系統(tǒng)在形成編隊(duì)的同時(shí),具有一定的防碰撞能力。
設(shè)計(jì)一致性控制器實(shí)現(xiàn)編隊(duì)控制問(wèn)題,首先要關(guān)注的是多智能體系統(tǒng)的通信拓?fù)浣Y(jié)構(gòu)。文獻(xiàn)[10]給出了拓?fù)鋱D是連通的是多智能體系統(tǒng)一致收斂的充要條件,文獻(xiàn)[11]證明了有向網(wǎng)絡(luò)拓?fù)浯嬖谟邢蛏蓸?shù),多智能體系統(tǒng)即可實(shí)現(xiàn)一致性。文獻(xiàn)[12,13]研究了切換拓?fù)湎露嘀悄荏w的一致性問(wèn)題。目前基于一致性理論實(shí)現(xiàn)編隊(duì)控制的研究多集中于固定拓?fù)洹N墨I(xiàn)[14]對(duì)離散系統(tǒng)設(shè)計(jì)了一致性控制器,使得離散多智能體系統(tǒng)形成編隊(duì)。文獻(xiàn)[15]研究了在有向通信拓?fù)錀l件下,多智能體系統(tǒng)的時(shí)變編隊(duì)控制問(wèn)題。文獻(xiàn)[16]研究了二階積分系統(tǒng)中利用一致性方法使得系統(tǒng)軌跡與編隊(duì)隊(duì)形一致。也有部分文獻(xiàn)突破了固定拓?fù)鋱D結(jié)構(gòu)的限制,文獻(xiàn)[17]在已知所有可能的拓?fù)浼蠗l件下,設(shè)計(jì)一致性控制器,解決了一階積分模型的多智能體編隊(duì)控制問(wèn)題。文獻(xiàn)[18]的編隊(duì)控制研究過(guò)程對(duì)有向切換拓?fù)涮岢隽藰O為苛刻的限制條件,它要求有向拓?fù)浼蟽?nèi)的所有拓?fù)鋱D是強(qiáng)連通且平衡,顯然所得結(jié)論不具有一般性。設(shè)計(jì)一致性控制器,使得多智能體系統(tǒng)在一般的有向切換拓?fù)錀l件形成編隊(duì)的研究還并不深入。
在實(shí)際的多智能體系統(tǒng)當(dāng)中,往往要建模成非線性系統(tǒng),作為一種常見(jiàn)的非線性環(huán)節(jié),Lur’e型非線性,在一致性研究過(guò)程中,文獻(xiàn)[19]研究了包含Lur’e型非線性的系統(tǒng)在固定拓?fù)錀l件下的控制問(wèn)題,文獻(xiàn)[20]研究了具有Lur’e型非線性環(huán)節(jié)的多智能體系統(tǒng)追蹤領(lǐng)導(dǎo)者的一致性問(wèn)題。文獻(xiàn)[21]研究了有向切換拓?fù)錀l件下Lur’e型非線性智能體系統(tǒng)的控制問(wèn)題,設(shè)計(jì)了分布式控制器,使得系統(tǒng)達(dá)成一致。在基于一致性理論解決編隊(duì)控制問(wèn)題時(shí),將Lur’e型非線性環(huán)節(jié)考慮在內(nèi)的成果還較少。
本文在一致性理論研究基礎(chǔ)上,設(shè)計(jì)了分布式控制器,用于解決有向切換拓?fù)錀l件下線性多智能體系統(tǒng)包含Lur’e型非線環(huán)節(jié)時(shí)的編隊(duì)控制問(wèn)題。所研究的拓?fù)鋱D是隨時(shí)間切換的,對(duì)通信要求更具一般性。設(shè)計(jì)的編隊(duì)為時(shí)變編隊(duì),更具有實(shí)際意義。
G=(V,E,A)用來(lái)表示多智能體系統(tǒng)的有向通信拓?fù)鋱D,其中V={v1,v2,…,vN}是拓?fù)鋱D的節(jié)點(diǎn)集合,E?V×V為拓?fù)鋱D的邊集合,A=[aij]N×N為拓?fù)鋱D的具有非負(fù)元素aij的鄰接矩,節(jié)點(diǎn)vi和vj之間的連接權(quán)重用aij表示,當(dāng)aij=1時(shí)節(jié)點(diǎn)vi可以接收到節(jié)點(diǎn)vj的信息,當(dāng)aij=0時(shí)則節(jié)點(diǎn)vi不能接收到節(jié)點(diǎn)vj的信息。如果G中存在一個(gè)節(jié)點(diǎn)vi,從這個(gè)點(diǎn)出發(fā)沿著有向邊可以到達(dá)圖中的任意其它點(diǎn),稱圖G包含有一個(gè)有向生成樹(shù),該節(jié)點(diǎn)vi為根節(jié)點(diǎn)。圖的Laplacian矩陣定義為L(zhǎng)=[Lij]N×N,其中Lii=∑j≠iaijLij=-aij,i≠j。
智能體之間的拓?fù)潢P(guān)系隨時(shí)間變換,Γ={G1,G2,…,Gp},p≥1為所有可能的有向拓?fù)涞募?,切換信號(hào)σ(t):[0,+∞)→={1,2,…,p},切換時(shí)刻表示為0=t0 引理1[22]:對(duì)于任意給定的x,y∈n,和具有相容維數(shù)的矩陣P>0,D和S,可以得到 2xTDSy≤xTDPDTx+yTSTP-1Sy 根據(jù)文獻(xiàn)[23]可得到類似的引理2。 引理2存在一個(gè)正數(shù)α0和與L1σ(t)同步切換的正定矩陣Qσ(t)使得 其中0<α0 考慮由N個(gè)具有Lur’e型非線性項(xiàng)的無(wú)人機(jī)構(gòu)成的無(wú)人機(jī)系統(tǒng),每個(gè)無(wú)人機(jī)的運(yùn)動(dòng)模型描述如下 yi(t)=Cxi(t) (1) xi(t)∈n,ui(t)∈p,yi=(yi1,…,yiq)T∈q分別是第i個(gè)智能體的狀態(tài)、控制輸入和測(cè)量輸出。ABCD是合適維的系統(tǒng)矩。Lur’e型非線性項(xiàng)由非線性函數(shù)f(yi)描述,其滿足斜率條件[0,Δ],Δ=diag{δ1,…,δq}即 0≤(fi(b)-fi(a))≤δi(b-a), fi(0)=0,?b≠a,i=1,…,q. 針對(duì)此類問(wèn)題,基于一致性方法,僅利用鄰居智能體的狀態(tài)信息,將控制器設(shè)計(jì)如下 ui=K1(xi(t)-hi(t))+wi(t) i=1,2,…,N (2) 將控制器(2)帶入原系統(tǒng)可得到 +BK1(xi(t)-hi(t)) (3) 因此可以得到 +(L?BK2-IN?BK1)h(t) +(IN?B)w(t)+(IN?D)f(y) (4) 令ξi(t)=xi(t)-hi(t)故得到 +(IN?A)h(t)+(I?B)w(t) (5) 如果上式各狀態(tài)量能夠達(dá)成一致,則多無(wú)人機(jī)系統(tǒng)能夠形成編隊(duì)。 利用Laplacian矩陣的特殊性質(zhì),做如下的線性變換,令ηi(t)=ξi(t)-ξi+1(t) 因此可以得到 +(E?A)h(t)+(E?B)w(t) (6) 基于以上的分析,推導(dǎo)出多無(wú)人機(jī)系統(tǒng)能夠形成編隊(duì)h(t)的充要條件是 (7) +(IN-1?D)φ(y) (8) 是漸進(jìn)穩(wěn)定的。 根據(jù)系統(tǒng)(1)B為列滿秩矩陣,因此對(duì)(7)兩端同時(shí)乘以(I?),其中因此可以得到 (9) (10) 對(duì)于式(7),可以恰當(dāng)?shù)倪x取輸入w(t)使其成立。欲所設(shè)計(jì)的控制器能夠使得系統(tǒng)形成編隊(duì),對(duì)編隊(duì)也是有要求的,即編隊(duì)h(t)需滿足式(8)。 定義于隨時(shí)間變化的通信拓?fù)銰σ(t)=0,其在時(shí)間區(qū)間[t0,t)上的平均駐留時(shí)間τa定義為 其中Nδ(t0,t)表示Gσ(t)在時(shí)間區(qū)間[t0,t)上的切換次數(shù)。 結(jié)合平均駐留時(shí)間的定義,控制器設(shè)計(jì)算法如下 算法: 1)設(shè)w1(t)=0,求解方程,得到輔助函數(shù)w(t) 2)根據(jù)編隊(duì)中心軌跡配置(A+BK1)的極點(diǎn),求解K1 根據(jù)矩陣不等式(11),求解可行解P (11) 其中 H1=(A+BK1)TP+P(A+BK1)-2αPBBTP+βP 定理:按照如上算法設(shè)計(jì)的控制器,能夠使得多無(wú)人機(jī)系統(tǒng)在切換拓?fù)鋾r(shí)即使受到外部擾動(dòng)也能夠形成時(shí)變編隊(duì)。 證明:構(gòu)建Lyapunov函數(shù) V(t)=ηT(t)(Qσ(t)?P)η(t) (12) 對(duì)上式沿著系統(tǒng)求導(dǎo),整理可得 η(t)-ηT(t)(((EM)TQσ(t)+Qσ(t)EM) ?PBBTP)η(t)+2η(t)(Qσ(t)?PD)φ(y) (13) 由引理1得 2η(t)(Qσ(t)?PD)φ(y) =2η(t)(I?PD)(Qσ(t)?I)φ(y) ≤ηT(t)(I?PD)(R?I)(I?DTP)ηT(t) (R-1?I)(Qσ(t)?C)ηT(t) (14) 其中R>0為維數(shù)相容的特定矩陣,令R=Qσ(t),則可以得到 (15) 如前所述,當(dāng)t∈[tk,tk+1)時(shí),V(t)是連續(xù)的,求導(dǎo)可以得到(20),由(11)可以得到 (16) 考慮到Qσ(t)≤φ1I和Qσ(t)≥φ2I,所以在拓?fù)淝袚Q時(shí)刻tk有 (17) 通過(guò)迭代推導(dǎo),因此 (18) 由(12)可得 (19) 其中?1=φ1max{λ(P)},?2=φ2min{λ(P)} 考慮多無(wú)人機(jī)系統(tǒng)的通信拓?fù)浣Y(jié)構(gòu)在如下的有向拓?fù)鋱D中隨機(jī)切換。 系統(tǒng)矩陣描述如下 將智能體狀態(tài)分量理解為無(wú)人機(jī)位置,初始狀態(tài)如下 編隊(duì)定義為 因此編隊(duì)形成后,4架無(wú)人機(jī)將構(gòu)成一個(gè)平行四邊形。 圖1為有限的有向拓?fù)浼希凑請(qǐng)D2的切換拓?fù)溥^(guò)程隨意切換。 圖1 有限的拓?fù)浼?/p> 圖2 拓?fù)淝袚Q過(guò)程 首先將(A+BK1)極點(diǎn)配置在(-1+i,-1-i,-1),可得到 令α0=0.4求解不等式(12),得到可行解 所以可得到反饋矩陣 如圖3所示,無(wú)人機(jī)的第一狀態(tài)量與無(wú)人機(jī)編隊(duì)第一狀態(tài)量的誤差曲線,從圖中可以得出無(wú)人機(jī)狀態(tài)和編隊(duì)誤差達(dá)成一致,編隊(duì)即可以形成編隊(duì)。 圖3 無(wú)人機(jī)的第一狀態(tài)量與無(wú)人機(jī)編隊(duì)第一狀態(tài)量的誤差 第二狀態(tài)量與第三狀態(tài)量都與第一狀態(tài)量具有類似的變化規(guī)律。圖3分別為4架無(wú)人機(jī)在1s,4s時(shí)刻的三維狀態(tài)值。 圖4 無(wú)人機(jī)在1s時(shí)刻的三維狀態(tài)值 圖5 無(wú)人機(jī)在4s時(shí)刻的三維狀態(tài)值 可以看出在4s之后,四架無(wú)人機(jī)形成平行四邊形編隊(duì),且編隊(duì)隊(duì)形處于動(dòng)態(tài)變化中,與預(yù)先設(shè)定的編隊(duì)隊(duì)形一致,驗(yàn)證了所設(shè)計(jì)的控制器的有效性。 利用一致性理論知識(shí),用于解決多無(wú)人機(jī)系統(tǒng)編隊(duì)控制問(wèn)題,所研究的系統(tǒng)包含lur’e型非線性項(xiàng),通信拓?fù)浣Y(jié)構(gòu)為有向切換拓?fù)?。本文的主要?jiǎng)?chuàng)新點(diǎn)是考慮了外部擾動(dòng)的影響,并降低了多無(wú)人機(jī)系統(tǒng)的通信要求,且利用Laplacian矩陣的特殊性質(zhì)將其分解,從而將編隊(duì)控制問(wèn)題轉(zhuǎn)化為低階系統(tǒng)的穩(wěn)定性問(wèn)題,利用矩陣不等式求解反饋矩陣,使得設(shè)計(jì)控制器難度降低。2.2 相關(guān)引理
3 問(wèn)題描述
4 控制器設(shè)計(jì)
5 仿真驗(yàn)證
6 結(jié)論