陳世明 邵 賽 姜根蘭
近些年來(lái),由于多智能體系統(tǒng)的分布式協(xié)同控制在編隊(duì)控制[1?2]、蜂擁[3?4]等多領(lǐng)域的應(yīng)用,現(xiàn)受到許多學(xué)者廣泛關(guān)注.目前為止,多智能體系統(tǒng)的一致性研究已經(jīng)由一階[5]、二階[6]逐步發(fā)展到高階[7?8].一致性的基本思想是每個(gè)智能體通過(guò)自身和鄰居信息來(lái)更新自身信息,從而使得所有個(gè)體最終收斂于同一狀態(tài).
在實(shí)際的工程應(yīng)用中,智能體自身能量和通訊信道帶寬往往都是有限的,因此,在設(shè)計(jì)控制協(xié)議時(shí)需要考慮智能體能量的損耗,讓其能有更長(zhǎng)的運(yùn)作時(shí)間.由此,將事件觸發(fā)機(jī)制引入到多智能體系統(tǒng)具有很大意義.文獻(xiàn)[9]將事件觸發(fā)策略引入多智能體系統(tǒng)的研究,控制器不再連續(xù)更新控制輸入,而是依賴于與測(cè)量誤差相關(guān)的事件觸發(fā)函數(shù),當(dāng)測(cè)量誤差達(dá)到某一臨界狀態(tài)才更新控制輸入.文獻(xiàn)[10]給出了一階多智能體系統(tǒng)的事件觸發(fā)控制協(xié)議,設(shè)計(jì)了與智能體系統(tǒng)狀態(tài)有關(guān)的觸發(fā)條件.文獻(xiàn)[11]研究了在有向拓?fù)湎?帶有擾動(dòng)多智能體系統(tǒng)的均方一致性問(wèn)題,智能體最終收斂到系統(tǒng)初始狀態(tài)的平均值,并且進(jìn)一步分析了切換拓?fù)涞囊恢滦?在大多數(shù)已有的成果中,對(duì)于觸發(fā)條件的設(shè)計(jì),不僅與自身的觸發(fā)時(shí)間有關(guān),還與其鄰居的觸發(fā)時(shí)間有關(guān).這樣將會(huì)增加通訊負(fù)擔(dān)和控制器的更新頻率.為了解決這個(gè)問(wèn)題,文獻(xiàn)[12]提出了聯(lián)合測(cè)量誤差,能減少智能體之間的通信次數(shù).為了進(jìn)一步的減小通訊負(fù)擔(dān)和控制器的更新頻次,文獻(xiàn)[13]將事件觸發(fā)機(jī)制引入到間歇控制,給出了集中式和分布式兩種事件觸發(fā)控制策略.
值得注意的是,大部分已有的基于事件觸發(fā)控制策略只是基于漸近收斂.然而,在一些實(shí)際的工程應(yīng)用中,尤其在一些要求較高精度和較高收斂速度的控制問(wèn)題中,經(jīng)常需要達(dá)到有限時(shí)間收斂.因此,基于事件觸發(fā)的有限時(shí)間一致性問(wèn)題有很大研究?jī)r(jià)值.文獻(xiàn)[14]研究了在無(wú)向拓?fù)湎?針對(duì)有領(lǐng)導(dǎo)者和無(wú)領(lǐng)導(dǎo)者兩種情形,通過(guò)將有限時(shí)間一致性控制器與事件觸發(fā)相結(jié)合,設(shè)計(jì)了兩種控制協(xié)議,然而,并沒(méi)有排除Zeno 行為.文獻(xiàn)[15]在此基礎(chǔ)上,設(shè)計(jì)了新的事件觸發(fā)條件,給出了排除Zeno 行為的證明和數(shù)值仿真.文獻(xiàn)[16]在文獻(xiàn)[14]基礎(chǔ)上,研究了在有向拓?fù)湎碌挠邢迺r(shí)間一致性問(wèn)題,給出了兩種事件觸發(fā)條件.盡管上述文獻(xiàn)很好地解決了基于事件觸發(fā)的有限時(shí)間一致性,但是設(shè)置的收斂時(shí)間都與智能體的初始狀態(tài)有關(guān),當(dāng)系統(tǒng)初始狀態(tài)很大時(shí),系統(tǒng)收斂時(shí)間會(huì)受較大影響.為了排除這一影響,文獻(xiàn)[17]設(shè)計(jì)了兩種控制協(xié)議:1)通過(guò)引入符號(hào)函數(shù)來(lái)抑制外部擾動(dòng)的固定時(shí)間一致性協(xié)議;2)為消除前者符號(hào)函數(shù)所帶來(lái)的抖振現(xiàn)象,引入飽和函數(shù),并給出事件觸發(fā)的條件.
上述文獻(xiàn)大部分都是關(guān)于普通一致性問(wèn)題,文獻(xiàn)[18]研究了比例一致性問(wèn)題,即各個(gè)智能體最終的狀態(tài)能夠趨于指定的比例,而不是同一定值.文獻(xiàn)[19]研究了切換拓?fù)湎聨в型ㄐ艜r(shí)延的比例一致性問(wèn)題.文獻(xiàn)[20]研究了一階和二階分組比例一致性問(wèn)題,設(shè)計(jì)了兩種分布式控制協(xié)議.文獻(xiàn)[21]研究了帶有外部擾動(dòng)的比例一致性問(wèn)題,給出了基于漸近收斂、有限時(shí)間收斂和固定時(shí)間收斂三種控制策略.
本文研究了基于事件觸發(fā)二階多智能體系統(tǒng)的固定時(shí)間比例一致性問(wèn)題,提出了一種新的基于事件觸發(fā)的比例一致性控制協(xié)議,該控制協(xié)議包含基于狀態(tài)信息和速度信息的分段式觸發(fā)條件:當(dāng)智能體在追蹤虛擬速度時(shí),采用與系統(tǒng)速度有關(guān)的觸發(fā)條件;當(dāng)完成虛擬速度追蹤后,切換為基于狀態(tài)信息的觸發(fā)條件,能有效的減小系統(tǒng)能量耗散及控制器更新頻次.基于Lyapunov 穩(wěn)定性理論、線性矩陣不等式和代數(shù)圖論證明了所提事件觸發(fā)控制策略能有效地實(shí)現(xiàn)二階多智能體系統(tǒng)的固定時(shí)間比例一致性,并且不存在Zeno 行為.相較于文獻(xiàn)[14]、[16],本文所給出的收斂時(shí)間不再依賴于系統(tǒng)的初始狀態(tài).在文獻(xiàn)[17]的基礎(chǔ)上,本文進(jìn)一步拓展,對(duì)二階多智能體系統(tǒng)進(jìn)行了研究,同時(shí)多智能體不再收斂于同一狀態(tài),而是按照既定的比例,收斂到不同狀態(tài).相較于文獻(xiàn)[18]、[20],本文采用事件觸發(fā)的策略來(lái)設(shè)計(jì)控制協(xié)議,能在達(dá)到比例一致性的同時(shí)有效節(jié)約系統(tǒng)資源.
N個(gè)智能體可視為N個(gè)節(jié)點(diǎn),可以用無(wú)向圖G=(V,E,A)表示,V={v1,···,vN}表示節(jié)點(diǎn)集合,E ?V ×V表示邊集.A=[aij]∈Rn×n是具有元素aij的加權(quán)矩陣,其對(duì)角線元素aii=0.如果(vi,vj)∈/E,aij=0,否則aij >0.若(vi,vj)∈E=(vj,vi)∈E,eij=(vi,vj) 表示第i個(gè)智能體與第j個(gè)智能體之間互相傳輸信息,則圖G為無(wú)向圖;若(vi,vj)∈E(vj,vi)∈E,eij=(vi,vj) 表示第i個(gè)智能體向第j個(gè)智能體傳輸信息,則圖G為有向圖,從節(jié)點(diǎn)i到節(jié)點(diǎn)j的有向路徑被稱為有向邊.度矩陣D∈RN×N定義為D=diag{di},其中di=Laplacian 矩陣L∈∑RN×N被定義為L(zhǎng)=[lij],L=D?A,其中,lii=
引理1[22].
1)無(wú)向圖G的Laplacian 矩陣L為半正定,有一個(gè)特征值為0.如果無(wú)向圖G是連通的,則除0以外的特征值均正定;
2)無(wú)向圖G的Laplacian 矩陣L的第二小特征值λ2(L) 滿足:
3)對(duì)于任意x=(x1,x2,···,xN)T∈RN有:
引理2[23].如果存在一個(gè)連續(xù)的徑向無(wú)界函數(shù)V:RN →R+∪{0}滿足:
1)V(x)=0?x=0 ;
2)系統(tǒng)任意的解x(t) 滿足:
引理3[24].假設(shè)w1,w2,···,wN ≥0,0
考慮到二階多智能體系統(tǒng)由N個(gè)智能體組成,智能體i的動(dòng)力學(xué)方程可寫(xiě)為:
上式中,xi(t)∈R 表示為智能體i的狀態(tài)變量,vi(t)∈R表示為智能體i的速度變量,ui(t)∈R 表示為系統(tǒng)的控制輸入,x(t)=[x1(t),x2(t),···,xN(t)]T.
定義1[20].對(duì)于給定的控制器ui,i=1,2,···,N,如果對(duì)于給定的任何初始值xi(0),i=1,2,···,N,存在一個(gè)與初始值有關(guān)的正數(shù)T以及固定的常數(shù)Tmax>0,T 則稱閉環(huán)系統(tǒng)達(dá)到固定時(shí)間比例一致性,其中si,i=1,2,···,N,為比例系數(shù). 受文獻(xiàn)[7]、[25]的啟發(fā),采用反推法來(lái)設(shè)計(jì)控制器,引入虛擬速度: 定義sig[m]k=sign(m)|m|k,s ign(·) 為符號(hào)函數(shù).其中,i=1,2,···,N,c1>0,c2>0,α ∈(0,1),β >1. 定義速度跟蹤誤差: 為設(shè)計(jì)智能體的事件觸發(fā)策略,對(duì)于每一個(gè)智能體i定義, 經(jīng)過(guò)以上分析,給出基于事件觸發(fā)的控制協(xié)議如下: 其中,c3、c4為正常數(shù),且p ∈(0,1),q >1 .定義x=(x1,x2,···,xN)T.為書(shū)寫(xiě)方便,令 當(dāng)t ∈[0,T1]時(shí),定義測(cè)量誤差為: 令e=(e1,e2,···,eN)T. 定理1.假設(shè)多智能體系統(tǒng)的固定通信拓?fù)鋱D為無(wú)向圖,考慮到多智能體系統(tǒng)(1) 在控制器(10)的作用下,給出如下觸發(fā)函數(shù):G 其中,Ei定義為t ∈(T1,T] 時(shí)的測(cè)量誤差,T1表示智能體速度與虛擬速度達(dá)到一致的時(shí)間,T表示多智能體系統(tǒng)收斂所需時(shí)間.μi ∈(0,1),εi ∈(0,1) .多智能體系統(tǒng)(1)在任意初始條件下均能實(shí)現(xiàn)固定時(shí)間比例一致性,且收斂時(shí)間滿足: T2表示智能體達(dá)到虛擬速度之后整個(gè)系統(tǒng)實(shí)現(xiàn)一致性的時(shí)間. 證明.由式(5)、(10)、(11)可得: 當(dāng)t ∈[0,T1] 時(shí),選定Lyapunov 函數(shù)為: 求導(dǎo)得 上式中 結(jié)合式(14)、(15)有: 由引理2 得,事件觸發(fā)條件為: 結(jié)合式(16)、(17)得: 另一方面,當(dāng)t ∈[0,T1] 時(shí),由式(18)及引理2知有界,再由式(1)、(3)、(4)得: 考慮到控制器ui是不連續(xù)更新控制輸入的,故有: 當(dāng)t ∈(T1,T]時(shí),定義測(cè)量誤差: 選取Lyapunov 函數(shù)為: 其中,S=diag{sisign(si)},導(dǎo)有: 于是,可以得到事件觸發(fā)條件: 由引理3,式(24)可以寫(xiě)成: 由引理1, 于是式子(26)可以寫(xiě)成: 結(jié)合式(19)、(28),可得多智能體系統(tǒng)(1)在控制輸入(10)及觸發(fā)條件(12)的作用下,可以實(shí)現(xiàn)固定時(shí)間一致性,且收斂時(shí)間T滿足: 考慮到時(shí)間T1是不確定的,對(duì)兩個(gè)事件觸發(fā)條件進(jìn)行合并.由式(29)可以看出,當(dāng)t ∈[0,T1] 時(shí),智能體處于追蹤虛擬速度的狀態(tài),1,此時(shí)事件觸發(fā)條件為式(17);當(dāng)t ∈(T1,T] 時(shí),觸發(fā)條件為式(25). 定理2.假設(shè)固定通信拓?fù)鋱DG是無(wú)向連通的,考慮多智能體系統(tǒng)(1)在控制器(10)和觸發(fā)條件(12)的作用下,系統(tǒng)能實(shí)現(xiàn)一致且不存在Zeno 行為. 其中,U表示控制器(10)不采用事件觸發(fā)機(jī)制時(shí)的控制協(xié)議.定理1 中給出了事件觸發(fā)條件,并在其后證明了在控制器(10)的作用下多智能體系統(tǒng)的穩(wěn)定性.控制器U實(shí)時(shí)更新控制輸入,也就是說(shuō),控制器U比控制器(10)更為保守.不難證明,在控制器U的作用下,依然能實(shí)現(xiàn)多智能體系統(tǒng)的固定時(shí)間一致性,因此U′必定是有界的.假定U′絕對(duì)值的 結(jié)合等式(32)、(36),可得最小觸發(fā)時(shí)間間隔: 由引理1, 于是不難得到: 因此,式子 以下證明類(lèi)似于t ∈[0,T1] 的情況,可得最小觸發(fā)時(shí)間間隔為: 其中,εmin=min{ε1,ε2,···,εN}.綜合上述論證,在兩個(gè)時(shí)間段內(nèi),事件觸發(fā)間隔都存在正下界.□ 實(shí)例1.考慮到多智能體系統(tǒng)由5 個(gè)智能體組成,5 個(gè)智能體互連構(gòu)成的連通拓?fù)鋱D如圖1 所示. 圖1 拓?fù)鋱DFig.1 Topological graph 由通信拓?fù)鋱D不難得到Laplacian 矩陣L: 其中,λ2(L)=1.38.選定初始的狀態(tài)為x(0)=[?0.5,?0.3,0.1,0.2,?0.1],初始速度為v(0)=[?0.2,0.1,?0.3,0.2,?0.1].設(shè)定控制增益分別為:c1=0.22,c2=1.2,c3=0.85,c4=0.4 .比例參數(shù)設(shè)置為:s1=?1.3,s2=?1.3,s3=0.3,s4=0.3,s5=1.其他需要設(shè)定的參數(shù)分別為:α=0.6,β=1.8,p=0.8,q=1.1,μi=0.5,εi=0.95.由等式(19)不難得出T1max=26.9 s,由等式(26) 得T2max=20.9 s.系統(tǒng)總的收斂時(shí)間滿足:T=T1+T2≤T1max+T2max=47.8 s. 圖2 表明每個(gè)智能體最后收斂到不同狀態(tài).由圖2 和圖3 知,系統(tǒng)總體的收斂時(shí)間在10 s 左右,顯然小于47.8 s.由圖4 知,當(dāng)各個(gè)智能體追蹤虛擬速度的誤差趨近于零時(shí),所需要的時(shí)間小于5 s,顯然小于T1max. 圖2 各智能體在控制策略(10)下的狀態(tài)軌跡Fig.2 Trajectories of agents under controller (10) 圖3 各智能體在控制策略(10)下的速度狀態(tài)Fig.3 Velocities of agents under controller (10) 圖4 追蹤虛擬速度的誤差Fig.4 Tracking the error of virtual speed 圖5 和圖6表示智能體1 在事件觸發(fā)控制協(xié)議(10)及事件觸發(fā)函數(shù)(12)下,其誤差范數(shù)的演化過(guò)程.圖5 表示的是在t ∈[0,T1],用基于速度信息的事件觸發(fā)條件時(shí),智能體1誤差范數(shù)的演化過(guò)程.圖6 表示在t∈(T1,T],當(dāng)多智能體系統(tǒng)完成虛擬速度追蹤時(shí),切換為基于狀態(tài)信息的事件觸發(fā)條件,智能體1 的誤差范數(shù)演化過(guò)程. 圖5 智能體1 在觸發(fā)條件(17)下的測(cè)量誤差及閾值變化趨勢(shì)Fig.5 The evolution of the error norm and the threshold of agent 1 with trigger function (17) 圖6 智能體1 在觸發(fā)條件(25)下的測(cè)量誤差及閾值變化趨勢(shì)Fig.6 The evolution of the error norm and the threshold of agent 1 with trigger function (25) 圖7 中i=1,2,···,5 為在控制策略(10)下,各個(gè)智能體觸發(fā)間隔;i=6 為在時(shí)間觸發(fā)下,每個(gè)智能體觸發(fā)間隔.圖7 表明本文所提出的事件觸發(fā)控制策略在減小系統(tǒng)的能量耗散和控制器的更新頻次的優(yōu)越性. 圖7 各智能體在控制策略(10)下的觸發(fā)間隔及在時(shí)間觸發(fā)控制策略下的觸發(fā)間隔Fig.7 The triggered interval of each agent under control scheme (10) and the trigger interval under the time trigger control strategy 圖8 給出了智能體1 在控制協(xié)議(10)下,與其它智能體之間的狀態(tài)誤差.當(dāng)系統(tǒng)達(dá)到穩(wěn)定狀態(tài)時(shí),各個(gè)智能體收斂于不同的值,且滿足既定的比例關(guān)系. 圖8 各智能體的狀態(tài)誤差Fig.8 State errors of agents 實(shí)例2.為了證明本文給出的結(jié)果能夠適應(yīng)更為復(fù)雜的多智能體系統(tǒng),選用12 個(gè)智能體組成的復(fù)雜多智能體系統(tǒng),12 個(gè)智能體互連構(gòu)成的連通拓?fù)鋱D如圖9 所示.其中,取多智能體系統(tǒng)的初始狀態(tài)、初始速度分別為x(0)=[?1,2,?3,4,?5,6,7,?8,9,10,?11,?7],v(0)=[?2,?1,3,4,?2,?6,7,8,9,?3,3.5].設(shè)定控制增益分別為:c1=0.2,c2=0.3,c3=1.2,c4=0.4.λ2(L)=0.558 .其他需要設(shè)定的參數(shù)分別為:α=0.4,β=1.8,p=0.8,q=1.1,μi=0.5,εi=0.66 . 圖9 拓?fù)鋱DFig.9 Topological graph 由等式(19) 不難得出T1max=32.7 s,由等式(26) 得T2max=26.2 s.系統(tǒng)總的收斂時(shí)間滿足:T=T1+T2≤T1max+T2max=58.9 s .圖10 表明在控制策略(10)下,多智能體系統(tǒng)能收斂至5 個(gè)不同的子群.圖11 表示各個(gè)智能體速度狀態(tài)軌跡圖.而圖12 則表明智能體追蹤虛擬速度的誤差.從圖中可以看出,智能體大約在4 s 左右實(shí)現(xiàn)虛擬速度的追蹤,系統(tǒng)總體的收斂時(shí)間在10 s 左右,顯然小于58.9 s. 圖10 各智能體在控制策略(10)下的狀態(tài)軌跡Fig.10 Trajectories of agents under controller (10) 圖11 各智能體在控制策略(10)下的速度狀態(tài)Fig.11 Velocities of agents under controller (10) 圖12 追蹤虛擬速度的誤差Fig.12 Tracking the error of virtual speed 本文研究了基于事件觸發(fā)二階多智能體系統(tǒng)的固定時(shí)間比例一致性.為使得系統(tǒng)狀態(tài)收斂到不同狀態(tài),設(shè)計(jì)了一種基于事件觸發(fā)的固定時(shí)間非線性比例一致控制策略,該控制協(xié)議包含一種基于狀態(tài)信息和速度信息的分段式觸發(fā)條件:當(dāng)多智能體系統(tǒng)處于追蹤虛擬速度的狀態(tài)時(shí),采用基于速度信息的事件觸發(fā)條件;當(dāng)完成虛擬速度的追蹤時(shí),采用基于狀態(tài)信息的事件觸發(fā)條件,能有效的減小系統(tǒng)的能量耗散和控制器的更新頻次.利用Lyapunov 穩(wěn)定性理論、線性矩陣不等式和代數(shù)圖論,證明在該控制策略下,二階多智能體系統(tǒng)能實(shí)現(xiàn)固定時(shí)間比例一致性,且不存在Zeno 行為.2 基于事件觸發(fā)的固定時(shí)間比例一致性
3 實(shí)例仿真
4 結(jié)論