徐君 張國(guó)良 曾靜 孫巧 羊帆,4
近年來,多智能體系統(tǒng)的分布式協(xié)調(diào)控制問題受到了研究者的極大關(guān)注,在衛(wèi)星編隊(duì)[1?2]、多無人系統(tǒng)[3?4]、無線傳感器網(wǎng)絡(luò)[5?6]等實(shí)際系統(tǒng)都有廣泛應(yīng)用.一致性問題作為多智能體系統(tǒng)分布式協(xié)調(diào)控制的一個(gè)基礎(chǔ)問題,一經(jīng)提出就得到研究者的普遍重視[7?12],它要求每個(gè)智能體僅利用自身和鄰居的狀態(tài)信息,通過設(shè)計(jì)合適的一致性協(xié)議,使得多智能體系統(tǒng)的某個(gè)感興趣的狀態(tài)變量相同或趨于一致.解決一致性問題的基本框架最早由Olfati-Saber等在文獻(xiàn)[7]提出,主要研究多智能體系統(tǒng)的一階一致性問題.Ren等在文獻(xiàn)[8]考慮了二階多智能體系統(tǒng)的一致性問題,給出了二階多智能體系統(tǒng)獲得一致性的充分條件.文獻(xiàn)[9]考慮了鄰域交互結(jié)構(gòu)優(yōu)化的二階多智能體快速蜂擁控制算法.Xi等在文獻(xiàn)[10]提出高階連續(xù)時(shí)間多智能體系統(tǒng)的一致性問題,并將高階多智能體系統(tǒng)的模型描述為一般線性系統(tǒng).文獻(xiàn)[11]研究了一類控制器模態(tài)和系統(tǒng)模態(tài)不匹配的異步切換高階多智能體系統(tǒng)的輸出調(diào)節(jié)一致性問題.文獻(xiàn)[12]研究了時(shí)延和切換拓?fù)錀l件下高階離散時(shí)間多智能體系統(tǒng)的一致性問題.文獻(xiàn)[13]討論了有領(lǐng)導(dǎo)者條件下高階離散時(shí)間多智能體系統(tǒng)的一致性問題.隨著研究的深入,研究者發(fā)現(xiàn)之前的研究?jī)H考慮了系統(tǒng)的穩(wěn)定性,沒有考慮系統(tǒng)的性能指標(biāo),例如系統(tǒng)的能量消耗.基于此考慮,Cheng等在文獻(xiàn)[14]中提出了保性能一致性問題.保性能一致性的優(yōu)點(diǎn)在于它不僅考慮了多智能體系統(tǒng)的一致性穩(wěn)定性,還考慮了多智能體系統(tǒng)的能量消耗.實(shí)際的多智能體系統(tǒng)所攜帶的能量往往都是有限的,因此研究多智能體系統(tǒng)的保性能一致性問題具有十分重要的工程意義.文獻(xiàn)[15]和文獻(xiàn)[16]研究了連續(xù)時(shí)間多智能體系統(tǒng)的一階保性能一致性問題.文獻(xiàn)[17]研究了連續(xù)時(shí)間多智能體系統(tǒng)的二階保性能一致性問題.上述文獻(xiàn)研究的是連續(xù)時(shí)間多智能體系統(tǒng)的保性能一致性問題,且沒有考慮系統(tǒng)的魯棒性.Xu等在文獻(xiàn)[18]中考慮了高階離散時(shí)間多智能體系統(tǒng)的魯棒保性能一致性問題.但是,文獻(xiàn)[18]僅僅討論了固定拓?fù)浜蜔o時(shí)延條件下的高階離散時(shí)間多智能體系統(tǒng)的魯棒保性能一致性問題,沒有涉及時(shí)延和切換拓?fù)涞那闆r.受此啟發(fā),本文考慮研究時(shí)延和聯(lián)合連通切換拓?fù)錀l件下的高階離散時(shí)間多智能體系統(tǒng)的魯棒保性能一致性問題.
本文符號(hào)說明如下:1N表示維數(shù)為N的元素全為1的列向量;I表示適當(dāng)維數(shù)的單位矩陣;rank表示矩陣的秩;?表示Kronecker直積[17];?表示對(duì)稱矩陣的中的相應(yīng)對(duì)稱元素.
用G=(V,E,A)表示一個(gè)有向圖,其中,V={v1,···,vN}表示圖的N個(gè)節(jié)點(diǎn)集;E?V×V表示圖的邊集,節(jié)點(diǎn)序號(hào)屬于一個(gè)固定的節(jié)點(diǎn)序列集I={1,2,···,N},圖G的邊用eij=(vi,vj)表示,eij表示從vi到vj的信息流,vi稱做父節(jié)點(diǎn),vj稱做子節(jié)點(diǎn).用非負(fù)矩陣A=[aij]表示其鄰接矩陣,圖G的邊eij關(guān)聯(lián)的權(quán)重aij非負(fù).另外假定aii=0,i∈I.如果eij∈E?eji∈E,則稱圖G為一個(gè)無向圖.圖G的Laplacian矩陣定義為L(zhǎng)(G)=L=??A,其中為圖G的度矩陣.ei是第i個(gè)元素為1其余元素為0的列向量.
文獻(xiàn)[10]指出,高階多智能體系統(tǒng)一致性問題可以用一般線性群系統(tǒng)一致性問題描述.因此,本文考慮一個(gè)由N個(gè)同構(gòu)智能體組成的高階離散時(shí)間不確定線性多智能體系統(tǒng).
其中,i=1,2,···,N,xi(k)∈Rd和ui(k)∈Rm分別表示智能體i的系統(tǒng)狀態(tài)和控制向量,A和B是適當(dāng)維數(shù)的常數(shù)矩陣,且(A,B)可控.?A和?B是適當(dāng)維數(shù)的不確定矩陣,假定形式如下:
其中,D,E1和E2是合適維數(shù)的常數(shù)矩陣,反映了離散時(shí)間多智能體系統(tǒng)(1)中的每一個(gè)智能體的不確定性結(jié)構(gòu),F是一個(gè)滿足
的未知矩陣,且可以是時(shí)變的.
注 1.在實(shí)際多智能體系統(tǒng)中,由于系統(tǒng)器件老化等原因,系統(tǒng)的參數(shù)常常會(huì)發(fā)生變化,但一般不會(huì)太大,因此本文做出式(3)的假設(shè).另外,?A和?B在實(shí)際系統(tǒng)中也不完全一定始終滿足?A=DFE1和?B=DFE2,如果?1或?2,高階離散時(shí)間不確定多智能體系統(tǒng)(1)的魯棒保性能問題將變得十分復(fù)雜,本文不做討論.
假定高階離散時(shí)間不確定多智能體系統(tǒng)(1)在k時(shí)刻的通信拓?fù)錇镚σ(k),并用ΓN={Gσ(k)}表示通信拓?fù)銰σ(k)所有可能拓?fù)浣Y(jié)構(gòu)的集合,具體表示為
其中,IΓN={1,2,···,M},σ(k):[0,∞)→IΓN表示通信拓?fù)涞那袚Q信號(hào),即通信拓?fù)浼中元素的索引.Lσ(k)=L(Gσ(k))為系統(tǒng)在k時(shí)刻通信拓?fù)銰σ(k)的Laplacian矩陣.
針對(duì)高階離散時(shí)間不確定多智能體系(1)的一致性問題,本文采用如下線性一致性協(xié)議:
其中,K是合適維的常值反饋矩陣,τ(k)是變時(shí)延,且滿足0≤τ(k)≤τmax,τmax為最大允許時(shí)延,aij(σ(k))表示當(dāng)切換信號(hào)為σ(k)時(shí),智能體j到智能體i的作用權(quán)重.
令δij(k)=xi(k)? xj(k),定義保性能函數(shù)
其中,
其中,Qx和Qu為給定的對(duì)稱正定加權(quán)矩陣.
定義1.對(duì)于高階離散時(shí)間不確定多智能體系統(tǒng)(1),如果存在一個(gè)序列c(k)和一個(gè)正數(shù)使得成立,則稱不確定多智能體系統(tǒng)(1)達(dá)到保性能一致性,c(k)稱做一致性序列,稱做保性能代價(jià).
注2.JC是一個(gè)與高階離散時(shí)間不確定多智能體系統(tǒng)(1)參數(shù)相關(guān)的保性能函數(shù),其中,JCu描述了系統(tǒng)控制輸入的能量消耗,JCx描述了一致性協(xié)議(4)造成的能量消耗,保性能一致性的實(shí)質(zhì)就是尋找一個(gè)JCu和JCx之間的平衡,具體就是尋找一個(gè)合適的反饋增益矩陣K使得保性能函數(shù)JC存在一個(gè)上界.由此可以看出,保性能一致性本質(zhì)上是從能量?jī)?yōu)化的角度考慮了多智能體系統(tǒng)的一致性,但最優(yōu)解一般很難得到,一般求出次優(yōu)解即可.
其中,?(k)=0.為了分析聯(lián)合連通條件下高階離散時(shí)間多智能體閉環(huán)系統(tǒng)(6)的一致性問題.
引理1[19].用L表示一個(gè)無向圖G的Laplacian矩陣,則零是它的一個(gè)特征值,如果G連通,則零是L的單一特征值,并且L的其他所有特征值均為正實(shí)數(shù).
定義 2.設(shè)存在一個(gè)有限時(shí)間段[k0,k0+κ),使得切換通信拓?fù)銰σ(k)在[k0,k0+κ)時(shí)間段內(nèi)的聯(lián)合作用通信拓?fù)銰κ是連通的,則稱切換通信拓?fù)銰σ(k)在有限時(shí)間段[k0,k0+κ)聯(lián)合連通.其中表示Gσ(k)在[k0,k0+κ)時(shí)間段內(nèi)的并集,所對(duì)應(yīng)的鄰接矩陣Aκ和Laplacian矩陣Lκ分別滿足.
注3.聯(lián)合連通與一般意義的切換拓?fù)涞膮^(qū)別是聯(lián)合連通的子拓?fù)洳灰欢ㄊ沁B通的,而一般意義的切換拓?fù)涞拿總€(gè)子拓?fù)涠际沁B通的,這樣多智能體系統(tǒng)在聯(lián)合連通條件下的一致性問題將更加復(fù)雜.
顯然,如果子系統(tǒng)(9)Schur穩(wěn)定,則閉環(huán)多智能體系統(tǒng)(6)獲得一致性.需要說明的是,這個(gè)條件與文獻(xiàn)[10]中的高階連續(xù)時(shí)間多智能體系統(tǒng)情況類似,區(qū)別是對(duì)于高階連續(xù)時(shí)間多智能體系統(tǒng),子系統(tǒng)(9)需要的是Hurwitz穩(wěn)定.
另外,保性能函數(shù)(5)可寫為
引理2(Jensen不等式)[20].對(duì)于任意常值矩陣M≥0,M∈Rn×n,ψ(i)∈Rn,正整數(shù)α1,α2,且α2≥α1≥1,如下不等式成立:
引理3.考慮一個(gè)高階離散時(shí)間不確定多智能體系統(tǒng)(1),同時(shí)假定它的通信作用拓?fù)涫锹?lián)合連通的,時(shí)間延遲為τ(k).如果存在合適維的矩陣K,d×d維的矩陣R1,R2,Q1,Q2滿足
則高階離散時(shí)間不確定多智能體系統(tǒng)(1)能在一致性協(xié)議(4)作用下獲得保性能一致性,且它的保性能函數(shù)上界滿足
證明.考慮Lyapunov函數(shù)候選
將式(25)和(26)代入式(24)可得,?V1(k)沿著式(6)的差分為
?V2(k)沿著式(6)的差分為
?V3(k)沿著式(6)的差分為
?V4(k)沿著式(6)的差分為
?V5(k)沿著式(6)的差分為
同時(shí),根據(jù)引理2,可得
?V6(k)沿著式(6)的差分為
進(jìn)一步,做出如下定義
注意到如果?J(k)≤0,有?V(k)≤0,接著可以得到
再由線性系統(tǒng)理論知識(shí)和凸集優(yōu)化理論可以得到,如果矩陣不等式(14)和(15)成立,則閉環(huán)系統(tǒng)(6)漸近穩(wěn)定.
從條件(37)和 ?J(k)≤0可以得到再利用 limk→∞?V(k)= 0 和,對(duì)C≤ ??V(k)兩邊進(jìn)行從k=0到k=∞求和,利用線性系統(tǒng)穩(wěn)定性理論可以得到JC≤V(0).根據(jù)定義可知,矩陣不等式(14)和(15)可確保高階離散時(shí)間不確定多智能體系統(tǒng)(1)獲得保性能一致性,并且系統(tǒng)的保性能函數(shù)(5)滿足JC≤V(0).另外,通過式(7)可以得到.又因?yàn)?所以有
由于UUT=IN,所以有和.這樣可以得到.又因?yàn)閤(k)=x(0),k∈{?τmax,?τmax+1,···,0},可以得到V4(0)=V5(0)=V6(0)=0.從而有
根據(jù)定義1,綜上可得,式(16)是這種情況下保性能函數(shù)(5)的一個(gè)上界.
注4.引理3利用狀態(tài)空間分解法,將不確定多智能體系統(tǒng)(1)的魯棒保性能一致性問題轉(zhuǎn)換為N?1個(gè)子系統(tǒng)(9)的魯棒保性能控制問題,并通過構(gòu)造合適的Lyapunov函數(shù),尋找到了一個(gè)高階離散時(shí)間不確定多智能體系統(tǒng)(1)在時(shí)延和切換通信拓?fù)錀l件下獲得魯棒保性能一致性的充分條件,并給出了保性能函數(shù)(5)的一個(gè)與不確定多智能體系統(tǒng)(1)的初始狀態(tài)x(0)和最大通信時(shí)延τmax相關(guān)的上界.可行矩陣P,R1,R2,Q1,Q2和K的求解與系統(tǒng)(1)的通信拓?fù)溆嘘P(guān),對(duì)保性能函數(shù)(5)的上界具有間接的影響.但易發(fā)現(xiàn)矩陣不等式(14)和(15)含有非線性不確定項(xiàng),因此很難利用引理3直接求解出反饋增益矩陣K.
引理4[21].給定合適維的矩陣Y,D和E,且Y是對(duì)稱矩陣,則
對(duì)于所有滿足FTF≤I的矩陣F成立的充要條件是存在ε>0滿足
引理5[22].線性矩陣不等式
其中,Q(x)=QT(x),R(x)=RT(x)和S(x)與x相關(guān),它等價(jià)于
1)Q(x)>0,R(x)?ST(x)Q?1(x)S(x)>0;
2)R(x)>0,Q(x)?S(x)R?1(x)ST(x)>0.
定理1.考慮高階離散時(shí)間不確定多智能體系統(tǒng)(1)的通信時(shí)延為τ(k),同時(shí)假定它的通信作用拓?fù)涫锹?lián)合連通的.一致性協(xié)議(4)能夠解決不確定多智能體系統(tǒng)(1)的魯棒保性能一致性問題的一個(gè)充分條件是存在正數(shù)ε1>0,ε2>0,ε3>0,合適維的反饋矩陣K,d×d維的正定矩陣P,S,R1,R2,M1,M2,Q1和Q2是如下優(yōu)化問題的一個(gè)解
證明.矩陣不等式(14)可寫為
將?A=DFE1和?B=DFE2代入矩陣不等式(53),并利用引理4,矩陣不等式(53)對(duì)于矩陣F所有可能成立,等價(jià)于存在正數(shù)ε1>0,ε2>0和ε3>0,滿足
另外,再對(duì)矩陣不等式(15)做同樣處理.令S=P?1,再利用錐補(bǔ)線性化方法[23]和凸集優(yōu)化理論,非線性矩陣不等式(54)的求解問題等價(jià)于非線性最小化問題(46)~(51).
注5.通過定理1,非線性線性矩陣不等式(14)和(15)轉(zhuǎn)化為優(yōu)化問題(46)~(51),它可以利用算法1進(jìn)行求解,從而得到反饋增益矩陣,從而使得多智能體系統(tǒng)(1)在一致性協(xié)議(4)下獲得魯棒保性能一致性.值得說明的是,因?yàn)镕是一個(gè)未知矩陣,無法直接利用與之相關(guān)的不等式條件獲得一致性協(xié)議的反饋增益矩陣.這種情況下,引理4很好地解決了這個(gè)問題.但需注意的是,解K,P,S,R1,R2,M1,M2,Q1,Q2與不確定矩陣D和F密切相關(guān).因?yàn)閮?yōu)化問題(46)~(51)的線性矩陣不等式是堆成的,所以可以利用MATLAB工具箱求解,從而驗(yàn)證其有效性.
算法1.優(yōu)化問題(46)~(51)的求解
步驟 1.尋找LMI(46)~(51)的一個(gè)可行解P0,S0,R1,0,R2,0,M1,0,M2,0,如果不存在,就退出.令k=0.
步驟2.令Pk=P0,Sk=S0,R1,k=R1,0,R2,k=R2,0,M1,k=M1,0,M2,k=M2,0,并尋找Pk+1,Sk+1,R1,k+1,R2,k+1,M1,k+1,M2,k+1滿足LMI(46)~(51),并使得tr(PkS+PSk+R1,kM1+R2,kM2+R1M1,k+R2M2,k)最小.
步驟3.如果tr(PkS+PSk+R1,kM1+R2,kM2+R1M1,k+R2M2,k)<6d+ε,則退出.否則,令k=k+1,返回步驟2.
定理2.當(dāng)閉環(huán)高階離散時(shí)間不確定多智能體系統(tǒng)(6)獲得保性能一致性時(shí),其一致性序列滿足
證明.令.根據(jù)式(7),xxx(k)能夠被唯一分解為x(k)=xc(k)+xr(k).如前所述,如果閉環(huán)不確定多智能體系統(tǒng)(6)獲得保性能一致性,則子系統(tǒng)(9)必須Schur穩(wěn)定,它暗示著子系統(tǒng)(9)由狀態(tài)xr(0)引起的響應(yīng)需滿足limk→∞ xr(k)=0.因此,一致性序列c(k)完全由xc(k)決定.下面分兩種情況討論一致性序列c(k).
又因?yàn)閏(k)滿足limk→∞(c(k)? xc(k))=0,k=0,1,2,···,綜上可得式 (55).
注6.從定理2可以看出,一致性序列c(k)僅與系統(tǒng)矩陣A+?A、通信拓?fù)浜统跏紶顟B(tài)x(0)相關(guān),與時(shí)間延遲無關(guān).這個(gè)條件與文獻(xiàn)[12]中的不含不確定性的高階離散時(shí)間多智能體系統(tǒng)情況類似,區(qū)別在于定理2描述了不確定性對(duì)高階離散時(shí)間不確定多智能體系統(tǒng)的一致性序列的影響.另外值得說明的是,文獻(xiàn)[24]利用內(nèi)模原理解決了異構(gòu)連續(xù)線性多智能體系統(tǒng)的魯棒一致性控制問題.本文與它的區(qū)別在于,文獻(xiàn)[24]主要從輸出一致性的角度考慮多智能體系統(tǒng)的一致性問題,而本文主要從保性能的角度考慮多智能體的一致性問題.同時(shí),二者考慮的不確定性也有所不同,但還是可以考慮在后續(xù)工作將兩者結(jié)合起來研究.此外,本文工作與H∞控制的區(qū)別在于,H∞控制目的在于抑制外部噪聲,本文考慮的是節(jié)省能量.
假定多智能體系統(tǒng)(1)的具體形式如下:
其中,r1,r2和r3是不確定參數(shù),它們滿足?1≤r1≤1,?1≤r2≤1和?1≤r3≤1.則高階離散時(shí)間不確定多智能體系統(tǒng)(1)可以重新寫為
定義保性能代價(jià)加權(quán)矩陣如下:
設(shè)高階離散時(shí)間多智能體系統(tǒng)(1)包含8個(gè)智能體,其通信拓?fù)銰σ(k)是聯(lián)合連通的,具體如圖1所示,圖1(a)~(c)為其3種通信可能,圖1(d)為通信拓?fù)鋱D1(a)~(c)的合并圖.
假定多智能體系統(tǒng)(1)的初始狀態(tài)為x1(0)=[1,5,?2]T,x2(0)=[2,4,3]T,x3(0)=[1,1,2]T,x4(0)=[3,2,1]T,x5(0)=[5,6,?2]T,x6(0)=[?3,3,4]T,x7(0)=[?2,?4,?3]T,x8(0)=[?5,?2,?1]T.同時(shí),令r1=0.15,r2=0.25,r3=0.15,τmax=3.利用定理1可得K=[0.0422,?0.0549,0.1121]T能夠使多智能體系統(tǒng)(1)獲得保性能一致性.仿真結(jié)果如圖2~6所示.圖2~4給出了多在一致協(xié)儀(4)作用下,智能體系統(tǒng)(1)在參數(shù)rj(j=1,2,3)變化前后的狀態(tài)軌跡變化曲線.圖2~4中,?表示定理2計(jì)算出來的多智能體系統(tǒng)(1)的通信拓?fù)洳话l(fā)生變化的初始一致性序列,?表示定理2計(jì)算出來的多智能體系統(tǒng)(1)的通信拓?fù)浒l(fā)生變化時(shí)的實(shí)際一致性序列,其他實(shí)線表示多智能體系統(tǒng)(1)狀態(tài)的變化軌跡.圖5給出了保性能指標(biāo)JC和的變化軌跡.圖6給出了多智能體系統(tǒng)(1)的通信拓?fù)淝袚Q信號(hào)σ(k)的時(shí)序圖.
圖1 多智能體系統(tǒng)(1)的通信拓?fù)銰Fig.1the interaction topology Gof multi-agent system(1)
圖2 狀態(tài)xi1在參數(shù)rj(j=1,2,3)變化前后的狀態(tài)軌跡Fig.2Comparison of state trajectories of xi1before and after parameters rj(j=1,2,3)change
圖4 狀態(tài) xi3在參數(shù)rj(j=1,2,3)變化前后的狀態(tài)軌跡Fig.4 Comparison of state trajectories of xi3 before and after parameters rj(j=1,2,3)change
從圖2~6的仿真結(jié)果可以看出,不確定多智能體系統(tǒng)(1)在一致性協(xié)議(4)下獲得魯棒保性能一致性.多智能體系統(tǒng)(1)包含/不包含參數(shù)不確定性時(shí),系統(tǒng)都收斂于式(55),與定理2計(jì)算出的一致性序列c(k)相同.區(qū)別在于當(dāng)多智能體系統(tǒng)(1)不包含不確定性時(shí),式(55)中的A+?A需被A取代.多智能體系統(tǒng)(1)的一致性收斂序列與不確定參數(shù)rj(j=1,2,3)和系統(tǒng)通信拓?fù)溆嘘P(guān),尤其是圖4,可以看出系統(tǒng)一致性序列c(k)會(huì)在系統(tǒng)通信拓?fù)淝袚Q時(shí)發(fā)生突變.圖5表明,JC<在實(shí)驗(yàn)過程中恒成立,滿足定義1的魯棒保性能一致性要求.實(shí)驗(yàn)充分說明了高階離散時(shí)間不確定多智能體系統(tǒng)(1)在定理1求得的增益矩陣K下,受一致性協(xié)議(4)作用,能夠獲得魯棒保性能一致,從而驗(yàn)證了定理1和定理2的正確性和有效性.
圖5 保性能代價(jià)軌跡圖Fig.5 Trajectories of cost
圖6 多智能體系統(tǒng)(1)的通信拓?fù)淝袚Q信號(hào)σ(k)Fig.6 The switching signal σ(k)of multi-agent system(1)
在時(shí)延和切換通信拓?fù)錀l件下,本文對(duì)高階離散時(shí)間不確定多智能體系統(tǒng)的魯棒保性能問題進(jìn)行了研究,給出了高階離散時(shí)間不確定多智能體系統(tǒng)獲得魯棒保性能一致性的一個(gè)充分條件,并提供了其保性能函數(shù)的上界和一致性序列.數(shù)值仿真驗(yàn)證了本文所提理論的正確性.另外,本文所提方法較為復(fù)雜,后續(xù)工作將考慮如何使其簡(jiǎn)化.