羅俊芝,張雪飛,詹環(huán)
(陸軍裝甲兵學(xué)院基礎(chǔ)部,北京 100072)
多智能體系統(tǒng)是由多個(gè)智能體組成的集合,智能體之間以及智能體與環(huán)境之間通過通信、協(xié)商與協(xié)作來共同完成單個(gè)智能體所不能解決的問題。多智能體系統(tǒng)有著廣泛的應(yīng)用背景,比如航天器的編隊(duì)控制問題,水下多機(jī)器人系統(tǒng)的勘探任務(wù)分配問題等,都可以轉(zhuǎn)化為多智能體系統(tǒng)的控制問題。隨著科技的發(fā)展,一項(xiàng)復(fù)雜的任務(wù)可以通過多個(gè)結(jié)構(gòu)、功能都相對(duì)簡(jiǎn)單的智能體來完成。因此,多智能體系統(tǒng)的控制研究已經(jīng)成為了一個(gè)熱門的研究方向。如文獻(xiàn)[1]對(duì)多智能體系統(tǒng)的隊(duì)形控制方法及應(yīng)用進(jìn)行了綜述,給出隊(duì)形控制的研究概況;文獻(xiàn)[2]通過引入虛擬領(lǐng)導(dǎo)者產(chǎn)生期望軌跡的方法,研究了離散時(shí)變多智能體系統(tǒng)有限時(shí)間一致性控制;文獻(xiàn)[3]則基于脈沖控制,針對(duì)時(shí)延異構(gòu)多智能體編隊(duì)控制進(jìn)行研究;文獻(xiàn)[4]則對(duì)無人機(jī)編隊(duì)形成與防碰撞進(jìn)行研究,提出了基于信息一致性的無人機(jī)編隊(duì)形成時(shí)避免碰撞的控制策略;文獻(xiàn)[5]在研究了時(shí)變拓?fù)浣Y(jié)構(gòu)下,系統(tǒng)有Leader 領(lǐng)導(dǎo)下多智能體系統(tǒng)的跟蹤控制問題。文獻(xiàn)[6]研究了時(shí)變拓?fù)渚W(wǎng)絡(luò)結(jié)構(gòu)下的多無人機(jī)系統(tǒng)的一致性控制問題;文獻(xiàn)[7]研究了時(shí)變拓?fù)浣Y(jié)構(gòu)下的多無人機(jī)領(lǐng)航跟隨一致性和軌跡跟蹤問題;文獻(xiàn)[8]研究了具有時(shí)滯和時(shí)變系數(shù)的離散多智能體系統(tǒng)的一致性。盡管目前關(guān)于多智能體系統(tǒng)的研究成果頗多,但是大部分研究是在系統(tǒng)線性模型的基礎(chǔ)上展開的。由于多智能體系統(tǒng)的實(shí)際背景比較復(fù)雜,線性模型不能夠精確描述多智能體系統(tǒng)的模型,因此基于非線性模型的多智能體系統(tǒng)研究更有意義。目前已有一些研究成果對(duì)此進(jìn)行了關(guān)注[9-16],如文獻(xiàn)[9]利用滑??刂蒲芯糠蔷€性多智能體系統(tǒng)一致性控制問題;文獻(xiàn)[10]則針對(duì)非線性傳輸?shù)亩嘀悄荏w系統(tǒng)的自適應(yīng)一致性控制問題進(jìn)行了研究;文獻(xiàn)[11]關(guān)注了脈沖控制下的非線性多智能體系統(tǒng)部分分量一致性問題。文獻(xiàn)[12]針對(duì)一類非線性多智能體系統(tǒng),研究了滿足預(yù)定性能的協(xié)同控制問題;文獻(xiàn)[13]研究了非線性多智能體系統(tǒng)的輸出調(diào)節(jié)問題,等等。該文基于多智能體系統(tǒng)的非線性模型,研究系統(tǒng)的一致性控制問題,考慮到智能體之間信息傳輸通過網(wǎng)絡(luò)進(jìn)行,傳輸效果與網(wǎng)絡(luò)環(huán)境有很大關(guān)系,如果網(wǎng)絡(luò)環(huán)境不好,可能造成信息傳輸時(shí)滯存在較大差異,考慮到智能體之間信息傳輸?shù)膶?shí)際情況,該文引入網(wǎng)絡(luò)時(shí)滯延遲值的概率分布模型,對(duì)非線性多智能體系統(tǒng)的一致性控制進(jìn)行研究。
該文從系統(tǒng)的非線性模型入手,假設(shè)系統(tǒng)的各節(jié)點(diǎn)之間信息傳輸時(shí)存在時(shí)滯,并且假定已知網(wǎng)絡(luò)傳輸延遲值的隨機(jī)分布,也就是網(wǎng)絡(luò)傳輸時(shí)滯取定某些數(shù)值的概率分布已知,把多智能體系統(tǒng)進(jìn)一步建模成非線性時(shí)滯系統(tǒng),給出一致性協(xié)議的設(shè)計(jì)方法,給出系統(tǒng)的一致性控制策略。最后通過數(shù)值仿真事例,驗(yàn)證所提方法的可行性和有效性。
在給出系統(tǒng)模型之前,先給出文中用到的假設(shè)和引理。
假設(shè)假定非線性函數(shù)f(x)滿足下面的Lipschitz條件,也就是?x,y∈Rn,有:
其中,L為一正常數(shù)。
引 理若x∈Rn,P=PT∈Rn×n,H∈Rm×n,Rank(H)=l<n,則下面的條件是等價(jià)的:
1)xTPx<0,?x∈{x∶Hx=0,x≠0}。
2)存在σ∈R,使得P-σHTH<0。
3)?X∈Rn×n,使得P+XH+HTXT<0。
4)H⊥TPH⊥<0,其中,H⊥是H的核,也就是HH⊥=0。
假設(shè)多智能體系統(tǒng)有N個(gè)節(jié)點(diǎn)Agent 組成,借助復(fù)雜網(wǎng)絡(luò)的思想,用G=(V,E,A)表示這N個(gè)智能體構(gòu)成的拓?fù)浣Y(jié)構(gòu),其中V={v1,v2,…,vN} 表示頂點(diǎn)的集合,vi表示第i個(gè)Agent;E?V×V表示邊組成的集合;eij=(vi,vj) 表示從vi到vj的邊,權(quán)值定義為aij,A=[aij]表示鄰接矩陣,其中,aij≥0;L=[cij]表示鄰接矩陣對(duì)應(yīng)的Laplace 矩陣。
假設(shè)多智能體系統(tǒng)的第i個(gè)節(jié)點(diǎn)的內(nèi)部動(dòng)力學(xué)模型表示為:
其中,xi(t)∈R2為系統(tǒng)狀態(tài)變量;f(xi(t))是非線性向量函數(shù),且滿足假設(shè)1;ui(t)為一致性控制策略,具體設(shè)計(jì)控制協(xié)議時(shí)可以根據(jù)給出的一致性充分條件得到。
一致性控制協(xié)議采用如下形式:
其中,i=1,2,…,N,α是智能體之間的耦合常數(shù),aij是鄰接矩陣A=[aij]n×n的元素,η(t)代表信息傳遞出現(xiàn)的時(shí)延函數(shù)。
把式(3)代入式(2),得:
對(duì)于給定的兩個(gè)常數(shù)η0和ηm(不妨假設(shè)η0≥ηm),定義:
考慮到特別大的網(wǎng)絡(luò)時(shí)延發(fā)生的概率非常小,所以總存在常 數(shù)ηM≥η0,使得Probη{η(t)∈(ηM,+∞)}=0,也就是時(shí)延大于ηM的概率為零,設(shè),并 令,從而存在 0 ≤β0≤1,滿足Prob{β(t)=1}=β0,Prob{β(t)=0}=1-β0。
其中,ξ=(ξ1,ξ2,…,ξN)T是A對(duì)應(yīng)Laplace 矩陣的特征向量,且ξT1N=1,ξTL=0。
在上述式(5)的模型基礎(chǔ)上,根據(jù)隨機(jī)控制和多智能體控制理論,研究系統(tǒng)的一致性控制策略,并給出其存在的充分條件。
定理對(duì)于給定的正常數(shù)η0>0、ηm>0、ηM>0 和β0>0,如果存在正定矩陣P>0和Qi≥0,使得下式成立:
則式(2)的系統(tǒng)在式(3)的控制協(xié)議下是漸近穩(wěn)定的。
證明:考慮式(5)誤差系統(tǒng)
若Mξ(t)=0,則:
如果(M⊥)TΩM⊥<0,由引理可以得到從而式(5)的誤差系統(tǒng)漸近穩(wěn)定。
為了討論方便,假設(shè)存在4 個(gè)Agent 節(jié)點(diǎn),并且4 個(gè)節(jié)點(diǎn)之間的關(guān)系拓?fù)錇閷?duì)稱拓?fù)洌? 個(gè)Agent 之間的彼此信息交互程度相同。取拓?fù)浣Y(jié)構(gòu)鄰接矩陣對(duì)應(yīng)的Laplace 矩陣為如下形式:
取α=0.5,β0=0.3,η0=0.2,ηm=0,ηM=0.8。
通過求解定理中的條件,可以得到:
取初始狀態(tài)量x0=(10,5,7,4),仿真曲線如圖1。
圖1 初始狀態(tài)為x0=(10,5,7,4)下系統(tǒng)的狀態(tài)變量
圖2 初始狀態(tài)為x0=(10,5,7,4)下系統(tǒng)的控制變量
通過仿真曲線可以看出,系統(tǒng)的4 個(gè)Agent 的狀態(tài)變量能趨于一致,這說明了文中所設(shè)計(jì)的一致性協(xié)議是有效的。驗(yàn)證通過設(shè)計(jì)與狀態(tài)時(shí)延有關(guān)的控制協(xié)議,系統(tǒng)中同級(jí)Agent 的狀態(tài)最終能夠?qū)崿F(xiàn)一致性。
針對(duì)一類非線性系統(tǒng),首先在假定系統(tǒng)非線性模型滿足匹配條件的前提下,研究非智能體系統(tǒng)的一致性條件;其次,針對(duì)系統(tǒng)諸節(jié)點(diǎn)信息傳遞的隨機(jī)時(shí)滯的概率分布,把時(shí)滯落在某個(gè)區(qū)間的概率引入系統(tǒng)的模型中,進(jìn)而借助復(fù)雜網(wǎng)絡(luò)和系統(tǒng)穩(wěn)定性理論,給出系統(tǒng)達(dá)到一致性的充分條件,其與此隨機(jī)時(shí)滯的概率相關(guān),考慮了時(shí)滯出現(xiàn)的概率對(duì)系統(tǒng)一致性的影響。通過仿真模擬,驗(yàn)證所提控制協(xié)議的可行性和有效性。傳輸時(shí)滯的上下界的大小以及出現(xiàn)概率值的大小對(duì)于系統(tǒng)的一致性的影響,是下一步要開展的工作研究的重點(diǎn),也更具挑戰(zhàn)性和實(shí)際意義。