關 威,邊天奇,任 艷
(沈陽航空航天大學自動化學院,沈陽 110136)
近年來,隨著控制理論的快速發(fā)展,人們對單個系統(tǒng)的控制研究越來越成熟,自適應控制、神經(jīng)網(wǎng)絡技術、事件觸發(fā)控制技術、切換控制技術以及最優(yōu)控制等許多高效先進的控制技術越來越成熟。但是近20年來,人工智能技術、計算機科學和控制算法等高科技飛速發(fā)展,人們對多智能體系統(tǒng)的研究越來越重視,相對于單系統(tǒng),多智能體系統(tǒng)在目標維度比較高且比較復雜時,其優(yōu)勢就逐漸得以體現(xiàn),其應用也非常廣泛,多智能體系統(tǒng)在無人機編隊、高空衛(wèi)星編隊技術及移動智能汽車群體控制等方面都有不可或缺的重要性。
多智能體系統(tǒng)中的核心問題之一就是一致性問題。上世紀七十年代Degroot等人首次提出一致性的定義[1],并應用在管理統(tǒng)計領域。在科學高速發(fā)展的今天,人們將一致性應用到對智能體系統(tǒng)的研究中,2004年OlfatiSaber等人正式提出了多智能體系統(tǒng)一致性問題的理論框架,所謂的一致性就是要求多智能體系統(tǒng)中每一個跟隨者都達到跟領航者相同的狀態(tài)。基于一致性問題的研究,人們對多智能體系統(tǒng)有了更深入的研究,文獻[2]給出了多智能體系統(tǒng)在一階積分環(huán)節(jié)中和固定拓撲結(jié)構(gòu)下達到一致性的條件;文獻[3]針對各個系統(tǒng)之間信息交換時存在的時延和丟包問題,給出了一致性協(xié)調(diào)控制算法;文獻[4]提出了通過非線性控制協(xié)議的方法來解決有限時間一致性問題,從而加快系統(tǒng)的收斂速度;文獻[5]利用當今比較熱門的神經(jīng)網(wǎng)絡技術解決了存在非線性因素和未知擾動的多智能體系統(tǒng)一致性問題。
在一個已經(jīng)達到穩(wěn)定的系統(tǒng)中執(zhí)行器有時會發(fā)生飽和現(xiàn)象。對于一個原本已經(jīng)穩(wěn)定的系統(tǒng),當執(zhí)行器發(fā)生飽和現(xiàn)象時,其穩(wěn)定性將被打破,如果在多智能體系統(tǒng)中執(zhí)行器發(fā)生飽和現(xiàn)象,那么多智能體系統(tǒng)是否能夠達到一致性將成為一個問題。針對執(zhí)行器發(fā)生的飽和現(xiàn)象,文獻[6]提出了在執(zhí)行器飽和條件下的系統(tǒng)吸引域估計問題,基于這一理論知識,本文將其推廣到多智能體系統(tǒng)中,研究多智能體系統(tǒng)的飽和問題。在控制器的設計過程中,考慮到跟隨者的狀態(tài)信息很難得到,所以本文根據(jù)每一個跟隨者的相對輸出信息進行設計,并運用線性不等式技術,來解決執(zhí)行器飽和下的多智能體系統(tǒng)一致性問題。
考慮多智能體系統(tǒng)由1個領航者和N個跟隨者組成,考慮領航者的控制輸入為0,其中領航者的狀態(tài)方程為
y0(t)=Cx0(t)
(1)
跟隨者的動態(tài)方程為
yi(t)=Cxi(t)
(2)
式中,x0∈Rn,y0∈Rp代表領航者的狀態(tài)向量和輸出向量;xi∈Rn,yi∈Rp,σ(ui(t))∈Rm(i=1,…,N),分別代表每一個跟隨者的狀態(tài)向量、輸出向量和帶飽和的控制輸入。A,B,C為具有適當?shù)臄?shù)的矩陣。
Kronecker積的性質(zhì)如下:
(1)(αA)?B=A?(αA), 其中α為常數(shù);
(2)(A+B)?C=A?C+B?C;
(3)(A?B)(C?D)=(AC?BC);
(4)(A?B)T=AT?BT。
假設1:領航者的信息可以被至少一個跟隨者獲取,而領航者無法獲取跟隨者的信息,也即圖G包含一個生成樹,且領航者是其中的根節(jié)點;另一方面,假設G是無向連通圖。
引理1[7]:滿足假設1的圖G對應的拉普拉斯矩陣L可以分解為
(3)
其中L2∈R(N-1)×1,L1∈R(N-1)×(N-1),且矩陣L1是正定矩陣,同時存在一個正交陣U,滿足UTL1U=diadλ1,…,λN,其中0≤λ1,≤…,≤λN為矩陣L1的特征值。
定義1:執(zhí)行器飽和的非線性以如下形式給出
(4)
(5)
引理3:對于有適當維數(shù)的矩陣X,Y和任意的實數(shù)μ>0,有式(6)成立
xTY+YTX≤μ-XTX+μYTY
(6)
定義2:定義XR為一個有界凸集XR=∈(R,1)={x∈Rn×n:xTRx≤1},R>0orXR=cox1,…,xL。對于一個集合S∈Rn,αR(S)=supα>0:αXR?S。
(1)S<0;
定義3:對于矩陣Ccl∈Rn×n,標記矩陣Ccl的第k行為Cclk,定義
g(Ccl)={x∈Rn:|Cclk|≤1,k∈I[1,L]}
(7)
定義4:橢球集合:P∈Rn×n為一正定矩陣,標記
ε(P,p)={x∈Rn:xTPx≤p}
(8)
令V(x)=xTPx。如果對于所有的x∈(Pp){0},有那么橢球ε(P,p)為壓縮不變集。顯然如果ε(P,p)為壓縮不變集,那么其必在吸引區(qū)域內(nèi)。
(9)
其中KC=BTP
將(9)式代入(2)式可得
(10)
定義新變量ξi(t)=xi(t)-x0(t),i=1,…,N,并記ξ0=0,所以由(1)和(10)可得
(11)
定義ξ=[ξ1,…,ξN]。
由圖論的知識和Kronecker積的性質(zhì)
(12)
利用引理2式(12)可以寫成
(13)
可以看出,如果式(13)是漸進穩(wěn)定的,那么多智能體系統(tǒng)就是漸進穩(wěn)定的,多智能體系統(tǒng)也能夠達到一致。
定理5:如果滿足KC=BTP,給定一個橢球ε(P,p),P∈Rn×n,如果對于所有的DD∈D與ε(P,p)?g(H),存在矩陣H∈Rn×n滿足
(14)
那么集合ε(P,p)為一個壓縮不變集,原多智能體系統(tǒng)可以實現(xiàn)一致性。
證明:考慮如下Lyapunov函數(shù)
V=ξT(L1?P)ξ
(15)
則
(16)
由引理3有
(L1?PB)DD(L1?BTP)
(17)
綜合式(17)可得
(18)
由引理4可得多智能體系統(tǒng)一致性條件(14)轉(zhuǎn)化為
(19)
通過式(19),我們可以得到無數(shù)個滿足條件的橢球,所以如何從這些橢球中選出最大的成為一個非常有趣的問題,這一問題可以用如下最優(yōu)化過程來解決
maxα
s.t.(a)αXR?ε(L1?P,p)
(b)(9)
(c)ε(L1?P,p)?g(H)
若參考集xR是橢球,那么限制條件(a)等價于
(20)
限制條件(c)等價于
(21)
所以優(yōu)化條件轉(zhuǎn)化為
maxα
(b)(9)
(22)
以上可以用LMI進行求解。
考慮式(1)和式(2)描述的多智能體系統(tǒng),由1個領航者和4個跟隨者組成。參數(shù)分別為
μ1=1,μ2=2,多智能體系統(tǒng)的拓撲結(jié)構(gòu)如圖(1)所示。
圖1 多智能體系統(tǒng)的拓撲結(jié)構(gòu)
由拓撲結(jié)構(gòu)可知只有跟隨者1能夠獲得領導者的信息,則對應的L1矩陣為
然后利用Matlab進行數(shù)據(jù)仿真,選定領航者的初始值為(8,8),圖2和圖3分別是多智能體系統(tǒng)第一狀態(tài)和第二狀態(tài)下領航者和跟隨者的狀態(tài)差曲線。其中實線代表領航者的狀態(tài)曲線,虛線代表跟隨者的狀態(tài)曲線。分析仿真圖像可知,在執(zhí)行器存在飽和的情況下,通過設計合適的控制器,多智能體系統(tǒng)能夠達到一致性。
圖2 第一個狀態(tài)下領航者和跟隨者的狀態(tài)差曲線
圖3 第二個狀態(tài)下領航者和跟隨者的狀態(tài)差曲線
本文研究了執(zhí)行器飽和下的多智能體系統(tǒng)的一致性問題,為了解決多智能體系統(tǒng)執(zhí)行器飽和的問題,首先設計合適的控制器,然后通過分析每一個跟隨者和領航者之間的狀態(tài)差所構(gòu)成的新的閉環(huán)系統(tǒng),再通過吸引區(qū)域的優(yōu)化,給出在執(zhí)行器飽和下多智能體系統(tǒng)實現(xiàn)一致性的條件,最后通過運用Matlab進行數(shù)據(jù)仿真,驗證了結(jié)果的正確性,從而實現(xiàn)了在執(zhí)行器飽和的情況下多智能體系統(tǒng)的一致性。