夏孟瑤,蔣海軍,于志永
(新疆大學 數(shù)學與系統(tǒng)科學學院,新疆 烏魯木齊 830017)
近幾十年來,多智能體系統(tǒng)的協(xié)同控制因其在無人機、航天器姿態(tài)協(xié)調、電網(wǎng)電源管理[1-3]等領域的廣泛應用而引起了人們的廣泛關注.一致性行為是一種合作控制行為,其目的是使智能體之間通過信息交換從而達成某種統(tǒng)一的協(xié)議.到目前為止,為了解決多智能體系統(tǒng)一致性問題,學者們從不同的方面提出了不同的有效的控制協(xié)議,如事件觸發(fā)控制、滑??刂频萚4-5].
在實際環(huán)境中,像物理系統(tǒng)、機械設備系統(tǒng)等網(wǎng)絡系統(tǒng)往往會受到不確定性環(huán)境的影響,這種干擾可以稱為隨機干擾.文獻[6]為了處理未知和時變問題提出了時變一致性方案,解決了一類不確定隨機非線性多智能體系統(tǒng)的時變一致性問題.在另一個學術領域,Markov 跳躍系統(tǒng)受到了廣泛的關注,因為它是一種混合系統(tǒng),具有描述大多數(shù)物理系統(tǒng)結構突變的優(yōu)勢,如意外事件和不受控制的結構型變化.它是在不同時間從一種模式切換到另一種模式的切換系統(tǒng),不同模式之間的切換可以通過Markov 鏈來實現(xiàn).文獻[7]研究了一類具有Markov 特征的二階多智能體系統(tǒng)的一致性問題,其中隨機切換拓撲和隨機通信時滯由兩個相互獨立的Markov 鏈所控制.直到現(xiàn)在,研究Markov 跳躍的隨機多智能體系統(tǒng)較少.因此,本文考慮了具有Markov 跳躍的隨機主從多智能體系統(tǒng).
在動力系統(tǒng)的演化過程中,由于受外部環(huán)境干擾或者機器發(fā)生故障,系統(tǒng)在某一時刻發(fā)生的突然變化稱為脈沖效應[8-10].脈沖效應作為一種普遍存在的現(xiàn)象,有很多優(yōu)點和缺點,它的優(yōu)點是提高數(shù)據(jù)安全性,降低控制成本.缺點是它會破壞系統(tǒng)的性能.文獻[10]設計了一種混合有限時間穩(wěn)定控制器,利用Lyapunov 函數(shù)給出了脈沖動力系統(tǒng)的有限時間穩(wěn)定條件.
與現(xiàn)有的研究相比,本文的主要貢獻如下:(1) 本文考慮了具有脈沖效應的Markov 跳躍和隨機擾動的主從多智能體系統(tǒng);(2) Markov 跳躍函數(shù)不僅存在于系統(tǒng)中,而且應用于所設計的控制器中.同時,本文還考慮了脈沖效應.從而使得系統(tǒng)在固定時間內達到一致.
首先,給出本文所用到的記號.其中Rn表示n 維歐幾里得空間.‖·‖ 表示歐幾里得范數(shù).IN表示N 維單位矩陣.對于矩陣 A,AT,λmax(A) 和λmin(A) 分別代表矩陣A 的轉置、最大特征值和最小特征值.A>0 表示矩陣A 是一個正定矩陣.diag(·) 表示對角矩陣.sign(·) 代表符號函數(shù).E{·} 表示數(shù)學期望.
考慮由N 個智能體所組成的網(wǎng)絡,網(wǎng)絡拓撲圖由圖G=(V,E) 表示,其中V={1,2,···,N} 表示節(jié)點集,E={(i,j)|i,j ∈V} 表示邊集,記智能體i 的鄰居節(jié)點集為Ni={j|(i,j)∈E}.A=[aij]∈RN×N是圖G 的鄰接矩陣,若(i,j)∈E,則aij>0,否則,aij=0.對于無向圖G 來說,aij=aji.記節(jié)點的度矩陣為D=diag{d1,d2,···,dN},其中P 則圖G 的拉普拉斯矩陣定義為L=D-A.令矩陣H=L+B,其中B=diag{b1,b2,···,bN},如果智能體i 能夠接收到領導者的信息,則bi=1,否則,bi=0.
Markov 鏈r(t)(t ≥0) 在概率空間(Ω,F,Ft≥0,P) 上是右連續(xù)的,它在有限集S={1,2,···,s} 上取值且算子θ=[θdρ]s×s(d,ρ ∈S) 滿足
第i 個跟隨者智能體的隨機動力系統(tǒng)描述為
其中r(t),t ≥0 表示在t 時刻馬爾可夫過程的模態(tài)演變過程.A(r(t)),B(r(t))∈Rn×n表示模態(tài)為r(t)的常數(shù)矩陣.xi(t)∈Rn,(i=1,···,N) 表示第i 個智能體的狀態(tài),ui(r(t))∈Rn代表第i 個智能體的控制輸入向量.f(·)∈Rn表示i 個智能體的連續(xù)函數(shù).g(·)∈Rn×n為跟隨者智能體的噪聲強度函數(shù).w(t)∈Rn表示布朗運動,并且滿足E{dw(t)}=0 和E{[dw(t)]2}=dt,假設Markov 鏈r(·) 與布朗運動w(·) 是相互獨立的.
領導者x0(t) 的隨機動力系統(tǒng)描述為其中x0(t)∈Rn表示領導者的狀態(tài),f(x0(t),t)∈Rn表示領導者的連續(xù)函數(shù),g(x0(t),t)∈Rn×n表示領導者的噪聲強度函數(shù).
下面給出一些假設、引理和定義.
假設1對于任意的向量x ∈Rn,y ∈Rn,假設函數(shù)f(·) 是Lipschitz 連續(xù)的,則存在一個常數(shù)k1>0 使得
‖f(x(t),t)-f(y(t),t)‖≤k1‖x(t)-y(t)‖.
假設2對于噪聲強度函數(shù)g(xi(t),t),xi(t)∈Rn滿足以下Lipschitz 條件
定義1對于一個時間T(0) 不依賴于系統(tǒng)初值xi(0),x0(0),如果說系統(tǒng)(2) 和系統(tǒng)(3) 在固定時間內達到一致,則有l(wèi)imt→TE{‖xi(t)-x0(t)‖}=0 和E{‖xi(t)-x0(t)‖}≡0,t ≥T 成立.其中T 為停息時間.
為了實現(xiàn)固定時間一致,設計以下切換反饋控制器
則根據(jù)引理2 得到停息時間T 為
根據(jù)以上分析,存在一個與智能體的初值狀態(tài)無關的時間T,使得
根據(jù)定義1 可得隨機多智能體系統(tǒng)(2) 和(3) 在控制協(xié)議(4) 下能夠在固定時間內達到一致.
當系統(tǒng)不帶有隨機干擾時,則可以將系統(tǒng)(2) 和(3) 改寫為以下模型
注1推論1 的證明與定理1 的證明相同,但是α1(r(t))的取值范圍不同.因為系統(tǒng)(2)和(3)中存在隨機干擾,所以定理1 中的α1(r(t)) 取值與k2有關.而推論1 中的α1(r(t)) 取值與k2無關,所以在隨機系統(tǒng)(1)和(2)中α1(r(t)) 的取值范圍比系統(tǒng)(14)和(15) 中的更為嚴格.
在本節(jié)將以數(shù)值模擬來驗證本文所提出的控制算法的正確性.
考慮具有Markov 跳躍的主從隨機多智能體系統(tǒng),令n=2,N=5,并選取如下的轉移概率矩陣P
脈沖增益矩陣選取為
非線性函數(shù)fi(xi(t),t) 選取為
噪聲強度函數(shù)g(xi(t),t) 為
令智能體的初值狀態(tài)為x0=(-30,12)T,x1=(25,-20)T,x2=(14,-23)T,x3=(-10,-5)T,x4=(-40,-6)T.
圖1 表示系統(tǒng)維納過程.圖2 表示定理1 中的Markov 切換過程.圖3 和圖4 描述了在系統(tǒng)不受控制的條件下智能體的狀態(tài)軌跡圖.
圖1 維納過程
圖2 Markov 切換過程
圖3 無控制下的智能體xi1(t) 狀態(tài)軌跡
圖4 無控制下的智能體xi2(t) 狀態(tài)軌跡
通過選取滿足假設定理的合適參數(shù)k1=1,k2=2,α1(1)=0.73,α1(2)=0.69,β1(1)=0.9,β1(2)=1.15,β2(1)=1.2,β2(2)=0.8,qd=1.02,并令ν=0.4,u=1.2,得到了固定時間一致的圖,其中圖5 和圖6 表示控制下的智能體的狀態(tài)軌跡.從數(shù)值模擬中可以看到本文所設計的控制器的有效性.
圖5 控制下的智能體xi1(t) 狀態(tài)軌跡
圖6 控制下的智能體xi2(t) 狀態(tài)軌跡
本文考慮了具有Markov 跳躍的主從隨機多智能體系統(tǒng)的固定時間一致性問題.考慮綜合因素,設計了具有脈沖效應的非線性狀態(tài)反饋切換控制協(xié)議.通過應用線性矩陣不等式、隨機分析理論以及Lyapunov 穩(wěn)定性理論給出了主從多智能體系統(tǒng)在固定時間內達到一致的相關準則.