繆坤忠,李建寧
(杭州電子科技大學自動化學院,杭州 310000)
近年來,由于多智能體系統(tǒng)在飛行器編隊[1-2]、傳感器網(wǎng)絡系統(tǒng)[3]、衛(wèi)星編隊等領域[4]得到了廣闊的應用,多智能體系統(tǒng)研究備受關注。特別是領導—跟隨多智能體的一致性問題,即所有智能體的狀態(tài)都可以通過適當?shù)目刂破鬟_到一致,使領導者和跟隨者之間的距離最小化。同時,許多學者提出一個領導者或者多個領導者[5-6]、固定時間[7-8]、自適應一致性[9-10]等領域的相關研究成果。
多智能體系統(tǒng)容易因未知現(xiàn)象而突然發(fā)生故障,這將導致控制性能的下降,為了克服這個困難,最值得考慮的辦法是自適應控制算法[11-12]、魯棒控制[13-14]等。其中,自適應控制最為突出,它被應用在許多領域。例如,在文獻[15]中,所研究系統(tǒng)的執(zhí)行器故障模型由線性部分和非線性部分組成,比文獻[11-12]中考慮的故障模型更為一般。此外,利用自適應控制策略得到的信息對控制器進行重構(gòu),使得Takagi-Sugeno 模糊系統(tǒng)的穩(wěn)定性受到較大的影響。文獻[16]描述了一種基于觀測器的輔助變量,利用自適應律來估計擾動和部分失效系數(shù),傳統(tǒng)一致性控制協(xié)議和魯棒控制的結(jié)合,實現(xiàn)了智能體的約束一致性。在文獻[17]中,考慮了故障的特征,建立分布式故障模型,并采用H∞模糊控制器來保證雙邊遙操作系統(tǒng)的正常運行。但是上述文獻在處理故障時,根據(jù)考慮故障的特征(微小故障的系統(tǒng)比大故障的系統(tǒng)發(fā)生故障的概率要大),建立一個更符合實際情況的失效模型十分有必要,同時這也是本文的第一個出發(fā)點。
另外,隨著多智能體應用領域的復雜化,繁瑣的系統(tǒng)規(guī)模以及控制精度的增加,不可避免地導致系統(tǒng)的穩(wěn)定性降低,例如網(wǎng)絡攻擊使得智能體之間的信息交互通信延遲、系統(tǒng)元器件損壞、系統(tǒng)的結(jié)構(gòu)可能發(fā)生跳變等,大大影響了系統(tǒng)的安全性。為了解決這些問題,學者們也做了許多努力。例如,在文獻[18]中,網(wǎng)絡攻擊強度的概率提前未知,一種強度依賴的共識協(xié)議被提出,DOS 攻擊下的異構(gòu)系統(tǒng)可以更快達到收斂目標。在文獻[19]中,通過設計一種新穎的模糊模型去描述異構(gòu)問題和控制器,非線性的多智能體系統(tǒng)在時變的拓撲切換下可以快速達到穩(wěn)定。在系統(tǒng)的通信拓撲發(fā)生故障和領導輸入受限的情況下,文獻[20]將高速列車模型轉(zhuǎn)化為協(xié)調(diào)一致問題,建模成帶有領導者的模型更為恰當,并采用Lyapunov-Krasovskii 方法提出H∞控制器增益。以上所討論文獻的不足之處是領導者和跟隨者初始狀態(tài)都要求是相同的,這在實際中應用的范圍是有限的。在領導輸入未知的情況下,文獻[21]提出了自適應容錯控制協(xié)議,該協(xié)議與智能體之間的信息交換無關,可以減弱領導者輸入未知的影響。在文獻[22]中,領導的輸入假設為有界,基于固定耦合增益和自適應時變增益的魯棒控制器被提出,該控制器在保證系統(tǒng)正常工作的同時,也消除了外部干擾的誤差。但是大多數(shù)文獻在處理領導者輸入未知時,假設領導者的輸入有界,這在特殊實際應用中存在一定的局限性。因此,本文構(gòu)造了一個基于初始狀態(tài)的性能指標來繞過零初始條件的需要,并結(jié)合魯棒技術(shù)和自適應方法來解決領導者輸入絕對未知的問題,即本文的第二個出發(fā)點。
本文解決了執(zhí)行器故障和領導者輸入絕對未知的問題,本文的主要貢獻總結(jié)如下。
(1)首先,基于故障的特征(微小故障發(fā)生的概率大于嚴重故障發(fā)生的概率,以及微小故障發(fā)生后的系統(tǒng)比健康系統(tǒng)更容易發(fā)生故障),建立了適合系統(tǒng)的故障分布模型。
(2)在傳統(tǒng)的經(jīng)典H∞控制理論中,由于零初始條件的約束,每個智能體(包括領導者和跟隨者)的初始狀態(tài)要求是相同的,保守性較強,因此本文構(gòu)建一種性能指標來減少零初始條件對系統(tǒng)的影響。
(3)結(jié)合魯棒技術(shù)和自適應方案,一種新穎的容錯控制器被呈現(xiàn)來削弱領導者絕對未知和執(zhí)行器故障對系統(tǒng)的影響。
包含N個智能體的通信拓撲用加權(quán)圖G(V,ε,A) 來表示,V={v1,v2,…,vn}是節(jié)點集,用ε?V×V來表示邊集,A=[aij]∈RN×N對應通信拓撲結(jié)構(gòu)圖的鄰接矩陣。如果智能體i向智能體j發(fā)送信息,則說明智能體i和智能體j是鄰居關系,兩個智能體之間的權(quán)重記為aij,反之如果智能體i和j之間沒有邊,則aij= 0和(Vi, Vj)?ε。如果對于任意的智能體i和j都滿足(Vi, Vj) ∈ε, (Vj, Vi)∈ε,則說明圖G為無向圖,反之為有向圖。拉普拉斯矩陣L=[lij]∈RN×N滿足如下特征:lii=∑i≠j aij,lij=-ai j,i≠j。有向圖的拉普拉斯矩陣是對稱的,無向圖的拉普拉斯矩陣一般是非對稱的。在本文中,考慮了帶有領導者的多智能體系統(tǒng),領導者和跟隨者之間的通信結(jié)構(gòu)用對角矩陣G=diag{g1,… ,gN}來表示,其中如果智能體i= 1,… ,N和領導者i= 0之間有信息交流,則gi> 0;否則,gi= 0。
本文考慮了一類具有故障和領導者輸入絕對未知的領導–跟隨多智能體系統(tǒng),領導者的動力學方程被確定為:
其中,x0(t)∈Rn為系統(tǒng)領導者的狀態(tài)量,r0(t)∈Rs是代設計的系統(tǒng)領導者絕對未知輸入,A∈Rn×n,B∈Rn×s被假定為已知且具有恰當維數(shù)的實矩陣。
與(1)相似,第i個跟隨者動力學模型被定義為:
本工作的目的是設計一系列合適的控制器uiF(t),在故障和未知領導者輸入的情況下實現(xiàn)領導—跟隨一致性。
目前,部分執(zhí)行器被提出的失效模型是基于故障的結(jié)構(gòu)特征,例如,微小故障的發(fā)生概率大于重大故障的發(fā)生概率,與運行良好的系統(tǒng)相比,有故障的系統(tǒng)更容易發(fā)生故障。因此,分布式故障模型需要被提供,如圖1所示。
圖1 分布式故障模型Fig.1 Failure distribution model
數(shù)字1、2、3分別被用來代表健康系統(tǒng)、小故障系統(tǒng)、重大故障系統(tǒng),π12被定義為健康系統(tǒng)向微小故障系統(tǒng)過渡的跳躍概率,其他信息可以類比。
接下來,將詳細地介紹故障的馬爾科夫跳變過程。使用隨機變量{ri(t)}去描述具有右連續(xù)的馬爾科夫過程,它的范圍在預定的范圍內(nèi)F={1,2,3, …,f}。此外,馬爾科夫鏈相關的模態(tài)轉(zhuǎn)移的跳變概率被描述為:
注 1.模態(tài)信息{ri j(t)}擴維后的信息用{ri j(t)}來表示,其中ri(t) ∈{3smodes} 。
為了解決故障和輸入的安全性問題,在模態(tài)ri(t)下的智能體i模型的輸入信息被建模成如下的形式:
其中,ρi(ri(t))代表智能體i的執(zhí)行器在模態(tài)ri(t)下的故障失效系數(shù),且滿足
此外,由于實際的情況,可以得到:
其中,ρij(ri j(t))定義為在模態(tài)ri j(t)下,第ith智能體的第jth執(zhí)行器的失效系數(shù)。如果ρij(ri j(t)) = 1,在模態(tài)ri j(t)下第ith智能體的第jth執(zhí)行器沒有故障;如果0<ρi j(ri j(t)) < 1,在模態(tài)ri j(t)下第ith智能體的第jth執(zhí)行器部分失效故障;如果ρi j(ri j(t)) = 0,在模態(tài)ri j(t)下第ith智能體的第jth執(zhí)行器完全失效。
注2.在任意(s-j)個執(zhí)行器失效的情況下(1≤j≤s-1),其余的執(zhí)行器仍能正常地工作來實現(xiàn)所需要的控制目標。
對于執(zhí)行器的故障模型,若由(1)和(2)組成的系統(tǒng)模型可以得到容錯一致性,需要做以下合理假設。
假設 1[23]: 系統(tǒng)模型的系數(shù)矩陣(A,B)是可控的。
引理1[24]: (Schur 補引理)。對于給定的對稱矩陣,其中S11為r階方陣,以下3 個條件是等價的:
受文獻[25]的啟發(fā),和領導—跟隨多智能體的狀態(tài)信息,如果對于任意的初始條件x0(0)和xi(0),i=1,2,…,N滿足:
則由式(1)和(2)組成的領導—跟隨多智能體系統(tǒng)在執(zhí)行器故障的情況下可以實現(xiàn)容錯一致性。
根據(jù)相鄰智能體的相對狀態(tài)信息,構(gòu)建如下分布式容錯控制協(xié)議:
其中:
基于上述的分析,將式(3)和(6)帶入式(2)中,可以得到xi(t)的動力學方程:
通過定義誤差向量δi(t)=xi(t)-x0(t),則相應的閉環(huán)系統(tǒng)的狀態(tài)方程為:
以及閉環(huán)系統(tǒng)的增廣形式被描述如下的形式:
其中:
注 3.結(jié)合標注1,每一個智能體的模態(tài)總數(shù)為3s,模態(tài)信息ri(t)擴維后的模態(tài)基數(shù)是(t) ∈{3Nsmodes}。
考慮變量β((t))和ρ((t))之間的關系,δ˙(t)的動力學方程可以改寫為:
在本文中,一種時變?nèi)蒎e輔助控制函數(shù)被提出來補償執(zhí)行器故障和未知的領導輸入,然后通過Lyapunov 穩(wěn)定性定理得到兩個未知估計值的自適應更新律。最后,在設計控制器的過程中,引出基于初始狀態(tài)的性能指標,解決了初始狀態(tài)相同的問題并得到系統(tǒng)穩(wěn)定的充分條件。
本文所設計的時變輔助控制函數(shù)Ki2(t)為:
此外,在給出領導輸入和執(zhí)行器故障的估計值之前,如下的定義是需要的:
令B=[b1,b2,...,bs]和bj是B的jth列向量,然后做出如下合理的定義:
根據(jù)投影算子,時變參數(shù)(t)(j=1,2,...,s)的自適應律確定為:
其中,σi是一系列恰當?shù)膮?shù),滿足σi>0,i=1,2,… ,N。
在本文中,為系統(tǒng)設計了恰當?shù)娜蒎e控制器。為簡化公式,將模態(tài)信息ri j(t),(t)和ri(t)分別表示為aij,a和ai。
定理 1.在假設1 和一致性協(xié)議(6)的基礎下。給定恰當?shù)膮?shù)?1>0,?2> 0,γ> 0,拓撲結(jié)構(gòu)矩陣L,G,具有恰當維數(shù)的系統(tǒng)矩陣A和B,設計適合于系統(tǒng)的容錯控制器增益矩陣為K(a)=-BTP(a),如果存在合適維度的矩陣(b) >0,(a) >0,P(a) >0,>0,M2>0和M3>0,滿足式(14)和式(15)的線性矩陣不等式成立,則由式(1)和式(2)組成的系統(tǒng)可以實現(xiàn)具有H∞性能指標γ的領導—跟隨容錯一致性。
其中:
證.構(gòu)造李雅普諾夫函數(shù)候選者為:
注 4.結(jié)合所選拓撲及其對應的鄰接矩陣,以及領導者和跟隨者之間的鄰接矩陣,可以保證(L+G)T是正定的,滿足Lyapunov 函數(shù)(16)的正定性。
設 ?(·) 為隨機過程{(δ(t),a),t≥0}的弱無窮小微分算子,可以得到:
用(L+G)T?P(b)表示為(b),將式(10)代入式(17),由式(17)可得:
將式(19)帶入式(18)可以導出式(20)。
由自適應更新律式(12)和式(13)可得等式:
此外,在模態(tài)ai下βi(ai)的實際值在[0,1]之間,可得:
然后可以得到如下的結(jié)果:
受相關文獻[16]啟發(fā),在經(jīng)典的H∞控制理論中,由于初始條件為零的要求,即δ(0) =0表示必須滿足x1(0)=x2(0) =...=xN(0)=x0(0),但在實踐中,這是相當保守的。因此,在控制器的設計過程中,建立了由誤差信息和初始狀態(tài)組成的性能指標函數(shù),以降低零初始條件對系統(tǒng)的影響。
所設計的性能指標J表示為:
其中:
進一步推展有:
如果正定矩陣M1,M2,M3滿足,γ2M2- I >0,γ2M3- I >0和=(a)M1,可以得到ζ> 0。在上述條件下,若?< 0,則必然可以得到J< 0。
將式(24)帶入?,不難得到:
其中,ψ(t) =(δT(t),ηT(t),QT(t))T以及
如果線性矩陣不等式(14)和(15)成立,我們可以得出?<0 ,式(25)中規(guī)定的性能指標可以實現(xiàn)。整個系統(tǒng)(10)可以在執(zhí)行器故障和干擾的情況下保持穩(wěn)定。也就是說,所考慮的領導—跟隨多智能體系統(tǒng)能夠?qū)崿F(xiàn)容錯一致性,從而完成定理1 的證明。
在本節(jié)中,用一個仿真的例子來說明所提供的理論方法的有效性。圖2描述了由5 個智能體組成的通信拓撲結(jié)構(gòu)。
圖2 通信拓撲結(jié)構(gòu)圖(智能體0 是領導者)Fig.2 Network topology(agent 0 is the leader)
相應的,拉普拉斯矩陣L和領導者的鄰接矩陣G為:
考慮一類具有執(zhí)行器失效的線性領導—跟隨多智能體系統(tǒng),每個智能體的參數(shù)描述如下:
給出領導者和跟隨者的初始狀態(tài)以及領導者的輸入:
選擇參數(shù)γ=0.5、?1=0.6和σi=1,i=1,2,...,N,自適應律的初始條件為: [(0),(0)] =[8,3.15]。
根據(jù)故障的特點和實際情況,大多數(shù)智能體處于微小故障,即執(zhí)行器故障數(shù)值范圍在模態(tài)2內(nèi)。由此假設每一個跟隨者在故障切換下的轉(zhuǎn)移矩陣如下:
根據(jù)故障對系統(tǒng)性能的危害程度將其分為幾個等級,并假設每一等級的數(shù)值范圍如下:
選擇輔助的失效系數(shù)為:0≤β1s(t) ≤0.078,0≤β2s(t) ≤0.275,0≤β3s(t) ≤0.46,0≤β4s(t)≤0.165。
通過求解(Linear Matrix Inequality, LMI)(14)和(15)可以得到如下矩陣P(a),a=1,2,3,則相應的控制器增益K(a)=-BTP(a),a=1,2,3為:
在本文中,假設領導者輸入和執(zhí)行器故障是未知的。從圖3可以看出,在控制器作用下,領導者輸入的估計值可收斂到實際領導者的輸入。圖4~7,表示故障的模態(tài)切換信息和故障估計的仿真結(jié)果,可以有效地估計故障。另外,圖8顯示所有智能體的跟蹤軌跡,表明跟隨者智能體的狀態(tài)最終趨近于領導者智能體的狀態(tài)。上述結(jié)果表明,該算法能較好地估計故障和實現(xiàn)容錯一致性。
圖3 參數(shù) r0(t)和(t)的軌跡Fig.3 Trajectories of parameters r0(t)and(t)
圖4 智能體1 的故障模態(tài)和失效系數(shù)估計值Fig.4 Failure mode and coefficient estimation of Agent 1
圖5 智能體2 的故障模態(tài)和失效系數(shù)估計值Fig.5 Failure mode and coefficient estimation of Agent 2
圖6 智能體3 的故障模態(tài)和失效系數(shù)估計值Fig.6 Failure mode and coefficient estimation of Agent 3
圖7 智能體4 的故障模態(tài)和失效系數(shù)估計值Fig.7 Failure mode and coefficient estimation of Agent 4
圖8 智能體(包括領導者和跟隨者)運動軌跡Fig.8 Trajectory of agents (including leader and followers)
注5.在設計控制器增益的過程中,引入性能指標J,考慮了領導者輸入未知、故障對估計誤差的影響,如式(25),擾動量?2βi(a)r0(s)]包含領導者輸入的估計誤差,可起到抑制作用,使系統(tǒng)有更強的魯棒性。由仿真圖可以看出,領導者輸入的估計值可以漸近真實值,但是本文重點關注智能體的一致性問題,即使在40~50 s 存在誤差,但是不影響系統(tǒng)達到一致性。
本文研究了具有執(zhí)行器故障和領導者輸入下的領導—跟隨多智能體系統(tǒng)的容錯一致性問題。該協(xié)議由帶補償?shù)淖赃m應增益、固定增益和相鄰智能體之間的狀態(tài)信息組成。同時,引入性能指標函數(shù),以減少零初始條件對系統(tǒng)的影響。最后,得到了保證系統(tǒng)實現(xiàn)容錯一致性的充分條件,仿真結(jié)果表明了該方法的有效性。在未來,對于具有多類型執(zhí)行器故障和切換拓撲的多智能體系統(tǒng),如何在有限時間內(nèi)實現(xiàn)容錯一致性仍然是一個值得考慮的問題。