張建強(qiáng),楊凱軍,歐陽(yáng)凌叢
(陜西科技大學(xué)電氣與控制工程學(xué)院,陜西 西安 710021)
多智能體編隊(duì)控制問(wèn)題如今已經(jīng)得到非常廣泛的關(guān)注,其目的是制定控制協(xié)議,利用相鄰智能體之間的信息交換,使得多智能體系統(tǒng)跟蹤并保持參考編隊(duì)隊(duì)形。目前,多智能體系統(tǒng)編隊(duì)控制在合作監(jiān)視[1]、航空航天[2]、自主水下機(jī)器人[3]、多機(jī)器人[4]等領(lǐng)域已經(jīng)得到廣泛的應(yīng)用。
為了解決非線性編隊(duì)跟蹤問(wèn)題,已有多種控制技術(shù)應(yīng)用于多智能體系統(tǒng),如自適應(yīng)滑模、神經(jīng)網(wǎng)絡(luò)、模糊邏輯系統(tǒng)等。文獻(xiàn)[5-6]提出一種基于自適應(yīng)滑模的編隊(duì)控制算法,通過(guò)設(shè)計(jì)滑模面來(lái)處理系統(tǒng)中存在的非線性項(xiàng)。文獻(xiàn)[7-8]提出基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制算法,使用神經(jīng)網(wǎng)絡(luò)逼近未知?jiǎng)恿W(xué),解決非線性多智能體系統(tǒng)的編隊(duì)問(wèn)題。神經(jīng)網(wǎng)絡(luò)可以通過(guò)學(xué)習(xí)和調(diào)整權(quán)重來(lái)適應(yīng)系統(tǒng)的非線性特性和復(fù)雜動(dòng)態(tài),從而提高控制精度,但其計(jì)算通常涉及大量的矩陣運(yùn)算和迭代優(yōu)化,耗費(fèi)大量計(jì)算時(shí)間,導(dǎo)致運(yùn)算實(shí)時(shí)性較差。模糊邏輯系統(tǒng)同樣可以處理控制系統(tǒng)存在的未知非線性項(xiàng)[9-11],該類(lèi)方法能以任意精度逼近致密集上的任意光滑函數(shù),但是受到模糊規(guī)則的限制,其在控制精度方面不及神經(jīng)網(wǎng)絡(luò)。但是在運(yùn)算實(shí)時(shí)性方面,模糊控制的基本計(jì)算是基于一組預(yù)定義的模糊規(guī)則,這些規(guī)則可以通過(guò)簡(jiǎn)單的模糊邏輯運(yùn)算進(jìn)行評(píng)估,運(yùn)算相對(duì)較快[12]。因此,本文采用模糊控制來(lái)處理多智能體系統(tǒng)中的不確定性問(wèn)題。
在很多工業(yè)系統(tǒng)中,通常要求受控系統(tǒng)能夠達(dá)到預(yù)定的瞬態(tài)和穩(wěn)態(tài)性能,且盡量避免由輸入飽和所帶來(lái)的系統(tǒng)控制性能下降問(wèn)題,因此,在控制器的設(shè)計(jì)過(guò)程中關(guān)注規(guī)定性能和輸入飽和尤為重要。為了便于控制器的設(shè)計(jì),通常將具有規(guī)定性能的系統(tǒng)從約束形式轉(zhuǎn)化為無(wú)約束形式,然后利用新系統(tǒng)設(shè)計(jì)編隊(duì)控制律。文獻(xiàn)[13-14]分別考慮在匹配和不匹配干擾下具有規(guī)定性能的多智能體系統(tǒng)的一致性問(wèn)題[13]和具有規(guī)定性能的時(shí)變編隊(duì)跟蹤問(wèn)題[14],并最終保證了閉環(huán)系統(tǒng)在瞬態(tài)和穩(wěn)態(tài)下的性能。文獻(xiàn)[15-16]研究具有輸入飽和的非線性多智能體系統(tǒng)協(xié)同控制問(wèn)題,并在設(shè)計(jì)過(guò)程中引入飽和補(bǔ)償系統(tǒng)來(lái)抵消輸入飽和的影響。然而,很少有文獻(xiàn)同時(shí)考慮到性能約束以及輸入飽和問(wèn)題。
在實(shí)際應(yīng)用場(chǎng)景中,智能體的通信資源往往有限。因此,為了解決控制器信號(hào)頻發(fā)問(wèn)題,進(jìn)一步減少網(wǎng)絡(luò)通信負(fù)擔(dān),事件觸發(fā)控制得到極大關(guān)注。事件觸發(fā)機(jī)制的原理在于當(dāng)系統(tǒng)穩(wěn)定時(shí)通過(guò)設(shè)計(jì)事件觸發(fā)條件,當(dāng)且僅當(dāng)此條件被滿足時(shí)控制信號(hào)才會(huì)觸發(fā)更新。文獻(xiàn)[17-19]分別針對(duì)一階系統(tǒng)、二階系統(tǒng)和n階非嚴(yán)格反饋系統(tǒng)設(shè)計(jì)事件觸發(fā)控制策略,大幅降低了控制器信號(hào)的更新頻率,節(jié)約了通信資源。此外,文獻(xiàn)[20-21]研究了多智能體系統(tǒng)動(dòng)態(tài)事件觸發(fā)控制問(wèn)題,動(dòng)態(tài)事件觸發(fā)機(jī)制存在一個(gè)動(dòng)態(tài)變量,相對(duì)于固定閾值,動(dòng)態(tài)變量可以自適應(yīng)地發(fā)生變化,從而使得觸發(fā)閾值不再是一個(gè)固定值,更加節(jié)省通信資源。因此,在多智能體編隊(duì)跟蹤問(wèn)題中,考慮動(dòng)態(tài)事件觸發(fā)機(jī)制很有必要。
本文研究具有規(guī)定性能和輸入飽和的非仿射純反饋多智能體系統(tǒng)編隊(duì)跟蹤問(wèn)題,結(jié)合模糊邏輯系統(tǒng),提出一種有限時(shí)間動(dòng)態(tài)事件觸發(fā)編隊(duì)控制算法。本文的主要工作如下:
1)提出一種基于動(dòng)態(tài)閾值的事件觸發(fā)機(jī)制。與文獻(xiàn)[11,15,17]中通過(guò)引入事件觸發(fā)機(jī)制來(lái)代替連續(xù)控制器從而節(jié)省通信資源的方案相比,基于動(dòng)態(tài)閾值的事件觸發(fā)機(jī)制由于具備更高的靈活性,因此能更大程度地節(jié)省能耗。
2)設(shè)計(jì)基于有限時(shí)間規(guī)定性能的輸入飽和控制機(jī)制。相比于文獻(xiàn)[13-14]僅考慮規(guī)定性能問(wèn)題以及文獻(xiàn)[15-16]僅考慮輸入飽和問(wèn)題,本文所研究的問(wèn)題更加接近實(shí)際,受控系統(tǒng)在達(dá)到預(yù)定性能的同時(shí)能防止輸入飽和所造成的影響。
3)設(shè)計(jì)多智能體系統(tǒng)模糊控制機(jī)制。與文獻(xiàn)[7-8]中所采用的神經(jīng)網(wǎng)絡(luò)控制相比,模糊控制具有計(jì)算量小、便于理解等優(yōu)點(diǎn)。此外,本文所考慮的系統(tǒng)模型為非仿射非線性純反饋多智能體系統(tǒng),由于非仿射非線性項(xiàng)的存在,使得控制策略的設(shè)計(jì)難度更大。
本節(jié)將通過(guò)圖論知識(shí)來(lái)描述智能體之間的通信關(guān)系。用無(wú)向圖G=(v,ε,A)來(lái)表示所有智能體之間的通信拓?fù)?,其中,ν為所有頂點(diǎn)的集合,ε為邊組成的集合,A為鄰接矩陣。通信拓?fù)鋱D中的頂點(diǎn)代表每個(gè)跟隨者智能體的位置,邊表示智能體之間的信息交換,鄰接矩陣A=[aij]?RN×N,aij表示智能體i與智能體j之間的通信權(quán)值,當(dāng)通信拓?fù)溥B接方式為無(wú)向圖時(shí),aij=aji。如果(i,j)?ε,那么aij=0,如果(i,j)?ε,那么aij=1,這里(i,j)?ε表示智能體j可以傳遞自身的狀態(tài)信息給智能體i,則節(jié)點(diǎn)i的鄰居頂點(diǎn)集合可表示為Ni={j?ν:(i,j) ?ε}。此外,定義無(wú)向通信拓?fù)涞睦绽咕仃嚍長(zhǎng)=D-A,D=diag(di)?RN×N稱(chēng)為節(jié)點(diǎn)vi的入度矩陣,其中定義領(lǐng)導(dǎo)者與跟隨者的連接矩陣為B=diag{b1,b2,…,bn},當(dāng)跟隨者智能體i能夠接收到領(lǐng)導(dǎo)者智能體的信息時(shí),bi>0,否則,bi=0。
考慮一類(lèi)非仿射非線性純反饋多智能體系統(tǒng),其中第i個(gè)跟隨者的動(dòng)力學(xué)模型可以描述為:
其中:uo>0和uω>0分別表 示不對(duì) 稱(chēng)輸入飽和ui(vi(t))的上界和下界。
此外,領(lǐng)導(dǎo)者的動(dòng)力學(xué)模型可以表示為:
其中:xr(t)表示領(lǐng)導(dǎo)者的狀態(tài);fr(xr(t))表示領(lǐng)導(dǎo)者動(dòng)力學(xué)的非線性項(xiàng);yr(t)表示領(lǐng)導(dǎo)者信號(hào)。
本文的控制目標(biāo)是通過(guò)設(shè)計(jì)控制律,使得非仿射非線性多智能體系統(tǒng)能夠在保證規(guī)定性能和避免輸入飽和的情況下形成預(yù)期編隊(duì),并保持與領(lǐng)導(dǎo)者行為的一致性。領(lǐng)導(dǎo)者與跟隨者智能體滿足如下定義。
定義1[13]根據(jù)多智能體系統(tǒng)的描述[式(1)和式(3)],如果對(duì)于任意的初始值,設(shè)計(jì)控制協(xié)議使得成立,則稱(chēng)其 能夠形成預(yù)期編隊(duì)。其中:i=1,2,…,N;ζ1>0和ζ2>0是2 個(gè)正常數(shù);Td是與系統(tǒng)初始狀態(tài)無(wú)關(guān)的穩(wěn)定時(shí)間;ιi表示編隊(duì)過(guò)程中第i個(gè)跟隨者與領(lǐng)導(dǎo)者之間的相對(duì)位置。
為了實(shí)現(xiàn)上述目標(biāo),本文進(jìn)行如下假設(shè):
假設(shè)1圖G包含一個(gè)生成樹(shù),其根節(jié)點(diǎn)表示領(lǐng)導(dǎo)者智能體,且至少有一個(gè)跟隨者智能體可以從領(lǐng)導(dǎo)者智能體處接收信息。
假設(shè)2[22]領(lǐng)導(dǎo)者信號(hào)yr(t)和其導(dǎo)數(shù)(t)是有界光滑函數(shù),并且存在2個(gè)未知常數(shù)Γ0和Γ1,使得
假設(shè)3[23]非仿射函數(shù)f(?)連續(xù)可微,定義其偏導(dǎo)數(shù)為:
對(duì)于所有有界偏導(dǎo)數(shù)f(?),存在2 個(gè)未知的正常數(shù)使得
因此,根據(jù)中值定理,有:
本節(jié)將為系統(tǒng)建立具有規(guī)定性能的控制方案,包括有限時(shí)間性能函數(shù)和誤差轉(zhuǎn)換模型。
1.3.1 性能函數(shù)
選擇有限時(shí)間性能函數(shù)為:
其中:ρi和0 <ci<1 是所設(shè)計(jì)的正常數(shù);0 <Ti<∞是設(shè)定系統(tǒng)達(dá)到穩(wěn)定時(shí)的時(shí)間。值得注意的是,式(6)中定義的性能函數(shù)βi(t)在時(shí)間Ti處收斂,如圖1 所示,圖中虛線為規(guī)定性能函數(shù)。
圖1 規(guī)定性能函數(shù)Fig.1 Prescribed performance function
引理1[22]如果在式(6)中構(gòu)造一個(gè)光滑函數(shù)βi(t),那么它滿足以下性質(zhì):
1)如果0 ≤t<Ti,那么βi(t)從ρi嚴(yán)格遞減到ρici;如果t≥Ti,那么βi(t)保持常數(shù)ρici。
2)對(duì)于t?[0,∞)(t)連續(xù)可微,k=1,2,…,m。
3)對(duì)于t?[0,∞),0 ≤-Tici成立。
1.3.2 轉(zhuǎn)換后的編隊(duì)誤差模型
本文的控制目標(biāo)是設(shè)計(jì)一種控制方案,使得非線性系統(tǒng)式(1)和式(3)的編隊(duì)誤差嚴(yán)格地在如下的范圍內(nèi)變化:
為了解決帶有約束的編隊(duì)跟蹤控制問(wèn)題,需將編隊(duì)誤差從式(7)中的帶約束形式轉(zhuǎn)換為無(wú)約束形式。首先定義調(diào)制誤差(t),并引入誤差變換為:
其中:si表示誤差映射。
可求得si的導(dǎo)數(shù)為:
為了進(jìn)一步減少不必要的資源浪費(fèi),本文為非線性多智能體系統(tǒng)設(shè)計(jì)動(dòng)態(tài)事件觸發(fā)機(jī)制,描述如下:
其中:zi(t)=ξi(t)-vi(t)代表測(cè)量誤差;是一個(gè)正常數(shù)是動(dòng)態(tài)事件觸發(fā)機(jī)制的更新時(shí)間;λi(0)>0和l>0是設(shè)計(jì)參數(shù)。
需要注意的是:
1)本文采用觸發(fā)信號(hào)代替控制器中的連續(xù)信號(hào),動(dòng)態(tài)事件觸發(fā)機(jī)制作用于控制器與執(zhí)行器之間,可以有效減少事件觸發(fā)的次數(shù),大幅節(jié)省資源。對(duì)于參數(shù)λi(t),從 式(10)中可以 進(jìn)一步得到λi(t)=λi(t0)exp(-l(t-t0))。設(shè)t0=0,λi(0)>0,l>0,則λi(t)>0。λi(t)的這個(gè)性質(zhì)對(duì)于后續(xù)的證明過(guò)程起到至關(guān)重要的作用。
2)本文設(shè)計(jì)動(dòng)態(tài)事件觸發(fā)機(jī)制旨在更大程度地節(jié)省控制資源,通過(guò)在靜態(tài)事件觸發(fā)機(jī)制右側(cè)添加一個(gè)非負(fù)的輔助動(dòng)態(tài)變量λi(t)來(lái)擴(kuò)大閾值函數(shù),如式(10)所示,此動(dòng)態(tài)變量呈現(xiàn)出指數(shù)遞減的趨勢(shì),在開(kāi)始進(jìn)行編隊(duì)時(shí),測(cè)量誤差較大,所對(duì)應(yīng)的閾值函數(shù)也較大,有效避免了事件頻繁觸發(fā);隨著編隊(duì)的形成,測(cè)量誤差減小,此時(shí)對(duì)應(yīng)的閾值函數(shù)也減小,使得控制器信號(hào)有效更新,其合理性在式(50)中通過(guò)Lyapunov 穩(wěn)定性方法得到驗(yàn)證。文獻(xiàn)[11,15,17]中的事件觸發(fā)機(jī)制可以看作本文方法的一種特殊情況,即當(dāng)本文事件觸發(fā)機(jī)制中的輔助動(dòng)態(tài)變量為0時(shí),可以近似為上述文獻(xiàn)中所提出的方法。因此,相比于其他文獻(xiàn)中的靜態(tài)事件觸發(fā)機(jī)制,本文方法能夠進(jìn)一步降低控制器的觸發(fā)頻率,節(jié)省更多資源,更適用于解決通信資源有限的問(wèn)題。
在許多實(shí)際的控制系統(tǒng)中經(jīng)常存在不確定性,這將嚴(yán)重降低系統(tǒng)的性能和穩(wěn)定性。為了減少不確定非線性項(xiàng)所帶來(lái)的影響,本文利用模糊邏輯系統(tǒng)來(lái)近似處理緊集Ω上的一些未知的連續(xù)函數(shù)。
模糊邏輯系統(tǒng)通常由4 個(gè)部分組成,即模糊器、知識(shí)庫(kù)、模糊推理機(jī)和去模糊器。
知識(shí)庫(kù)由一組模糊If-then 規(guī)則組成,如下:
R?:IFχ1是,…,χn是,則y是G?,?=1,2,…,L其中:χ=[χ1,χ2,…,χn]T和y分別表示模糊系統(tǒng)的輸入與輸出;L代表模糊規(guī)則的數(shù)量為模糊集。通過(guò)應(yīng)用單點(diǎn)模糊化、乘積推理和中心平均去模糊化,模糊邏輯系統(tǒng)可以表示為:
引理2[16]對(duì)于定義在緊集Ω上的任意連續(xù)函數(shù)F(χ),存在模糊邏輯系統(tǒng)式(13)使得:
其中:?是一個(gè)任意小的常數(shù)。
此外,最優(yōu)參數(shù)Θ*表示為:
其中:Ω1和Ω2分別表示Θ和χ的緊集。則模糊近似誤差?為:
引理3[24]對(duì)于e?R和m>0,不等式0 ≤|e| -成立。
本文通過(guò)反步法設(shè)計(jì)多智能體系統(tǒng)的虛擬控制器和自適應(yīng)律。為了實(shí)現(xiàn)控制目標(biāo),定義一個(gè)參數(shù)為:
由于系統(tǒng)中存在輸入飽和,因此設(shè)計(jì)如下輔助系統(tǒng)來(lái)消除輸入飽和所帶來(lái)的影響:
其中:pi>0 是所設(shè)計(jì)的一個(gè)參數(shù)。
圖2 所示為本文為第i個(gè)跟隨者設(shè)計(jì)控制器的過(guò)程,其中包含模糊邏輯系統(tǒng)、輸入補(bǔ)償器、微分跟蹤器和事件觸發(fā)機(jī)制,因此,編隊(duì)跟蹤控制器可以在系統(tǒng)中存在輸入飽和以及不確定性的情況下實(shí)現(xiàn)多智能體系統(tǒng)的預(yù)期編隊(duì)。
圖2 跟隨者的編隊(duì)跟蹤控制器Fig.2 Formation tracking controller for the follower
定義如下鄰域誤差以及坐標(biāo)變換:其中:αi,k-1是虛擬控制信號(hào)。
控制器設(shè)計(jì)步驟如下:
步驟1考慮如下Lyapunov 候選函數(shù):
未知函數(shù)Fi,1可利用模糊邏輯系統(tǒng)逼近,其形式為:
其中:χi,1=[xi,1,xj,1]T;?i,1>0 是一個(gè)常數(shù)。由young’s不等式和θi,j的定義,可得:
設(shè)計(jì)虛擬控制信號(hào)和自適應(yīng)律為:
引入如下的微分跟蹤器來(lái)解決“計(jì)算爆炸”問(wèn)題:
則虛擬控制信號(hào)的導(dǎo)數(shù)可估計(jì)為:
其中:τi,k和ζi,k是2 個(gè)正常數(shù);qi,k是估計(jì)誤差,且存在正常數(shù),滿足|qi,k|≤qˉi,k。
步驟2構(gòu)造一個(gè)正定Lyapunov 函數(shù)為:
可求得Vi,2的導(dǎo)數(shù)為:
其中:?i,2用于跟蹤。同樣地,根據(jù)young’s 不等式可得:
設(shè)計(jì)虛擬控制信號(hào)和自適應(yīng)律為:
步驟k(3 ≤k≤n-1)選擇如下的Lyapunov 候選函數(shù):
步驟n由于存在輸入飽和,因此ei,n可進(jìn)一步表示為:
其中:ηi為抗飽和參數(shù)。因此,ei,n導(dǎo)數(shù)為:
選擇Lyapunov 候選函數(shù)為:
可求得Vi,n的導(dǎo)數(shù)為:
其中:|m1| ≤1;|m2| ≤1。設(shè)計(jì)中 間連續(xù) 控制信號(hào)ξi(t)為:
其中:m3是一個(gè)正的常數(shù)。
由引理3、式(44)、式(45),可得:
將式(44)~式(48)代入式(42)并根據(jù)young’s 不等式,可得:
算法1描述了基于反步法設(shè)計(jì)的具有規(guī)定性能和輸入飽和的有限時(shí)間動(dòng)態(tài)事件觸發(fā)編隊(duì)控制器的偽代碼。
算法1有限時(shí)間動(dòng)態(tài)事件觸發(fā)編隊(duì)控制算法
本節(jié)將通過(guò)以下定理來(lái)證明非仿射非線性多智能體系統(tǒng)的穩(wěn)定性。
定理1對(duì)于滿足假設(shè)1~假設(shè)3 的非仿射多智能體系統(tǒng)式(1),考慮控制律式(47)、參數(shù)自適應(yīng)律式(48)、事件觸發(fā)機(jī)制式(10)和規(guī)定性能函數(shù)式(6),則可以保證多智能體系統(tǒng)式(1)中所有信號(hào)有界,并且編隊(duì)跟蹤誤差漸近收斂至0。
證明1考慮一個(gè)Lyapunov 候選函數(shù)為:
其中:V(0)是有界的是一個(gè)未知的有界正常數(shù),因此V(t)是有界的。進(jìn)而根據(jù)式(17)可得:
由式(8)可知,編隊(duì)誤差滿足:
此外,為了證明輔助系統(tǒng)參數(shù)的有界性,考慮如下Lyapunov 候選函數(shù):
綜上所述,可以推導(dǎo)出多智能體系統(tǒng)式(1)中的所有信號(hào)都是有界的。此外,由于V(t)及其導(dǎo)數(shù)連續(xù)有界,根據(jù)Barbalat 引理,可得t趨于無(wú)窮時(shí)V(t)收斂至0,因此,由式(17)、式(28)、式(35)、式(42)及式(54)可得,編隊(duì)跟蹤誤差ei漸近收斂至0,并且嚴(yán)格地在預(yù)定范圍內(nèi)變化,證畢。
接下來(lái)將通過(guò)如下定理來(lái)證明所設(shè)計(jì)的動(dòng)態(tài)事件觸發(fā)機(jī)制不會(huì)出現(xiàn)Zeno 行為。
定理2對(duì)于滿足假設(shè)1~假設(shè)3 的一類(lèi)非仿射多智能體系統(tǒng)式(1),設(shè)計(jì)控制律式(47)、參數(shù)自適應(yīng)律式(48)、事件觸發(fā)機(jī)制式(10)和規(guī)定性能函數(shù)式(6),則可以保證事件觸發(fā)的時(shí)間間隔存在一個(gè)下界,即Zeno 行為被排除。
證明2對(duì)于動(dòng)態(tài)事件觸發(fā)機(jī)制式(10),由zi(t)=ξi(t)-vi(t)可得:
根據(jù)ξi的定義,可以知道是有界的。因此,有這里的是一個(gè)正的常數(shù)。此外,由于:
根據(jù)上述分析,Zeno 行為被成功避免,證畢。
需要注意的是:
1)在控制器設(shè)計(jì)過(guò)程中,首先采用有限時(shí)間性能函數(shù),相比于大多數(shù)有關(guān)規(guī)定性能的文獻(xiàn),本文提出的規(guī)定性能函數(shù)式(6)可以在時(shí)間Ti內(nèi)達(dá)到預(yù)定值;隨后利用模糊邏輯系統(tǒng)處理未知的非線性函數(shù),這能有效放松一些現(xiàn)有文獻(xiàn)中對(duì)非線性函數(shù)的約束,同時(shí),微分跟蹤器用于解決“計(jì)算爆炸”問(wèn)題;最后通過(guò)Lyapunov 穩(wěn)定性理論,證明所有智能體之間的編隊(duì)跟蹤誤差能夠漸近收斂至0。
2)對(duì)于編隊(duì)中可能存在的外部有界擾動(dòng)問(wèn)題,將會(huì)在控制器設(shè)計(jì)過(guò)程中考慮一個(gè)自適應(yīng)參數(shù)[8],這個(gè)自適應(yīng)參數(shù)能夠根據(jù)誤差變化進(jìn)行自適應(yīng)更新,從而補(bǔ)償外部擾動(dòng)的影響。而對(duì)于執(zhí)行器故障問(wèn)題,擬采用自適應(yīng)在線更新策略[25]來(lái)估計(jì)未知的執(zhí)行器效率因子,通過(guò)為每個(gè)跟隨者設(shè)計(jì)在線自適應(yīng)更新律來(lái)估計(jì)故障因子,從而起到容錯(cuò)的作用。相對(duì)于其他經(jīng)典方法,自適應(yīng)控制在處理外部擾動(dòng)方面具有更強(qiáng)的魯棒性和自適應(yīng)能力以及不需要準(zhǔn)確系統(tǒng)模型等優(yōu)勢(shì)。
為了驗(yàn)證所提算法的有效性,對(duì)包含1 個(gè)領(lǐng)導(dǎo)者智能體和5 個(gè)跟隨者智能體的多智能體系統(tǒng)進(jìn)行數(shù)值仿真,圖3 所示為所有智能體之間的網(wǎng)絡(luò)通信拓?fù)?,其中? 代表領(lǐng)導(dǎo)者智能體,1~5 代表5 個(gè)跟隨者智能體。
圖3 多智能體系統(tǒng)的通信拓?fù)銯ig.3 Communication topology of the multi-agent system
從通信拓?fù)渲锌梢钥吹?,領(lǐng)導(dǎo)者智能體與任何一個(gè)跟隨者智能體之間都存在一條有向路徑,所以滿足假設(shè)1。此外,根據(jù)圖3 可計(jì)算其拉普拉斯矩陣為:
領(lǐng)導(dǎo)者與跟隨者的連接矩陣為:
第i個(gè)跟隨者的動(dòng)力學(xué)模型如下:
其中:i=1,…,5。非仿射非線性函數(shù)表示如下:
領(lǐng)導(dǎo)者模型表示為:
系統(tǒng)輸入飽和的上界和下界分別為uω=-30,uo=30。
所有智能體的初始狀態(tài)選擇為:xr(0)=[0;0],x1,1(0)=[0.6;3],x2,1(0)=[-0.2;4],x3,1(0)=[-1.5;5],x4,1(0)=[-1.5;0.8],x5,1(0)=[-0.2;1.5],xi,2(0)=[0;0],i=1,…,5。
規(guī)定性能函數(shù)表示為:
控制器的設(shè)計(jì)參數(shù)選擇為:ci,1=30,ci,2=40,τi2,ζi=0.8,=0.4,pi=30,δi,1=0.1,δi,2=0.1,ri,1=ri,2==1,λi(0)=0.9,l=1.2=0.12。其中,i=1,…,5。
仿真結(jié)果如圖4~圖12 所示。圖4 所示為每個(gè)智能體的軌跡和形成過(guò)程,從中可以看到,所有跟隨者都能保持一定的隊(duì)形,以相同的速度跟隨領(lǐng)導(dǎo)者智能體。圖5 和圖6 所示分別為編隊(duì)誤差曲線以及規(guī)定性能函數(shù)(彩色效果見(jiàn)《計(jì)算機(jī)工程》官網(wǎng)HTML版),從中可以看出,編隊(duì)跟蹤誤差能夠在有限時(shí)間內(nèi)漸近收斂至0,并且一直保持在預(yù)先定義的函數(shù)范圍內(nèi)。圖7~圖11 所示為連續(xù)控制器與事件觸發(fā)控制器的控制曲線,從中可以看到,控制曲線一直維持在-30~30 之間。圖12 所示為各智能體的觸發(fā)時(shí)刻,從中可以看出,動(dòng)態(tài)事件觸發(fā)控制有效地減少了控制器的更新次數(shù)。這些仿真結(jié)果驗(yàn)證了本文所提算法的有效性。
圖4 多智能體系統(tǒng)軌跡Fig.4 Multi-agent system trajectories
圖5 多智能體系統(tǒng)水平方向上的編隊(duì)跟蹤誤差Fig.5 Formation tracking error of multi-agent system in horizontal direction
圖6 多智能體系統(tǒng)豎直方向上的編隊(duì)跟蹤誤差Fig.6 Formation tracking error of multi-agent system in vertical direction
圖7 控制器ξ1(t)與事件觸發(fā)控制器u1(t)Fig.7 Controller ξ1(t) and event-triggered controller u1(t)
圖8 控制器ξ2(t)與事件觸發(fā)控制器u2(t)Fig.8 Controller ξ2(t) and event-triggered controller u2(t)
圖9 控制器ξ3(t)與事件觸發(fā)控制器u3(t)Fig.9 Controller ξ3(t) and event-triggered controller u3(t)
圖10 控制器ξ4(t)與事件觸發(fā)控制器u4(t)Fig.10 Controller ξ4(t) and event-triggered controller u4(t)
圖11 控制器ξ5(t)與事件觸發(fā)控制器u5(t)Fig.11 Controller ξ5(t) and event-triggered controller u5(t)
圖12 各智能體觸發(fā)時(shí)刻Fig.12 Trigger time of each agent
對(duì)于具有輸入飽和的多智能體編隊(duì)控制問(wèn)題,從控制信號(hào)絕對(duì)值的積分(IAU)、未飽和區(qū)域的控制器曲線峰值和調(diào)節(jié)時(shí)間3 個(gè)方面來(lái)分析有無(wú)規(guī)定性能對(duì)運(yùn)算成本的影響,結(jié)果如表1 所示。其中:IAU 可以衡量控制信號(hào)的能量消耗及幅值特性,IAU值越大,表示控制信號(hào)的幅值較大,意味著需要較大的控制力;未飽和區(qū)域峰值是指控制器曲線在飽和閾值內(nèi)的最大值。若考慮規(guī)定性能控制,很明顯可以看出,控制器所對(duì)應(yīng)的IAU 值以及峰值的數(shù)據(jù)要小于沒(méi)有考慮規(guī)定性能時(shí)的值,并且調(diào)節(jié)時(shí)間也相對(duì)較短,這說(shuō)明本文所考慮的基于有限時(shí)間規(guī)定性能的輸入飽和控制能夠節(jié)省控制資源,對(duì)減少運(yùn)算成本起到積極作用。此外,由于本文中存在輸入飽和,為了處理輸入飽和的情況,設(shè)計(jì)額外算法來(lái)補(bǔ)償飽和效應(yīng),這可能會(huì)增加運(yùn)算成本,但是能夠有效防止輸入飽和所帶來(lái)的不良影響。
表1 控制器有無(wú)規(guī)定性能時(shí)的對(duì)比Table 1 Comparison of controllers with and without prescribed performance
針對(duì)具有規(guī)定性能和輸入飽和的非仿射多智能體系統(tǒng),本文提出一種有限時(shí)間動(dòng)態(tài)事件觸發(fā)控制算法,以解決多智能體系統(tǒng)編隊(duì)跟蹤問(wèn)題。采用反步法結(jié)合模糊控制以及微分跟蹤技術(shù)設(shè)計(jì)有限時(shí)間編隊(duì)控制律,通過(guò)設(shè)計(jì)動(dòng)態(tài)事件觸發(fā)機(jī)制減少控制信號(hào)的更新頻率,并保證Zeno 行為不會(huì)發(fā)生。此外,引入動(dòng)態(tài)補(bǔ)償器來(lái)應(yīng)對(duì)輸入飽和所帶來(lái)的影響。利用Lyapunov 穩(wěn)定性理論證明多智能體編隊(duì)跟蹤誤差會(huì)漸近收斂至0。仿真結(jié)果表明,本文所設(shè)計(jì)的控制器可以實(shí)現(xiàn)編隊(duì)控制目標(biāo),并且能夠有效節(jié)省通信資源,驗(yàn)證了控制算法的有效性。本文所提控制算法主要解決了系統(tǒng)中的性能約束及輸入飽和問(wèn)題,而在實(shí)際中還存在如外部擾動(dòng)、執(zhí)行器故障等許多突發(fā)情況,下一步將繼續(xù)完善控制算法,使其能夠適應(yīng)各種突發(fā)情況。