摘 要 針對(duì)具有外部擾動(dòng)和非線性動(dòng)力學(xué)的二階領(lǐng)導(dǎo)者-跟隨者多智能體系統(tǒng)的有限時(shí)間一致性問題,提出一種全分布式自適應(yīng)遞歸終端滑??刂扑惴?。首先,在避免奇異性的基礎(chǔ)上,提出一種新的自適應(yīng)算法,有效克服了多智能體系統(tǒng)中常見的控制器抖動(dòng)現(xiàn)象;然后,用神經(jīng)網(wǎng)絡(luò)估計(jì)系統(tǒng)中未知的非線性動(dòng)力學(xué),使控制器不再需要已知精確的模型信息。最后,用仿真算例驗(yàn)證了該算法的優(yōu)越性,算法結(jié)構(gòu)簡(jiǎn)單,不包含任何圖論信息和模型信息,具有一定的通用性。
關(guān)鍵詞 遞歸終端滑??刂?神經(jīng)網(wǎng)絡(luò) 多智能體系統(tǒng) 自適應(yīng)算法
中圖分類號(hào) TP18" "文獻(xiàn)標(biāo)志碼 A" "文章編號(hào) 1000-3932(2024)06-0965-08
多智能體系統(tǒng)具有較高的物理可實(shí)現(xiàn)性,在無(wú)人機(jī)[1]、智能機(jī)器人編隊(duì)[2]、無(wú)人船[3]等領(lǐng)域應(yīng)用廣泛。具有代表性的多智能體控制問題是指每個(gè)智能體只與相鄰的智能體交互,使整個(gè)群體相互協(xié)調(diào),最終達(dá)到共同目標(biāo)。隨著研究的深入,多智能體系統(tǒng)的魯棒性和非線性控制問題成為一個(gè)重要的研究方向。
滑模變結(jié)構(gòu)控制方法具有較強(qiáng)的抗干擾特性并易于物理實(shí)現(xiàn),因此越來(lái)越多的學(xué)者通過(guò)引入滑模算法來(lái)提高多智能體全系統(tǒng)的魯棒性,并取得了豐碩的成果[4~6]。與傳統(tǒng)的一階滑模相比,高階滑模不僅在收斂速度上具有優(yōu)勢(shì)[7],而且可以顯著提高系統(tǒng)的穩(wěn)態(tài)精度[8]。因此,引入高階滑??商岣叨嘀悄荏w系統(tǒng)的整體性能。針對(duì)多智能體跟蹤問題,文獻(xiàn)[9]提出非奇異終端滑??刂扑惴ǎ稍谟邢迺r(shí)間內(nèi)將跟蹤誤差控制在零的較小鄰域,但算法未考慮外部擾動(dòng),并且需要假定系統(tǒng)的非線性動(dòng)力學(xué)完全已知。文獻(xiàn)[10]研究了具有不確定動(dòng)力學(xué)和有界外部擾動(dòng)的二階多智能體系統(tǒng)的一致跟蹤控制問題,但整個(gè)系統(tǒng)只能保證局部有限時(shí)間收斂,且需要知道擾動(dòng)上界。文獻(xiàn)[11]研究了具有未知擾動(dòng)上界的高階非線性系統(tǒng)的自適應(yīng)協(xié)同跟蹤控制,考慮了未知擾動(dòng)上界和未知系統(tǒng)動(dòng)態(tài)狀態(tài),并保證系統(tǒng)在有限時(shí)間內(nèi)達(dá)到穩(wěn)定階段,然而該算法控制輸入的峰值較高,控制器在穩(wěn)態(tài)后會(huì)抖動(dòng)。基于以上討論,筆者提出一種新的自適應(yīng)終端滑??刂扑惴?,算法考慮了系統(tǒng)未知非線性動(dòng)力學(xué)和未知擾動(dòng)上界,以期有效克服多智能體控制器中常見的抖振現(xiàn)象;利用神經(jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)的非線性動(dòng)力學(xué)進(jìn)行估計(jì),使控制器不再依賴精確的模型信息,從而提高算法的通用性。
1 圖論
設(shè)通信拓?fù)鋱DG=(V,ε,A),G的節(jié)點(diǎn)集合V={1,2,…,n},G的邊集ε?奐V×V。考慮用有序節(jié)點(diǎn)
(i,j)描述邊,表示節(jié)點(diǎn)i可以向節(jié)點(diǎn)j發(fā)送信息,節(jié)點(diǎn)j也稱為節(jié)點(diǎn)i的鄰節(jié)點(diǎn)。鄰接矩陣A=[a■]表示節(jié)點(diǎn)與邊之間的關(guān)系,(i,j)∈ε,a■>0,如果a■=0則表示節(jié)點(diǎn)i和節(jié)點(diǎn)j之間沒有路徑,即無(wú)數(shù)據(jù)交換。G的拉普拉斯量L=D-A,其中D為度矩陣且有D=diag{d■,d■,…,d■},d■=■a■。
本研究中,假設(shè)拓?fù)鋱DG=(V,ε,A)表示由n+1個(gè)智能體組成的Leader-Follower多智能體系統(tǒng)的通信拓?fù)鋱D,其中,V=V∪{0},0表示領(lǐng)導(dǎo)者;拓?fù)鋱DG是G的一個(gè)子拓?fù)鋱D,表示所有追隨者之間的通信拓?fù)浣Y(jié)構(gòu);ε?奐V×V是圖論G的邊集;A表示節(jié)點(diǎn)與邊之間的關(guān)系。輸入矩陣B=diag{b■,b■,…,b■},如果領(lǐng)導(dǎo)者將位置、速度等信息發(fā)送給跟隨者i,則b■=1;如果跟隨者沒有接收到信息,則b■=0。圖論矩陣H=L+B,表示整個(gè)多智能體系統(tǒng)的通信信息。
2 系統(tǒng)描述
考慮如下多智能體系統(tǒng):
■■=v■■■=f■(x■,v■)+η■(x■)u■+d■,i=0,1,2,…,n(1)
其中,x■∈R■表示第i個(gè)智能體的位置,■■和
v■∈R■表示第i個(gè)智能體的速度,v■是x■的一階導(dǎo)數(shù),■■表示第i個(gè)智能體的加速度;f■(x■,v■)∈R■表示智能體本身的未知非線性特征;η■(x■)∈R■表示控制器增益,且η■(x■)是一個(gè)非奇異矩陣;u■∈R■表示第i個(gè)智能體的控制輸入;d■表示有界的外部未知擾動(dòng)。
式(1)描述了擁有一個(gè)領(lǐng)導(dǎo)者(i=0)和多個(gè)跟隨者(i=1,2,…,n)的二階多智能體系統(tǒng)。
本研究的控制目標(biāo)是提出一個(gè)多智能體系統(tǒng)的自適應(yīng)遞歸終端滑??刂扑惴?,保證系統(tǒng)狀態(tài)通過(guò)無(wú)抖振的方式在固定時(shí)間內(nèi)收斂。
假設(shè)1[12] 外部擾動(dòng)d■是有界且未知的。
假設(shè)2[13] 拓?fù)鋱DG包含一個(gè)以根節(jié)點(diǎn)為領(lǐng)
導(dǎo)節(jié)點(diǎn)的生成樹。
引理1[14] 當(dāng)且僅當(dāng)假設(shè)2成立時(shí),圖論矩陣H是半正定的,并且具有正實(shí)特征值。
3 控制方案設(shè)計(jì)
3.1 多智能體動(dòng)態(tài)模型
本地相鄰節(jié)點(diǎn)的狀態(tài)一致性誤差可寫為:
e■=■a■(x■-x■)+b■(x■-x■)e■=■a■(v■-v■)+b■(v■-v■)(2)
其中,N為自然數(shù);x■和v■分別表示領(lǐng)導(dǎo)者的位置和速度。因此,整個(gè)多智能體系統(tǒng)的一致性誤差可表示為:
e■=(H?茚I)θ■∈R■e■=(H?茚I)θ■∈R■(3)
θ■=(θ■■,θ■■,…,θ■■)■∈R■θ■=(θ■■,θ■■,…,θ■■)■∈R■θ■=x■-x■∈R■θ■=v■-v■∈R■(4)
其中,I為單位矩陣;?茚表示克羅內(nèi)克積;θ■和θ■分別為第i個(gè)跟隨者與領(lǐng)導(dǎo)者之間的位置誤差和速度誤差;θ■和θ■分別為θ■和θ■的集合。
記Z■=H?茚I,Z■=Z■■。那么,多智能體系統(tǒng)的誤差動(dòng)態(tài)模型為:
■■=e■Z■■■=-■+F+ηu+d(5)
其中,e■和e■分別為diag(e■,e■,…,e■)■和
diag(e■,e■,…,e■)■;X=(x■,x■,…,x■)■∈R■,且X二階連續(xù)可導(dǎo),其二階導(dǎo)數(shù)記作■。F=(f■,f■,…,
f■)■∈R■表示系統(tǒng)的未知非線性特性。η、u、d分別表示整個(gè)系統(tǒng)的增益、控制輸入、外部擾動(dòng)的集合。
3.2 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)具有非線性擬合能力強(qiáng)、學(xué)習(xí)規(guī)則簡(jiǎn)單、魯棒性強(qiáng)、易于物理實(shí)現(xiàn)等特點(diǎn),因此在非線性控制領(lǐng)域廣泛應(yīng)用。
本研究采用神經(jīng)網(wǎng)絡(luò)對(duì)未知非線性f■進(jìn)行近似,f■可表示為:
f■=W■■φ■(X■)+ε■(6)
其中,W■為理想的神經(jīng)網(wǎng)絡(luò)權(quán)重;φ■為激活函數(shù);X■為系統(tǒng)狀態(tài)的集合;ε■為近似誤差。
激活函數(shù)選擇高斯函數(shù):
φ■=exp■,z=1,2,…,p(7)
其中,■和ξ表示高斯函數(shù)中需要設(shè)計(jì)的參數(shù);p為節(jié)點(diǎn)i的神經(jīng)元數(shù)量。
那么,神經(jīng)網(wǎng)絡(luò)的估計(jì)值■■為:
■■=■■■φ■(8)
其中,■■表示W(wǎng)■的估計(jì)值。
神經(jīng)網(wǎng)絡(luò)權(quán)值更新規(guī)律設(shè)計(jì)如下:
■■=r■s■φ■(X■)-r■μ■■■(9)
其中,s■為待設(shè)計(jì)的遞歸終端滑模變量;κ表示向量■■中的第κ個(gè)元素;r■和μ■表示神經(jīng)網(wǎng)絡(luò)的權(quán)重更新率,而且r■和W■可整理為矩陣r和W:
r■=diag(r■I■,r■I■,…,r■I■)r=diag(r■,r■,…,r■)W■=(W■,W■,…,W■)■W=(W■,W■,…,W■)■(10)
3.3 控制器設(shè)計(jì)
考慮如下快速非奇異終端滑模變量:
ρ■=■■+k■e■+k■sig(e■)■(11)
其中,k■、k■和α■表示第i個(gè)智能體的滑模變量參數(shù);sig(e■)■=|e■|■sign(e■),sign(·)為符號(hào)函數(shù)。
那么,遞歸終端滑模變量可表示為:
s■=ρ■+k■ χ■(12)
其中,χ■的一階導(dǎo)數(shù)滿足等式■■=sig(ρ■)■,k■和β■表示第i個(gè)智能體的滑模變量參數(shù)。
將k■、k■、k■分別整理為k■、k■、k■:
k■=diag{k■I,k■I,…,k■I}∈R■k■=diag{k■I,k■I,…,k■I}∈R■k■=diag{k■I,k■I,…,k■I}∈R■(13)
那么,整個(gè)多智能體系統(tǒng)的遞歸終端滑模變量可寫為:
ρ=■■+k■e■+k■ sig(e■)■s=ρ+k■χ(14)
其中,ρ、α、s、 χ分別為ρ■、α■、s■、 χ■的集合。
遞歸終端滑模變量s的導(dǎo)數(shù)為:
■=■■+k■■■+σ+k■■(15)
其中,σ的表達(dá)式如下:
σ■=(k■α■|e■|■e■,k■α■|e■|■e■,…,k■α■|e■|■e■)■σ=(σ■■,σ■■,…,σ■■)(16)
定義如下變量:
?諄=Z■(σ+k■■■+k■■)(17)
?準(zhǔn)=ε+?諄+d-■■(18)
如果將■■記為?準(zhǔn)■=(ε■+?諄■+d■-■■)的估計(jì)值,那么自適應(yīng)更新律可以設(shè)計(jì)為:
■■=τ■|s■|-τ■μ■■■(19)
其中,τ■和μ■為需要設(shè)計(jì)的參數(shù),記為:
τ=diag(τ■,τ■,…,τ■)∈R■(20)
那么,可以得到整個(gè)多智能體系統(tǒng)的自適應(yīng)更新律:
■=τ|s|-τμ■■(21)
選擇一個(gè)正常數(shù)δ為邊界層,自適應(yīng)律可以寫為:
u■=sign(s■)■■,■>1■|■■|" ,■≤1(22)
那么,可以得到u■為:
u■=(u■,u■,…,u■)■(23)
綜上,節(jié)點(diǎn)i的控制策略可以寫為:
u■=η■■(-■■-μ■ s■-u■)(24)
其中,μ■>0為需要設(shè)計(jì)的參數(shù)。
引理2[15] 對(duì)于本文所考慮的多智能體系統(tǒng)(1),在假設(shè)1和假設(shè)2成立的前提下,控制策略(24)將保證整個(gè)系統(tǒng)在有限時(shí)間內(nèi)收斂,且滑模變量s■將收斂到下式:
|s■|≤■(25)
其中,π■和π■為需要設(shè)計(jì)的參數(shù),且滿足如下不等式:
0<π■<10<π■<■(26)
4 仿真分析
為了說(shuō)明上述控制方法的有效性,筆者用文獻(xiàn)[10]中的二階多智能體非線性系統(tǒng)作為仿真對(duì)象,其動(dòng)態(tài)模型簡(jiǎn)化如下:
■■=v■■■=f■(x■,v■)+η■u■+d■(27)
未知的非線性動(dòng)力學(xué)可描述為:
f■(x■,v■)=4x■sin(0.25π+0.5v■)f■(x■,v■)=4x■cos(0.5v■)(28)
跟隨者的初始狀態(tài)為:
x■(0)=(0.3,0.2)■,v■(0)=(0,-0.1)■x■(0)=(0.1,0.1)■,v■(0)=(0.3,0.2)■x■(0)=(-1.8,1.4)■,v■(0)=(-0.1,-0.1)■x■(0)=(0.4,0.5)■,v■(0)=(0.2,0.3)■x■(0)=(-0.1,-0.5)■,v■(0)=(0.1,-0.2)■(29)
領(lǐng)導(dǎo)者的變化軌跡為:
x■(t)=(0.5sin t,0.5cos t)■v■(t)=(0.5cos t,-0.5sin t)■(30)
遞歸終端滑模變量s■=(s■,s■)■,外部未知擾動(dòng)選擇d■=(0.1sin t,0.1cos t)■。此外,系統(tǒng)狀態(tài)x■=
(x■,x■)■,v■=(v■,v■)■,控制輸入u■=(u■,u■)■,擾動(dòng)d■=(d■,d■)■。
仿真中的相關(guān)參數(shù):μ■=10,π■=0.2,π■=0.005,τ■=11,μ■=0.008,η■=I■,其中I■表示二階單位矩陣。
神經(jīng)網(wǎng)絡(luò)輸入X■=[s■,■■)■,r■=60,高斯函數(shù)的參數(shù)c■=-1.0,-0.5,0,0.5,1.0-1.0,-0.5,0,0.5,1.0■,b■=8.6。遞歸終端滑模變量的參數(shù)k■=1.4,k■=0.1,k■=2,α■=1.8,
β■=0.8。
考慮以領(lǐng)導(dǎo)者為根節(jié)點(diǎn)的多智能體無(wú)向通信拓?fù)鋱D如圖1所示,則矩陣L和B為:
L=" 2?搖?搖 -1?搖?搖" "0?搖?搖" " 0?搖?搖" -1-1?搖?搖" 2?搖?搖" -1?搖?搖" " 0?搖?搖" " 0" 0?搖?搖 -1?搖?搖" "2?搖?搖" -1?搖?搖" " 0" 0?搖?搖" "0?搖?搖" -1?搖?搖" "2?搖?搖" -1-1?搖?搖" "0?搖?搖" "0?搖?搖" -1?搖" "?搖 2(31)
B=1?搖?搖" 0?搖?搖" 0?搖?搖" 0?搖?搖" 00?搖?搖nbsp; 0?搖?搖" 0?搖?搖" 0?搖?搖" 00?搖?搖" 0?搖?搖" 0?搖?搖" 0?搖?搖" 00?搖?搖" 0?搖?搖" 0?搖?搖" 0?搖?搖" 00?搖?搖" 0?搖?搖" 0?搖?搖" 0?搖?搖" 0(32)
在筆者控制方法的作用下,控制律u■和u■的變化曲線如圖2所示,可以看出筆者方法沒有明顯的控制器抖動(dòng)。
圖3為每個(gè)智能體的跟蹤軌跡變化曲線,可以看出每一個(gè)跟隨者經(jīng)過(guò)短暫的調(diào)節(jié)過(guò)程后都能夠與領(lǐng)導(dǎo)者的變化保持一致。
圖4為跟隨者的位置跟蹤誤差和速度跟蹤誤差,位置跟蹤誤差在穩(wěn)定10 s后能夠達(dá)到10-5數(shù)量級(jí),速度跟蹤誤差能夠達(dá)到10-4數(shù)量級(jí),說(shuō)明筆者算法有很高的控制精度,跟蹤誤差能夠很快收斂。
自適應(yīng)更新律的曲線變化如圖5所示,由于系統(tǒng)穩(wěn)定后,神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)誤差很小,為了直觀地看出自適應(yīng)律在該方法中起到的作用,令D=?諄+d-■0。
圖6展現(xiàn)了神經(jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)非線性動(dòng)力學(xué)估計(jì)的效果,其中?資=1,2,可以看出,隨著系統(tǒng)的自適應(yīng)調(diào)整,神經(jīng)網(wǎng)絡(luò)可以有效地近似系統(tǒng)的非線性動(dòng)力學(xué)。
遞歸終端滑模變量的曲線變化如圖7所示,可以看出滑模變量能夠快速收斂。
圖8為?滋3對(duì)一致性誤差上界的影響,可以看出,適當(dāng)放大?滋3的取值可以提高系統(tǒng)的整體性能。
5 結(jié)束語(yǔ)
針對(duì)一類二階領(lǐng)導(dǎo)者-跟隨者多智能體系統(tǒng),提出基于無(wú)向通信的自適應(yīng)控制算法。該控制算法是一種完全分布式的控制算法,可以在不存在外部擾動(dòng)上界的情況下解決控制器抖動(dòng)問題,并且控制器不包含任何圖論信息。仿真結(jié)果表明,所提算法能夠保證多智能體系統(tǒng)在短時(shí)間內(nèi)達(dá)到預(yù)期的軌跡和跟蹤性能。
參 考 文 獻(xiàn)
[1]" DONG X W,ZHOU Y,REN Z,et al.Time-Varying Formation Tracking for Second-Order Multi-Agent Systems Subjected to Switching Topologies with Application to Quadrotor Formation Flying[J].IEEE Transactions on Industrial Electronics,2017,64(6):5014-5024.
[2]" "KHOO S Y,XIE L H,MAN Z H.Robust Finite-Time Consensus Tracking Algorithm for Multirobot Systems[J].IEEE/ASME Transactions on Mechatronics,2009,14(2):219-228.
[3]" BAI W W, ZHANG W J, CAO L,et al. Adaptive Control for Multi-Agent Systems with Actuator Fault via Reinforcement Learning and Its Application on Multi-Unmanned Surface Vehicle[J].Ocean Enginee-ring,2023,280:114545.
[4]" "LI W,NIU Y G,CAO Z R,et al.Sliding Mode Control for Multi-Agent Systems under Stochastic Communication Protocol[J].International Journal of Robust and Nonlinear Control,2022,32(13):7522-7535.
[5]" "婁如思,王璐瑤,馬丹.二階非線性多智能體系統(tǒng)有限時(shí)間分布式優(yōu)化[J].控制理論與應(yīng)用,2021,38(7):1015-1022.
[6]" "朱偉,周雙.基于終端滑??刂频亩嘀悄荏w系統(tǒng)有限時(shí)間跟蹤控制[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,35(4):696-705.
[7]" NI J K, WEN C Y, ZHAO Y.Fixed-Time Leader-Follower Quantized Output Consensus of High-Order Multi-Agent Systems over Digraph[J].Information Sciences,2022,587:408-434.
[8]" ZHANG Z C,ZUO Z Q,WANG Y J.Finite-Time Consensus of Neutrally Stable Multi-Agent Systems in the Presence of Input Saturation[J].Journal of the Franklin Institute-Engineering and Applied Mathemat-ics,2019,356(2):894-907.
[9]" "DONG L J,YU D Y,NGUANG S K.Novel Nonsingular Terminal Sliding Mode Control for Multi-Agent Tracking Systems with Application to Jerk Circuit[J].IEEE Transactions on Circuits and SystemsⅡ:Express Briefs,2020,67(8):1429-1433.
[10]" ZOU A M,KUMAR K D,HOU Z G.Distributed Consensus Control for Multi-Agent Systems Using Terminal Sliding Mode and Chebyshev Neural Networks[J].International Journal of Robust and Nonlinear Control,2013,23(3):334-357.
[11]" ZHANG H W,LEWIS F L.Adaptive Cooperative Tracking Control of Higher-Order Nonlinear Systems with Unknown Dynamics[J].Automatica,2012,48(7):1432-1439.
[12]" YU Z Y,YU S Z,JIANG H J,et al.Distributed Consensus for Multi-Agent Systems via Adaptive Sliding Mode Control[J].International Journal of Robust and Nonlinear Control,2021,31(15):7125-7151.
[13]" "ZHAO L, YU J P,LIN C, et al.Distributed Adaptive Fixed-Time Consensus Tracking for Second-Order Multi-Agent Systems Using Modified Terminal Sliding Mode[J].Applied Mathematics and Computation,2017,312:23-35.
[14]" "HU J P, FENG G. Distributed Tracking Control of Leader-Follower Multi-Agent Systems under Noisy Measurement[J].Automatica,2010,46(8):1382-1387.
[15]" "JIA C,SHANGGUAN X,ZHENG L.Dynamic bound-ary layer super-twisting sliding mode control algorit-hm based on RBF neural networks for a class of leader-follower multi-agent systems[J].International Journal of Robust and Nonlinear Control,2024,34(3):2109-2140.
(收稿日期:2024-02-28,修回日期:2024-10-21)
Adaptive Recursive Terminal Sliding Mode Control Algorithm Based on Multi-agent System
JIA Chao1, 2, WANG Hong-kun1, 2, SHANGGUAN Xuan-yue 1,2
(1.School of Electrical Engineering and Automation, Tianjin University of Technology;2. Tianjin Key Laboratory of Control Theory and Application for Complex Systems)
Abstract" "Aiming at the finite-time consensus of second-order leader-following multi-agent system with external disturbances and nonlinear dynamics, a fully-distributed adaptive recursive terminal sliding mode control algorithm was proposed, including having the avoiding singularity based to propose a new adaptive algorithm to overcome the controller’s vibration in multi-agent system; then, having the neural network employed to estimate unknown nonlinear dynamics in the system so that the controller needs to know the precise model information no longer; finally, making use of simulation example verify superiority of the algorithm. The results show that, this algorithm has a simple structure without any graph theory information and model information and has certain versatility.
Key words" "recursive terminal sliding mode control, neural network, multi-agent system, adaptive algorithm