摘" 要: 針對非線性多智能體系統(tǒng)(MASs)的分布式優(yōu)化問題,提出一種固定時間自適應(yīng)神經(jīng)網(wǎng)絡(luò)輸出反饋控制策略。在懲罰函數(shù)的基礎(chǔ)上,解除一致性約束條件來重構(gòu)全局目標函數(shù)。為了避免反演過程中偏導(dǎo)數(shù)的計算和“復(fù)雜性爆炸”的問題,設(shè)計了一種基于命令濾波的固定時間控制器,并引入補償信號對濾波誤差進行補償。基于Lyapunov穩(wěn)定性理論,證明系統(tǒng)中所有輸出信號在固定時間內(nèi)均能達到最優(yōu)解。最后,通過仿真實驗驗證了所提控制方案的有效性。
關(guān)鍵詞: 多智能體系統(tǒng); 分布式優(yōu)化; 固定時間; 命令濾波; 自適應(yīng)反演; 自適應(yīng)神經(jīng)網(wǎng)絡(luò)
中圖分類號: TN609?34; TP273" " " " " " " " " " "文獻標識碼: A" " " " " " " " " " 文章編號: 1004?373X(2024)11?0105?08
Fixed?time distributed optimization algorithm for nonlinear multi?agent systems
SUN Qing, YANG Hui, YAO Rao
(School of Air Transportation, Shanghai University of Engineering Science, Shanghai 201620, China)
Abstract: A fixed?time adaptive neural network output?feedback control strategy is proposed for the distributed optimization of nonlinear multi?agent systems (MASs). On the basis of the penalty function method, the consensus constraint is removed and the global objective function is reconstructed. To avoid the calculation of partial derivatives and the ″complexity explosion″ in the backstepping process, a fixed?time controller based on command filtering is designed and the filter errors are compensated by introducing compensating signals. It is proved on the basis of Lyapunov stability theory that all output signals in the system can reach the optimal solution in a fixed time. The simulation results prove the effectiveness of the proposed approach.
Keywords: MASs; distributed optimization; fixed time; command filtering; adaptive backstepping; adaptive neural network
0" 引" 言
作為MASs的一個核心問題,MASs的協(xié)同控制一直備受關(guān)注。其中,多智能體一致性問題是協(xié)同控制中最重要的方面[1],在無人機[2]、航天器協(xié)調(diào)[3]和飛行器編隊[4]等領(lǐng)域得到廣泛應(yīng)用。分布式優(yōu)化問題是MASs共識問題的延伸,是指在共識的基礎(chǔ)上解決分布式優(yōu)化問題。分布式優(yōu)化的主要目標是通過最小化全局目標函數(shù)使得局部目標函數(shù)之和最小[5]。對于MASs而言,分布式優(yōu)化的一個關(guān)鍵目標是設(shè)計合適的分布式控制器[6],使得所有的智能體能夠在特定的通信拓撲結(jié)構(gòu)下達到一致性,并在收斂后達到分布式優(yōu)化的最優(yōu)解。
目前已經(jīng)有一些文獻對低階MASs的分布式優(yōu)化問題進行求解[7?11]。其中文獻[8]基于事件觸發(fā)策略設(shè)計了一種分布式優(yōu)化算法來求解具有外部干擾和離散通信的一階MASs的分布式優(yōu)化問題。文獻[10]提出了一種改進的分布式連續(xù)時間算法,用來求解二階MASs的廣義分布式優(yōu)化問題。然而,許多實際系統(tǒng)如機械臂和直升機等,并不能用低階動力學(xué)來描述。因此,具有未建模動態(tài)的高階MASs的分布式優(yōu)化問題引起了一些學(xué)者的關(guān)注。例如,文獻[12]在假設(shè)所有智能體目標函數(shù)之和最小的條件下,構(gòu)建了在MASs中實現(xiàn)全局最優(yōu)共識的有界控制律。文獻[13]提出了一種基于Lyapunov的自適應(yīng)反演方法,將高階MASs的分布式優(yōu)化問題分解為求解多個子系統(tǒng)的優(yōu)化問題。文獻[14]研究了一種具有狀態(tài)約束的MASs分布式優(yōu)化算法。本文在懲罰函數(shù)的基礎(chǔ)上,解除一致性約束條件來重構(gòu)全局目標函數(shù),從而解決分布式優(yōu)化問題。
對于MASs來說,收斂速度是評價算法有效性的重要性能指標,而上述文獻都是以漸近的方式達到最優(yōu)解,即在無限時間范圍內(nèi)獲得最優(yōu)解。因此,有些學(xué)者運用有限時間控制方法來解決分布式優(yōu)化問題。例如,文獻[15?16]提出了不連續(xù)算法來解決有限時間內(nèi)的分布式優(yōu)化問題。但同時這些文獻中的收斂時間都與多智能體的初始條件有關(guān),而在一般情況下初始條件可能是事先未知的,因此很難估計收斂時間的上界。文獻[17]提出了固定時間穩(wěn)定性理論來克服這一缺點。文獻[18?19]研究了低階多智能體的固定時間分布式優(yōu)化問題,但目前有關(guān)高階多智能體的分布式優(yōu)化問題的研究很少。
本文研究了具有未建模動態(tài)的高階MASs分布式優(yōu)化問題,提出了一種基于命令濾波的固定時間自適應(yīng)反演控制策略。并根據(jù)Lyapunov漸近穩(wěn)定性理論和線性不等式理論,證明了所提出的控制策略能夠有效地使得多智能體系統(tǒng)的輸出在固定時間內(nèi)達到分布式優(yōu)化問題的最優(yōu)解。最后,通過仿真實例驗證了該方法的有效性及可行性。
1" 問題描述和預(yù)備知識
1.1" 圖" 論
假設(shè)系統(tǒng)中存在[NNgt;0]個智能體,定義無向圖:[Q=?,Z,A],其中,[?=m1,m2,…,mN]表示圖中節(jié)點集。定義[Z=mi,mj∈?×?]為圖中不存在自環(huán)的邊集,[A=aij∈RN×N]表示鄰接矩陣。[mi,mj?Z],當且僅當[aij=0],定義[Ni=jmi,mj∈Z]為節(jié)點[i]的鄰居智能體的集合,矩陣[D=diagd1,d2,…,dN],[di=j∈n=Niaij]為度矩陣,則拉普拉斯矩陣[L=D-A]。
引理1[20]:對稱矩陣[L∈RN×N]是無向圖[Q]的拉普拉斯矩陣。定義一個列向量[1N],[N]個元素均為1。[1N]是拉普拉斯矩陣特征值為0的特征向量。
1.2" 多智能體系統(tǒng)
具有未建模動態(tài)的高階非線性MASs如下:
[xi,m(t)=xi,m+1+hi,m(Xi,m)xi,n(t)=ui(t)+hi,n(Xi,n)yi(t)=xi,1(t)] (1)
式中:[m=1,2,…,n-1];[hi,m]是未知非線性函數(shù);[Xi,m=(xi,1,xi,2,…,xi,m)T∈Rm]。
1.3" 分布式優(yōu)化問題
本文研究了具有未建模動態(tài)的高階MASs的分布式優(yōu)化問題,其中每個智能體都有一個局部目標函數(shù)[f:R→R],且都是強凸的。對于智能體[i]的局部目標函數(shù)可以定義為:
[fi(xi,1)=mix2i,1+τixi,1+ci] (2)
式中:[migt;0];[cigt;0];[τi]為常數(shù),[1≤i≤N]。
定義全局目標函數(shù)為:
[fx1=i=1Nfi(xi,1)] (3)
式中[x1=x1,1,x2,1,…,xN,1T],根據(jù)引理1,對于某個[α∈R],如果[x1=α?1N],可以得到:
[Lx1=0] (4)
根據(jù)文獻[21]設(shè)計懲罰項和懲罰函數(shù)為:
[xT1Lx1=0] (5)
[Px1=i=1Nfi(xi,1)+xT1Lx1] (6)
本文的目標是設(shè)計[ui]使得每一個智能體[limt→∞xi,1t→x*i,1],定義[x*1=x*1,1,x*2,1,…,x*N,1]。 智能體的最優(yōu)解[x*i,1]定義為:
[x*1,1,x*2,1,…,x*N,1=argminx1,1,x2,1,…,xN,1P(x1)] (7)
根據(jù)式(6)和式(7)推出,當MASs達到最優(yōu)解[x*1]時,智能體在達到一致性的同時收斂到最優(yōu)軌跡。
注1:由式(6)可知,懲罰函數(shù)由兩部分組成。[i=1Nfi(xi,1)]是全局目標函數(shù),[xT1Lx1]是懲罰項,使所有智能體達到共識。本文的重點是設(shè)計一個控制器使懲罰函數(shù)最小化,保證在最小化全局目標函數(shù)的同時MASs的一致性跟蹤誤差收斂到零。
假設(shè)1[17]:如果系統(tǒng)(1)是有限時間穩(wěn)定的,且收斂時間有上界,則稱其為固定時間穩(wěn)定的。
引用下面的引理用來方便計算。
引理2[17]:定義光滑函數(shù)[Vχ≥0]。如果滿足以下不等式,則系統(tǒng)(1)是固定時間穩(wěn)定的。
[Vχ≤-cVχσ-γVχλ+ρ] (8)
式中:[σgt;1];[0lt;λlt;1];[γgt;0];[cgt;0];[ρgt;0]。收斂時間可以表示為:
[Ts≤Tmax=1cσ-1+1γ1-λ] (9)
引理3[22]:定義命令濾波器為:
[ai,1=ηnai,2ai,2=-2υηnai,2-ηnai,1-αi] (10)
式中:[υ∈0,1];[ηngt;0]是設(shè)計參數(shù);[ai,1]和[αi]表示命令濾波器的輸出信號和輸入信號,[ai,10=αi0],[ai,20=0]。
引理4[23]:任意[H1]、[H2∈Rn],滿足以下不等式:
[HT1H2≤λ??H1?+1ψλψH2ψ] (11)
式中:[?gt;1],[λgt;0],[ψgt;1],[?-1ψ-1=1]。
引理5[24]:任意[Θj∈R],[0lt;plt;1],[qgt;1],滿足以下不等式:
[j=1nΘjp≤j=1nΘjpj=1nΘjq≤nq-1j=1nΘjq] (12)
2" 控制器設(shè)計及穩(wěn)定性分析
2.1" 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是一種逼近連續(xù)函數(shù)的有效工具,本文利用神經(jīng)網(wǎng)絡(luò)對非線性函數(shù)[hi,l,i=1,2,…,n]進行補償,[hi,lXi,n:Rn→R]。
[hi,lXi,n=θTi,lφi,lXi,n] (13)
式中:[Xi,n]是輸入向量,[1≤i≤n];[θi,l∈Rp]是權(quán)重向量,[p]表示神經(jīng)網(wǎng)絡(luò)隱含層的節(jié)點個數(shù);[φi,lXi,n=φ1i,lXi,n,…,φpi,lXi,nT]是徑向基函數(shù)向量。
[φpi,lXi,n]是一個典型的高斯基函數(shù),表達式如下:
[φpi,lXi,n=exp-Xi,n-cqTXi,n-cqb2q] (14)
式中:[cq∈Rn]為高斯基函數(shù)中心點的坐標向量;[bq∈R]為高斯基函數(shù)的寬度。
引理6[25]:一個連續(xù)未知函數(shù)[hx]定義在緊集[Ωx],存在神經(jīng)網(wǎng)絡(luò)[θ*Tφx]和任意精度[?x],滿足:
[hx=θ*Tφx+?x] (15)
式中:[?x]為神經(jīng)網(wǎng)絡(luò)的逼近誤差;[θ*]是理想權(quán)值,其中[θ*=argminθ∈Ωθsupx∈Ωxhx-θTφx]。
定義參數(shù)逼近誤差[θi,l ]和最優(yōu)逼近誤差[?i,lx]為:
[θi,l =θ*i,l-θi,l," " l=1,2,…,n?i,lx=hi,lXi,n-hi,lXi,nθ*i,l] (16)
假設(shè)2:最優(yōu)逼近誤差保持有界,對于任意[?x]有[?x≤?0,?0gt;0]。
2.2" 控制器設(shè)計
在進行控制器設(shè)計之前,定義如下變量:
[si,1=2mi(xi,1-bi)+j∈Niaij(xi,1-xj,1)si,l=xi,l-ai,lzi,l=si,l-ξi,l] (17)
式中:[si,l]表示跟蹤誤差;[ai,l]是命令濾波器相對于虛擬控制器[ai,l]產(chǎn)生的輸出信號;[ξi,l]是誤差補償信號,在本文中被設(shè)計為:
[ξi,1=di(ξi,2+ai,2-ai,1)-32ξi,1-li,1sgnξi,1] (18)
[ξi,2=ai,3-ai,2-diξi,1-ξi,2+ξi,3-li,2sgnξi,2] (19)
[ξi,m=ai,m+1-ai,m-ξi,m-1-ξi,m+ξi,m+1-li,msgnξi,m] (20)
[ξi,n=-ξi,n-ξi,n-1-li,nsgnξi,n] (21)
式中[li,n]為設(shè)計參數(shù)。虛擬控制律和控制輸入為:
[ai,1=1di(2mibi-32si,1+j∈Niaijxj,2+θTj,1φj,1-Ki,1,112κz2κ-1i,1-Ki,1,212κz2κ-1i,1-diθTi,1φi,1)] (22)
[ai,2=ai,2-si,2-disi,1-θTi,2φi,2-Ki,2,112κz2κ-1i,2-Ki,2,212κz2κ-1i,2] (23)
[ai,m=ai,m-si,m-si,m-1-θTi,mφi,m-Ki,m,112κz2κ-1i,m-Ki,m,212κz2κ-1i,m] (24)
[ui=ai,n-si,n-si,n-1-θTi,nφi,n-Ki,n,112κz2κ-1i,n-Ki,n,212κz2κ-1i,n] (25)
設(shè)計自適應(yīng)律為:
[θi,1=ri,1diφi,1zi,1-ri,1θi,1-1ri,1θ2κ-1i,1] (26)
[θj,1=-rj,1φj,1zi,1-rj,1θj,1-1rj,1θ2κ-1j,1] (27)
[θi,l=ri,lφi,lzi,l-ri,lθi,l-1ri,lθ2κ-1i,l] (28)
式中:[Ki,n,1]、[Ki,n,2]、[κ]、[κ]、[ri,n]、[ri,n]為設(shè)計參數(shù)。
步驟1:首先,根據(jù)式(6)得到懲罰函數(shù)的梯度:
[?P(x1)?x1=vec(?fi(xi,1(t))?xi,1)+Lx1] (29)
式中[vec?fixi,1(t)?xi,1]是一個列向量。最優(yōu)解[x*1]滿足:
[?P(x*1)?x*1=0] (30)
對于智能體[i],有:
[?fi(x*i,1(t))?x*i,1+j∈Niaij(x*i,1-x*j,1)=0] (31)
根據(jù)式(2)和式(30),可以得到:
[2mi(x*i,1-bi)+j∈Niaij(x*i,1-x*j,1)=0] (32)
式中[bi=-12miτi],結(jié)合式(17)和式(31),推出:
[?P(x1)?xi,1=?fixi,1(t)?xi,1+j∈Niaij(xi,1-xj,1)=2mi(xi,1-bi)+j∈Niaij(xi,1-xj,1)=si,1] (33)
設(shè)計第一步Lyapunov函數(shù)為:
[V1=i=1N12z2i,1+12ri,1θTi,1θi,1+12j=NIaij1rj,1θTj,1θj,1] (34)
式中[ri,1]和[rj,1]是設(shè)計參數(shù)。根據(jù)式(17),計算出:
[si,1=di(zi,2+ξi,2+ai,2)-j∈Niaijxj,2+di(θTi,1φi,1+θTi,1φi,1+?i,1)-2aibi-j∈Niaij(θTj,1φj,1+θTj,1φj,1+?j,1)] (35)
式中[di=2mi+j∈Niaij],根據(jù)式(17),得到[zi,1=si,1-ξi,1],并由式(34)、式(35)和引理2,推出:
[V1=i=1Nzi,1di(zi,2+ξi,2+ai,2)-2aibi-ξi,1+diθTi,1φi,1+θTi,1φi,1+?i,1-j∈Niaijxj,2+(θTj,1φj,1+θTj,1φj,1+?j,1)-1ri,1θTi,1θi,1-j∈Niaij1rj,1θTj,1θj,1] (36)
根據(jù)引理4,可以得到以下不等式:
[zi,1li,1sgnξi,1≤z2i,12+l2i,12dizi,1?i,1≤z2i,12+(di?i,1)22zi,1j∈Niaij?j,1≤z2i,12+(j∈Niaij?j,1)22] (37)
將設(shè)計的補償項式(18)、虛擬控制器式(22)、自適應(yīng)律式(26)和式(27)以及上述不等式代入式(36),可以計算出:
[V1≤i=1Ndizi,1zi,2-Ki,1,112κz2κi,1+Di,1+1r2i,1θi,1θ2κ-1i,1-Ki,1,212κz2κi,1+ri,1ri,1θTi,1θi,1+j∈Niaijrj,1rj,1θTj,1θj,1+1r2j,1θj,1θ2κ-1j,1] (38)
式中[Di,1=l2i,12+(di?i,1)22+j∈Niaij?j,122]。
步驟2:設(shè)計第2步Lyapunov函數(shù)為:
[V2=V1+i=1N12z2i,2+12ri,2θTi,2θi,2] (39)
根據(jù)系統(tǒng)式(1)和式(17),可以推出:
[zi,2=zi,3+ξi,3+ai,3+θTi,2φi,2+θTi,2φi,2+?i,2-ai,2-ξi,2] (40)
對Lyapunov函數(shù)求導(dǎo)得到:
[V2=V1+i=1Nzi,2(zi,3+ξi,3+ai,3-ai.2-ξi,2+θTi,2φi,2+θTi,2φi,2+?i,2)-1ri,2θTi,2θi,2" " " " " " " " " " " " " " " " " " " " " " (41)]
根據(jù)引理4,以下不等式恒成立:
[zi,2li,2sgnξi,2≤z2i,22+l2i,22zi,2?i,2≤z2i,22+?2i,2 2] (42)
將設(shè)計的補償項式(19)、虛擬控制器式(23)、自適應(yīng)律式(28)和上述不等式代入式(41),可以計算出:
[V2≤i=1Nl=12zi,2zi,3-Ki,l,112κz2κi,l-Ki,l,212κz2κi,l+ri,lri,lθTi,lθi,l+1r2i,lθi,lθ2κ-1i,l+Di,2+j∈Niaijrj,1rj,1θTj,1θj,1+1r2j,1θj,1θ2κ-1j,1] (43)
式中[Di,2=Di,1+l2i,22+?2i,2 2]。
步驟[m]:設(shè)計第[m]步Lyapunov函數(shù)為:
[Vm=Vm-1+i=1N12z2i,m+12ri,mθTi,mθi,m] (44)
根據(jù)系統(tǒng)式(1)和式(17),可以推出:
[zi,m=zi,m+1+ξi,m+1+ai,m+1+θTi,mφi,m+θTi,mφi,m+?i,m-ai,m-ξi,m] (45)
對Lyapunov函數(shù)求導(dǎo)得到:
[Vm=Vm-1+i=1Nzi,m(zi,m+1+ξi,m+1+ai,m+1-ai.m-ξi,m+θTi,mφi,m+θTi,mφi,m+?i,m)-1ri,mθTi,mθi,m] (46)
根據(jù)引理4,以下不等式恒成立:
[zi,mli,msgnξi,m≤z2i,m2+l2i,m2zi,m?i,m≤z2i,m2+?2i,m 2] (47)
將設(shè)計的補償項式(20)、虛擬控制器式(24)、自適應(yīng)律式(28)和上述不等式代入式(46),可以計算出:
[Vm≤i=1Nl=1mzi,mzi,m+1-Ki,l,112κz2κi,l-Ki,l,212κz2κi,l+ri,lri,lθTi,lθi,l+1r2i,lθi,lθ2κ-1i,l+Di,m+j∈Niaijrj,1rj,1θTj,1θj,1+1r2j,1θj,1θ2κ-1j,1] (48)
式中[Di,m=Di,m-1+l2i,m2+?2i,m 2]。
步驟[n]:設(shè)計第[n]步Lyapunov函數(shù)為:
[Vn=Vn-1+i=1N12z2i,n+12ri,nθTi,nθi,n] (49)
根據(jù)系統(tǒng)式(1)和式(17),通過計算得到:
[zi,n=ui+θTi,nφi,n+θTi,nφi,n+?i,n-ai,n-ξi,n] (50)
對Lyapunov函數(shù)求導(dǎo)得到:
[Vn=Vn-1+i=1Nzi,n(ui-ai.n-ξi,n+θTi,nφi,n+θTi,nφi,n+?i,n)-1ri,nθTi,nθi,n] (51)
根據(jù)引理4,以下不等式恒成立:
[zi,nli,nsgnξi,n≤z2i,n2+l2i,n2zi,n?i,n≤z2i,n2+?2i,n 2] (52)
將設(shè)計的補償項式(21)、控制輸入式(25)、自適應(yīng)律式(28)和上述不等式代入式(51),可以得到:
[Vn≤i=1Nl=1n-Ki,l,1z2i,l2κ-Ki,l,2z2i,l2κ+ri,lri,lθTi,lθi,l+1r2i,lθi,lθ2κ-1i,l+Di,n+j∈Niaijrj,1rj,1θTj,1θj,1+1r2j,1θj,1θ2κ-1j,1] (53)
式中[Di,n=Di,n-1+l2i,n2+?2i,n 2]。
2.3" 穩(wěn)定性分析
證明:定義[εi,1=minKi,1,1,Ki,2,1,…,Ki,n,1],[εi,2=minKi,1,2,Ki,2,2,…,Ki,n,2],根據(jù)引理5,可以得到下述不等式:
[-k=1nKi,k,1z2i,k2κ≤-εi,1k=1nz2i,k2κ-k=1nKi,k,2z2i,k2κ≤-εi,2nκ-1k=1nz2i,k2κ] (54)
根據(jù)楊氏不等式可以得到:
[l=1nri,lri,lθTi,lθi,l≤-l=1nri,l2ri,lθ2i,l+l=1nri,l2ri,lθ*2i,lj∈Niaijrj,1rj,1θTj,1θj,1≤j∈Niaij(-rj,12rj,1θ2j,1+rj,12rj,1θ*2j,1)] (55)
通過參考文獻[26]和引理5可以推出:
[l=1n1r2i,lθi,lθ2κ-1i,l≤Θ*i,n-εi,nηκ-1l=1nθ2i,l2ri,lκj∈Niaij1r2j,1θj,1θ2κ-1j,1≤Θ*i-εil=1naijθ2j,l2rj,lκ] (56)
[l=1nri,l2ri,lθ2i,lκ≤?κ+l=1nri,l2ri,lθ2i,lrj,12rj,1θ2j,1κ≤?κ+rj,12rj,1θ2j,1] (57)
式中[?κ=1-κκκ/1-κgt;0]。通過計算得到:
[Vn≤i=1N-εi,1k=1nz2i,k2κ-εi,2nκ-1k=1nz2i,k2κ-εi,nηκ-1l=1nθ2i,l2ri,lκ-εij∈Niaijθ2j,12rj,1κ-l=1nri,l2ri,lθ2i,lκ-j∈Niaijrj,12rj,1θ2j,1κ+Dn] (58)
式中[Dn=Di,n+2?κ+l=1nri,l2ri,lθ*2i,l+j∈Niaijrj,12rj,1θ*2j,1+]
[Θ*i,n+Θ*i]。
通過式(58)和引理2,可以推出:
[Vn≤-γVκn-cVκn+Dn] (59)
式中:[γ=minεi,1,rκi,l,rκj,1];[c=minεi,2nκ-1,εi,nnκ-1,εi]。
根據(jù)引理2,可以確定系統(tǒng)的收斂時間并證明了系統(tǒng)的穩(wěn)定性。
步驟[n]+1:設(shè)計如下的Lyapunov函數(shù):
[Vn+1=i=1Nk=1n12ξ2i,k] (60)
對式(60)進行求導(dǎo)可得:
[Vn+1=i=1Nm=2n-1ξi,mai,m+1-ai,m+diξi,1ai,2-ai,1-k=1nli,kξi,k-1+diξ2i,1-j=2nξ2i,j≤i=1Ndiξi,1ai,2-ai,1+m=2n-1ξi,mai,m+1-ai,m-k=1nli,kξi,k-k=2nξ2i,k] (61)
根據(jù)文獻[27]可以得到[ai,k-ai,1≤ηi,k],其中,[k=1,2,…,n-1],[ηi,k]是一個已知常數(shù),可以推出:
[Vn+1≤-k=1nξ2i,k-li,1-diηi,1ξi,1-k=2n-1li,k-ηi,kξi,k-li,nξi,n≤-K1V1n+1-K2V12n+1] (62)
式中:[K2=2minli,1-diηi,1,li,k-ηi,k,li,n];[K1=Nn-3]。
根據(jù)引理2,[ξi,k]在固定時間內(nèi)收斂于原點。上述的基于固定時間的自適應(yīng)反演策略及其穩(wěn)定性分析總結(jié)在定理1。
定理1:對于具有未建模動態(tài)的高階MASs(1),在假設(shè)1和假設(shè)2成立的前提下,通過設(shè)計虛擬控制律式(22)~式(24)、控制輸入式(25)、誤差補償信號式(18)~式(21)以及自適應(yīng)律式(26)~式(28),可以保證誤差在固定時間內(nèi)收斂到平衡點的一個小鄰域,并且系統(tǒng)的輸出信號收斂到分布式優(yōu)化問題的最優(yōu)解[x*1]。
3" 數(shù)值仿真
為了驗證上文所提出的方法,在本節(jié)中進行了數(shù)值仿真。
考慮由5個智能體組成的MASs,其通信拓撲圖如圖1所示。
考慮到如下的二階MASs:
[xi,1=xi,2+hi,1Xi,1xi,2=ui+hi,2Xi,2yi=xi,1] (63)
式中:[i=1,2,3,4,5],各個智能體的初始狀態(tài)為:[x1(0)=[0.1,0.1]," x2(0)=[0.2,0.2]," x3(0)=[0.3,0.3],][x4(0)=[0.4,0.4]," x5(0)=[0.5,0.5]]。
設(shè)計系統(tǒng)中未建模動態(tài)為:
[h1,1=h2,1=h3,1=h4,1=h5,1=0h1,2=x1,1-0.25x1,2-x31,1h2,2=x2,1-0.25x2,2-x32,1+0.1x22,1+x22,212h3,2=x3,1-0.25x3,2-x33,1+0.2x23,1+2x23,212h4,2=x4,1-0.25x4,2-x34,1+0.22x24,1+2x24,212h5,2=x35,1+x25,2-x35,1+0.3x25,1+x25,212]
虛擬控制律、誤差補償信號、自適應(yīng)律以及控制輸入中參數(shù)部分的設(shè)計為:[Ki,1,1=Ki,2,1=0.8],[Ki,1,2=Ki,2,2=0.5],[κ=1113,κ=1513],[li,1=li,2=0.1],[ri,1=ri,2=rj,1=1],[ri,1=ri,2=rj,1=80]。由引理2和式(58)計算可知:[Tmax=14.13]。在這個數(shù)值仿真實驗中,令[b1=sint],[b2=2sint],[b3=3sint],[b4=4sint],[b5=5sint]。通過計算,可以得到最優(yōu)解[x*1=3sint]。
根據(jù)懲罰函數(shù)的定義式(6),求解分布式優(yōu)化問題的最優(yōu)條件為:
[?P(x*1)?x*1=0]
圖2~圖5為仿真結(jié)果。圖2表明了每個智能體的輸出最終與最優(yōu)解保持一致,可以看出圖中存在一定的誤差。圖3表示的是跟蹤誤差的軌跡[si,1],可以清楚地看出[si,1]在5 s內(nèi)收斂到0,滿足引理2的[Ts≤Tmax]。圖4表示的是系統(tǒng)的控制輸入。圖5顯示了懲罰函數(shù)梯度的值,從圖中可以看出,梯度在固定時間內(nèi)很好地收斂到零,這符合求解分布式優(yōu)化問題的最優(yōu)條件。
由數(shù)值仿真結(jié)果可見,該算法可以保證具有未建模動態(tài)的高階MASs中所有智能體的輸出均在固定時間內(nèi)收斂到最優(yōu)解。跟蹤誤差在固定時間內(nèi)收斂到一個小的原點區(qū)域,同時,懲罰函數(shù)的梯度能夠成功收斂到零。采用該方法所設(shè)計的控制器不僅保證所有智能體在固定時間內(nèi)能夠達到共識,而且還考慮了MASs的分布式優(yōu)化問題。
4" 結(jié)" 語
本文研究了具有未建模動態(tài)的高階MASs的分布式優(yōu)化問題。首先在懲罰函數(shù)的基礎(chǔ)上,解除一致性約束條件來重構(gòu)全局目標函數(shù),使得所有智能體的輸出既能達到共識,又能達到分布式優(yōu)化問題的最優(yōu)解;然后,通過引入命令濾波技術(shù)來避免固定時間回溯控制中產(chǎn)生的“奇點”和“復(fù)雜性爆炸”問題。最后通過Lyapunov穩(wěn)定性理論證明了所有輸出信號在固定時間內(nèi)能夠達到最優(yōu)解。仿真結(jié)果表明,所提出的方法可以使得系統(tǒng)在固定時間內(nèi)達到共識,并且收斂到最優(yōu)軌跡。下一步的工作是研究具有隨機擾動的MASs分布式優(yōu)化問題。
參考文獻
[1] BAI W W, ZHANG W J, CAO L, et al. Adaptive control for multi?agent systems with actuator fault via reinforcement learning and its application on multi?unmanned surface vehicle [J]. Ocean engineering, 2023, 280: 114545.
[2] 王琪,范慶東.彈性模型結(jié)合改進滑模控制器的無人機協(xié)同控制[J].電光與控制,2022,29(11):44?49.
[3] ZHAO L, JIA Y M. Decentralized adaptive attitude synchronization control for spacecraft formation using nonsingular fast terminal sliding mode [J]. Nonlinear dynamics, 2014, 78(4): 2779?2794.
[4] 索良澤,王冬,王紅蕾,等.無線網(wǎng)絡(luò)通信下多無人飛行器編隊飛行控制[J].電光與控制,2018,25(9):49?52.
[5] ZHENG Y L, LIU Q S. A review of distributed optimization: Problems, models and algorithms [J]. Neurocomputing, 2022, 483: 446?459.
[6] LI S L, NIAN X H, DENG Z H. Distributed optimization of general linear multi?agent systems with external disturbance [J]. Journal of the Franklin Institute, 2021, 358(11): 5951?5970.
[7] KIA S S, CORTéS J, MARTíNEZ S. Periodic and event?triggered communication for distributed continuous?time convex optimization [C]// 2014 American Control Conference. New York: IEEE, 2014: 5010?5015.
[8] DENG Z H, WANG X H, HONG Y G. Distributed optimisation design with triggers for disturbed continuous?time multi?agent systems [J]. IET control theory amp; applications, 2017, 11(2): 282?290.
[9] XU G H, GUAN Z H, HE D X, et al. Distributed tracking control of second?order multi?agent systems with sampled data [J]. Journal of the Franklin Institute, 2014, 351(10): 4786?4801.
[10] YANG F, YU Z, HUANG D, et al. Distributed optimization for second?order multi?agent systems over directed networks [J]. Mathematics, 2022, 10(20): 3803.
[11] MO L P, HU H K, YU Y G, et al. Distributed optimization without boundedness of gradients for second?order multi?agent systems over unbalanced network [J]. Information sciences, 2021, 565: 177?195.
[12] XIE Y J, LIN Z L. Global optimal consensus for higher?order multi?agent systems with bounded controls [J]. Automatica, 2019, 99: 301?307.
[13] QIN Z Y, LIU T F, JIANG Z P. Distributed optimization of nonlinear uncertain systems: An adaptive backstepping design [J]. IFAC?PapersOnLine, 2020, 53(2): 5653?5658.
[14] YAO Y H, YUAN J X, CHEN T, et al. Distributed convex optimization of bipartite containment control for high?order nonlinear uncertain multi?agent systems with state constraints [J]. Mathematical biosciences and engineering, 2023, 20(9): 17296?17323.
[15] LIN P, REN W, FARRELL J A. Distributed continuous?time optimization: Nonuniform gradient gains, finite?time convergence, and convex constraint set [J]. IEEE transactions on automatic control, 2016, 62(5): 2239?2253.
[16] HU Z L, YANG J Y. Distributed finite?time optimization for second order continuous?time multiple agents systems with time?varying cost function [J]. Neurocomputing, 2018, 287: 173?184.
[17] POLYAKOV A. Nonlinear feedback design for fixed?time stabilization of linear control systems [J]. IEEE transactions on automatic control, 2011, 57(8): 2106?2110.
[18] YU Z Y, YU S Z, JIANG H J, et al. Distributed fixed?time optimization for multi?agent systems over a directed network [J]. Nonlinear dynamics, 2021, 103: 775?789.
[19] CHEN G, LI Z Y. A fixed?time convergent algorithm for distributed convex optimization in multi?agent systems [J]. Automatica, 2018, 95: 539?543.
[20] 劉建剛,黃志武,王晶.不確定多智能體互聯(lián)動態(tài)系統(tǒng)分布式魯棒[H∞]協(xié)同控制[J].控制與決策,2014,29(7):1267?1273.
[21] SUN X M, WANG W. Integral input?to?state stability for hybrid delayed systems with unstable continuous dynamics [J]. Automatica, 2012, 48(9): 2359?2364.
[22] DONG G E, LI X M, YAO D Y, et al. Command filtered fixed?time control for a class of multi?agent systems with sensor faults [J]. International journal of robust and nonlinear control, 2021, 31(18): 9588?9603.
[23] LIU Y C, ZHU Q D, ZHAO N, et al. Adaptive fuzzy backstepping control for nonstrict feedback nonlinear systems with time?varying state constraints and backlash?like hysteresis [J]. Information sciences, 2021, 574: 606?624.
[24] 劉宜成,熊宇航,楊海鑫.基于RBF神經(jīng)網(wǎng)絡(luò)的多關(guān)節(jié)機器人固定時間滑模控制[J].控制與決策,2022,37(11):2790?2798.
[25] HUA C C, LI Y F, GUAN X P. Finite/fixed?time stabilization for nonlinear interconnected systems with dead?zone input [J]. IEEE transactions on automatic control, 2017, 62(5): 2554?2560.
[26] WANG F, LAI G Y. Fixed?time control design for nonlinear uncertain systems via adaptive method [J]. Systems amp; control letters, 2020, 140: 104704.
[27] FARRELL J A, POLYCARPOU M M, SHARMA M, et al. Command filtered backstepping [J]. IEEE transactions on automatic control, 2009, 54(6): 1391?1395.
作者簡介:孫" 慶(2001—),女,江蘇人,在讀研究生,研究方向為多智能體分布式優(yōu)化。
楊" 慧(1977—),女,山東人,博士,講師,研究方向為多智能體分布式優(yōu)化。