李枝強(qiáng) ,劉 洋 ,周 琪 ,魯仁全
(1.廣東工業(yè)大學(xué)廣東省智能決策與協(xié)同控制重點(diǎn)實(shí)驗(yàn)室,廣東廣州 510006;2.山東交通學(xué)院航運(yùn)學(xué)院,山東威海 264200)
近年來(lái),多智能體系統(tǒng)協(xié)同控制因其通信成本低、靈活性與魯棒性高等特點(diǎn),在衛(wèi)星集群、無(wú)人車(chē)跟蹤、移動(dòng)機(jī)器人等領(lǐng)域得到了廣泛應(yīng)用[1-4].作為協(xié)同控制的基本問(wèn)題,一致性跟蹤控制受到了國(guó)內(nèi)外專(zhuān)家學(xué)者的廣泛關(guān)注,并取得了大量研究成果[5-8].實(shí)際系統(tǒng)大多是本質(zhì)非線性的,而神經(jīng)網(wǎng)絡(luò)(neural network,NN)作為一種處理非線性的有效手段,廣泛應(yīng)用于控制器設(shè)計(jì)中[9-16].其中,文獻(xiàn)[12]采用NN逼近嚴(yán)格反饋系統(tǒng)的未知非線性函數(shù),并基于動(dòng)態(tài)面技術(shù)設(shè)計(jì)了自適應(yīng)NN控制器,解決了傳統(tǒng)反步法的“計(jì)算爆炸”問(wèn)題.文獻(xiàn)[13]針對(duì)一類(lèi)具有周期擾動(dòng)的純反饋非線性系統(tǒng),提出了自適應(yīng)NN控制方法,放寬了未知非仿射函數(shù)的有界條件,并消除了非仿射函數(shù)可微的限制.文獻(xiàn)[14]研究了一類(lèi)非嚴(yán)格反饋系統(tǒng)的自適應(yīng)NN控制問(wèn)題,利用系統(tǒng)邊界函數(shù)的單調(diào)性和徑向基NN的結(jié)構(gòu)特征,克服了非嚴(yán)格反饋結(jié)構(gòu)帶來(lái)的設(shè)計(jì)困難.文獻(xiàn)[15]提出了一種自適應(yīng)NN容錯(cuò)控制方法,利用NN逼近大系統(tǒng)的非線性互聯(lián)項(xiàng),并設(shè)計(jì)了擾動(dòng)觀測(cè)器對(duì)逼近誤差、未知死區(qū)和外部擾動(dòng)組成的復(fù)合擾動(dòng)進(jìn)行估計(jì).文獻(xiàn)[16]將NN擴(kuò)展到多智能體系統(tǒng)的研究中,設(shè)計(jì)了NN狀態(tài)觀測(cè)器,解決了高階非線性多智能體系統(tǒng)的狀態(tài)不可測(cè)問(wèn)題.然而,文獻(xiàn)[9-16]采用的傳統(tǒng)NN不能準(zhǔn)確逼近未知非線性.為了得到更好的逼近效果和期望性能,文獻(xiàn)[17]提出了一種復(fù)合NN動(dòng)態(tài)面控制方法,在權(quán)值更新律的設(shè)計(jì)中引入預(yù)測(cè)誤差,實(shí)現(xiàn)了對(duì)未知非線性函數(shù)的精確逼近.文獻(xiàn)[18]采用文獻(xiàn)[17]提出的思想,設(shè)計(jì)了基于NN和擾動(dòng)觀測(cè)器的估計(jì)模型,解決了具有時(shí)變擾動(dòng)的未知非線性系統(tǒng)自適應(yīng)控制問(wèn)題.文獻(xiàn)[17-18]將復(fù)合自適應(yīng)律的設(shè)計(jì)思想引入簡(jiǎn)單系統(tǒng)中,得到了準(zhǔn)確逼近的效果.
系統(tǒng)受物理器件和外界條件的限制,在控制過(guò)程中往往需要對(duì)跟蹤誤差進(jìn)行約束,從而保證系統(tǒng)安全穩(wěn)定運(yùn)行.漏斗控制作為一種有效的約束方法,可以較好地調(diào)節(jié)閉環(huán)系統(tǒng)穩(wěn)態(tài)和瞬態(tài)響應(yīng).目前,針對(duì)漏斗控制的研究已取得了豐碩的成果[19-24].其中,文獻(xiàn)[22]首次提出了漏斗控制設(shè)計(jì)思想,并通過(guò)簡(jiǎn)單的誤差反饋控制,使跟蹤誤差滿(mǎn)足規(guī)定約束.文獻(xiàn)[23]將漏斗誤差變換與動(dòng)態(tài)面技術(shù)相結(jié)合,提高了嚴(yán)格反饋系統(tǒng)的輸出性能.文獻(xiàn)[24]改進(jìn)了漏斗誤差變換,解決了文獻(xiàn)[23]中跟蹤誤差為零時(shí)存在的不可微問(wèn)題.需要指出的是,上述研究?jī)H能得到漸近穩(wěn)定的結(jié)果,而實(shí)際工程控制中往往需要閉環(huán)系統(tǒng)在有限時(shí)間內(nèi)達(dá)到穩(wěn)定狀態(tài).為此,文獻(xiàn)[25]針對(duì)非仿射非線性系統(tǒng),設(shè)計(jì)了自適應(yīng)有限時(shí)間漏斗控制器,使閉環(huán)系統(tǒng)中的信號(hào)均為半全局實(shí)際有限時(shí)間有界的.文獻(xiàn)[26]針對(duì)具有未知輸入約束的永磁同步電機(jī)系統(tǒng),提出了一種有限時(shí)間NN漏斗控制方法,使跟蹤誤差有限時(shí)間穩(wěn)定且約束在規(guī)定的漏斗邊界內(nèi).但文獻(xiàn)[25-26]提出的有限時(shí)間都受限于系統(tǒng)初始條件和設(shè)計(jì)參數(shù),且設(shè)計(jì)過(guò)程相對(duì)復(fù)雜.
鑒于以上分析,本文研究一類(lèi)具有未知非線性和時(shí)變擾動(dòng)的多智能體系統(tǒng)一致性跟蹤問(wèn)題,設(shè)計(jì)基于精確估計(jì)的預(yù)設(shè)有限時(shí)間(preassigned finite-time,PFT)漏斗復(fù)合控制器.不同于文獻(xiàn)[25-26]的結(jié)果,本文提出的PFT漏斗控制方法保證跟蹤誤差收斂時(shí)間的獨(dú)立性和靈活性,并且設(shè)計(jì)過(guò)程簡(jiǎn)單.此外,盡管文獻(xiàn)[18]在文獻(xiàn)[17]的基礎(chǔ)上處理了外界擾動(dòng)對(duì)系統(tǒng)的影響,但是它們的研究對(duì)象均為簡(jiǎn)單的非線性系統(tǒng),無(wú)法直接應(yīng)用到復(fù)雜的多智能體系統(tǒng)中,而本文結(jié)合智能體間的拓?fù)浣Y(jié)構(gòu)與權(quán)值復(fù)合更新律的設(shè)計(jì)思想,建立復(fù)合估計(jì)模型來(lái)提高逼近精度,進(jìn)而增強(qiáng)多智能體系統(tǒng)的魯棒性.
本文采用圖論描述智能體間的通信拓?fù)?定義有向圖G=(V,E,A).其中,V=(v1,v2,···,vN)為N個(gè)智能體的非空集合,E ?V ×V為智能體邊的集合,(vi,vj)∈E表示智能體i接收到智能體j的信息.智能體i的鄰接節(jié)點(diǎn)集合表示為Ni={vj ∈|(vi,vj).定義權(quán)重鄰接矩陣為A=[ai,j]∈RN×N,如果(vi,vj)∈E,那么ai,j >0;否則ai,j=0.假設(shè)拓?fù)鋱D中不存在自環(huán),即ai,i=0,?i ∈V.定義節(jié)點(diǎn)i的入度矩陣為bi=,入度對(duì)角矩陣R=diag{b1,b2,···,bN},則圖G的拉普拉斯矩陣為L(zhǎng)=R-A.定義H=diag{a1,0,a2,0,···,aN,0},如果節(jié)點(diǎn)i能接收到領(lǐng)導(dǎo)者0的信息,則ai,0>0;否則,ai,0=0.
引理1[5]如果存在一條路徑能夠從根節(jié)點(diǎn)0到達(dá)所有其他節(jié)點(diǎn),那么稱(chēng)有向圖G具有一個(gè)生成樹(shù),則矩陣L+H是非奇異的.
假設(shè)1[6]領(lǐng)導(dǎo)者的信號(hào)y0只能被部分智能體直接獲取.且y0已知,y0及其導(dǎo)數(shù)均為連續(xù)有界的.
本文研究的多智能體系統(tǒng)包含N個(gè)跟隨者,第i個(gè)跟隨者可描述為一類(lèi)具有未知非線性與時(shí)變擾動(dòng)的ni階嚴(yán)格反饋系統(tǒng)
漏斗控制通過(guò)引入時(shí)變的控制增益?(t)達(dá)到控制目的,文獻(xiàn)[22]將漏斗控制的控制輸入定義如下:
其中:Fψ(t)為漏斗邊界;‖e(t)‖為跟蹤誤差的歐幾里得范數(shù).
控制增益?(t)可選擇為
注1根據(jù)文獻(xiàn)[19-26]中采用的漏斗邊界可知,其需在時(shí)間趨于無(wú)窮時(shí)收斂于ρ∞.相比之下,本文所設(shè)計(jì)的PFT漏斗邊界具有更好的暫態(tài)性能,因其可在有限時(shí)間Ti收斂到提前設(shè)定的界內(nèi),這也體現(xiàn)了設(shè)計(jì)方法的靈活性.
本節(jié)設(shè)計(jì)了一種PFT漏斗復(fù)合控制器,使跟蹤誤差約束在PFT漏斗內(nèi),并保證閉環(huán)系統(tǒng)中的所有信號(hào)均為有界的.基于NN的逼近特性,系統(tǒng)(1)可轉(zhuǎn)換為如下形式:
本節(jié)采用Lyapunov函數(shù)對(duì)多智能體系統(tǒng)進(jìn)行穩(wěn)定性分析.
定理1在假設(shè)1和假設(shè)2成立的條件下,考慮虛擬控制信號(hào)(17)(26)(32),實(shí)際控制器(36),濾波補(bǔ)償信號(hào)(19)(28)(33)(37),NN權(quán)值的復(fù)合更新律(21)(30)(34)(38),如果跟蹤誤差ei,1(t)的初始條件滿(mǎn)足ei,1(0)<Fψ,i(0),則多智能體系統(tǒng)(1)的所有信號(hào)均為有界的,且跟蹤誤差ei,1(t)約束在規(guī)定的PFT漏斗邊界內(nèi).
證選取Lyapunov函數(shù)為
由式(43),得
從式(44)可知,當(dāng)t →∞時(shí),V →(κ/μ).可以證明Lyapunov函數(shù)(40)中的所有信號(hào)均為有界的.并由式(6)可得誤差|ξi,1|和|ei,r|是有界的,令
其中邊界?的大小與設(shè)計(jì)參數(shù)有關(guān).
根據(jù)式(45),得
將式(2)代入式(46),得
由式(47)得
則多智能體的跟蹤誤差約束在PFT漏斗邊界內(nèi),并且通過(guò)調(diào)整設(shè)計(jì)參數(shù)可以使跟蹤誤差任意減小.
證畢.
為驗(yàn)證所提出控制方法的有效性,本節(jié)考慮的多智能體系統(tǒng)由4個(gè)跟隨者和1個(gè)領(lǐng)導(dǎo)者組成,每個(gè)跟隨者為具有時(shí)變擾動(dòng)的二階嚴(yán)格反饋非線性系統(tǒng)
多智能體通信拓?fù)湟?jiàn)圖1.其中領(lǐng)導(dǎo)者的輸出信號(hào)為y0=sint.假設(shè)所有邊的權(quán)重都為1,跟隨者與領(lǐng)導(dǎo)者之間的連接權(quán)重為H=diag{1,0,1,0},選擇鄰接矩陣A與拉普拉斯矩陣L如下:
圖1 通信拓?fù)鋱DFig.1 Communication topology
在仿真中,初值設(shè)置為xi,1(0)=(0)=[0.1 0 0.1 0],xi,2(0)=(0)=[0 0 0 0],si,1(0)=[0.9 1 0.9 1],si,2(0)=[0.1 0 0.1 0],(0)=(0)=[0 0 0 0].將NN初始權(quán)值設(shè)為0,其中xi,1,xi,2的中心點(diǎn)在[-1,1],[-2,2]均勻間隔,對(duì)fi,1選擇NN節(jié)點(diǎn)數(shù)為?i,1=7,對(duì)fi,2選擇NN 節(jié)點(diǎn)數(shù)為?i,2=25.選取設(shè)計(jì)參數(shù)的值為ρi,0=1,ki,1=ki,2=10,ρi,Ti=0.02,Ti=0.1,τi,1=0.005,βi,1=βi,2=1,γi,1=γi,2=1,γηi,1=γηi,2=50,δi,1=δi,2=10,λi,1=λi,2=10.
仿真結(jié)果如圖2-6所示.圖2為跟隨者yi的跟蹤效果圖,在較短的時(shí)間實(shí)現(xiàn)了一致性跟蹤.圖3為跟蹤誤差,由圖3(a)可知,漏斗控制使跟蹤誤差約束在給定的漏斗邊界內(nèi);對(duì)比圖3(a)和3(b)可看出,不具有PFT漏斗控制的跟蹤誤差漸近穩(wěn)定且穩(wěn)態(tài)誤差接近0.02,而加入PFT漏斗控制后的跟蹤誤差在預(yù)設(shè)時(shí)間0.1 s前穩(wěn)定且穩(wěn)態(tài)誤差小于0.0001,因此,PFT漏斗控制顯著減小了一致性跟蹤的穩(wěn)態(tài)誤差,并保證誤差在預(yù)設(shè)時(shí)間內(nèi)收斂.圖4-5給出了未知非線性和時(shí)變擾動(dòng)的逼近效果,由圖4(a)和5(a)可知,采用NN和擾動(dòng)觀測(cè)器的復(fù)合估計(jì)模型,能精確估計(jì)多智能體系統(tǒng)的未知非線性和時(shí)變擾動(dòng);與圖4(b)和5(b)的傳統(tǒng)NN逼近方法相比,本文設(shè)計(jì)的復(fù)合更新率使估計(jì)模型具有更精確的逼近效果.圖6為控制器輸入ui,系統(tǒng)穩(wěn)定后控制輸入均小于3,表明該控制器能耗較低、性能良好.
圖2 參考信號(hào)y0和輸出信號(hào)yiFig.2 Reference signal y0 and output yi
圖3 跟蹤誤差ei,1Fig.3 Tracking errors ei,1
圖4 兩種估計(jì)(fi,1+di,1)的方法Fig.4 Two estimation methods of(fi,1+di,1)
圖5 兩種估計(jì)(fi,2+di,2)的方法Fig.5 Two estimation methods of(fi,2+di,2)
圖6 控制信號(hào)uiFig.6 Control signal ui
本文研究了具有未知非線性和時(shí)變擾動(dòng)的多智能體系統(tǒng)一致性跟蹤問(wèn)題.在控制器設(shè)計(jì)過(guò)程中,引入了PFT漏斗控制方法,使跟蹤誤差約束在PFT漏斗內(nèi),達(dá)到了預(yù)設(shè)時(shí)間收斂的目標(biāo).建立了基于NN和擾動(dòng)觀測(cè)器的復(fù)合估計(jì)模型,精確估計(jì)了多智能體系統(tǒng)的未知非線性和時(shí)變擾動(dòng).并結(jié)合動(dòng)態(tài)面技術(shù)設(shè)計(jì)了基于精確估計(jì)的PFT漏斗復(fù)合控制器,實(shí)現(xiàn)了對(duì)領(lǐng)導(dǎo)者的一致性跟蹤.通過(guò)仿真驗(yàn)證了該方法的有效性.在未來(lái)研究中,考慮將該方法應(yīng)用于更復(fù)雜的環(huán)境中.