魏永東,李宗剛,杜亞江,陳引娟
(蘭州交通大學(xué)機(jī)電工程學(xué)院,甘肅蘭州 730070;蘭州交通大學(xué)機(jī)器人研究所,甘肅蘭州 730070)
近年來(lái),由于在智能電網(wǎng)、多機(jī)器人系統(tǒng)協(xié)同等復(fù)雜網(wǎng)絡(luò)化系統(tǒng)建模與控制中的廣泛應(yīng)用,多智能體系統(tǒng)(multi-agent system,MAS)協(xié)同控制得到了深入研究,并取得了豐碩的成果[1–5].
在多智能體系統(tǒng)的研究中,人們采用了多種經(jīng)典控制方法,包括在給定時(shí)間區(qū)間內(nèi)能快速跟蹤期望軌跡的迭代學(xué)習(xí)(iterative learning control,ILC)方法[6–9].對(duì)于連續(xù)的系統(tǒng),文獻(xiàn)[10]建立相應(yīng)分布式ILC控制律,保證輸入輸出型線性系統(tǒng)的MAS在給定時(shí)間區(qū)間達(dá)成一致性.文獻(xiàn)[11]研究了具有不確定性和存在擾動(dòng)情形下的二階多智能體系統(tǒng)ILC一致性問(wèn)題.文獻(xiàn)[12]基于給出的初態(tài)可學(xué)習(xí)分布式ILC協(xié)議,研究了固定拓?fù)浣Y(jié)構(gòu)下非線性多智能體系統(tǒng)的一致性問(wèn)題.而對(duì)于離散的系統(tǒng),文獻(xiàn)[13]中的拓?fù)浣Y(jié)構(gòu)在有限區(qū)間的時(shí)間軸和無(wú)限增加的迭代軸雙變化,根據(jù)個(gè)體智能體所能獲得的局部信息建立的分布式ILC更新律保證了線性系統(tǒng)MAS完成編隊(duì).文獻(xiàn)[14]考慮了存在時(shí)間延時(shí)和拓?fù)浣Y(jié)構(gòu)變化的情況,根據(jù)局部信息建立的分布式ILC能夠保證所有線性系統(tǒng)智能體達(dá)成輸出一致性.文獻(xiàn)[15]在面對(duì)拓?fù)浣Y(jié)構(gòu)改變、初態(tài)漂移和存在擾動(dòng)的情況,使用分布式ILC的方法仍能使非線性系統(tǒng)的MAS完成編隊(duì).值得注意的是,將ILC代入到MAS中,很多變量將會(huì)是沿時(shí)間軸和迭代軸雙變化的,這增加了保證MAS達(dá)成一致性對(duì)通信拓?fù)浣Y(jié)構(gòu)的要求.若在此情況下,若通信拓?fù)湟彩茄貢r(shí)間軸和迭代軸雙變化的,這很自然的使整個(gè)MAS變成了一個(gè)二維(2D)的動(dòng)態(tài)變化系統(tǒng)[14].此外,在變拓?fù)錀l件下ILC學(xué)習(xí)增益的求解大都要求系統(tǒng)通訊拓?fù)浣Y(jié)構(gòu)的變化規(guī)律已知[12–15].在實(shí)際應(yīng)用中,傳感器測(cè)量范圍有限在某些情形下也對(duì)多智能體系統(tǒng)能否求解一致性問(wèn)題帶來(lái)了挑戰(zhàn),針對(duì)這一問(wèn)題也取得了一些成果.文獻(xiàn)[16]研究了具有固定拓?fù)淝掖嬖谳斎腼柡偷囊浑A多智能體一致性問(wèn)題.文獻(xiàn)[17]研究固定和變化的無(wú)向拓?fù)浣Y(jié)構(gòu)下輸入飽和的情況.文獻(xiàn)[18]研究了固定無(wú)向拓?fù)浣Y(jié)構(gòu)下,個(gè)體動(dòng)態(tài)特性為離散系統(tǒng)且存在輸入飽和的情況.文獻(xiàn)[19]研究了在無(wú)向拓?fù)浣Y(jié)構(gòu)下,存在輸出飽和且基于事件觸發(fā)機(jī)制下多智能體一致性問(wèn)題.此外,文獻(xiàn)[20]考慮了測(cè)量受限與存在測(cè)量噪聲的影響,用飽和函數(shù)對(duì)測(cè)量受限進(jìn)行建模,給出了實(shí)際測(cè)量值與輸出之間的函數(shù)關(guān)系,建立了通訊拓?fù)鋬H沿時(shí)間軸切換時(shí)的一致性問(wèn)題可解條件.
受文獻(xiàn)[20]啟發(fā),本文考慮連續(xù)正則線性多智能體系統(tǒng)測(cè)量受限一致性問(wèn)題,其中智能體之間的通信拓?fù)溲貢r(shí)間軸和迭代軸兩個(gè)維度變化,給出此類系統(tǒng)可解一致性問(wèn)題的條件.與文獻(xiàn)[18]和文獻(xiàn)[20]所考慮的離散線性系統(tǒng)相比,由于測(cè)量受限的存在而引入了非光滑的飽和函數(shù),這為分析連續(xù)系統(tǒng)帶來(lái)相關(guān)困難.此外,與單一變化或是固定無(wú)向拓?fù)浣Y(jié)構(gòu)相比,本文采用分布式迭代學(xué)習(xí)控制方法且拓?fù)浣Y(jié)構(gòu)沿時(shí)間軸和迭代軸雙變化,這也為達(dá)成一致性增加了困難.而且,與文獻(xiàn)[16–20]相比,連續(xù)的正則線性系統(tǒng)中在狀態(tài)和輸出兩處都由輸入引入了測(cè)量值而非實(shí)時(shí)的真實(shí)值,這為所探索的問(wèn)題進(jìn)一步的增加了困難.
多智能體系統(tǒng)中個(gè)體之間的通訊拓?fù)淅糜邢驁D表示,記為G=(V,E,A),其中:n為智能體的個(gè)數(shù),V={v1,v2,···,vn}為頂點(diǎn)集合,E ?V×V為邊集,A=[aij]為鄰接矩陣,aij≥0,aii=0.當(dāng)aij >0時(shí),(vj,vi)∈E,表明智能體i能夠接收到智能體j的相關(guān)信息.Ni={vl ∈V:(vl,vi)∈E}表示智能體vi的鄰居集.取,圖G的度矩陣表示為D=diag{d1,d2,···,dn}.L=D ?A為圖G的拉普拉斯矩陣.如果圖G中至少存在一個(gè)頂點(diǎn)vi,對(duì)圖中任一其他節(jié)點(diǎn)vj,總存在首尾相連的一組邊則稱圖G含有生成樹(shù).此外,I表示單位矩陣,A>0(A≥0)表示矩陣A的所有元素都為正(非負(fù)),?n={1,2,···,n},A ?B表示矩陣A和B的kronecker 積.diag{x1,x2,···,xn}表示以xi為元素的對(duì)角矩陣.N+={0,1,2,···},1n=[1 1···1]T∈Rn.
考慮由n個(gè)跟隨著和1個(gè)虛擬領(lǐng)導(dǎo)者組成的多智能體系統(tǒng)一致性問(wèn)題,其跟隨者vi的動(dòng)力學(xué)方程為
其中:i ∈?n,k ∈N+和t ∈[T1,T2](0 ≤T1 所考慮系統(tǒng)中的虛擬領(lǐng)導(dǎo)者v0的動(dòng)力學(xué)方程形如系統(tǒng)(1),系統(tǒng)矩陣仍為A(t),B(t),C(t),D(t),相應(yīng)的期望輸入為ud(t),期望狀態(tài)為xd(t),期望輸出為yd(t).需要說(shuō)明的是,在本文所考慮的多智能體系統(tǒng)中,只有部分跟隨者能夠獲得虛擬領(lǐng)導(dǎo)者信息的情形.當(dāng)跟隨者vi(i ∈?n)接收到虛擬領(lǐng)導(dǎo)者v0的信息時(shí),取qi,k(t)=1,否則qi,k(t)=0.令 考慮跟隨者智能體測(cè)量受限時(shí)由式(1)給出的多智能體系統(tǒng)一致性問(wèn)題.為此設(shè)r0>0為一給定常數(shù),領(lǐng)導(dǎo)者智能體的輸出yd(t)的元滿足,i=1,···,m.跟隨者智能體傳感器的量程為[?r0,r0].智能體vi與其鄰居之間的通信方式如圖1所示. 圖1 跟隨者智能體vi通信方式Fig.1 Communication mechanism of agent vi 定義跟隨者vi的輸出誤差信號(hào)為 則所考慮一致性問(wèn)題轉(zhuǎn)化為設(shè)計(jì)一個(gè)分布式控制律ui,k(t),使得對(duì)每一個(gè)跟隨者智能體,均有 成立.為此,在設(shè)計(jì)基于迭代學(xué)習(xí)方法的控制律之前,先給出關(guān)于系統(tǒng)的兩個(gè)約定條件,以及將要用到的3個(gè)引理. 假設(shè)1對(duì)由式(1)給出的測(cè)量受限多智能體系統(tǒng),每次迭代時(shí)所有智能體的初態(tài)均能重置,即有 成立. 注1在迭代學(xué)習(xí)控制中,關(guān)于初態(tài)重置的假設(shè)是一個(gè)基本條件,它在某些問(wèn)題中是軌跡能夠完美跟蹤期望的保證[9].該方法引入多智能體系統(tǒng)領(lǐng)域后,初態(tài)重置的條件也普遍存在[4,12–13,16]. 假設(shè)2對(duì)由式(1)給出的測(cè)量受限多智能體系統(tǒng),其通信拓?fù)溆蓤D表示.假設(shè)始終含有以領(lǐng)導(dǎo)者v0為根節(jié)點(diǎn)的生成樹(shù)且信息切換拓?fù)涞慕Y(jié)構(gòu)已知,其中k ∈N+,t ∈[T1,T2]. 引理1[20]考慮由式(1)給出的測(cè)量受限多智能體系統(tǒng),其通信拓?fù)鋱D為,拉普拉斯矩陣由式(3)表示.若圖滿足假設(shè)2,則 的所有特征值具有正實(shí)部. 引理2[21]設(shè)x(t),y(t)是[T1,T2]上的實(shí)值連續(xù)函數(shù),a≥0,若 注2引理1的證明參見(jiàn)文獻(xiàn)[21]中附錄部分關(guān)于Bellman-Gronwall的證明,其中只需將積分下限由0變?yōu)門(mén)1即可,此處從略. 引理3[12]對(duì)任意給定的矩陣M ∈Rn×n,若其譜半徑ρ(M)<1,則至少存在一種矩陣范數(shù)‖·‖s,使得 定義1[12]‖M(t)‖s表示矩陣M在t時(shí)刻的某種范數(shù),基于此s–范數(shù)定義一個(gè)λ–范數(shù),其表達(dá)式如下: 其中λ>0且可任意取值. 注3需要說(shuō)明的是,在文中其他部分范數(shù)‖·‖s均以‖·‖代替. 為實(shí)現(xiàn)控制目標(biāo)(5),式(1)所示跟隨者智能體基于迭代學(xué)習(xí)方法的控制律取為 由式(1)和式(4),所有跟隨者智能體的輸入、輸出和誤差信號(hào)可寫(xiě)為 則式(7)所示跟隨者智能體的控制律的向量形式為 其中σk(t)=diag{σ1,k(t),···,σn,k(t)}. 定理1考慮由式(1)給出的測(cè)量受限多智能體系統(tǒng),其通信拓?fù)錆M足假設(shè)2.若跟隨者智能體每次迭代初態(tài)滿足假設(shè)1,且其迭代學(xué)習(xí)控制律由式(7)給出.那么,如果學(xué)習(xí)增益γk(t)滿足不等式 其中 則隨著迭代次數(shù)k的增加,所有跟隨者智能體的輸出均收斂到虛擬領(lǐng)導(dǎo)者的輸出,即式(5)成立. 證由式(4)和式(9)關(guān)于輸出誤差的定義,得到 我們都知道,企業(yè)的建立以及發(fā)展必定會(huì)存在著風(fēng)險(xiǎn)。應(yīng)收賬款制度的實(shí)施,必須認(rèn)清其可能會(huì)帶來(lái)的各種風(fēng)險(xiǎn)問(wèn)題,只有正確認(rèn)識(shí)了其可能帶來(lái)的風(fēng)險(xiǎn),我們才能夠制定正確的解決方案,而這些,很多企業(yè)往往是做不到的。對(duì)于風(fēng)險(xiǎn)問(wèn)題,企業(yè)沒(méi)有考慮周全,就很容易導(dǎo)致大量的應(yīng)收賬款不能按期收回,形成呆賬、壞賬的現(xiàn)象。企業(yè)沒(méi)有正確認(rèn)識(shí)到此制度帶來(lái)的風(fēng)險(xiǎn)問(wèn)題,只盲目地開(kāi)展應(yīng)收賬款,沒(méi)有做好回收工作,信用體系沒(méi)有建立健全,很容易就會(huì)導(dǎo)致企業(yè)陷入破產(chǎn)的境地。故對(duì)應(yīng)收賬款制度所帶來(lái)的風(fēng)險(xiǎn)認(rèn)識(shí)不足也是一個(gè)現(xiàn)存的問(wèn)題。 其中Γk(t)如式(12)所示.則有 上式兩端取范數(shù),易得 上式等號(hào)兩端同乘上e?λt,可得 此外,由式(1)可得 對(duì)式(15)兩端取范數(shù),可得 由定義1可知,λ可自由選取,故當(dāng)選取充分大的λ時(shí),上面不等式的右邊第二項(xiàng)可忽略不計(jì),所以當(dāng)滿足條件(11)時(shí),隨著迭代次數(shù)k的不斷增加,ek(t)將趨于0,即所有跟隨者智能體的輸出均收斂到虛擬領(lǐng)導(dǎo)者的輸出. 最后由假設(shè)2和引理1可知,矩陣Lk(t)+Qk(t)所有特征值均具有正實(shí)部,因此Γk(t)σk(t)的行向量不存在零元,此為條件(11)成立的前提.需要注意的是,根據(jù)定理1所給出的條件在實(shí)時(shí)求解迭代學(xué)習(xí)增益γk(t)的過(guò)程中總是需要知道σk(t),由于該信息是一個(gè)全局信息,因而導(dǎo)致跟隨者智能體很難利用局部信息獲得γk(t),這使得系統(tǒng)在切換拓?fù)淝樾蜗路植际綄?shí)現(xiàn)比較困難.為此,通過(guò)限定迭代學(xué)習(xí)增益γk(t)的形式,給出一個(gè)可分布式實(shí)現(xiàn)的結(jié)果. 定理2考慮由式(1)給出的測(cè)量受限多智能體系統(tǒng),智能體之間通信拓?fù)錆M足假設(shè)2,跟隨者智能體每次迭代初態(tài)滿足假設(shè)1,且其迭代學(xué)習(xí)控制律由式(7)給出.若取γk(t)使得D(t)γk(t)=?k(t)Im,其中?k(t)滿足 其中:ρ(·)為矩陣的譜半徑,?k(t)為隨拓?fù)鋱D結(jié)構(gòu)改變而變化的實(shí)數(shù).則隨著迭代次數(shù)k的不斷增加,式(5)成立,即一致性問(wèn)題可解. 故‖ei,k+1(·)‖λ將減小,同理對(duì)‖ej,k+1(·)‖λ也有形如式(25)的存在,故‖ej,k+1(·)‖λ也會(huì)減小.所以‖ei,k+1(·)‖λ將會(huì)不斷的減小.故隨著迭代次數(shù)的不斷增加,所有的σi,k(t),i ∈?n將會(huì)不斷的趨近于1. 而隨著所有的σi,k(t),i ∈?n將會(huì)不斷的趨近于1,式(24)中的范圍將變得和式(23)中λi的范圍一樣.故隨著迭代次數(shù)k的不斷增加,有: 則對(duì)于任意的某一時(shí)刻t ∈[T1,T2],由引理3可知,對(duì)于任意給定的迭代次數(shù)k,存在一種范數(shù)形式使得定理1中條件(11)成立.故由對(duì)定理1的證明過(guò)程可知‖ek+1(t)‖<‖ek(t)‖.同理也存在著某種范數(shù)形式使得‖ek+2(t)‖<‖ek+1(t)‖.雖然不同迭代次數(shù)之間所采用的范數(shù)形式可能不一樣,但都存在著某種范數(shù)形式使得對(duì)定理1的證明過(guò)程成立,故可以看出對(duì)不同的迭代次數(shù)k,均滿足存在著某種范數(shù)形式使得‖ek+1(t)‖<‖ek(t)‖,即隨著迭代次數(shù)k的增加,所有跟隨者智能體的輸出均收斂到虛擬領(lǐng)導(dǎo)者的輸出,即式(5)成立. 注4由于D(t)是行滿秩的,因此對(duì)于學(xué)習(xí)增益γk(t)中的某一列,可由D(t)γk(t)=?k(t)Im列出m個(gè)線性無(wú)關(guān)方程,則γk(t)中每列元素可由此m個(gè)線性無(wú)關(guān)方程組成的方程組求出. 注5與定理1相比較,定理2在求解學(xué)習(xí)增益γk(t)時(shí),只需求解使條件(20)成立的?k(t),而不受全局信息σk(t)的影響,因此可實(shí)現(xiàn)分布式實(shí)時(shí)計(jì)算. 本節(jié)對(duì)所得結(jié)論進(jìn)行仿真驗(yàn)證.考慮由5個(gè)跟隨者智能體和1個(gè)虛擬領(lǐng)導(dǎo)者組城的多智能體系統(tǒng),通信拓?fù)涞?種狀態(tài)及切換方式如圖2所示.為簡(jiǎn)化起見(jiàn),取每條邊的權(quán)值為0或1,跟隨者測(cè)量上限r(nóng)0=8.易知每個(gè)通信拓?fù)鋱D均含有以領(lǐng)導(dǎo)者為根的生成樹(shù).仿真實(shí)驗(yàn)中,設(shè)t ∈[T1,T2]=[1,3],假設(shè)每次迭代之后切換到下一個(gè)狀態(tài),其中設(shè)在1~1.5 s區(qū)間內(nèi),通信拓?fù)鋸腉a開(kāi)始切換,而在1.5~2 s,2~2.5 s,2.5~3 s三個(gè)時(shí)間段內(nèi),系統(tǒng)從Ga,Gb,Gc,Gd任一通信拓?fù)溟_(kāi)始切換.顯然,在此條件下系統(tǒng)的通信拓?fù)渫瑫r(shí)沿迭代軸k和時(shí)間軸t變化. 圖2 4種狀態(tài)的交流有向圖和切換機(jī)制Fig.2 The directed graphs and switching mechanism of four-states 取跟隨者智能體的動(dòng)力學(xué)方程為 在上述條件下,對(duì)于通訊拓?fù)銰a,可解得Lk(t)+Q的特征值,按升序排列為1=λ1=λ2=λ3=λ4<λ5=2.為使 可取增益 易驗(yàn)證 成立.類似地,對(duì)于通信拓?fù)銰b,Gc,Gd,取 易驗(yàn)證也有式(20)成立.也即滿足定理2條件. 圖3和圖4所示為所有跟隨者智能體vi,i ∈?n和虛擬領(lǐng)航者v0的輸出軌跡以及在時(shí)間[1,3]區(qū)間上,隨迭代次數(shù)k的不斷增加,所有跟隨者智能體vi,i ∈?n和虛擬領(lǐng)航者v0輸出之間最大誤差無(wú)窮范數(shù)的變化趨勢(shì).由圖可見(jiàn),每個(gè)跟隨者智能體在所求得的學(xué)習(xí)增益作用下,其輸出均能夠很好地跟蹤虛擬領(lǐng)航者的輸出. 圖3 不同迭代次數(shù)之間所有智能體的實(shí)際軌跡輸出(y1)Fig.3 Output trajectory of all agents at different iterations(y1)and the norm of error 圖4 不同迭代次數(shù)之間所有智能體的實(shí)際軌跡輸出(y2)Fig.4 Output trajectory of all agents at different iterations(y2)and the norm of error 針對(duì)實(shí)際工程應(yīng)用中大量存在的測(cè)量限制情形,本文研究了存在測(cè)量限制影響的連續(xù)線性多智能體系統(tǒng)基于迭代學(xué)習(xí)方法的輸出一致性問(wèn)題.通過(guò)利用飽和函數(shù)對(duì)測(cè)量受限情況進(jìn)行建模,給出了一個(gè)居于局部信息的輸出一致性協(xié)議,通過(guò)建立實(shí)際輸出與測(cè)量輸出之間的函數(shù)關(guān)系,得到了兩個(gè)使所有智能體輸出收斂到期望輸出的兩個(gè)充分條件.其中第二個(gè)條件大大簡(jiǎn)化了學(xué)習(xí)增益的設(shè)計(jì)過(guò)程,使得算法的分布式實(shí)現(xiàn)成為可能.需要指出的是,所考慮系統(tǒng)的信息拓?fù)鋱D在沿時(shí)間軸切換的同時(shí),也沿迭代軸切換,加之跟隨者動(dòng)力學(xué)方程中利用飽和函數(shù)對(duì)測(cè)量受限進(jìn)行建模帶來(lái)的非線性和非光滑性,使得問(wèn)題的求解比較困難.從仿真結(jié)果看,本文所得結(jié)果較好地解決了這一問(wèn)題,隨著迭代次數(shù)的增加,最終實(shí)現(xiàn)了輸出一致性目標(biāo).在后續(xù)研究中,將進(jìn)一步考慮通信拓?fù)溲貢r(shí)間軸和迭代軸聯(lián)合聯(lián)通時(shí)測(cè)量受限多智能體系統(tǒng)的一致性問(wèn)題.3 多智能體系統(tǒng)一致性分析
4 仿真
5 結(jié)論