陳世明,林子朋,高彥麗,裴惠琴
華東交通大學(xué) 電氣與自動化工程學(xué)院,南昌 330013
網(wǎng)絡(luò)化的網(wǎng)絡(luò)物理系統(tǒng)和嵌入式系統(tǒng)技術(shù)的進(jìn)步引起控制領(lǐng)域?qū)ρ芯慷嘀悄荏w系統(tǒng)(Multi-agent System,MAS)的興趣的增長。迄今為止,為MAS開發(fā)的控制技術(shù)使人們能夠?qū)椥?、廉價和靈活的方法應(yīng)用于維護(hù)、監(jiān)視、偵察、搜索和救援任務(wù),建設(shè)和操縱等許多領(lǐng)域的各種協(xié)同合作任務(wù)。MAS 中的個體同時工作,個體之間相互有規(guī)則地進(jìn)行信息傳遞,具有自主協(xié)調(diào)控制和分布式控制的性能和很強(qiáng)的魯棒性,以及較高的運(yùn)轉(zhuǎn)效率[1]。一致性是MAS中的一項基本性合作任務(wù),要求系統(tǒng)中的每一個體都應(yīng)就某個特定的狀態(tài)量達(dá)到一致,但是只需要利用自身狀態(tài)和鄰居局部信息來更新其狀態(tài)量[2]。
現(xiàn)有的許多一致性問題研究都是在同質(zhì)或者同階數(shù)的模型下完成的,但是在實(shí)際應(yīng)用的過程中發(fā)現(xiàn)這個前提過于理想,而包含不同動力學(xué)結(jié)構(gòu)的異質(zhì)多智能體系統(tǒng)更符合廣泛的應(yīng)用需求。Tian和Zhang[3]提出針對不同通信延遲的系統(tǒng),高階系統(tǒng)一致性不要求每個智能體的固有時延等于智能體之間的通信延遲,并給出了自身固有延遲和通信延遲的匹配條件。Liu 等[4]通過設(shè)計基于事件觸發(fā)原理的分布式輸出控制器,令智能體的最終一致性誤差為0,從而解決了無向拓?fù)湎碌南到y(tǒng)輸出一致問題。
以上研究結(jié)果的通信網(wǎng)絡(luò)都是基于無向圖,而實(shí)際應(yīng)用中有向通信拓?fù)鋺?yīng)用更加廣泛。Zheng 和Wang[5]研究了包含二階和一階的異質(zhì)MAS 在固定有向通信拓?fù)浜颓袚Q有向通信拓?fù)湎逻_(dá)到一致性的充要條件。Zhang 等[6]采用了包含Markov 鏈的控制器來解決異質(zhì)MAS在實(shí)際網(wǎng)絡(luò)內(nèi)部的未知通信狀態(tài)和局部信息交換問題,并通過設(shè)計狀態(tài)反饋控制器使系統(tǒng)達(dá)到一致狀態(tài)。Li 和Liu[7]提出了基于隨機(jī)不可分非周期矩陣和偽預(yù)測方法的二級一致性控制協(xié)議,用以解決線性時不變異質(zhì)MAS的通信時延。
隨著研究的深入,多智能體系統(tǒng)的應(yīng)用環(huán)境變得更加復(fù)雜,為了應(yīng)對實(shí)際任務(wù)中存在的未知變化或者任務(wù)本身需要多個小組分工完成,要求系統(tǒng)中的智能體能夠自行組織成個體群組完成分工任務(wù)。群一致性就是使網(wǎng)絡(luò)中的智能體分成多個子群體,不同的子群分別向不同特定狀態(tài)量漸進(jìn)收斂并分別實(shí)現(xiàn)狀態(tài)一致。
Yu和Wang最早在文獻(xiàn)[8]中提出,當(dāng)系統(tǒng)滿足兩個子群之間的相互影響達(dá)到平衡時可以實(shí)現(xiàn)異質(zhì)MAS的群一致性。宋海裕等[9]提出了融合牽制控制器的一階多智能體系統(tǒng)群一致性。實(shí)際應(yīng)用中除了要考慮智能體的位置信息,也要考慮智能體的速度信息。Cui 等[10]研究了二階有向拓?fù)浣Y(jié)構(gòu)下的群一致性追蹤控制,設(shè)計了智能體入度平衡的控制協(xié)議,使得研究結(jié)果可以從兩個子群擴(kuò)展到n個子群。Xu等[11]設(shè)計了分布式自適應(yīng)牽制控制協(xié)議,使得二階非線性多智能體系統(tǒng)在全局信息缺失的情況下實(shí)現(xiàn)漸進(jìn)群一致性。Xie等[12]使用不同于常規(guī)切換拓?fù)浠蝰R爾科夫切換拓?fù)涞那袚Q信號集來實(shí)現(xiàn)二階多智能體系統(tǒng)群一致性。Gao等[13]根據(jù)拓?fù)鋱D入度是否為0和非負(fù)矩陣群一致性準(zhǔn)則,討論了存在切換拓?fù)浜蜁r延條件的二階離散時間多智能體系統(tǒng)的群一致性。
現(xiàn)有關(guān)于多智能體的文獻(xiàn)中,或者考慮異質(zhì)多智能體一致性,或者考慮高階系統(tǒng)或分?jǐn)?shù)階系統(tǒng)的一致性,或者考慮同質(zhì)多智能體系統(tǒng)群體一致性,關(guān)于異質(zhì)多智能體系統(tǒng)群體一致性方面研究還較少。然而,研究具有異質(zhì)多智能體系統(tǒng)的群體一致性控制具有現(xiàn)實(shí)意義和理論意義。本文基于固定通信拓?fù)溲芯慨愘|(zhì)多智能體系統(tǒng),針對通信拓?fù)浣Y(jié)構(gòu)中每一條邊施加自適應(yīng)耦合權(quán)重,使得多智能體系統(tǒng)僅依賴智能體鄰居個體信息來實(shí)現(xiàn)群體一致性控制,與經(jīng)典多智能體群一致性相比,經(jīng)典異質(zhì)多智能體系統(tǒng)通信拓?fù)溥叺鸟詈蠙?quán)重是固定值,而通過加入自適應(yīng)控制調(diào)節(jié)邊的耦合權(quán)重可以有效提高多智能體系統(tǒng)的收斂速度。
假設(shè)G=(v,ε,A)為一個無向的通信拓?fù)?,其中包含n個節(jié)點(diǎn),MAS網(wǎng)絡(luò)內(nèi)部的邊體現(xiàn)所連接的個體之間的通信關(guān)系。每個智能體依靠其鄰居個體的狀態(tài)信息來更新其控制輸入。其中V=(v1,v2,…,vn) 表示節(jié)點(diǎn)集合;ε=v×v表示邊集合;A=[aij]n×n是加權(quán)鄰接矩陣,如果eij∈ε,則aij >0 ,否則aij=0 ,并且aij=aji。如果存在邊eij=(vi,vj),則說明節(jié)點(diǎn)vi可以從節(jié)點(diǎn)vj中獲得信息。Ni={vj|eji∈ε} 表示節(jié)點(diǎn)vi的鄰居節(jié)點(diǎn)集。如果節(jié)點(diǎn)vi和vk之間存在一系列的邊(vi,v1),(vi,v2),…,(vk-1,vk),則表示一條通路存在于MAS網(wǎng)絡(luò)的兩個體之間。如果無向通信網(wǎng)絡(luò)內(nèi)部每一對節(jié)點(diǎn)之間存在一條通路,則說明網(wǎng)絡(luò)拓?fù)鋱DG是無向連通圖。L=D-A表示拓?fù)鋱D的Laplace 矩陣,其中D=diag(d1,d2,…,dn)表示拓?fù)鋱D的度矩陣,表示節(jié)點(diǎn)i的度。L=[lij]n×n可定義為:
考慮一個具有n個智能體的異質(zhì)MAS,其中包含n-m個一階多智能體、m個二階多智能體。一階結(jié)構(gòu)的多智能體動力學(xué)方程定義為:
Tam等[41]研究了光柵軌跡和Peano軌跡對材料去除的影響。實(shí)驗(yàn)結(jié)果表明在光柵軌跡加工過程中存在明顯的邊緣效應(yīng),而Peano軌跡則有效避免了邊緣效應(yīng)的產(chǎn)生(圖4(a)、圖4(b))。同時文獻(xiàn)中指出,為了更均勻地移除材料,軌跡方向的變化應(yīng)當(dāng)均勻地分布在整個表面上。
式中,xi(t)∈Rn,ui(t)∈Rn,體現(xiàn)第i個智能體在t時刻所處的位置狀態(tài)和其自身的控制輸入。二階結(jié)構(gòu)的智能體的動力學(xué)方程定義為:
式中,用xi(t)∈Rn,vi(t)∈Rn,ui(t)∈Rn,體現(xiàn)第i個智能體在t時刻所處的位置狀態(tài)、速度狀態(tài)及其自身的控制輸入。
假設(shè)將異質(zhì)MAS網(wǎng)絡(luò)中的個體分成k(k≥2)群,如果智能體屬于第k個群,則記σi=t。xσi是智能體系統(tǒng)的分群系數(shù),且當(dāng)σi=σj時,表示個體屬于同一子群,并且有xσi=xσj,否則xσi≠xσj。
定義1當(dāng)智能體系統(tǒng)具有任意的初始狀態(tài)xi(0),vi(0)如果滿足:
其中,?i,j∈{1,2,…,n},?σi,σj∈{1,2,…,k}。滿足上述條件則說明異質(zhì)MAS實(shí)現(xiàn)了k群一致性(k≥2)。
注1本文的論證都是基于一維向量空間,所得結(jié)論都可以利用克羅內(nèi)克積(Kronecker product)拓展到n維向量空間。
(1)當(dāng)‖x‖ →∞時,V(x)→∞。
引理2[15]無向圖G的拉普拉斯矩陣L是半正定的,L矩陣所對應(yīng)的特征值有一個0 根,其余特征值都是整數(shù)當(dāng)且僅當(dāng)圖G是連通的。
根據(jù)MAS 網(wǎng)絡(luò)內(nèi)部鄰居個體的信息交流情況,定義控制器如下:
其中,智能體i和智能體j屬于同一子群時,hij=1,否則hij=0;cij(t)表示鄰居智能體間的自適應(yīng)耦合權(quán)重,并有cij(t)=cji(t),cij(0)=c >0;εij表示自適應(yīng)控制律cij(t)的耦合強(qiáng)度且εij >0。
定理1如果MAS 的通信網(wǎng)絡(luò)是固定無向連通的,那么由線性一階二階智能體組成的異質(zhì)MAS在控制器(4)的作用下可以實(shí)現(xiàn)k群一致性。
證明根據(jù)控制器(4),可以將式(1)、(2)改寫成:
因?yàn)樵O(shè)定MAS 的通信網(wǎng)絡(luò)為無向連通的,那么鄰接矩陣A=[aij]n×n是對稱矩陣,因此:
根據(jù)上式形式可看出當(dāng)ψ >0 時,可以調(diào)節(jié)參數(shù)ψ=1,得到:
然后利用引理 1,設(shè)S={(e1,e2,…,en,v1,v2,…,vm)|是S中的最大不變子集,當(dāng)時:
根據(jù)上面得到的結(jié)果,最大不變子集M化為:
本文將進(jìn)行Matlab 平臺仿真實(shí)驗(yàn)來驗(yàn)證自適應(yīng)耦合權(quán)重控制對MAS 的有效性。給定異質(zhì)MAS 網(wǎng)絡(luò)內(nèi)部具有7個個體,節(jié)點(diǎn)個體間的通信關(guān)系如圖1所示,且通信拓?fù)涫菬o向連通的,其中1、2、3號個體具有一階動力學(xué)特征,4、5、6、7號個體具有二階動力學(xué)特征。7個個體的初始狀態(tài)為xi(0)=[3,5,1,4,2,6]T,vi(0)=[4,0.2,1,2.5]T,自適應(yīng)控制策略下的隨機(jī)初始耦合權(quán)重為cij(0)=[5,1,4,2,3,6,7]T,分群系數(shù)xσ1=5,xσ2=2 。經(jīng)典群體一致性的模型基于文獻(xiàn)[16]提出,初始速度位置狀態(tài)以及通信拓?fù)浜鸵陨舷嗤?shí)驗(yàn)結(jié)果如圖2~圖6所示。
圖1 通信拓?fù)鋱D
圖2 經(jīng)典異質(zhì)多智能體群一致性位置變化曲線
對比圖2和圖4可以發(fā)現(xiàn),在初始條件相同的情況下,經(jīng)典群體一致性算法的各子群在第52秒位置狀態(tài)達(dá)到一致,應(yīng)用自適應(yīng)耦合權(quán)重調(diào)節(jié)系統(tǒng)后,各子群位置狀態(tài)達(dá)到一致的時間為第11秒,收斂速度提高了78.8%。
對比圖3 和圖5 可以發(fā)現(xiàn),應(yīng)用自適應(yīng)耦合權(quán)重調(diào)節(jié)系統(tǒng)后,系統(tǒng)內(nèi)部二階個體速度達(dá)到一致的時間為第11秒,與位置狀態(tài)的變化是吻合的。
圖3 經(jīng)典異質(zhì)多智能體群一致性速度變化曲線
圖4 自適應(yīng)控制協(xié)議下的位置狀態(tài)軌跡
圖5 自適應(yīng)控制協(xié)議下的速度狀態(tài)軌跡
圖6 自適應(yīng)耦合權(quán)重變化曲線
根據(jù)圖6 的耦合權(quán)重變化曲線和圖2~圖5 中的狀態(tài)變化可以發(fā)現(xiàn),由于經(jīng)典群體一致性控制算法的耦合權(quán)重是固定的,系統(tǒng)部分個體在前期運(yùn)動時的調(diào)整步長較小,在中后期個體距離較近時的調(diào)整步長又偏大。依靠位置狀態(tài)設(shè)計的自適應(yīng)耦合權(quán)重算法針對這一缺陷進(jìn)行了有效的改進(jìn),因而較好地提高了系統(tǒng)的整體收斂速度。
經(jīng)典群體一致性采用固定耦合權(quán)重,而本文在加入自適應(yīng)耦合權(quán)重之后經(jīng)過證明發(fā)現(xiàn),系統(tǒng)依舊可以在時間t趨近于無窮時同一子群收斂到同一位置,不同子群收斂于不同位置,這表明了改進(jìn)算法依舊保持了良好的魯棒性,數(shù)值仿真也很好地表現(xiàn)了這一點(diǎn)。
綜上所述,仿真驗(yàn)證了系統(tǒng)能漸進(jìn)收斂地達(dá)到群體一致性,且有效提高了系統(tǒng)的收斂速度。
本文針對包含一階和二階智能體的異質(zhì)MAS,設(shè)計了基于固定無向通信拓?fù)涞姆植际降娜后w一致性控制協(xié)議,在基于邊的自適應(yīng)耦合權(quán)重控制協(xié)議和控制輸入的作用下,多智能體系統(tǒng)能夠漸進(jìn)收斂達(dá)到群體一致性,數(shù)值仿真結(jié)果表明了理論分析的正確性和可行性。