唐 茜,涂細(xì)凱,鄭笑雨,張冰冰
(1.湖北工業(yè)大學(xué)工業(yè)設(shè)計(jì)學(xué)院,湖北 武漢 430068;2.湖北工業(yè)大學(xué)機(jī)械工程學(xué)院,湖北 武漢 430068)
過(guò)去二十幾年來(lái),多智能體的分布式協(xié)同控制一直是各學(xué)科非常感興趣的話題,廣泛的應(yīng)用于分布式一致性、編隊(duì)控制、包容控制和同步等。其中,一致性問(wèn)題是分布式協(xié)同的關(guān)鍵問(wèn)題[1-3]。一般來(lái)說(shuō),一致性問(wèn)題的目標(biāo)是設(shè)計(jì)合適控制算法,通過(guò)鄰居智能體之間的局部信息交換,使得所有智能體的狀態(tài)最終收斂到一致。
根據(jù)網(wǎng)絡(luò)領(lǐng)導(dǎo)者的數(shù)量,一致性可以分為:無(wú)領(lǐng)導(dǎo)一致性、一致性追蹤(Leader-Following)和多追蹤(Multi-Tracking)等。近些年來(lái),多追蹤問(wèn)題受到越來(lái)越多的注意。多追蹤問(wèn)題中,一個(gè)多智能體網(wǎng)絡(luò)由多個(gè)群集組成,每個(gè)群集的所有跟隨者的狀態(tài)最終收斂于領(lǐng)導(dǎo)者的軌跡,同時(shí),不同的群集之間收斂的軌跡不同[4-5]。注意到,代數(shù)圖理論一直是研究多智能體一致性問(wèn)題[6-8]的有效方法。
值得注意的是相比于位置信息,智能體的速度信息更難測(cè)量。因此,研究速度不可測(cè)的二階多智能體系統(tǒng)的一致性問(wèn)題是非常有必要的。前文提到大部分工作的前提是智能體之間信息的傳輸是連續(xù)的,然而,由于傳輸帶寬的限制,這種傳輸形式不太可靠。因此,對(duì)于研究二階多智能體系統(tǒng)的一致性問(wèn)題來(lái)說(shuō),與連續(xù)數(shù)據(jù)相比,采樣數(shù)據(jù)是更實(shí)際的來(lái)源。
在實(shí)際應(yīng)用中,由于傳輸信息的帶寬有限制,采樣數(shù)據(jù)需要提前量化。因此,使用量化數(shù)據(jù)研究多智能體的一致性問(wèn)題更有現(xiàn)實(shí)意義。進(jìn)一步,量化誤差對(duì)網(wǎng)絡(luò)一致性性能的影響也不能忽視。但是,針對(duì)具有量化數(shù)據(jù)的二階多智能體系統(tǒng)的一致性結(jié)論并不多。另一方面,在各種量化方法中,隨機(jī)量化器的量化間隔是平均的,并且其量化誤差的特性可以用于研究一致性問(wèn)題。因此,針對(duì)二階多智能體系統(tǒng)的一致性問(wèn)題,采用了隨機(jī)量化的方案進(jìn)行研究。通信時(shí)滯的影響也應(yīng)該要考慮,因其是降低網(wǎng)絡(luò)性能的另一個(gè)因素。
針對(duì)考慮通信時(shí)滯的二階多智能體系統(tǒng),提出了一種量化的間歇控制規(guī)則用于解決系統(tǒng)的多追蹤問(wèn)題。不同于上述文獻(xiàn),僅僅使用了系統(tǒng)的采樣位移信息,且控制輸入是可變的。同時(shí),引入了隨機(jī)量化的方案,在傳輸之前量化位移信息。基于代數(shù)圖論、隨機(jī)量化和穩(wěn)定性理論,分析得到了被控系統(tǒng)實(shí)現(xiàn)多追蹤的一些充分必要條件。
符號(hào)定義:定義m階單位矩陣為I∈?m×m,m階零矩陣為0 ∈?m×m,并將I5∈?5N×5N簡(jiǎn)化為I5。定義1ml∈?ml×1為所有元素是1的ml階列向量,Re(·)和Im(·)分別是復(fù)數(shù)的實(shí)部和虛部。AT和det(A)分別代表矩陣A的轉(zhuǎn)置和行列式。?為Kronecker運(yùn)算,P{·}和E{·}分別代表量化和期望運(yùn)算。
加權(quán)有向圖G={V,ε,A} 中節(jié)點(diǎn)集為V={1,2,…m},邊集為ε?V×V,非對(duì)稱加權(quán)鄰接矩陣為A=[aij]∈?m×m。假如從節(jié)點(diǎn)j到節(jié)點(diǎn)i存在一個(gè)有向連接,則定義e(j,i)∈ε。當(dāng)且僅當(dāng)e(j,i)∈ε時(shí)aij>0,假設(shè)沒(méi)有自回路,也就是說(shuō)對(duì)所有i∈V,令aii=0。定義節(jié)點(diǎn)i∈V的鄰居節(jié)點(diǎn)集為Ni={j∈V,|(j,i)∈E},節(jié)點(diǎn)i∈V的入度為。有向圖G的對(duì)角矩陣為D=,拉普拉斯矩陣定義為L(zhǎng)=D-A。
定義1:(子網(wǎng)絡(luò))定義網(wǎng)絡(luò)Gs={Vs,εs,As} 為 網(wǎng) 絡(luò)G={V,ε,A} 的子網(wǎng)絡(luò),滿足Vs?V、Es?E和As?A。
考慮具有m個(gè)節(jié)點(diǎn)的多智能體網(wǎng)絡(luò)G={V,ε,A},其由n≥2個(gè)子網(wǎng)絡(luò)Gs={Vs,εs,As} (s=1,2,…,n)組成,每個(gè)子網(wǎng)絡(luò)包含ms個(gè)節(jié)點(diǎn),并且滿足。同時(shí),對(duì)任意s≠s′,Vs≠?,滿足。第sth個(gè)子網(wǎng)絡(luò)的節(jié)點(diǎn)標(biāo)記為Vs=,且令m0=0。
基于文獻(xiàn)[9]中對(duì)隨機(jī)量化的定義:假設(shè)數(shù)據(jù)h∈[-R,R]量化后長(zhǎng)度為l比特,那么,我們可以得到量化點(diǎn)r=2l個(gè)和量化區(qū)間δ=2R/2l,以下為量化數(shù)據(jù)的方式:
那么,對(duì)于此量化器我們可以得到一個(gè)很重要的特性:
假設(shè)每個(gè)智能體具有如下二階動(dòng)態(tài)特性:
其中,xi(t)∈?,νi(t)∈? 分別是智能體i(i=1,2,…,m)的位移和速度量。μi(t)為狀態(tài)反饋量。
第sth個(gè)子網(wǎng)絡(luò)期望的追蹤軌跡為:
其中,fs≥0 ∈[0,+∞)在時(shí)間t內(nèi)是分段連續(xù)的函數(shù),(t)∈?,∈?表示第sth個(gè)子網(wǎng)絡(luò)期望的位移和速度量。僅研究了二階多智能體的勻速多追蹤問(wèn)題,即fs=0。
二階多智能體系統(tǒng)(1)在期望軌跡為(2)下的多追蹤問(wèn)題可以重新寫(xiě)為:
定義2:對(duì)任意初始狀態(tài),二階多智能體系統(tǒng)(1)能夠?qū)崿F(xiàn)多追蹤當(dāng)且僅當(dāng)
其中,Lx和Lν是關(guān)于δ的兩個(gè)單調(diào)遞增函數(shù),且滿足:
在實(shí)際應(yīng)用中,信息傳輸?shù)倪^(guò)程中不可避免的存在時(shí)滯,這種情況對(duì)一致性控制協(xié)議的性能有很大的影響。假設(shè)多智能體系統(tǒng)通信時(shí)滯為τ,智能體之間只在采樣時(shí)刻進(jìn)行通信,采樣時(shí)間序列為0 ≤t0<t1<…<tk<…,那么定義采樣區(qū)間為ξ=tk-tk-1。針對(duì)多追蹤問(wèn)題提出了如下間歇控制方案:
其中,控制參數(shù)α>0,β>0,γ>0,tk<t≤tk+1。?xi(tk)=q(xi)-xi為第ith個(gè)智能體的位移量化誤差為第sth個(gè)子網(wǎng)絡(luò)的期望位移量化誤差。η(t)為脈沖函數(shù),表示如下:
其中,ε∈(0,ξ]為控制持續(xù)時(shí)間,函數(shù)(t)的選取可以依據(jù)不同的狀態(tài),可以為矩形函數(shù)、三角函數(shù)、梯形函數(shù)和非線性函數(shù)。從量化方程我們可以得到位移量化誤差的如下性能:
其中,δxj和δxds分別為智能體的位移和期望位移的量化誤差區(qū)間。
令
令H(tk)=[p(tk)T,y(tk)T,?(k)]T,多智能體系統(tǒng)(1)可以改寫(xiě)為:
全文只考慮通信時(shí)滯滿足τ<ξ-ε的情況,
令:
引理1:[10]基于控制協(xié)議(4),二階多智能體系統(tǒng)(1)可以實(shí)現(xiàn)多追蹤當(dāng)且僅當(dāng)ρ(A)<1,其中ρ(·)為矩陣A的譜半徑。
證明:令
從式(8)可得,
明顯可知,
必要性:如果ρ(?)≥1,那么ρ(? ??)≥1,基于控制協(xié)議(4)的多智能體系統(tǒng)(1)一定是分散的,無(wú)法實(shí)現(xiàn)多追蹤。
充分性:如果ρ(?)<1,那么ρ(? ??)<1,一定存在一個(gè)足夠小的常數(shù)?<1滿足‖? ??‖2=?<1。那么
其中,f(δs)=。
由于?<1,可得:
并且,
結(jié)合不等式(10),
因此,存在正的常數(shù)a>0和b>0,使得
也就是說(shuō)
很明顯,不等式右邊為函數(shù)δs的單調(diào)遞增函數(shù)。由定義2可知,系統(tǒng)(1)可以實(shí)現(xiàn)多追蹤。
其中,
證明:矩陣A的特征多項(xiàng)式為:
矩陣A的特征值滿足:
不難發(fā)現(xiàn),對(duì)每個(gè)給定的θi,都可得五個(gè)矩陣A的特征值,其中0為一個(gè)特殊的特征值。為了簡(jiǎn)化計(jì)算,令
不難發(fā)現(xiàn)當(dāng)且僅當(dāng)R(z)<0時(shí)ρ(A)<1,也就是說(shuō)二階多智能體系統(tǒng)可以漸進(jìn)到達(dá)多追蹤當(dāng)且僅當(dāng)多項(xiàng)式(13)時(shí)Hurwitz穩(wěn)定的。
我們采用具有五個(gè)智能體的多智能體網(wǎng)絡(luò),測(cè)試所提出的通信時(shí)滯下的量化間歇控制協(xié)議。網(wǎng)絡(luò)的拓?fù)鋱D,如圖1所示。將此網(wǎng)絡(luò)G劃分為兩個(gè)子網(wǎng)絡(luò),兩個(gè)子網(wǎng)絡(luò)分別為:V1={1,2,3}和V2={4,5}。
圖1 具有5個(gè)節(jié)點(diǎn)的多智能體系統(tǒng)的拓?fù)鋱DFig.1 The Topology Diagram of a Multi-Agent System with 5 Nodes
牽制矩陣為B=[0,1,0,0,0;0,0,0,0,1],也即牽制節(jié)點(diǎn)分別為節(jié)點(diǎn)2和節(jié)點(diǎn)5。Laplacian矩陣L為:
令脈沖函數(shù)為η(t)=1,通信時(shí)滯為τ=0.05,控制持續(xù)時(shí)間為ε=0.001,期望軌跡為。選擇控制參數(shù)α=5,β=0.4和γ=2。從定理1可得,系統(tǒng)可以現(xiàn)實(shí)多追蹤當(dāng)且僅當(dāng)0.1 <ξ<3.5?;诳刂茀f(xié)議(4),考慮通信時(shí)滯為τ,ξ=3.4時(shí)二階多智能體系統(tǒng)(1)可以實(shí)現(xiàn)多追蹤,如圖2所示。ξ=3.5時(shí)二階多智能體系統(tǒng)(1)可以實(shí)現(xiàn)多追蹤,如圖3所示。
圖2 ξ=3.4時(shí)通信時(shí)滯下的多智能體系統(tǒng)的多追蹤軌跡。Fig.2 The Multi-Tracking Trajectory of Multi-Agent System Under Communication Time Lag ξ=3.4
圖3 ξ=3.5時(shí)通信時(shí)滯下的多智能體系統(tǒng)的多追蹤軌跡。Fig.3 The Multi-Tracking Trajectory of Multi-Agent System Under Communication Time Lag ξ=3.5.
針對(duì)通信時(shí)滯存在下的二階多智能體的多追蹤問(wèn)題,提出了一個(gè)間歇控制協(xié)議,此控制協(xié)議中每個(gè)智能體的控制僅基于采樣位移信息。為了克服通信帶寬的限制,在信息傳輸前,采取隨機(jī)量化的方案量化智能體的信息?;诖鷶?shù)圖論、隨機(jī)量化和穩(wěn)定性理論,分析得到了實(shí)現(xiàn)系統(tǒng)多追蹤的一些充分必要條件。仿真研究表明,所提出的控制協(xié)議可以保證每組中的智能體狀態(tài)趨同于領(lǐng)導(dǎo)者的軌跡,另一方面不同組之間互不影響。最后,數(shù)值案例研究證實(shí)了所提出的間歇控制協(xié)議的有效性。將來(lái),我們將考慮不同通信時(shí)滯的范圍,完善系統(tǒng)的多追蹤問(wèn)題,提出的控制方案也可以應(yīng)用于更多的案例。