楊 誠(chéng) ,孔繁軍,戴 晶
(中國(guó)船舶重工集團(tuán)公司 第 七一九研究所,湖北 武 漢 4 30064)
多智能體系統(tǒng)的協(xié)調(diào)控制是當(dāng)前控制領(lǐng)域研究的前沿方向,包含一致性、同步、編隊(duì)控制、分布式濾波等問(wèn)題,在多機(jī)器人編隊(duì)系統(tǒng)[1]、無(wú)人飛機(jī)網(wǎng)絡(luò)系統(tǒng)[2]、傳感器網(wǎng)絡(luò)和分布式觀測(cè)與監(jiān)控[3]等領(lǐng)域有著重要的應(yīng)用前景。蜂擁是多智能體系統(tǒng)協(xié)調(diào)控制研究領(lǐng)域的一個(gè)重要問(wèn)題,它描述的是大量個(gè)體朝著一個(gè)方向以相同的速度運(yùn)動(dòng),且個(gè)體彼此之間保持一定的距離——既不分離,也不發(fā)生碰撞。由于蜂擁在人工仿生網(wǎng)絡(luò)系統(tǒng)等眾多工程領(lǐng)域有著廣泛的應(yīng)用,大量研究者對(duì)蜂擁行為進(jìn)行了深入的研究。
1987年,Reynolds給出了蜂擁控制的3個(gè)基本要求[4],即分離(Separation)、聚合(Cohesion)和速度匹配(Alignment)。之后,Olfati-Saber[5]提出了一個(gè)理論上的蜂擁控制框架,設(shè)計(jì)了不同的數(shù)學(xué)算法并進(jìn)行了綜合性分析。文獻(xiàn)[6]中,作者對(duì)蜂擁控制算法中的人工勢(shì)函數(shù)重新進(jìn)行了構(gòu)造,利用加邊延遲規(guī)則結(jié)合新構(gòu)造的人工勢(shì)函數(shù)克服分裂現(xiàn)象。
目前,多智能體系統(tǒng)蜂擁控制研究大多采用的是連續(xù)的控制系統(tǒng)模型,即智能體通過(guò)與鄰居智能體之間進(jìn)行連續(xù)的通訊來(lái)獲得鄰居的狀態(tài)。然而在實(shí)際系統(tǒng)中,連續(xù)的信息傳輸必然帶來(lái)巨大的能源消耗?;诖?,文中提出一種基于事件驅(qū)動(dòng)的控制機(jī)制來(lái)實(shí)現(xiàn)多智能體系統(tǒng)的蜂擁行為。事件驅(qū)動(dòng)控制機(jī)制是指在一個(gè)控制環(huán)中控制器和執(zhí)行器當(dāng)某個(gè)事件觸發(fā)時(shí)發(fā)起一次通訊的控制方法[7]。近年來(lái),事件驅(qū)動(dòng)機(jī)制作為一種替代傳統(tǒng)周期性時(shí)鐘驅(qū)動(dòng)的控制方式被提出,這是因?yàn)?,一方面事件?qū)動(dòng)更符合實(shí)際網(wǎng)絡(luò)系統(tǒng)中個(gè)體交互和決策的行為特征;另一方面,事件驅(qū)動(dòng)是按需驅(qū)動(dòng),即當(dāng)智能體有“需要”時(shí),控制任務(wù)才執(zhí)行。從仿生學(xué)應(yīng)用的角度來(lái)看,這種控制機(jī)制更能夠適應(yīng)受通訊約束的分布式多智能體系統(tǒng)的設(shè)計(jì)需求,同時(shí)也有利于優(yōu)化系統(tǒng)資源。例如,在配備有微處理器的分布式無(wú)線傳感器/執(zhí)行器網(wǎng)絡(luò)中,應(yīng)用事件觸發(fā)的控制策略,可以降低處理器功率消耗,延長(zhǎng)網(wǎng)絡(luò)壽命。
本文針對(duì)多智能體系統(tǒng)的蜂擁控制問(wèn)題,首先結(jié)合傳統(tǒng)勢(shì)函數(shù)和速度一致性算法,設(shè)計(jì)了由事件驅(qū)動(dòng)機(jī)制觸發(fā)速度信息交互的混雜控制算法;進(jìn)一步針對(duì)每個(gè)智能體,給出了基于誤差的分布式事件驅(qū)動(dòng)條件。理論上證明了系統(tǒng)能實(shí)現(xiàn)穩(wěn)定的蜂擁運(yùn)動(dòng),同時(shí)采用加邊延遲效應(yīng)設(shè)計(jì)了有界的勢(shì)函數(shù)保持網(wǎng)絡(luò)的連通性。最后,仿真驗(yàn)證了方法的正確性。
首先,介紹本文需要用到的符號(hào)。R和Z分別表示實(shí)數(shù)集和非負(fù)整數(shù)集,Z+表示正整數(shù)集。Rn表示維實(shí)向量空間,Rnxn表示n×n階實(shí)矩陣空間。In表示n維單位矩陣,In表示所有元素都為 1的 n維向量。對(duì)于對(duì)稱(chēng)矩陣 A∈Rn×n,λmax(A)和 λmin(A)分別表示A的最大特征值和最小特征值。此外,用∩代表邏輯“或”運(yùn)算,∪代表邏輯“與”運(yùn)算?!ぁ硎揪仃嚨淖V范數(shù),?表示Kronecker積。
定義 G =(V,E,A)表示 n 維空間的無(wú)向圖,其中 V =是個(gè)智能體體的集合。Ni={j∈V,(j,i)∈E}表示頂點(diǎn)的鄰居集合,ni表示集合Ni的基數(shù)。E是由V中的無(wú)序點(diǎn)對(duì)構(gòu)成的邊集, 可表示為 E ?{(i,j):i,∈V,j≠i}(簡(jiǎn)單圖),{j,i}∈E?(i,j}∈E,那么這個(gè)圖被稱(chēng)為對(duì)稱(chēng)的(Symmetric)或者無(wú)向圖 (Undirected),若圖中任意兩個(gè)節(jié)點(diǎn)之間都存在一條路徑,則稱(chēng)圖G為連通圖,否則為非連通圖。A={aij}N×N表示鄰接矩陣,其所有元素都是非負(fù)實(shí)數(shù),當(dāng)(i,j}∈E 時(shí),aij>0,否則 aij=0。度矩陣D=diag{ dij}是N×N階對(duì)角陣,其中那么,Laplacian矩陣L可以表示為
引理2.1[5]:是無(wú)向圖G的Laplacian矩陣,鄰接矩陣A=AT且為非負(fù)的,那么:
1)L 的特征值滿足 0=λ1(L)≤λ2(L)≤…≤λN(L),當(dāng)且僅當(dāng)圖G是連通的,有代數(shù)相關(guān)性λ2(L)>0,且
2)矩陣L是半正定的矩陣,滿足下面的性質(zhì):
引理2.2[8]:假設(shè)圖G是一個(gè)n維的無(wú)向圖,在圖 G中加入一些邊構(gòu)成圖 G1。 那么,λ2(L(G1))≥λ2(L(G)),其中 L(G),L(G1)分別表示圖G和G1的Laplacian矩陣。
考慮N智能體在n維的歐式空間中運(yùn)行,可以假設(shè)第i個(gè)智能體的運(yùn)動(dòng)方程如下:
其中 xi∈Rn,vi∈Rn,ui∈Rn分 別 代表 智 能 體 i 的 位 置 向量,速度向量和控制輸入。
2) 如果(i,j)?E(t-)并且則智能體 i 和智能體j之間在時(shí)刻t產(chǎn)生一條連邊;
對(duì)每個(gè)智能體i,速度信息通訊只需在事件驅(qū)動(dòng)時(shí)刻點(diǎn)處觸動(dòng),因此控制輸入為
定義‖xi-xj‖=‖xij‖,Ψxij(‖xij(t)‖)為非負(fù)光滑有界的分段人工勢(shì)函數(shù),勢(shì)函數(shù)的梯度表示為▽?duì)穢ij(‖xij(t)‖),滿足
定義4-1:對(duì)于一個(gè)多智能體系統(tǒng),如果說(shuō)系統(tǒng)可以實(shí)現(xiàn)穩(wěn)定的蜂擁狀態(tài),那么當(dāng)且僅當(dāng)對(duì)于任意的初始狀態(tài),滿足
滿足時(shí)被驅(qū)動(dòng)。其中 θi∈(0,1),?i=1,2,…,N,ni是 t時(shí)刻智能體 i鄰域內(nèi)個(gè)體數(shù)。常數(shù) a<λ2(L(0))/(N-1),λ2(L(0))是初始時(shí)刻系統(tǒng)的代數(shù)相關(guān)性。假設(shè)初始能量Q0為一個(gè)有限值,并且網(wǎng)絡(luò)是初始連通的。那么可以得到如下結(jié)論:
1)對(duì)于任意的t≥0,圖G(t)是連通的并且整個(gè)運(yùn)動(dòng)過(guò)程中沒(méi)有碰撞發(fā)生;
2)統(tǒng)漸進(jìn)的實(shí)現(xiàn)穩(wěn)定的蜂擁狀態(tài)。
證明:對(duì)于系統(tǒng)(7),定義一個(gè)類(lèi)似能量的Lyapunov函數(shù))
由于網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)是時(shí)變的,Q是一個(gè)分段連續(xù)函數(shù)。定義系統(tǒng)的拓?fù)淝袚Q時(shí)間系列為t是它的不連續(xù)點(diǎn)。另外,控制輸入的更新序列為失一般性,假設(shè)T0=0。在區(qū)間t∈[T0,T1]上,對(duì)Lyapunov函數(shù)Q求導(dǎo),可得
其中,ni是智能體i在t時(shí)刻鄰域內(nèi)智能體的個(gè)數(shù),并且有可以得到
即Q˙(t)≤0,tk時(shí)刻沒(méi)有邊會(huì)斷開(kāi)。因此整個(gè)運(yùn)動(dòng)過(guò)程中網(wǎng)絡(luò)是保持連通的。再根據(jù)引理2.2有,對(duì)于?t≥0,λ2(L(0))≤λ2(L(t)),那么事件條件式(8)可以應(yīng)用于整個(gè)運(yùn)動(dòng)過(guò)程中。進(jìn)一步,根據(jù)人工勢(shì)函數(shù)的定義,同樣可以得到對(duì)于?t>0智能體之間的距離不會(huì)趨近于0,因此在整個(gè)運(yùn)動(dòng)過(guò)程中智能體之間沒(méi)有碰撞發(fā)生。
下面分析定理4-1中的結(jié)論2)。假設(shè)在時(shí)刻tˉkα,有mk條邊增加到網(wǎng)絡(luò)中來(lái),因此,系統(tǒng)(7)的拓?fù)淝袚Q次數(shù)是有限的,那么網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)最終將保持不變。假設(shè)網(wǎng)絡(luò)的最后一個(gè)拓?fù)淝袚Q時(shí)刻是tˉk′α,那么對(duì)于 t∈是連續(xù)的且單調(diào)遞減的。接下來(lái)的分析可以限制到區(qū)域因此,集合}是一個(gè)正的不變集。其中
注釋4-1:由于系統(tǒng)的平均速度v=v(0),假設(shè)每個(gè)智能體能獲得系統(tǒng)的初始全局平均速度,那么事件驅(qū)動(dòng)條件式(9)可以寫(xiě)為
定理4-2:考慮一個(gè)具有個(gè)智能體的系統(tǒng),它們的運(yùn)動(dòng)方程為(4),每個(gè)智能體的控制輸入為式(5)并由集中式事件驅(qū)動(dòng)更新,在如下事件條件
滿足時(shí)被驅(qū)動(dòng)。假設(shè)初始的能量Q0為一個(gè)有限值并且網(wǎng)絡(luò)是初始連通的。那么:
1)對(duì)于任意的t≥0,圖G(t)是連通的并且整個(gè)運(yùn)動(dòng)過(guò)程沒(méi)有碰撞發(fā)生;
2)系統(tǒng)漸進(jìn)的實(shí)現(xiàn)穩(wěn)定的蜂擁狀態(tài)。
考慮10個(gè)智能體在二維平面上的運(yùn)動(dòng)。它們的初始位置和速度分別隨機(jī)產(chǎn)生于[-25,10]×[-25,10]和[-10,10]×[-10,10]。鄰域半徑R=30,智能體之間的理想距離為[8,10],延遲距離為 τ=5,常數(shù) a可取 a=0.1<λ2(L(0))/(N-1)。 仿真的結(jié)果如圖1和2所示。圖1繪出了所有智能體從t=0到t=20 s的運(yùn)動(dòng)軌跡。xi1,xi2分別是位置沿x,y坐標(biāo)軸的分量,箭頭代表速度的方向。圖2顯示了每個(gè)智能體速度模值的收斂情況并用垂直于時(shí)間軸的實(shí)線表示事件驅(qū)動(dòng)時(shí)刻。
本文采用事件驅(qū)動(dòng)控制方法,研究了多智能體系統(tǒng)的蜂擁問(wèn)題。提出了一種分布式事件驅(qū)動(dòng)混雜控制算法,利用鄰域內(nèi)其他個(gè)體的位置信息和事件驅(qū)動(dòng)時(shí)刻點(diǎn)處的速度信息,設(shè)計(jì)相應(yīng)的控制策略實(shí)現(xiàn)了系統(tǒng)的蜂擁行為。算法設(shè)計(jì)中,考慮到控制能量的有界性和網(wǎng)絡(luò)的連通性,利用加邊延遲效應(yīng)人工勢(shì)函數(shù)進(jìn)行了改進(jìn)。最后仿真驗(yàn)證了結(jié)果的有效性。
圖1 10個(gè)智能體從t=0 s到t=20 s的運(yùn)動(dòng)軌跡Fig.1 The moving trajectories of 10 agents from 0 to 20s
圖2 10個(gè)智能體速度模值的收斂情況和事件驅(qū)動(dòng)時(shí)刻Fig.2 The convergence trajectories of the modulus of velocity and the event-triggered instants of 10 agents
[1]Hayes A T,Dormiani-Tabatabaei P.Self-organized flocking with agent failure:off-line optimization and demonstration with real robots[C]//Robotics and Automation,Proceedings.ICRA'02,2002:3900-3905.
[2]Butt A R,Zhang R,Hu Y C.A self-organizing flock of condors[J].Journal of Parallel and Distributed Computing,2006,66(1):145-161.
[3]Schenato L,Fiorentin F.Average timesync:A consensus-based protocol for time synchronization in wireless sensor networks[J].Estimation and Control of Networked Systems,2009,1(1):30-35.
[4]Reynolds C W.Flocks,herds and schools:A distributed behavioral model[J].ACM SIGGRAPH Computer Graphics,1987,21(4):25-34.
[5]Olfati-Saber R.Flocking for multi-agent dynamic systems:algorithms and theory[J].IEEE Transactions on Automatic Control,2006,51(3):401-420.
[6]Zavlanos M M,Jadbabaie A,Pappas G J.Flocking while preserving network connectivity[C]//46thIEEE Conference on Decision and Control,2007:2919-2924.
[7]Stocker C,Lunze J.Event-based control of nonlinear systems:An input-output linearization approach [C]//Decision and Control and European Control Conference (CDC-ECC),2011:2541-2546.
[8]Merris R.Laplacian matrices of graphs:a survey[J].Linear Algebra and Its Applications,1994(197):143-176.
[9]Ji M Egerstedt M.Distributed Coordination control of multiagent systems while preserving connectedness[J].IEEE Transactions on Robotics,2007,23(4):693-703.