劉自理, 嚴(yán)衛(wèi)生, 張守旭
(西北工業(yè)大學(xué) 航海學(xué)院, 陜西 西安 710072)
由于在編隊(duì)控制[1-2]、目標(biāo)跟蹤[3]、覆蓋控制[4]、姿態(tài)控制[5]等領(lǐng)域的廣泛應(yīng)用,近年來(lái)多智能體系統(tǒng)的協(xié)同輸出調(diào)節(jié)問(wèn)題得到了越來(lái)越多的關(guān)注。
多智能體系統(tǒng)的協(xié)同控制問(wèn)題可根據(jù)系統(tǒng)內(nèi)有無(wú)領(lǐng)導(dǎo)者分為均勻一致性問(wèn)題[6]和主從跟蹤一致性問(wèn)題[7]。本文研究的協(xié)同輸出調(diào)節(jié)問(wèn)題屬于主從跟蹤一致性問(wèn)題,該問(wèn)題的解決需要達(dá)成2個(gè)條件:①保證閉環(huán)多智能體系統(tǒng)的穩(wěn)定性;②確保輸出信號(hào)與外部信號(hào)之間的追蹤誤差趨近于零。該外部信號(hào)可代表外部輸入或者外部干擾,由外部系統(tǒng)(即領(lǐng)導(dǎo)者系統(tǒng))產(chǎn)生。經(jīng)典的多智能體系統(tǒng)輸出調(diào)節(jié)問(wèn)題最初由Davison、Francis等[8-9]提出,但其控制器要求多智能體系統(tǒng)內(nèi)的每個(gè)智能體不僅需要獲知自身狀態(tài)信息而且需要獲知外部系統(tǒng)的狀態(tài)變量信息。針對(duì)部分跟隨者無(wú)法直接獲知外部系統(tǒng)狀態(tài)變量的多智能體系統(tǒng),Huang等[7]提出了分布式協(xié)同控制算法以解決多智能體系統(tǒng)輸出調(diào)節(jié)問(wèn)題,該項(xiàng)研究可被看作經(jīng)典輸出調(diào)節(jié)問(wèn)題的延伸。隨后,文獻(xiàn) [10-12] 對(duì)多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題進(jìn)行了一系列擴(kuò)展性研究,但是這些研究中多數(shù)沒(méi)有考慮多智能體通信網(wǎng)絡(luò)中的時(shí)延現(xiàn)象或者假設(shè)時(shí)延為固定時(shí)延。
事實(shí)上,大多數(shù)的多智能體系統(tǒng)都基于無(wú)線網(wǎng)絡(luò)進(jìn)行通信,因此在智能體通信過(guò)程中不可避免地會(huì)產(chǎn)生通信時(shí)延[13],文獻(xiàn)[14]的研究對(duì)象為含有通信時(shí)延的多智能體系統(tǒng),但解決的是無(wú)領(lǐng)導(dǎo)者的多智能體系統(tǒng)一致性問(wèn)題,文獻(xiàn)[15]研究了具有離散時(shí)間時(shí)延多智能體系統(tǒng)的輸出調(diào)節(jié)問(wèn)題,但其關(guān)注的是固定時(shí)延。由于每個(gè)智能體所處的外部環(huán)境和通信目標(biāo)是時(shí)變的,智能體通信過(guò)程中發(fā)生的時(shí)延一般也為時(shí)變的。文獻(xiàn)[16]研究了時(shí)變通信時(shí)延的多智能體一致性問(wèn)題,但其關(guān)注的是平均一致性問(wèn)題。由于多智能體通信網(wǎng)絡(luò)中時(shí)變時(shí)延的存在,各智能體控制器將會(huì)無(wú)規(guī)律地異步更新鄰居節(jié)點(diǎn)的狀態(tài)信息,這將為分布式反饋控制算法設(shè)計(jì)增加難度,從而給多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題的解決帶來(lái)極大困難,這是本文所面臨的第一個(gè)難點(diǎn)。
另外,在智能體通信過(guò)程中,產(chǎn)生時(shí)變通信時(shí)延的同時(shí)數(shù)據(jù)丟失現(xiàn)象也將隨機(jī)出現(xiàn)[17],這將導(dǎo)致多智能體系統(tǒng)通信網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)動(dòng)態(tài)地發(fā)生變化,從而給多智能體閉環(huán)控制系統(tǒng)的穩(wěn)定性分析和跟蹤誤差的收斂性分析造成極大困難。文獻(xiàn)[18]研究了通信網(wǎng)絡(luò)中存在數(shù)據(jù)丟包的多智能體一致性問(wèn)題,但其關(guān)注的是平均一致性問(wèn)題。文獻(xiàn)[11,19-21]研究了動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)湎碌亩嘀悄荏w輸出調(diào)節(jié)問(wèn)題,但并未討論數(shù)據(jù)丟包和通信時(shí)延同時(shí)存在時(shí)的一致性問(wèn)題。文獻(xiàn)[22]對(duì)多智能體系統(tǒng)動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)湎麓嬖跁r(shí)延現(xiàn)象的輸出調(diào)節(jié)問(wèn)題進(jìn)行了研究,但其關(guān)注的是固定時(shí)延。目前已發(fā)表文獻(xiàn)中,對(duì)通信網(wǎng)絡(luò)中同時(shí)存在數(shù)據(jù)包丟失和時(shí)變時(shí)延現(xiàn)象的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題的研究成果較少,這也是本文所面臨的第二個(gè)難點(diǎn)。
基于上述研究現(xiàn)狀分析,本文主要研究動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)湎戮哂袝r(shí)變通信時(shí)延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題。本文通過(guò)引入隊(duì)列機(jī)制,將時(shí)變時(shí)延多智能體系統(tǒng)轉(zhuǎn)化為具有固定時(shí)延和隨機(jī)數(shù)據(jù)丟包的多智能體系統(tǒng),隨后設(shè)計(jì)出相應(yīng)的狀態(tài)觀測(cè)器,進(jìn)而提出分布式測(cè)量輸出反饋控制算法。該算法能有效解決隨機(jī)數(shù)據(jù)丟包和時(shí)變通信時(shí)延同時(shí)存在情況下的多智能體輸出調(diào)節(jié)問(wèn)題。針對(duì)不穩(wěn)定和穩(wěn)定外部系統(tǒng),分別給出了解決多智能體系統(tǒng)輸出調(diào)節(jié)問(wèn)題需要滿足的條件。
若有向圖G中存在一個(gè)邊序列(v1,v2),(v2,v3),…,(vk-1,vk),則稱vk由v1可達(dá)。若有向圖G中的每一個(gè)智能體都由vi可達(dá),則稱圖G中至少包含一個(gè)以vi為根的生成樹(shù)。
考慮引入文獻(xiàn) [15] 中的隊(duì)列機(jī)制來(lái)處理多智能體通信過(guò)程中伴隨的時(shí)變時(shí)延現(xiàn)象。
假設(shè)G內(nèi)的所有智能體時(shí)鐘同步并且數(shù)據(jù)包都以h為周期向外發(fā)送。令τ(dmin<τ 在t∈[kh,kh+τ)內(nèi),當(dāng)有數(shù)據(jù)包到達(dá)vi的接收器時(shí),vi將檢查該數(shù)據(jù)包的時(shí)間戳,若該數(shù)據(jù)包在kh時(shí)刻被發(fā)送,則vi將其放入隊(duì)列中,否則該數(shù)據(jù)包將被丟棄;在t=kh+τ時(shí)刻,vi將利用接收器隊(duì)列中的數(shù)據(jù)更新其控制輸入;在t∈[kh+τ,(k+1)h)內(nèi),所有到達(dá)vi的數(shù)據(jù)均被看為過(guò)時(shí)信息而被丟棄。通過(guò)引入隊(duì)列機(jī)制,在每個(gè)周期內(nèi)G內(nèi)的所有智能體都將在t=kh+τ時(shí)刻同步更新控制輸入。 假設(shè)1通信網(wǎng)絡(luò)中,任意2個(gè)智能體的通信與其他智能體無(wú)關(guān);獨(dú)立同分布的時(shí)變通信時(shí)延服從均勻分布U[0,dmax],其中dmax為最大通信時(shí)延;隨機(jī)丟包過(guò)程服從伯努利分布。 一般情況下,固定拓?fù)湎聼o(wú)時(shí)延的線性離散多智能體系統(tǒng)中的跟隨者系統(tǒng)可表示為如下形式: 式中,i=1,…,n,xi∈Rp,ui∈Rq,ei∈Rc,υ∈Rd分別表示第i個(gè)智能體系統(tǒng)的狀態(tài),控制輸入,追蹤誤差和外部信號(hào);Ai∈Rp×p,Bi∈Rp×q,Ei∈Rp×d,Ci∈Rc×p,Di∈Rc×q和Fi∈Rc×d均為常數(shù)矩陣;ymi∈Rcm表示第i個(gè)智能體的測(cè)量輸出,其中,角標(biāo)中的m表示此變量為測(cè)量值,i指代第i個(gè)智能體;Cmi∈Rcm×p,Dmi∈Rcm×q,Fmi∈Rcm×d。 外部信號(hào)υ可以表示外部輸入或外部干擾,它可由如下外部系統(tǒng)產(chǎn)生 υ(k+1)=Sυ(k) 式中,S∈Rd×d為常數(shù)矩陣。 為保證信息傳輸?shù)臅r(shí)效性,假設(shè)本文研究的多智能體系統(tǒng)中只有鄰居節(jié)點(diǎn)之間才有數(shù)據(jù)傳輸,并且各智能體不對(duì)外轉(zhuǎn)發(fā)其所接收的各項(xiàng)信息。因此,若智能體vj是智能體vi的鄰居節(jié)點(diǎn),則vi只能將vj的狀態(tài)信息作為vi自身的控制輸入,而不能作為中繼器將vj的信息轉(zhuǎn)發(fā)給其他智能體vk。由于不能保證每個(gè)跟隨者的鄰居節(jié)點(diǎn)集合中都包含有領(lǐng)導(dǎo)者,為保證無(wú)法接收外部信號(hào)的跟隨者也能實(shí)現(xiàn)對(duì)領(lǐng)導(dǎo)者的跟蹤控制,可考慮設(shè)計(jì)如下分布式測(cè)量輸出反饋控制算法 在隊(duì)列機(jī)制下,針對(duì)通信網(wǎng)絡(luò)中存在隨機(jī)數(shù)據(jù)丟失和時(shí)變通信時(shí)延的多智能體系統(tǒng),考慮描述跟隨者系統(tǒng)如(1)式所示 (1) 外部系統(tǒng)如(2)式所示 υ((k+1)h)=Sυ(kh) (2) (1)式和(2)式共同構(gòu)成了本文研究的動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下具有時(shí)變通信時(shí)延的多智能體系統(tǒng),該系統(tǒng)包含n+1個(gè)多智能體,其中,(1)式表示跟隨者系統(tǒng),(2)式表示領(lǐng)導(dǎo)者系統(tǒng)。 在隊(duì)列機(jī)制下,設(shè)計(jì)外部系統(tǒng)狀態(tài)變量的動(dòng)態(tài)觀測(cè)器如下 (3) 針對(duì)智能體不能直接測(cè)量自身狀態(tài)信息的情況,設(shè)計(jì)自身狀態(tài)變量動(dòng)態(tài)觀測(cè)器如下 (4) 因此,結(jié)合(3)式和(4)式可設(shè)計(jì)分布式測(cè)量輸出反饋控制算法如(5)式所示 (5) 結(jié)合(1)~(5)式可得智能體vi的閉環(huán)控制系統(tǒng)如下所示 令 (6) 式中,In?S表示單位矩陣In與矩陣S的克羅內(nèi)克積,1n表示元素為1的n維列向量。 Al(k)= 定義1 給定多智能體系統(tǒng)(6),若存在分布式測(cè)量輸出反饋控制算法(5)使得離散時(shí)間閉環(huán)多智能體系統(tǒng)滿足: 1) 當(dāng)外界輸入為零時(shí),閉環(huán)多智能體系統(tǒng)漸進(jìn)穩(wěn)定; 則表明動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下多智能體系統(tǒng)的協(xié)同輸出控制問(wèn)題可被反饋控制算法(5)解決。 在保證一般性的前提下,首先給出解決多智能體協(xié)同輸出調(diào)節(jié)問(wèn)題的標(biāo)準(zhǔn)假設(shè)條件: 假設(shè)2外部系統(tǒng)的系統(tǒng)矩陣S的所有特征值的模均不小于1。 假設(shè)3(Ai,Bi) 是可鎮(zhèn)定的,i=1,…,n。 假設(shè)4(Cmi,Ai) 是可觀測(cè)的,i=1,…,n。 定理1若假設(shè)1~5同時(shí)成立,令增益矩陣Ki1和Li分別滿足假設(shè)3和假設(shè)4,當(dāng)且僅當(dāng)參數(shù)φ(k)和Ki2在每個(gè)周期內(nèi)同時(shí)滿足以下2個(gè)條件: 1) 2) 矩陣方程 AiXi+BiKi1Xi+BiKi2+Ei=XiS CiXi+DiKi1Xi+DiKi2+Fi=0 有解(Xi,Ki2); 則稱反饋控制算法(5)可以解決動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時(shí)變通信時(shí)延的多智能體系統(tǒng)(6)的協(xié)同輸出調(diào)節(jié)問(wèn)題。 證明: 令 則可得 AiXi+BiKi1Xi+BiKi2+Ei=XiS CiXi+DiKi1Xi+DiKi2+Fi=0 綜上可得,在假設(shè)1~5同時(shí)成立的前提下,當(dāng)且僅當(dāng)參數(shù)φ(k)和Ki2在每個(gè)周期內(nèi)均滿足定理1的2個(gè)條件時(shí),反饋控制算法(5)可以解決動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時(shí)變通信時(shí)延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題。 假設(shè)6外部系統(tǒng)的系統(tǒng)矩陣S的所有特征值的模均小于1。 定理2若假設(shè)1和假設(shè)3~6同時(shí)成立,令增益矩陣Ki1和Li分別滿足假設(shè)3和假設(shè)4,當(dāng)且僅當(dāng)參數(shù)φ(k)在每個(gè)周期內(nèi)均滿足 則稱反饋控制算法(5)可以解決動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時(shí)變通信時(shí)延的多智能體系統(tǒng)(6)的協(xié)同輸出調(diào)節(jié)問(wèn)題。 證明: 同理定理1的證明過(guò)程可得,若選取滿足假設(shè)3和假設(shè)4的增益矩陣Ki1和Li,當(dāng)且僅當(dāng)參數(shù)φ(k)在每個(gè)周期內(nèi)均滿足 綜上可得,在假設(shè)1和假設(shè)3~6同時(shí)成立的前提下,當(dāng)且僅當(dāng)存在參數(shù)φ(k),使得定理2中給出的條件在每個(gè)周期內(nèi)均成立,則測(cè)量輸出反饋控制算法(5)可以解決動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時(shí)變通信時(shí)延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題。 本節(jié)以如下多智能體系統(tǒng)為例進(jìn)行仿真分析。 假設(shè)跟蹤者系統(tǒng)如下所示 其領(lǐng)導(dǎo)者系統(tǒng)為如下形式 若轉(zhuǎn)換為(1)式和(2)式所示形式,可得 令Ki1=[-1.5,-0.5],Li=[-1.5,-3]T。顯然,假設(shè)3和假設(shè)4成立。 本節(jié)所研究的多智能體系統(tǒng)中存在5個(gè)多智能體,其中節(jié)點(diǎn)0代表領(lǐng)導(dǎo)者,節(jié)點(diǎn)1~4代表跟隨者。初始時(shí)刻的多智能體網(wǎng)絡(luò)拓?fù)淙鐖D1所示,此拓?fù)浣Y(jié)構(gòu)中存在以0節(jié)點(diǎn)為根的有向生成樹(shù)。 圖1 初始網(wǎng)絡(luò)拓?fù)?/p> 由于多智能體系統(tǒng)在通信過(guò)程中存在隨機(jī)的數(shù)據(jù)丟包,多智能體的通信網(wǎng)絡(luò)在[kh,kh+τ]內(nèi)的不同時(shí)刻會(huì)具有不同形式的拓?fù)浣Y(jié)構(gòu),在某些特定時(shí)刻其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中將不再存在生成樹(shù),如圖2所示。 圖2 數(shù)據(jù)丟包時(shí)的網(wǎng)絡(luò)拓?fù)浼?/p> 圖3 期望網(wǎng)絡(luò)拓?fù)?/p> 從圖3a)中可得: 圖4 外部系統(tǒng)不穩(wěn)定時(shí)跟隨者的追蹤誤差 由定理2可知,分布式測(cè)量測(cè)量輸出反饋控制算法(5)可以解決動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時(shí)變通信時(shí)延的多智能體協(xié)同輸出調(diào)節(jié)問(wèn)題,仿真結(jié)果如圖5所示。 圖5 外部系統(tǒng)穩(wěn)定時(shí)跟隨者的追蹤誤差 由圖4和圖5可得,針對(duì)不穩(wěn)定和穩(wěn)定的外部系統(tǒng),測(cè)量輸出反饋控制算法(5)均可使得其所有跟隨者的跟蹤誤差漸進(jìn)趨向于零,動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時(shí)變通信時(shí)延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題可以被有效解決。 本文研究了動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)湎戮哂袝r(shí)變通信時(shí)延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題。主要得到以下3項(xiàng)結(jié)論:①基于隊(duì)列機(jī)制,設(shè)計(jì)了新的分布式測(cè)量輸出反饋控制算法以解決具有隨機(jī)數(shù)據(jù)丟包和時(shí)變通信時(shí)延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題;②在標(biāo)準(zhǔn)假設(shè)成立的前提下,針對(duì)不穩(wěn)定外部系統(tǒng),給出了動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)湎戮哂袝r(shí)變通信時(shí)延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題的解決條件;③在標(biāo)準(zhǔn)假設(shè)成立的前提下,針對(duì)穩(wěn)定外部系統(tǒng),給出了動(dòng)態(tài)網(wǎng)絡(luò)拓?fù)湎戮哂袝r(shí)變通信時(shí)延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題的解決條件。仿真分析驗(yàn)證了本文所提出的測(cè)量輸出反饋控制算法能夠有效解決具有通信時(shí)延和數(shù)據(jù)丟失的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題。另外,在基于隊(duì)列機(jī)制的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問(wèn)題中,隊(duì)列時(shí)間的取值十分重要,因此,最優(yōu)隊(duì)列時(shí)間問(wèn)題將是未來(lái)工作的重心之一。1.3 系統(tǒng)描述
2 主要結(jié)論
3 仿真結(jié)果與分析
4 結(jié) 論
西北工業(yè)大學(xué)學(xué)報(bào)2019年3期