周 媛,劉永芳,馬生昌,趙 宇
(西北工業(yè)大學(xué)自動(dòng)化學(xué)院,西安 710129)
隨著計(jì)算機(jī)、互聯(lián)網(wǎng)、微電子等新科技在軍事方面的不斷發(fā)展,現(xiàn)代戰(zhàn)爭(zhēng)形態(tài)逐漸從“機(jī)械化”向“信息化、智能化”轉(zhuǎn)變,無人系統(tǒng)作戰(zhàn)技術(shù)已成為各國(guó)爭(zhēng)相發(fā)展的關(guān)鍵技術(shù)。而傳統(tǒng)的單機(jī)作戰(zhàn)由于其探測(cè)能力、抗擾能力、打擊能力等方面的局限性導(dǎo)致其無法適應(yīng)現(xiàn)代化戰(zhàn)爭(zhēng)環(huán)境的復(fù)雜性、作戰(zhàn)任務(wù)的艱巨性,因此,無人系統(tǒng)集群作戰(zhàn)將成為未來戰(zhàn)爭(zhēng)的主要作戰(zhàn)方式[1-3]。在此背景下,對(duì)基于多智能體的無人系統(tǒng)進(jìn)行協(xié)調(diào)控制這一關(guān)鍵技術(shù)就顯得尤為重要。
多智能體系統(tǒng)是近年來新興的一個(gè)比較熱門的研究方向,它是指由一系列信息交互的智能體組成的群體系統(tǒng),其內(nèi)部的各智能體可通過相互感知、相互通信等方式,完成單個(gè)智能體所不能完成的大規(guī)模的復(fù)雜的特定任務(wù)。分布式控制是多智能體系統(tǒng)協(xié)調(diào)控制的主要方式,其僅依賴每個(gè)智能體與其鄰居智能體間的狀態(tài)信息交互對(duì)系統(tǒng)實(shí)行控制。分布式控制的優(yōu)勢(shì)在于完成任務(wù)的同時(shí)也克服了集中式控制產(chǎn)生的計(jì)算量與能耗較大的缺陷,具有更高的應(yīng)用價(jià)值。作為多智能體系統(tǒng)協(xié)同控制的熱點(diǎn)研究問題,編隊(duì)控制要求系統(tǒng)中的每個(gè)個(gè)體在執(zhí)行任務(wù)過程中能保持一定的幾何形態(tài),以適應(yīng)其所處的環(huán)境約束。比如在大型物資運(yùn)輸過程中,對(duì)運(yùn)輸車輛所處的位置有一定的要求,以滿足運(yùn)輸過程的穩(wěn)定和負(fù)載平衡等[4-5]。
近年來,大量的國(guó)內(nèi)外學(xué)者對(duì)多智能體系統(tǒng)分布式編隊(duì)控制進(jìn)行了深入的研究,并且取得了豐碩的研究成果。文獻(xiàn)[6]基于人工勢(shì)能場(chǎng),對(duì)輪式機(jī)器人模型系統(tǒng)領(lǐng)航—跟蹤問題進(jìn)行了深入研究,提出了一種新型的“行星–衛(wèi)星”式避障算法。但該算法僅能保證系統(tǒng)漸近收斂,即當(dāng)時(shí)間接近正無窮大時(shí),跟蹤者才能收斂到其領(lǐng)航者的軌跡。然而,在實(shí)際應(yīng)用時(shí),對(duì)任務(wù)時(shí)間總是有著一定的要求,人們期望系統(tǒng)能在給定的時(shí)間限制之前達(dá)到控制目標(biāo)。因此,Cortés[7]基于一階積分器系統(tǒng)提出了有限時(shí)間控制,并將其應(yīng)用于梯度系統(tǒng)實(shí)現(xiàn)多智能體系統(tǒng)有限時(shí)間一致性控制。自此,出現(xiàn)了多種多樣的有關(guān)多智能體有限時(shí)間控制問題,如有限時(shí)間跟蹤問題[8-9],多衛(wèi)星有限時(shí)間編隊(duì)問題[10-13]和自適應(yīng)有限時(shí)間同步問題[14]。但是,有限時(shí)間控制所得到的收斂時(shí)間常與初始狀態(tài)相關(guān),如果不能預(yù)先獲得系統(tǒng)的初始狀態(tài),那么控制器將會(huì)失去其效用。于是又提出了固定時(shí)間算法[15-17]來解決這個(gè)問題。該算法主要依賴控制器的參數(shù),計(jì)算出其收斂時(shí)間的上界,所以,固定時(shí)間算法的收斂時(shí)間通常具有一定的保守性。為克服以上算法的缺陷,本文提出了一種指定時(shí)間控制算法,使系統(tǒng)的收斂時(shí)間僅取決于用戶的設(shè)定值。
需要指出的是,上述文獻(xiàn)的研究均是基于智能體之間為協(xié)同合作關(guān)系假設(shè)得出的,而實(shí)際中不同個(gè)體間既存在合作關(guān)系又存在競(jìng)爭(zhēng)關(guān)系,這樣的考慮更為普遍。文獻(xiàn)[18]正是基于這樣的想法,將智能體間的信息交互用圖論進(jìn)行描述,其中正的邊權(quán)重可以表示個(gè)體間為合作關(guān)系,負(fù)的權(quán)重可表示智能體間的競(jìng)爭(zhēng)關(guān)系?;谶@樣的模型,Altafini[18]提出了“雙向一致性”的概念,并給出了多智能體系統(tǒng)實(shí)現(xiàn)雙向一致性的充要條件。于是,文獻(xiàn)[19-20]分別研究了一階積分器和二階積分器多智能體系統(tǒng)雙向一致性編隊(duì)問題,其要求智能體能以分組的形式實(shí)現(xiàn)各組的編隊(duì)構(gòu)型,并且每組智能體能以特定的隊(duì)形、相反的方向進(jìn)行運(yùn)動(dòng)。除此之外,文獻(xiàn)[21]針對(duì)二階非線性多智能體系統(tǒng)雙向編隊(duì)問題,設(shè)計(jì)了脈沖控制器及狀態(tài)反饋控制器,實(shí)現(xiàn)脈沖控制機(jī)制下系統(tǒng)雙向編隊(duì)目標(biāo)。但目前,在多智能體系統(tǒng)雙向編隊(duì)控制這一問題上的研究成果還遠(yuǎn)遠(yuǎn)不足,還需從不同的控制算法、不同的控制系統(tǒng)對(duì)多智能體系統(tǒng)雙向編隊(duì)控制進(jìn)行較為深入的探討。
因此,本文研究了具有一般線性動(dòng)力學(xué)的多智能體系統(tǒng)的指定時(shí)間雙向編隊(duì)問題。利用龐特里亞金極大值原理和運(yùn)動(dòng)規(guī)劃技術(shù),提出了雙向編隊(duì)控制算法,使系統(tǒng)能夠在指定時(shí)間內(nèi)實(shí)現(xiàn)雙向編隊(duì)。與現(xiàn)有的多智能體系統(tǒng)分布式控制結(jié)果相比,本文的貢獻(xiàn)主要體現(xiàn)在以下三個(gè)方面:首先,提出了一種變?cè)鲆娴闹付〞r(shí)間控制律,系統(tǒng)的收斂時(shí)間可由用戶任意指定,克服了傳統(tǒng)的有限時(shí)間控制對(duì)初始狀態(tài)的依賴性和固定時(shí)間控制導(dǎo)致的保守性的缺點(diǎn)[7-17]。其次,與現(xiàn)有的基于完全協(xié)同拓?fù)鋄6-17]的文獻(xiàn)不同,本文研究的拓?fù)浣Y(jié)構(gòu)同時(shí)含有協(xié)同和競(jìng)爭(zhēng)作用。但本文提出的控制算法同樣適用于解決傳統(tǒng)的非負(fù)圖的指定時(shí)間一致性編隊(duì)問題。最后,值得注意的是,本文提出的控制器僅依賴離散的采樣時(shí)刻多智能體的狀態(tài),也就是說該算法并不需要系統(tǒng)實(shí)時(shí)通信,僅要求系統(tǒng)在采樣點(diǎn)處滿足一定的通信條件。因此,該算法能夠減輕網(wǎng)絡(luò)的通信負(fù)擔(dān),降低其對(duì)網(wǎng)絡(luò)通信能力的要求。
本文使用標(biāo)準(zhǔn)符號(hào)。文中,用R表示實(shí)數(shù)集,Rn表示n維的實(shí)列向量集, Rm×n表示m×n的實(shí)矩陣集。那么, 1n∈Rn表示元素為1的n維列向量,In∈Rn×n表示單位矩陣。d iag {m1,m2,… ,mn}表示以m1,m2,… ,mn為對(duì)角元素的對(duì)角矩陣。?表示克羅內(nèi)克積,表示歐幾里得范數(shù), det ()表示行列式, sgn ()表示符號(hào)函數(shù),表示絕對(duì)值符號(hào)。對(duì)于一個(gè)矩陣M∈Rn×n來說,M?0意味著M的所有元素均非負(fù),若其同時(shí)滿足M1n=1n,則稱M為隨機(jī)矩陣。
引理 1.對(duì)于隨機(jī)矩陣M,若其所有特征值滿足則稱其為SIA(Stochastic,Indecomposable, Aperiodic)矩陣。并且M具有如下性質(zhì):其中y∈Rn表示元素均非負(fù)的n維列向量[22]。
基于圖論知識(shí),本文使用帶符號(hào)的有向圖G = ( V,E,A)來表示智能體間通信拓?fù)浣Y(jié)構(gòu),其中點(diǎn)集 V ={1 ,2,…,N}表示N個(gè)智能體,邊集E = {Eij= (i,j)} 表示智能體之間的信息流,A= [aij] ∈RN×N表示圖G 的加權(quán)鄰接矩陣。邊集元素表示從有信息流從j節(jié)點(diǎn)傳遞給i節(jié)點(diǎn),從而A中相應(yīng)的元素αij≠ 0,反之,αij=0;如果αij< 0表示j節(jié)點(diǎn)和i節(jié)點(diǎn)之間為競(jìng)爭(zhēng)關(guān)系,αij> 0表示j節(jié)點(diǎn)和i節(jié)點(diǎn)之間為合作關(guān)系。本文不考慮帶有自環(huán)的拓?fù)浣Y(jié)構(gòu),因此,αii= 0。符號(hào) adj(i)表示智能體i的鄰居集合。那么,圖的拉普拉斯矩陣可以定義為L(zhǎng)=[lij],其中若圖G 中存在一個(gè)點(diǎn)i可以向圖中其他所有的點(diǎn)傳送信息,那么稱i節(jié)點(diǎn)為根節(jié)點(diǎn),稱圖G 含有生成樹。
圖G 稱為結(jié)構(gòu)平衡圖當(dāng)且僅當(dāng)點(diǎn)集V分為完全沒有交集的兩個(gè)子集并且同時(shí)滿足以下條件:(1) V1∪ V2=V, V1∩ V2=?;(2)αij< 0, ?i,j∈Vk;αij> 0, ?i∈Vk,j∈V3-k,其 中k∈{ 1 ,2}。
引理2.如果圖G 為結(jié)構(gòu)平衡圖,L為其相應(yīng)的拉普拉斯矩陣,那么,一定存在對(duì)角矩陣Υ=diag {γ1,γ2,… ,γn},使ΥLΥ?0,其中γi∈ {1 ,-1 }[18]。
考慮由N個(gè)一般線性動(dòng)力學(xué)組成的多智能體系統(tǒng),其動(dòng)力學(xué)方程可以描述為
定義編隊(duì)誤差ei(t) =xi(t)-hi,其中hi∈Rn為第i個(gè)智能體的編隊(duì)向量,那么,系統(tǒng)(1)的指定時(shí)間雙向編隊(duì)目標(biāo)可以表述如下。
定義 1.對(duì)多智能體系統(tǒng)(1),如果對(duì)于任意的初始狀態(tài)xi(t0)及人為指定的時(shí)間T,都有
則稱系統(tǒng)(1)實(shí)現(xiàn)了指定時(shí)間雙向編隊(duì)。
注 1.式(2)所表述的指定時(shí)間雙向編隊(duì)問題要求不同組的智能體的狀態(tài)分別實(shí)現(xiàn)自己的編隊(duì)構(gòu)型,并以不同的方向分別運(yùn)動(dòng)。具體來講,當(dāng)智能體i和智能體j屬于同一子集時(shí),αij> 0,那么即i和j運(yùn)動(dòng)方向相同;當(dāng)i和j屬于不同子集時(shí),即i和j運(yùn)動(dòng)方向相反。顯然,當(dāng)hi=hj= 0時(shí),式(2)描述的控制目標(biāo)可以重新表述為“指定時(shí)間雙向一致性”。因此,得出結(jié)論:“雙向一致性”是“雙向編隊(duì)”的特例。
為了實(shí)現(xiàn)系統(tǒng)“指定時(shí)間雙向編隊(duì)”的控制目標(biāo),本文做出如下假設(shè)。
假設(shè)1.多智能體系統(tǒng)(1)能控;
假設(shè)2.帶符號(hào)的有向拓?fù)浣Y(jié)構(gòu)G為含有一棵生成樹的結(jié)構(gòu)平衡圖。
注 2.本文考慮兩個(gè)組的智能體分別實(shí)現(xiàn)各自的編隊(duì)構(gòu)型,因此系統(tǒng)(1)滿足能控條件僅是對(duì)線性系統(tǒng)一個(gè)比較基本的條件。另外,假設(shè)2要求拓?fù)浣Y(jié)構(gòu)中有足夠的信息流,其能從網(wǎng)絡(luò)中的某個(gè)節(jié)點(diǎn)流向其他節(jié)點(diǎn);此外,智能體實(shí)現(xiàn)雙向編隊(duì)還需滿足分組條件。綜其所述,本文所給的假設(shè)1和假設(shè)2是必要且可行的。
引理 3.若多智能體系統(tǒng)(1)滿足假設(shè)1,那么當(dāng)t≠t0時(shí),有[10]
引理 4.記若拓?fù)浣Y(jié)構(gòu)G滿足假設(shè)2,那么圖G的拉普拉斯矩陣L滿足:
其中:lii為拉普拉斯矩陣L的對(duì)角元素。
因此,式(4)成立。
基于非周期采樣算法,本文提出非周期采樣時(shí)間序列為
另外,在運(yùn)動(dòng)規(guī)劃技術(shù)和SIA矩陣的性質(zhì)下,第i個(gè)智能體在第k+1步的終端狀態(tài)約束為
因此,對(duì)式(1)、(6)應(yīng)用龐特里亞金極大值原理,構(gòu)造式(6)的哈密頓函數(shù):
其中:?i(t)為協(xié)態(tài)變量。繼而,式(8)分別對(duì)hi,xi和ui求偏導(dǎo),有
其中,式(9c)為式(8)存在極值的必要條件。聯(lián)立式(9a)、(9b),可發(fā)現(xiàn)其為一線性矩陣方程組。對(duì)其從tk至tk1+進(jìn)行積分,有
其中:
定理1.若系統(tǒng)(1)滿足假設(shè)1且拓?fù)浣Y(jié)構(gòu)G滿足假設(shè) 2,那么,控制器(12)按照時(shí)間序列式(5)進(jìn)行采樣,能夠保證系統(tǒng)(1)實(shí)現(xiàn)指定時(shí)間雙向編隊(duì)。
證.首先,證明在控制器(12)作用下,多智能體系統(tǒng)(1)的采樣狀態(tài)收斂,即
將式(12)代入系統(tǒng),并對(duì)其從t至tk1+進(jìn)行積分,有
根據(jù)引理4中SIA矩陣的性質(zhì),有
綜上所述,控制器(12)能夠使系統(tǒng)(1)實(shí)現(xiàn)指定時(shí)間雙向編隊(duì)。
注 3.文中設(shè)計(jì)的控制器(12)取決于時(shí)間序列間隔tk+1-tk的大小,由于采樣時(shí)間序列是非周期的,因此控制器(12)的增益是時(shí)變的。另外,控制器的大小僅取決于離散的采樣時(shí)刻狀態(tài)大小,而不需系統(tǒng)滿足實(shí)時(shí)通信,從而減輕網(wǎng)絡(luò)的通信負(fù)擔(dān),降低其對(duì)網(wǎng)絡(luò)通信能力的要求。
注 4.控制器(12)可實(shí)現(xiàn)多智能體系統(tǒng)(1)實(shí)現(xiàn)指定時(shí)間雙向編隊(duì)控制。與文獻(xiàn)[7-17]相比,本文設(shè)計(jì)的控制器主要優(yōu)勢(shì)在于系統(tǒng)的收斂時(shí)間可事先人為指定,而不依賴系統(tǒng)的初始狀態(tài),同時(shí)也不具有保守性。
注 5.由于文中提出的控制器適用于結(jié)構(gòu)平衡的拓?fù)浣Y(jié)構(gòu),而傳統(tǒng)的無符號(hào)拓?fù)浣Y(jié)構(gòu)是一類特殊的結(jié)構(gòu)平衡圖,其中一個(gè)子集為空。因此,將本文的控制器應(yīng)用于傳統(tǒng)的拓?fù)浣Y(jié)構(gòu)上時(shí)可實(shí)現(xiàn)一般的指定時(shí)間編隊(duì)控制。
注 6.顯然,采樣序列(1)的收斂性在控制系統(tǒng)實(shí)現(xiàn)指定時(shí)間編隊(duì)的過程中發(fā)揮著重要作用,在此,可選取采樣時(shí)間間隔為k= 1,2,…},其以多項(xiàng)式速率收斂至T。另一個(gè)可選取的采樣時(shí)間間隔為k= 1,2,…},其以指數(shù)速率收斂到T。
但是,注意到在以上采樣序列作用下,控制器(12)會(huì)在有限時(shí)間內(nèi)產(chǎn)生無數(shù)次采樣,即產(chǎn)生了芝諾效應(yīng)。為解決這一問題,通常會(huì)采取一個(gè)誤差上界來避免此現(xiàn)象,即:當(dāng)時(shí),認(rèn)為其已經(jīng)實(shí)現(xiàn)了指定時(shí)間雙向編隊(duì)。由此,可以推導(dǎo)出采樣頻率的上界:
因此,修正后的采樣間隔序列為
在這一部分,我們考慮6個(gè)動(dòng)力學(xué)為二階積分器類型的智能體的指定時(shí)間二分編隊(duì)控制問題的數(shù)值仿真。為便于刻畫其在指定時(shí)間的收斂性,本文僅考慮x-y平面內(nèi)智能體實(shí)現(xiàn)編隊(duì),即則系統(tǒng)的動(dòng)力學(xué)可如式(16)所示:
其中:
顯然,式(16)描述的系統(tǒng)一定為能控系統(tǒng),即滿足假設(shè)1。智能體間的通信拓?fù)浣Y(jié)構(gòu)可由圖1來描述,其滿足假設(shè) 2,其中V1= {1 ,2,3},V2= {4 ,5,6}。
圖1 6個(gè)智能體的通信拓?fù)浣Y(jié)構(gòu)Fig.1 The communication topology with 6 agents
為了能夠以一個(gè)三維視圖(時(shí)間–二維平面)的方式顯示指定時(shí)間算法的有效性,假設(shè)智能體在高度方向上保持一致,則相應(yīng)的編隊(duì)隊(duì)形為二維平面圖形。指定智能體最后的編隊(duì)隊(duì)形為兩正三角形,則相應(yīng)的編隊(duì)向量可以給定為指定系統(tǒng)的收斂時(shí)間為T=8以及編隊(duì)誤差界限ε= 10–3,對(duì)其進(jìn)行仿真,結(jié)果如下所示。
圖2 智能體位置誤差和速度誤差Fig.2 The position errors and velocity errors of agents
圖3刻畫了6個(gè)智能體的運(yùn)動(dòng)軌跡,并繪制了系統(tǒng)在t=8和t=15時(shí)兩組智能體的編隊(duì)隊(duì)形。顯然,屬于不同子集的智能體實(shí)現(xiàn)各自編隊(duì)隊(duì)形之后便朝著相反的方向進(jìn)行運(yùn)動(dòng),即實(shí)現(xiàn)了雙向編隊(duì)。
圖3 6個(gè)智能體的飛行軌跡Fig.3 The real flight trajectories of 6 agents
計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù)的發(fā)展,推動(dòng)了現(xiàn)代戰(zhàn)爭(zhēng)向集群作戰(zhàn)方式轉(zhuǎn)變,同時(shí)也為多智能體系統(tǒng)技術(shù)的應(yīng)用提供了一個(gè)廣闊的平臺(tái)。本文針對(duì)作戰(zhàn)過程中無人系統(tǒng)的編隊(duì)問題,利用龐特里亞金極大值原理,設(shè)計(jì)了一類分布式雙向編隊(duì)控制器,解決了一般線性動(dòng)力學(xué)多智能體系統(tǒng)指定時(shí)間雙向編隊(duì)問題,并且通過數(shù)值仿真證明了控制器的有效性,為無人系統(tǒng)的編隊(duì)飛行提供了潛在的應(yīng)用前景。
后續(xù)還可圍繞文中所提算法進(jìn)行以下研究:
(1)針對(duì)領(lǐng)航者—跟隨者網(wǎng)絡(luò)編隊(duì)問題,設(shè)計(jì)相應(yīng)的分布式控制器使系統(tǒng)實(shí)現(xiàn)指定時(shí)間收斂。
(2)本文控制器依靠狀態(tài)反饋來實(shí)現(xiàn)多智能體系統(tǒng)指定時(shí)間雙向編隊(duì),但當(dāng)網(wǎng)絡(luò)受到攻擊時(shí),智能體間的通信會(huì)受到干擾,因此,可以考慮基于輸出反饋來實(shí)現(xiàn)系統(tǒng)指定時(shí)間雙向編隊(duì)控制。