馬煜文 李賢偉,2,3 李少遠(yuǎn),2,3
近二十年來,多智能體系統(tǒng)的分布式協(xié)同控制由于在編隊(duì)控制、集群控制、傳感器網(wǎng)絡(luò)等領(lǐng)域展現(xiàn)了巨大應(yīng)用潛力[1–5],引起了研究者們的廣泛關(guān)注.一致性問題作為多智能體協(xié)同控制中的基本問題之一,其目的在于通過各智能體間信息的交互與共享,實(shí)現(xiàn)某個或多個狀態(tài)的趨同.各智能體狀態(tài)趨向一致時(shí)遵守的信息交互規(guī)則,被稱為一致性協(xié)議,是解決一致性問題的關(guān)鍵.
依照協(xié)議所依賴的信息,一致性協(xié)議大致分為狀態(tài)反饋和輸出反饋兩大類.文獻(xiàn)[6–10]研究了基于狀態(tài)反饋的一致性協(xié)議.然而,在實(shí)際工程中,智能體狀態(tài)信息往往難以直接測量,導(dǎo)致上述協(xié)議的應(yīng)用場景受到很大限制.因此,如何消除一致性協(xié)議對智能體狀態(tài)信息的依賴成為了研究者們關(guān)注的熱點(diǎn)之一.在文獻(xiàn)[11–15]中,通過額外獲取鄰接智能體的控制器狀態(tài)信息,所設(shè)計(jì)的控制協(xié)議在使用智能體絕對輸出或相對輸出信息的情況下,有效解決了一致性問題.在僅依靠智能體間相對輸出信息的前提下,文獻(xiàn)[16–24]深入地研究了一致性協(xié)議的存在性和設(shè)計(jì)方法,揭示了該類協(xié)議重要優(yōu)勢:第一,該類協(xié)議相比于文獻(xiàn)[6–10]中的基于狀態(tài)反饋的一致性協(xié)議,無需交互控制器或觀測器的狀態(tài)信息,可以減輕多智能體系統(tǒng)在協(xié)同控制過程中的通信負(fù)擔(dān)(為方便,后文統(tǒng)稱該類協(xié)議為無控制器間通信的一致性協(xié)議).第二,在深空探測、室內(nèi)協(xié)同導(dǎo)航等應(yīng)用領(lǐng)域,智能體的絕對輸出信息較難獲取.例如深空中的絕對位置測量困難且測量誤差都以千米為計(jì)量單位,而飛行器間的相對位置測量則較為簡單且精度更高.因而,相比于文獻(xiàn)[25–26]需要絕對輸出信息,無控制器間通信的一致性協(xié)議在該類領(lǐng)域更具有應(yīng)用前景.第三,當(dāng)智能體間相對輸出信息可直接測量時(shí)(例如文獻(xiàn)[27]考慮了可直接測量相對姿態(tài)和間距的無人車系統(tǒng)),無控制器間通信的一致性協(xié)議所需的相對輸出信息由智能體自身測量可得,無需與相鄰智能體進(jìn)行數(shù)據(jù)通信,因而避免了數(shù)據(jù)通信中的數(shù)據(jù)包丟失、數(shù)據(jù)內(nèi)容篡改等網(wǎng)絡(luò)安全威脅,對于保障多智能體系統(tǒng)的信息安全具有重要意義[18].
輸出反饋協(xié)議的具體設(shè)計(jì)方法與所依賴的信息緊密相關(guān).文獻(xiàn)[15]利用相對輸出信息構(gòu)造了全階一致性協(xié)議,盡管該協(xié)議需要額外的控制器相對狀態(tài)信息,但是其設(shè)計(jì)條件滿足類似線性系統(tǒng)理論中“分離原理”,計(jì)算簡便.文獻(xiàn)[20]研究了無控制器通信的全階一致性協(xié)議,并在智能體開環(huán)極點(diǎn)位于左半復(fù)平面的前提下,提出了該類協(xié)議的低增益設(shè)計(jì)方法.文獻(xiàn)[16]首先構(gòu)造了基于智能體間相對輸出信息和相對輸入信息的降階一致性協(xié)議,進(jìn)一步以約束智能體開環(huán)極點(diǎn)位于閉左半復(fù)平面為代價(jià),通過對相對輸入信息項(xiàng)的截?cái)?構(gòu)造了無控制器間通信的降階一致性協(xié)議.在類似智能體約束前提下,文獻(xiàn)[19]構(gòu)造了階次不同于文獻(xiàn)[16]的無控制器間通信的降階一致性協(xié)議.需要指出的是,為了保證無控制器間通信的一致性協(xié)議存在性,前述設(shè)計(jì)方法均需要確定一個低增益參數(shù),而該參數(shù)的取值范圍不僅依賴于協(xié)議增益矩陣,還依賴于智能體之間的耦合強(qiáng)度.因而,這些設(shè)計(jì)方法并不完全具備類似文獻(xiàn)[15]中 “分離原理” 的良好計(jì)算特性.此后,文獻(xiàn)[21]和文獻(xiàn)[24]更加系統(tǒng)地討論了無控制器間通信的全階一致性協(xié)議的存在性,然而從設(shè)計(jì)的角度,所提方法仍然具有上述弊端.最近,受未知輸入觀測器[28]啟發(fā),文獻(xiàn)[18,23]通過設(shè)計(jì)鄰居智能體的未知輸入觀測器,引入了巧妙的控制器增益矩陣參數(shù)化方法,為無控制器間通信的一致性協(xié)議提供了新的設(shè)計(jì)思路.需要注意的是,文獻(xiàn)[18,23]的參數(shù)設(shè)計(jì)的存在性暗含智能體輸出維數(shù)不小于輸入維數(shù)的前提,使得該設(shè)計(jì)方法仍有一定的理論和應(yīng)用局限性.
基于上述討論,本文在文獻(xiàn)[18,23]參數(shù)設(shè)計(jì)方法的啟發(fā)下,提出一種新型的無控制器間通信的一致性協(xié)議.相比于文獻(xiàn)[16,19–22],本文提出的協(xié)議參數(shù)設(shè)計(jì)方法具有類似文獻(xiàn)[15]中 “分離原理” 的屬性,使得協(xié)議設(shè)計(jì)過程更加簡便.相比于文獻(xiàn)[18,23],本協(xié)議具有與其相斥的存在性條件,因而拓展了文獻(xiàn)[18,23]中設(shè)計(jì)方法的適用范圍.另外,不同于文獻(xiàn)[18,23]以構(gòu)造智能體相對狀態(tài)觀測器為前提,本文提出的協(xié)議不符合未知輸入觀測器[28]的適用條件,協(xié)議狀態(tài)并不具有智能體相對狀態(tài)的估計(jì)意義,因而該協(xié)議在一定程度上也是對文獻(xiàn)[18,23]中設(shè)計(jì)思想的理論延伸.在本文中,首先給出該協(xié)議的構(gòu)造方法;然后通過對智能體動力學(xué)進(jìn)行適當(dāng)約束,建立協(xié)議存在的等價(jià)條件;進(jìn)一步在通信圖具有有向生成樹的前提下,證明閉環(huán)系統(tǒng)的一致性.
符號說明.Rm×n表示m×n維實(shí)矩陣的集合,表示具有非負(fù)實(shí)部的復(fù)數(shù)集.I表示單位矩陣,1表示內(nèi)部元素均為 1 的列向量.P >0 表示P是一個對稱、正定矩陣.R e(·)和 I m(·)分別表示復(fù)數(shù)的實(shí)部和虛部.A ?B表示矩陣A和B的 Kronecker 積.d iag{A1,A2,···,An} 是以A1,A2,···,An為對角塊的分塊對角矩陣.c ol{x1,x2,···,xn} 是以x1,x2,···,xn為列元素組合成的列向量.r ank(·)代表矩陣的秩,I mage(·)表示矩陣的像空間.‖·‖ 表示向量的 2 范數(shù).
引理 1[29]. 當(dāng)且僅當(dāng)圖G具有一個有向生成樹時(shí),0 是L的一個簡單特征值,且L的其余特征值均具有正實(shí)部,其中L是G的拉普拉斯矩陣.
考慮一個含有N個線性同構(gòu)智能體的多智能體系統(tǒng),智能體的動力學(xué)方程為
其中,lij是拉普拉斯矩陣L的第 (i,j)個元素.本文擬研究的一致性問題概括如下.
問題 1.針對由式 (1)構(gòu)成的多智能體系統(tǒng),設(shè)計(jì)降階輸出反饋一致性協(xié)議
注1.另一種常用的輸出反饋協(xié)議具有如下形式
其中,Hr,Fr,Gr,Hu,Fu和Gu為具有適當(dāng)維數(shù)的常數(shù)矩陣,且
式 (2)和式 (3)刻畫了線性多智能體系統(tǒng)輸出反饋一致性協(xié)議的兩種一般形式.相比于協(xié)議 (3),協(xié)議 (2)僅需相對輸出信息(t),而無需鄰接智能體的控制器狀態(tài)信息(t).因此,在(t)可以直接測量的前提下,協(xié)議 (2)并不依賴于額外的通信媒介.這也是本文稱協(xié)議 (2)無需控制器間通信的原因.事實(shí)上,文獻(xiàn)[17–24]均對類似問題 1 的一致性問題展開了研究,但對形如式 (2)的一致性協(xié)議采用了不同的叫法.例如,文獻(xiàn)[20]稱其為動態(tài)輸出補(bǔ)償器一致性協(xié)議,文獻(xiàn)[16]稱其為基于截?cái)嘟惦A觀測器的輸出反饋一致性協(xié)議,文獻(xiàn)[19,21]稱其為無控制器交互的輸出反饋一致性協(xié)議,文獻(xiàn)[18]稱其為免受攻擊的純相對輸出一致性協(xié)議.這些叫法都在一定程度上概括了這類協(xié)議的主要特征.類似于文獻(xiàn)[18],本文考慮的協(xié)議 (2)的階次仍然小于智能體的階次,因此相較于文獻(xiàn)[20–22]中的全階一致性協(xié)議,協(xié)議 (2)也具有更低的實(shí)現(xiàn)復(fù)雜度.另一方面,不同于文獻(xiàn)[18],本文考慮的協(xié)議 (2)的單個控制器階次為nx-ny,而文獻(xiàn)[18]的降階控制協(xié)議的相應(yīng)階次為nx-nu(在不考慮自適應(yīng)參數(shù)的前提下).
本節(jié)給出協(xié)議 (2)明確的參數(shù)設(shè)計(jì)方法,以解決問題 1 所定義的一致性問題.在給出具體設(shè)計(jì)之前,需做如下假設(shè).
式 (5)中的λi,i=2,···,N是拉普拉斯矩陣L的特征值.對稱正定矩陣是下列代數(shù)Riccati 方程的解
在分析多智能體系統(tǒng) (1)基于協(xié)議 (2)和式(4)構(gòu)成的閉環(huán)系統(tǒng)一致性之前,本節(jié)將討論協(xié)議(2)和式 (4)的存在性條件.顯然,針對式 (4)中給出的參數(shù)設(shè)計(jì),協(xié)議 (2)的可行性取決于是否存在正定矩陣P滿足式 (6),以及是否存在矩陣L使Hr為赫爾維茲的.
定理 1.當(dāng)且僅當(dāng)多智能體系統(tǒng) (1)滿足假設(shè)2和假設(shè) 3,(A,C)可檢測,且有向圖G滿足假設(shè) 1,則協(xié)議 (2)和式 (4)存在.
證明.當(dāng)且僅當(dāng)假設(shè) 2 成立時(shí),矩陣T和U可以被定義,且T和U顯然為可逆矩陣.當(dāng)且僅當(dāng)(A,C)可檢測時(shí),式 (6)存在對稱正定解P.根據(jù)引理 1,當(dāng)且僅當(dāng)假設(shè) 1 成立,存在滿足式 (5)的常數(shù)μ.為證明存在矩陣L使Hr為赫爾維茲的,即(C⊥AT1-C⊥BU1CAT1,C⊥BU2)可穩(wěn),還需證明(C⊥AT1-C⊥BU1CAT1,C⊥BU2)可穩(wěn)與假設(shè)3 的等價(jià)性.首先,根據(jù)矩陣T1,T2,U1和U2的定義,需注意到CT1=0,CT2=,CBU1=和CBU2=0.因此,經(jīng)過一系列代數(shù)運(yùn)算,可以得到如下等式
注 2.由定理 1 可知,協(xié)議 (2)和式 (4)的可行性與智能體系統(tǒng)矩陣 (A,B,C)有關(guān).假設(shè)2 要求輸出矩陣C和矩陣CB行滿秩,其成立的一個必要條件是輸入u的維數(shù)不小于輸出y的維數(shù)1本文尚不清楚假設(shè)2 在一般情形下的直觀系統(tǒng)解釋.當(dāng)nu= ny=1時(shí),假設(shè)2 等價(jià)于要求智能體的相對階為1.若考慮文獻(xiàn)[18]的對應(yīng)條件,即 r ank(CB)=rank(B)= nu,根據(jù)未知輸入觀測器理論[28],該對應(yīng)條件的直觀解釋為鄰居的控制輸入信號可以直接通過相對輸出獲得,不過這種解釋并不適用于假設(shè)2..不同于文獻(xiàn)[16]以及文獻(xiàn)[19-20,22]要求智能體開環(huán)極點(diǎn)位于閉左半復(fù)平面,本協(xié)議中假設(shè) 3 的系統(tǒng)意義為要求智能體在閉右半復(fù)平面上無不變零點(diǎn)(即系統(tǒng)是最小相位的).另外,注意到假設(shè)3 實(shí)際上暗含對(A,B)的可鎮(zhèn)定性要求(因?yàn)榧僭O(shè)3 意味著 rank[,B]=nx對所有s∈成立).還需指出的是,假設(shè)2 和假設(shè)3 與 (A,C)的可觀性和可檢測性沒有直接關(guān)系 (例如,對于A=[1,1;0,1],B=I2和C=[0,1],顯然假設(shè)2 和假設(shè)3 成立,但是(A,C)既不可觀也不可檢測),這也是本文明確要求(A,C)可檢測以保證 R iccati 方程 (6)有鎮(zhèn)定解的原因.
假設(shè)3 在形式上與文獻(xiàn)[18] 中定理 2 的條件(ii)類似.如前所述,本文的一致性協(xié)議設(shè)計(jì)思想受到了文獻(xiàn)[18,23]啟發(fā),為避免控制器間通信,構(gòu)造了如式 (4)所示的協(xié)議增益矩陣參數(shù)化方法,由此引出了存在性條件,即假設(shè) 2 和假設(shè) 3.盡管如此,與文獻(xiàn)[18,23]不同的是,由于假設(shè) 2 和假設(shè) 3 均不符合未知輸入觀測器的前提條件,所以本文給出的控制協(xié)議設(shè)計(jì)方法并不能直接使用文獻(xiàn)[18]所基于的未知輸入觀測器理論.特別注意到,一致性協(xié)議 (2)中控制器狀態(tài)ri并非是對智能體相對狀態(tài)的估計(jì),因此其設(shè)計(jì)思路并不是以設(shè)計(jì)一個智能體相對狀態(tài)的觀測器為前提(文獻(xiàn)[18] 所采用的未知輸入觀測器思路實(shí)際上對智能體相對狀態(tài)進(jìn)行了估計(jì)).
注 3.就一致性協(xié)議 (2)和式 (4)的存在性條件(即假設(shè) 2 和假設(shè) 3 成立以及 (A,C)可觀)而言,對于給定的多智能體系統(tǒng) (1),這些條件是否成立非常容易驗(yàn)證.由式 (4)給出的協(xié)議增益矩陣Hr,Fr,Fu和Hu具有良好的解耦設(shè)計(jì)特性,即分別由中間參數(shù)矩陣P和L計(jì)算可得.其中,矩陣P >0 滿足Riccati方程 (6),而矩陣L需使得矩陣Hr是赫爾維茲的.對于后者,可以令L=-(C⊥BU2)TP1,其中P1為以下 R iccati 方程的對稱正定解
因此,若假設(shè)2 和假設(shè)3 成立,且 (A,C)可檢測,則由式 (4)給出的協(xié)議參數(shù)設(shè)計(jì)方法滿足類似“分離原理” 的性質(zhì),因而計(jì)算過程十分簡易.特別地,與文獻(xiàn)[16,19–22]的設(shè)計(jì)步驟不同,第 2.1 節(jié)所給出的設(shè)計(jì)步驟并不需要確定一個與其他協(xié)議參數(shù)耦合的低增益參數(shù).
本節(jié)將給出基于協(xié)議 (2)和式 (4)的多智能體閉環(huán)系統(tǒng)一致性分析.
定理 2.對于式 (1)中的多智能體系統(tǒng),若假設(shè)1、假設(shè) 2 和假設(shè) 3 成立且 (A,C)可檢測,則協(xié)議(2)和式 (4)可以解決問題 1.
令s:=col{s1,···,sN},其中si:=col{xi,ri}.若協(xié)議 (2)和式 (4)可以解決問題 1,則當(dāng)t→∞時(shí),閉環(huán)系統(tǒng)的一致性狀態(tài)向量可表征如下
其中,向量η∈RN滿足ηTL=0 和ηT1=1.
證明.由s(t)的定義,可給出智能體 (1)基于協(xié)議 (2)和式 (4)的閉環(huán)系統(tǒng)動力學(xué)方程如下
由[15,式(9)]中的矩陣變換可知,拉普拉斯矩陣L可轉(zhuǎn)換為如下形式
因此,聯(lián)合式 (10)、式 (13)和式 (15)可得,向量?(t)滿足如下微分方程
其中,參數(shù)Hr,Hu,Fu,Fr和T1來自于式 (4).由于矩陣L的設(shè)計(jì)已經(jīng)確保Hr為赫爾維茲的,所以僅需證明A+λi(BFu+T1Fr)C,i=2,3,···,N是赫爾維茲的.至此,通過代入式 (4)中的Fu和Fr值,可以得到
因此,A+λi(BFu+T1Fr)C=A-μλiPCTC,其中P為滿足式 (6)的對稱正定矩陣,μ是滿足式(5)的正數(shù).令Zi=A-μλiPCTC,則有
其中,Q來自于式 (6).整理式 (5)、式 (6)和式(18)可得
因?yàn)棣虧M足式 (5),所以Q0i≤0,Qi >0.因?yàn)镻 >0且Qi >0,基于李雅普諾夫方程 (20),顯然對于所有i=2,···,N,Zi=A+λi(BFu+T1Fr)C均為赫爾維茲的,即說明閉環(huán)系統(tǒng) (10)的狀態(tài)可達(dá)到一致.
為證明式 (9),對式 (10)中的狀態(tài)向量s(t)進(jìn)行如下變換
又由于Hr為赫爾維茲的,所以,當(dāng)t→∞,向量xi和ri滿足式(9).
注 4.在定理 2 的證明中,本文首先受文獻(xiàn)[15]啟發(fā)將一致性條件轉(zhuǎn)為矩陣+λi的穩(wěn)定性問題,進(jìn)一步經(jīng)過合適的相似變換將該問題轉(zhuǎn)化為矩陣A+λi(BFu+T1Fr)C的穩(wěn)定性問題,最后通過引入滿足 R iccati 方程 (6)的矩陣P和滿足與拓?fù)浼s束有關(guān)的參數(shù)μ,有效計(jì)算出增益矩陣Fu和Fr.協(xié)議設(shè)計(jì)式 (4)、式 (5)和式 (6)作為一個整體,有效保留了文獻(xiàn)[15]中經(jīng)典輸出反饋協(xié)議所滿足的類似“分離原理” 的優(yōu)良計(jì)算特性.
注 5.通過設(shè)計(jì)合適的增益矩陣,協(xié)議 (2)和式(4)可指定狀態(tài)誤差xi-xj以及ri-rj的收斂率.為此,根據(jù)式 (6),只需對式 (4)中增益矩陣的設(shè)計(jì)要求修改為: 矩陣A+λi(BFu+T1Fr)C,i=2,3,···,N和Hr的所有特征值實(shí)部均小于-α,其中α為給定的正數(shù).若滿足,則對于所有i,j=1,2,···,N,t≥0,下列不等式均成立
其中,γ為某一正數(shù).
下面通過仿真算例驗(yàn)證本文無控制器間通信一致性協(xié)議的有效性,并通過與文獻(xiàn)[16]的降階一致性協(xié)議的對比實(shí)驗(yàn)來說明本文方法的優(yōu)勢.
本文考慮由 6 個智能體組成的多智能體系統(tǒng),智能體 (1)中的矩陣如下所示
容易驗(yàn)證假設(shè)2 和假設(shè)3 成立且 (A,C)可檢測.假設(shè)有向通信網(wǎng)絡(luò)G的拉普拉斯矩陣為
經(jīng)計(jì)算,該矩陣的特征值為 0、1、2、3.3247和 1.3376±0.5623i,表明假設(shè)1 成立.
智能體初始狀態(tài)xi(0)設(shè)置為隨機(jī)數(shù)值,控制器初始狀態(tài)ri(0)設(shè)置為0,仿真結(jié)果如圖1 和圖2 所示.在參數(shù)設(shè)計(jì)過程中可以看到,參數(shù)Hr,Hu和Fr,Fu的設(shè)計(jì)過程是完全獨(dú)立的,即滿足類似文獻(xiàn)[15]中 “分離原理” 的性質(zhì).圖1 和圖2 顯示基于協(xié)議 (2)和式 (4)設(shè)計(jì)的降階輸出反饋一致性協(xié)議使閉環(huán)多智能體系統(tǒng)達(dá)到了一致,驗(yàn)證了該協(xié)議的有效性.
圖1 無控制器通信一致性協(xié)議(2)下的智能體狀態(tài)xiFig.1 Agent states xi under the protocol (2)
圖2 無控制器通信一致性協(xié)議(2)下的控制器狀態(tài)riFig.2 Controller states ri under the protocol (2)
文獻(xiàn)[16]中一致性協(xié)議具有如下形式
圖3 一致性協(xié)議 (21)下的智能體狀態(tài)xiFig.3 Agent states xi under the protocol (21)
為展示本文協(xié)議在抵抗網(wǎng)絡(luò)攻擊方面的優(yōu)勢,假定相對輸出可直接測量得到,同時(shí)假定智能體4的輸入值u4在通信傳輸中每經(jīng)過 0.1 s 被篡改一次,導(dǎo)致鄰接智能體接收的值為 2u4.協(xié)議 (2)下仿真結(jié)果與圖1 和圖2 一致,因?yàn)樵搮f(xié)議并不需要鄰居智能體的輸入信號(或者說該協(xié)議不需要控制器間的通信);協(xié)議 (21)下仿真結(jié)果如圖4 所示.
圖4 遭受網(wǎng)絡(luò)攻擊時(shí)一致性協(xié)議 (21)下的智能體狀態(tài)xiFig.4 Agent states xi under the protocol (21)when subjected to a network attack
一方面,圖3 的仿真結(jié)果表明,在控制器間的通信網(wǎng)絡(luò)能夠準(zhǔn)確傳送鄰居輸入信號的前提下,協(xié)議(21)有效地控制多智能體系統(tǒng)(1)達(dá)成一致.另一方面,圖4 的仿真結(jié)果表明,當(dāng)通信網(wǎng)絡(luò)遭受攻擊導(dǎo)致無法準(zhǔn)確傳送鄰居輸入信號時(shí),協(xié)議(21)則有可能完全失效.與之相比,本文所提協(xié)議(2)在遭受網(wǎng)絡(luò)攻擊的情況下仍然能夠達(dá)成一致(仿真結(jié)果仍如圖1 和圖2 所示,因?yàn)閰f(xié)議(2)不依賴于鄰居的輸入信號),從而顯示出本文協(xié)議(2)在網(wǎng)絡(luò)攻擊免疫方面的優(yōu)勢.
本文針對線性同構(gòu)多智能體系統(tǒng),提出了一種新型的無需控制器間通信的降階一致性協(xié)議.本文提出的參數(shù)設(shè)計(jì)方法仍然滿足類似 “分離原理” 的性質(zhì),增益參數(shù)便于計(jì)算.當(dāng)智能體非穩(wěn)定時(shí),本文協(xié)議中的控制器狀態(tài)仍能在實(shí)現(xiàn)一致性過程中保持有界,并且可以通過調(diào)整增益矩陣,指定智能體間狀態(tài)誤差xi-xj的收斂率.不同于文獻(xiàn)[18,23]以構(gòu)造智能體相對狀態(tài)觀測器為設(shè)計(jì)前提,本文協(xié)議中控制器狀態(tài)向量并非是對智能體相對狀態(tài)的估計(jì),因此本文提出的協(xié)議及其設(shè)計(jì)方法在一定程度上延伸了文獻(xiàn)[18,23]中一致性協(xié)議設(shè)計(jì)思想的適用范圍和理論框架.