王 平,劉 暢
(1.海鷹航空通用裝備有限責(zé)任公司,北京 100074;2.北京自動化控制設(shè)備研究所,北京 100074)
近年來,多智能體系統(tǒng)的編隊控制引起各個領(lǐng)域研究人員的廣泛關(guān)注。智能體之間通過編隊協(xié)同工作充分發(fā)揮單個智能體的優(yōu)勢,提高任務(wù)的完成率、拓寬其使用范圍等,在民生、軍事等領(lǐng)域均有巨大的應(yīng)用潛力[1-5]。例如,在執(zhí)行偵察任務(wù)時,單架無人機受到傳感器的角度限制,不能從多個方位對目標(biāo)區(qū)域進(jìn)行觀測,多架無人機編隊飛行,通過分工協(xié)作可實現(xiàn)目標(biāo)區(qū)域的多方位觀測,縮短任務(wù)完成時間,提高任務(wù)完成效率[6]。編隊保持作為編隊控制的基本問題,是編隊有效執(zhí)行任務(wù)的基本保障。編隊保持的核心問題是通過設(shè)計恰當(dāng)?shù)目刂茀f(xié)議,借助鄰居智能體之間的局部交互形成并保持期望的隊形。目前編隊保持和控制的方法主要包括領(lǐng)航—跟隨法[7]、虛擬結(jié)構(gòu)法[8]、行為控制法[9]及一致性控制方法[10]。Ren[11]論證了領(lǐng)航—跟隨法、虛擬結(jié)構(gòu)法及行為控制法都可以歸入一致性的統(tǒng)一框架內(nèi)。
許多物理系統(tǒng),特別是機械系統(tǒng),通常表示為二階積分器模型。然而工程實踐中的物理系統(tǒng)往往具有非線性特性,導(dǎo)致系統(tǒng)模型無法簡化為線性積分系統(tǒng)的形式。針對有向網(wǎng)絡(luò)拓?fù)淝樾危琘u等[12]研究了具有非線性動態(tài)的二階多智能體系統(tǒng)的一致性,得到了系統(tǒng)達(dá)到一致的條件。在此基礎(chǔ)上,Song等[13]考慮了帶有領(lǐng)航者的情形,利用牽引控制方法研究了二階非線性多智能體系統(tǒng)的協(xié)調(diào)跟蹤問題。針對跟隨者之間的通信拓?fù)鋱D為無向圖和有向圖兩種情形,Wen等[14]給出了控制增益滿足的條件,確保系統(tǒng)實現(xiàn)目標(biāo)跟蹤。然而上述控制增益均依賴智能體的非線性特性以及通信拓?fù)鋱D等全局信息,并沒有實現(xiàn)真正意義上的分布式。注意到鳥群、魚群、羊群等在集群運動過程中,只需調(diào)整自身與相鄰智能體的相對位置即可維持整體隊形。為此,設(shè)計僅依賴自身與鄰居智能體之間相對狀態(tài)的控制協(xié)議實現(xiàn)群體分布式控制更符合實際且更具有挑戰(zhàn)性。
基于以上分析,本文研究二階非線性多智能體系統(tǒng)的分布式編隊控制問題。利用鄰居智能體之間的相對狀態(tài)信息,提出了具有時變增益的自適應(yīng)控制協(xié)議,確保實現(xiàn)多智能體系統(tǒng)編隊控制。本文的創(chuàng)新主要體現(xiàn)在以下兩個方面:(1)考慮了智能體自身的非線性動態(tài)特性,更符合工程實際;(2)設(shè)計的自適應(yīng)編隊控制協(xié)議不依賴智能體的非線性動態(tài)及通信拓?fù)鋱D信息,實現(xiàn)了真正意義上的分布式,可滿足大規(guī)模的多智能體編隊控制需求。
本節(jié)簡要介紹代數(shù)圖論的相關(guān)概念(詳細(xì)內(nèi)容參考文獻(xiàn)[15]),采用拓?fù)鋱DG(υ,ε,A)表示智能體之間的通信關(guān)系,其中υ= {υ1,υ2,… ,υN}表示參與編隊的N個智能體,表示編隊中各有向信息路徑組成的集合。連接權(quán)重表示智能體之間的通信狀態(tài),當(dāng)智能體i收到智能體j的信息時,aij> 0,否則aij= 0,并且規(guī)定aii= 0,對應(yīng)鄰接矩陣。如果對任意的(υi,υj)∈ε均有(υj,υi)∈ε,則圖G為無向圖,反之則圖G為有向圖。圖G的一條有向路徑是指一組有限的節(jié)點序列υ1,υ2,… ,υl,滿 足(υi-1,υi) ∈υ,i= 1,2,…,l。定義拉普拉斯矩陣為
采用G表示有領(lǐng)航者的通信拓?fù)鋱D,節(jié)點υ0表示領(lǐng)航者,υ1,υ2,… ,υN為跟隨者。對角矩陣表示領(lǐng)航者的鄰接矩陣,若υ0是υi的鄰居時,bi=ai0> 0,否則bi= 0。
假設(shè)1.對于每一個跟隨者,均存在一條由領(lǐng)航者到跟隨者的有向路徑。此外,跟隨者之間的通信拓?fù)鋱D為無向圖。
引理1[16].在假設(shè)1成立的條件下,矩陣M=L+B正定。
考慮包含N個跟隨者和1個領(lǐng)航者的多智能體系統(tǒng),其通信拓?fù)鋱D為G,節(jié)點υ0表示領(lǐng)航者,υ1,υ2,… ,υN為跟隨者。第i個智能體的動態(tài)方程表示如下:
其中:xi(t),vi(t),ui(t) ∈Rm分別表示第i個智能體的位置、速度和控制輸入(或者控制協(xié)議),u0=0。f(t,xi(t),vi(t))表示第i個智能體的非線性動態(tài),為一致連續(xù)可微的向量函數(shù)并且滿足利普希茨條件:
?x1,x2,v1,v2∈Rm,t≥0成立,其中ρ1≥0,ρ2≥ 0為利普希茨常數(shù)。
定義1.稱控制協(xié)議iu能夠解決系統(tǒng)的編隊控制問題,當(dāng)且僅當(dāng)對于任意的初始狀態(tài),所有智能體漸近形成期望的編隊,即
本文的目標(biāo)是設(shè)計分布式控制協(xié)議iu以解決多智能體系統(tǒng)(2)的編隊控制問題。
注意到文獻(xiàn)[11-13]控制協(xié)議中的控制增益均為常值,且依賴智能體的非線性特性及通信拓?fù)鋱D等全局信息。然而集群運動過程中,各智能體只需調(diào)整自身與相鄰智能體的相對位置即可維持整體隊形。為進(jìn)一步提升系統(tǒng)的智能程度,本文基于相鄰智能體之間的相對狀態(tài)信息,提出了如下具有時變增益的自適應(yīng)控制協(xié)議:
其中:k1,k2,τi均為正數(shù),αi(t)為對應(yīng)于第i個跟隨者的時變控制增益。
定義編隊誤差:
記:
編隊誤差系統(tǒng)(6)可描述為如下矩陣形式:
定理1.在假設(shè)1成立的條件下,自適應(yīng)控制協(xié)議(5)無須借助任何全局信息即可解決多智能體系統(tǒng)(2)的編隊控制問題。此外,控制增益αi(t)收斂于有限值。
證.考慮如下的李雅普諾夫函數(shù):
V(t)沿著系統(tǒng)(7)對時間t求導(dǎo),得
注意到非線性動態(tài)F(t,ξ,ζ)滿足利普希茨條件(3),則有
從而:
此外:
將式(11)、式(12)代入式(9)得
注.文獻(xiàn)[12-14]中確定靜態(tài)控制增益需要事先知道通信拓?fù)鋱D的拉普拉斯矩陣及智能體自身的非線性特性,然后根據(jù)系統(tǒng)穩(wěn)定性理論確定靜態(tài)控制增益的取值范圍。本文提出的自適應(yīng)控制協(xié)議(5)的參數(shù)自主調(diào)節(jié),不依賴智能體自身的非線性動態(tài)及通信拓?fù)鋱D信息,可滿足大規(guī)模的多智能體編隊控制需求。然而,控制協(xié)議(5)中的控制增益需要不斷更新,相比于靜態(tài)控制協(xié)議更復(fù)雜,對硬件設(shè)備計算性能提出更高的要求。
本節(jié)通過仿真實例驗證自適應(yīng)控制協(xié)議的有效性??紤]包含6個跟隨者和1個領(lǐng)航者的多智能體系統(tǒng),節(jié)點υ0表示領(lǐng)航者,υ1,υ2,… ,υ6表示跟隨者,其通信拓?fù)鋱D如圖1所示。顯然該通信拓?fù)鋱D滿足假設(shè)1。假設(shè)所有的非零權(quán)重均為1。
圖1 通信拓?fù)鋱DFig.1 The communication graph
所有智能體的動態(tài)方程均由系統(tǒng)(2)給出,非線性動態(tài)由下列Chua's 電路[17]給出:
當(dāng)p=10,q=18, a= 4/3, b=-3 /4時,系統(tǒng)呈現(xiàn)混沌狀態(tài)。選取k1=3,k2=2。
6個跟隨者的初始位置和速度狀態(tài)分別從[0,10]×[-6 ,6]×[-1 0,0]和[-4 ,4]×[-4,4]×[-4 ,4]中隨機選取,領(lǐng)航者的初始位置和速度分別為[1,2,3]T和 [0.6,-0 .2,0.3]T。此外,時變控制增益的初值設(shè)置為 αi( 0) =0和τi= 0.01,i = 1,2,…, 6。假設(shè)期望的一字隊形為其中:
在自適應(yīng)控制協(xié)議(5)作用下多智能體系統(tǒng)的位置和速度曲線分別如圖2~3所示,可以看出多智能體系統(tǒng)形成并保持期望的一字隊形,且速度漸近達(dá)到一致。圖4描述了自適應(yīng)控制協(xié)議(5)中時變增益 αi(t), i= 1,2,… ,6的軌跡曲線。顯然,αi(t), i= 1,2,… ,6漸近趨于某個有限值。
圖2 自適應(yīng)控制協(xié)議(5)作用下的位置曲線Fig.2 Position trajectories of the network under the adaptive control protocol (5)
圖3 自適應(yīng)控制協(xié)議(5)作用下的速度曲線Fig.3 Velocity trajectories of the network under the adaptive control protocol (5)
圖4 時變控制增益 αi(t), i= 1,2,… ,6Fig.4 Time-varying control gains αi(t), i= 1,2,… ,6
本文針對二階非線性多智能體系統(tǒng)的編隊控制問題,設(shè)計了具有時變增益的自適應(yīng)控制協(xié)議。該控制協(xié)議僅依賴鄰居智能體之間的相對狀態(tài)信息,無須知道智能體自身的非線性動態(tài)特性或通信拓?fù)鋱D的特征值等全局信息,從而實現(xiàn)了真正意義上的分布式。通過對包含6個跟隨者和1個領(lǐng)航者的多智能體系統(tǒng)的編隊控制進(jìn)行數(shù)值仿真,證實了該控制協(xié)議的有效性。值得注意的是,本文假設(shè)跟隨者之間的通信拓?fù)鋱D為無向圖,未來將持續(xù)研究跟隨者之間的通信拓?fù)鋱D為有向圖的情形。