陶 夢 ,劉小洋,2?,曹進德 ,邵 劭
(1.江蘇師范大學計算機科學與技術學院,江蘇徐州 221116;2.系統(tǒng)控制與信息處理教育部重點實驗室,上海 200240;3.東南大學數(shù)學學院,江蘇南京 210096;4.東北大學秦皇島分校控制工程學院,河北秦皇島 066004)
隨著計算機技術和通信技術的飛速發(fā)展,多智能體系統(tǒng)的協(xié)同工作模式引起了人們的極大興趣.特別是近年來,由于具有操作成本低、魯棒性強、高容錯性、高效率和并行性等優(yōu)良特性,多智能體系統(tǒng)已經在移動機器人、智能電力網(wǎng)絡、傳感器網(wǎng)絡和智能交通控制等諸多工業(yè)領域得到了廣泛地應用.考慮到實際系統(tǒng)多為復雜的非線性系統(tǒng),一般的線性模式不再適用,非線性系統(tǒng)開始受到眾多研究者的關注.其中,Euler-Lagrange系統(tǒng)作為一種經典的非線性系統(tǒng),其可以描述機器人、機械臂、地面車輛和航天器等復雜的動力學系統(tǒng),已經被廣泛應用于工業(yè)生產、空間探索、災難救援等領域[1–2].此外,伴隨著網(wǎng)絡科學的持續(xù)發(fā)展,多Euler-Lagrange系統(tǒng)(multiple Euler-Lagrange systems,MELS)在空間對抗和航天器協(xié)同攻擊等軍事領域的應用已經獲得了極大地推廣.因此,研究MELS的協(xié)同控制問題具有重要的理論價值和現(xiàn)實意義.
MELS的一致性是多智能體系統(tǒng)協(xié)同控制領域的熱點問題.近年來,眾多學者對其進行了大量研究并取得了一些研究成果[3–5].例如,文獻[3]基于自適應分布式觀測器解決了不確定MELS的領導–跟隨一致性問題.文獻[4]在傳統(tǒng)采樣策略的基礎上提出了一類時變采樣策略實現(xiàn)了MELS的一致性.然而,上述成果均是基于網(wǎng)絡中各節(jié)點之間僅存在合作關系的假設而實現(xiàn)的.事實上,現(xiàn)實生活中的個體之間不僅存在合作關系而且也存在對抗關系.例如,兩黨制中,當其中一個政黨的領導人對某個特殊事件發(fā)表觀點,同一陣營的成員會表示贊成,而對立陣營的成員則會表示反對[6].這表明同一陣營的成員之間是合作關系,而不同陣營的成員之間是對抗關系.對此,Altafini在文獻[7]中引入符號圖的概念,將對抗關系表示為節(jié)點間的負邊,合作關系表示為節(jié)點間的正邊.如此,在合作–對抗網(wǎng)絡中,多智能體系統(tǒng)二分一致性就演變成控制目標的模是相同的,而符號則相反.在此基礎上,文獻[8]利用異步脈沖控制策略實現(xiàn)了具有領導者的多智能體系統(tǒng)的分布式二分一致性.文獻[9]分別研究了在細節(jié)平衡圖與細節(jié)非平衡圖條件下多智能體系統(tǒng)的有限時間二分一致性.
另一方面,被控系統(tǒng)往往要求在有限時間內收斂,因此收斂速度是評價控制協(xié)議性能的一個重要指標.為了加快多智能體系統(tǒng)的收斂速度,眾多優(yōu)化控制時間的控制方法被提出,如有限時間和固定時間控制策略[10–16].但是,無論是有限時間控制策略還是固定時間控制策略都有一定的保守性,其收斂時間嚴重依賴系統(tǒng)參數(shù),甚至是系統(tǒng)初值,這使得控制協(xié)議無法完成一些對時間要求較高的任務.為了克服以上缺陷,預設時間控制策略開始走入人們視線.多智能體系統(tǒng)的預設時間控制能使系統(tǒng)在任意事先指定的時間內實現(xiàn)一致性,同時確保該時間與其它任何參數(shù)無關,完全根據(jù)任務需要預先設置.截止目前,多智能體系統(tǒng)預設時間一致性已經取得了一些研究成果[17–19].例如,文獻[17]基于分布式觀測器和滑??刂撇呗詫崿F(xiàn)了二階多智能體系統(tǒng)預設時間一致性.但是,目前關于MELS預設時間二分一致性的研究成果較少.
此外,由于復雜多變的工作環(huán)境,多智能體系統(tǒng)不可避免地會受到各種干擾的影響.鑒于滑??刂茖ν獠扛蓴_具有良好的魯棒性,文獻[20]基于滑模控制理論和圖論提出了有限時間滑模跟蹤控制協(xié)議,實現(xiàn)了Euler-Lagrange網(wǎng)絡系統(tǒng)領導–跟隨有限時間協(xié)同追蹤.文獻[21]基于有限時間滑模觀測器,解決了在速度不可測情況下多智能體系統(tǒng)有限時間一致性問題.文獻[22]提出了全新的滑??刂破?實現(xiàn)了具有多個領導者的MELS固定時間一致性.但是,現(xiàn)有的文獻大多集中在有限時間滑模控制和固定時間滑??刂?對于如何設計新的滑??刂撇呗詠肀WCMELS的預設時間二分一致性仍然有待解決.
基于上述討論,本文主要研究了具有外部干擾的MELS的預設時間二分一致性問題.本文主要創(chuàng)新點如下:
1)與文獻[3–5,10–12]中的完全一致性不同,本文在結構平衡圖下,實現(xiàn)了MELS的預設時間二分一致性,最終的一致性目標的模相同,但是符號相反;
2)與文獻[22]考慮的無干擾的系統(tǒng)相比,本文研究了具有外部擾動的MELS,采用預設時間控制方法克服了外部干擾對系統(tǒng)實現(xiàn)二分一致性的影響;
3)與文獻[22]中的控制時間依賴于系統(tǒng)參數(shù)不同,本文借助時變函數(shù)方法設計了全新的預設時間滑??刂茀f(xié)議,保證MELS在預設時間內實現(xiàn)二分一致性,且控制時間可以根據(jù)任務需要而預先設定.
考慮由有向符號圖G(V,E,A)來描述N個跟隨者之間的通信拓撲,其中:V={v1,v2,···,vN}表示頂點集;E ?V×V表示有向邊集;(vj,vi)∈E表示智能體i可以接收到智能體j的信息,但反之不成立;A=[aij]∈RN×N表示圖G的鄰接矩陣,如果(vj,vi)∈E,那么aij0,否則aij=0.本文不考慮閉環(huán),即aii=0.點vi1到點vij的路徑可以由有序點集{vi1,vi2,···,vij}來表示,其中(vik,vik+1)∈E,k=1,2,···,j-1.如果有向圖中任意兩點之間都有一條路徑連接,那么稱圖G為強連通圖.
圖G的拉普拉斯矩陣L=[lij]∈RN×N定義如下:
對于符號圖G,如果頂點集V可以劃分為兩個集合V1和V2,滿足V1∪V2=V,V1∩V2=?,?vi,vj ∈Vm,m∈{1,2},aij≥0并 且?vi ∈Vm,vj ∈V3-m,m∈{1,2},aij≤0,那么稱圖G為結構平衡圖,否則稱圖G為結構非平衡圖.
將領導者節(jié)點記為v0,假設領導者只發(fā)送信息,不接收跟隨者的信息.如果第i個跟隨者可以直接獲取領導者的信息,則bi>0,否則bi=0.記對角陣B=diag{b1,b2,···,bN},并定義新矩陣H=L+B.
考慮由N個跟隨者組成的多Euler-Lagrange系統(tǒng),第i個Euler-Lagrange系統(tǒng)定義如下:
其中:qi,,∈Rp分別代表廣義坐標、速度和加速度向量;Mi(qi)∈Rp×p表示正定對稱慣性矩陣;Ci(qi,)∈Rp×p表示科里奧利–向心力矩陣;gi(qi)∈Rp表示重力;τi∈Rp表示作用在系統(tǒng)上的控制器;δi∈Rp為有界的外部干擾,滿足‖Mi(qi)δi‖≤σ,σ為正常數(shù).
定義動態(tài)領導者如下:
其中q0,,∈Rp分別表示領導者的位置、速度和加速度信息.
式(1)可以進一步寫成矩陣形式為
假設1領導者的加速度有界,滿足‖(t)‖≤ε,ε為正常數(shù).
假設2有向符號圖G是強連通的并且結構平衡,且至少有一個節(jié)點可以直接接收領導者的信息.
引理1[7]若圖G是結構平衡的,則存在對角陣D=diag{d1,d2,···,dN},di ∈{-1,1},i=1,2,···,N,使得矩陣DAD的所有元素非負.
對于MELS(1),預設時間二分一致性定義如下:
定義1若以下
成立,則稱MELS(1)實現(xiàn)了預設時間二分一致性,其中Tf是系統(tǒng)實現(xiàn)一致性的時間,該時間可以根據(jù)任務需求預先設計.
注1二分一致性是指多智能體系統(tǒng)中的各智能體通過彼此的合作及對抗交互,達到兩組模值相同但符號相反的狀態(tài).它可以用來刻畫同時具有競爭與合作關系的多智能體系統(tǒng)的演化規(guī)律.此時系統(tǒng)可以分為具有相反任務目標的兩組陣營并進行動力學分析,常應用于多移動機器人對抗系統(tǒng)、社交網(wǎng)絡的觀點分析等領域.
本節(jié)提出一種新的滑??刂撇呗詠韺崿F(xiàn)帶有動態(tài)領導者的MELS預設時間二分一致性.
首先定義追蹤誤差
其中: 常數(shù)?>1,t0>0是系統(tǒng)初始時刻,tf>0是系統(tǒng)收斂所花費的時間,Tf=t0+tf是預先設計的收斂時間.
基于函數(shù)?(t),設計終端滑模s(t)如下:
再引入函數(shù)φ(t),即
其中: 常數(shù)?1,?2>1;T1表示滑動時間,滿足0 基于時變函數(shù)?(t)與φ(t),設計控制器如下: 其中參數(shù)k>0. 定理1在假設1、假設2和控制協(xié)議(12)下,如果控制參數(shù)滿足k≥,則MELS(1)在t=Tf時實現(xiàn)預設時間二分一致性,并且ui(t)在[t0,∞)上保持有界. 證本文的證明分為3個步驟.首先,證明系統(tǒng)(1)可以在t=t0+T1時到達滑模面s(t)=0;其次,證明系統(tǒng)(1)能在t=Tf時實現(xiàn)二分一致性;最后,證明ui(t)在整個時間區(qū)間[t0,∞)上的有界性. 步驟1證明在控制協(xié)議(12)下,系統(tǒng)(1)可以在t=t0+T1時到達滑模面s(t)=0. 沿著系統(tǒng)(8)對滑模變量(10)求導得 1)當t∈[t0,t0+T1)時,根據(jù)函數(shù)φ(t)的定義,式(18)可以寫為 基于以上分析可知,MELS(1)在t=t0+T1時到達滑模面s(t)=0,并在[t0+T1,t0+tf)內沿著滑模面滑動. 步驟2證明e1(t)和e2(t)在t=t0+tf時沿著滑模面(10)收斂到原點,即系統(tǒng)(1)在t=Tf時實現(xiàn)二分一致性. 與式(19)–(22)過程相似,可以進一步得到 2)當t∈[t0+tf,∞)時,因為e1(t)在t=t0+tf時刻是連續(xù)的,所以有 接下來要證明當t>Tf時,e1(t)≡0,e2(t)≡0.為此,構造以下Lyapunov函數(shù): 基于以上分析可知,當t∈[Tf,∞)時,q-q0≡0,-≡>0.因此,MELS(1)在預設時間Tf時實現(xiàn)了二分一致性. 步驟3證明當t∈[t0,∞),ui(t)恒有界. 由式(9)–(10)(13)可知 與步驟1證明相似,有 然后,將式(34)代入式(31)得 3)當t∈[t0+tf,∞)時,s(t)≡0.由式(31)可知‖u(t)‖在[t0+tf,∞)上恒有界. 綜上所述,u(t)在整個時間區(qū)間[t0,∞)上恒有界. 證畢. 注2由定理1可知,系統(tǒng)(1)實現(xiàn)二分一致性的時間為Tf,與系統(tǒng)到達滑模面的時間t0+T1無關.無論系統(tǒng)到達滑模面的時間如何設置,只要滿足t0+T1 注3控制器ui(t)在t=t0+T1時刻和t=t0+tf時刻的有界性分析相當重要.當時間趨近于t0+T1時,1/φ(t)趨近于無窮;當時間趨近于t0+tf時,1/?(t)和1/φ(t)均趨近于無窮.但是,從式(32)與式(35)可以看出,只要ρ1,ρ2均大于1,就可以確保ui(t)在整個時間區(qū)間上的有界性. 注4文獻[23]研究了具有動態(tài)領導者的MELS預設時間二分一致性問題,但是其要求領導者的動力學方程是線性函數(shù).而本文則沒有這種限制,領導者動力學方程可以是非線性的,而且本文進一步考慮了外部干擾對系統(tǒng)的影響.另一方面,文獻[23]采用的方法只可以設置實現(xiàn)收斂的時間上界,無法獲得精確的收斂時間.然而,本文采用的時變函數(shù)控制策略能夠精確設置MELS一致性時間,使系統(tǒng)在該時刻實現(xiàn)二分一致性,這在本文的仿真中也已得到驗證.此外,文獻[23]考慮的拓撲是無向符號圖,本文在有向符號圖下獲得了MELS預設時間二分一致性. 本節(jié)將給出一個二自由度機械臂系統(tǒng)的數(shù)值仿真例子來驗證定理1的正確性.這里考慮由5個機械臂系統(tǒng)組成的MELS,第i,i=1,2,···,5個節(jié)點的動力學方程如下: 其中g=9.8,記Θi=[ρi1ρi2ρi3ρi4ρi5]T,有Θ1=[0.6 1.1 0.1 0.6 0.3]T,Θ2=[0.8 1.2 0.1 0.9 0.5]T,Θ3=[0.9 1.3 0.2 1.3 0.6]T,Θ4=[1.1 1.4 0.3 1.7 0.7]T,Θ5=[1.0 1.2 0.4 1.6 0.6]T. 圖1表示5個跟隨者的有向拓撲圖G,其中集合V={1,2,3,4,5}可以劃分為兩個子集V1={1,2},V2={3,4,5}.顯然,有向圖G是結構平衡的.根據(jù)引理1,可以求得D=diag{1,1,-1,-1,-1}.將領導者與跟隨者之間的信息交互矩陣設置為B=diag{0.6,0,0.6,0.6,0},則網(wǎng)絡拓撲滿足假設2.然后,將領導者的動力學方程設置為q0(t)=[-0.1cost-0.1cost]T.領導者與跟隨者的初始狀態(tài)從[-2,2]×[-2,2]中隨機選取. 圖1 5個跟隨者之間的網(wǎng)絡拓撲Fig.1 Network topology of five followers 對于控制器(12),分別取t0=0,k=1.8,ρ=1.11,ρ1=1.12,ρ2=1.13,設置系統(tǒng)(36)到達滑模面的時間為t0+T1=2,系統(tǒng)實現(xiàn)二分一致性的時間為Tf=4.不難驗證它們的取值滿足定理1的條件,由定理1 可知MELS(36)將在t=4 時實現(xiàn)二分一致性.圖2–3分別給出了5個跟隨者的位置qi與速度,領導者的位置q0與速度(由虛線表示)隨時間演化的過程,而圖4–5則分別給出了二分追蹤誤差qi-diq0和-di隨時間演化的過程. 圖2 MELS(36)中qi的演化過程Fig.2 Evolution of qi in MELS(36) 由圖2和圖3可以看出,MELS(36)在t=4時實現(xiàn)了二分一致性.子集V1中的2個節(jié)點的位置和速度狀態(tài)在t=4時與領導者趨近一致,而子集V2中的3個節(jié)點的位置和速度在t=4時與領導者的位置和速度的模相同,但是符號相反,驗證了定理1的結論. 圖3 MELS(36)中的演化過程Fig.2 Evolution of in MELS(36) 由圖4和圖5可以看出,5個跟隨者的二分追蹤誤差在預設時間t=4時收斂到零,與理論分析的實現(xiàn)二分一致性的時間相同.然而文獻[23]的預設時間控制算法僅能預設實現(xiàn)二分一致性收斂時間的上界,這與本文的算法有著本質的不同.因此,本文提出的預設時間二分一致性算法可以應用于對駐留時間要求精確的復雜任務. 圖4 二分追蹤誤差qi-diq0的演化過程Fig.4 Evolution of bipartite tracking errors qi-diq0 圖5 二分追蹤誤差-di 的演化過程Fig.5 Evolution of bipartite tracking errors -di 本文提出了一種基于終端滑模方法的MELS預設時間二分一致性控制算法.針對結構平衡圖下具有動態(tài)領導者的MELS,設計預設時間終端滑模和分布式預設時間控制器保證系統(tǒng)實現(xiàn)預設時間二分一致性目標.最后,通過仿真實驗驗證了本文理論結果的有效性.在未來的工作中,筆者將進一步研究在有向圖拓撲結構下,切換系統(tǒng)的預設時間二分一致性問題.4 數(shù)值仿真
5 結論