陳 俠,尹立遠
(沈陽航空航天大學,沈陽 110136)
近年來,多智能體在許多領(lǐng)域具有廣泛的應用,例如,無人飛行器(UAV)的協(xié)作控制[1-3]、編隊控制[4-8]、群集[9-11]等。多智能體系統(tǒng)一致性問題是指每個智能體在任意的初始狀態(tài)下,通過設(shè)計多智能體系統(tǒng)一致性協(xié)議,最終使得所有智能體的狀態(tài)達到一致或者趨近于一致。一致性問題是多智能體系統(tǒng)中的一個核心問題,目前越來越多地受到國內(nèi)外學者的關(guān)注[12-14]。文獻[12]首次對分布式系統(tǒng)的一致性進行了研究。1995 年,文獻[13]以Boid 模型[14]為基礎(chǔ),用數(shù)學方法模擬了一致性的現(xiàn)象。文獻[15]對多智能體系統(tǒng)達到一致所需要的時間進行了研究,并指出多智能體系統(tǒng)中,當智能體之間的交流通訊增加時,系統(tǒng)達到一致的時間不會減少。
在多智能體系統(tǒng)中,由于智能體之間的通信是通過網(wǎng)絡(luò)來實現(xiàn)的,因而在實際應用中常常出現(xiàn)延時的情況,因此,研究時間延時問題是多智能體系統(tǒng)中的一個重要研究問題。文獻[16]研究了具有多個時變通信時延的高階連續(xù)時間多智能體系統(tǒng)的平均一致性。文獻[17]研究了帶有時間延時的多智能體系統(tǒng)一致性問題,并得到了滿意的結(jié)果。文獻[18]研究了具有切換拓撲和耦合時延的多智能體網(wǎng)絡(luò)的平均一致性問題。
在實際的多智能體控制系統(tǒng)中,有限的信道帶寬給多智能體協(xié)調(diào)控制帶來很大的制約。而每個智能體的通信能力和計算能力都是有限的,利用傳統(tǒng)的周期采樣控制方式[19-22],可以減少智能體之間的信息通訊次數(shù),從而節(jié)省計算資源。但從網(wǎng)絡(luò)資源利用的角度看,為了減少資源消耗,要求每個智能體的控制器盡可能少地更新它們的信息,為了克服周期采樣控制的局限性,引入了事件觸發(fā)機制[23-25]。文獻[23-24]分別研究了多智能體系統(tǒng)的分布式事件觸發(fā)控制及分布式多智能體協(xié)調(diào)控制策略,詳細地分析和討論了事件觸發(fā)控制技術(shù)在多智能體系統(tǒng)中的應用,并且指出事件觸發(fā)機制能夠大量地減少智能體之間的信息傳輸和智能體更新控制器的次數(shù)。文獻[25]研究了基于事件觸發(fā)機制的多智能體系統(tǒng)一致性,設(shè)計一階系統(tǒng)的事件觸發(fā)控制協(xié)議。通過Lyapunov 穩(wěn)定性理論設(shè)計事件觸發(fā)器的觸發(fā)函數(shù),保證一階系統(tǒng)的穩(wěn)定性和一致性。
目前研究通信延時下基于事件觸發(fā)的多智能體系統(tǒng)一致性問題已經(jīng)引起了有關(guān)學者的高度重視。文獻[26]研究了通信延時和數(shù)據(jù)丟包下事件驅(qū)動的多智能體系統(tǒng)一致性,提出了分布式協(xié)同控制律以保證系統(tǒng)的漸近一致性,并給出了相應的時滯依賴Markov 切換控制器設(shè)計的新方法。值得注意的是,在應用事件觸發(fā)機制時,必須要考慮Zeno 行為,它是指在單位時間內(nèi),系統(tǒng)的事件觸發(fā)器被無限次觸發(fā),而且每次的觸發(fā)間隔無限短。這與事件觸發(fā)機制被提出的初衷相違背。如果Zeno 行為在控制器中出現(xiàn),則該事件觸發(fā)控制器是不可行的,因而在連續(xù)或者說采樣間隔是無窮小的系統(tǒng)中,避免Zeno行為是極為重要的。但在已有的相關(guān)研究成果中沒有考慮Zeno 行為,也沒有給出能夠排除Zeno 行為的最小觸發(fā)間隔下界。本文針對延時下基于事件觸發(fā)的一階多智能體系統(tǒng)一致性問題進行研究。針對固定有向拓撲,設(shè)計了通信延時下基于事件觸發(fā)的控制協(xié)議,利用Lyapunov 穩(wěn)定性理論建立了使一階系統(tǒng)穩(wěn)定和一致的事件觸發(fā)函數(shù),并給出了時滯上界,然后利用該機制求取兩次觸發(fā)之間的最小間隔,排除了Zeno 行為。最后通過仿真實驗驗證了該理論方法的有效性。
因此,依據(jù)一階多智能體系統(tǒng)的一致性定義,得到了網(wǎng)絡(luò)延時下基于事件觸發(fā)機制的多智能體系統(tǒng)的一致性理論,即一階多智能體式(5)在控制協(xié)議式(9)與事件觸發(fā)函數(shù)(19)的作用下,系統(tǒng)將達到一致。
由圖2 可知,系統(tǒng)在控制協(xié)議式(9)控制下,經(jīng)過大約48 s,系統(tǒng)中5 個智能體的狀態(tài)趨于一致,即在無人機編隊中,5 架無人機最終在位置上實現(xiàn)了一致,即實現(xiàn)了編隊控制,體現(xiàn)出本文工作對無人機編隊的物理意義。
圖2 具有輸入時延時一階多智能體系統(tǒng)狀態(tài)圖
圖3 無向圖中誤差的歐幾里得范數(shù)變化
圖4 智能體的控制輸入
圖5 顯示了事件觸發(fā)的時刻和時間間隔,可見,需要傳輸?shù)牟蓸訑?shù)據(jù)大大減少了。
圖5 事件觸發(fā)時刻和時間間隔
值得注意的是,本文假設(shè)輸入時滯為固定的常時滯,而在實際的控制系統(tǒng)中,此時滯的變化是非常復雜的。此外,由于編隊中各個智能體之間的通訊是通過網(wǎng)絡(luò)來實現(xiàn)的,因此,常會出現(xiàn)丟包、非線性干擾等一系列的挑戰(zhàn)。本文忽略了這些因素對控制系統(tǒng)的影響,在未來的工作中,要將這些因素考慮進來,實現(xiàn)對多智能體系統(tǒng)的一致性控制。
本文提出了通信延時下基于事件觸發(fā)機制的一階多智能體系統(tǒng)一致性方法,針對有向固定拓撲,建立了通信延時下基于事件觸發(fā)的一階多智能體閉環(huán)系統(tǒng)模型,并對其穩(wěn)定性和一致性進行了研究。采用Lyapunov 漸進穩(wěn)定性理論建立了事件觸發(fā)函數(shù)并求取時滯上界,求解出保證閉環(huán)系統(tǒng)穩(wěn)定和一致的充分條件,此外,為了排除系統(tǒng)的Zeno 行為,并計算出執(zhí)行間隔的下限估計。最后,通過仿真實例驗證了該算法的可行性。