張棟,馬蘇慧,呂石,王孟陽(yáng),唐碩
(1. 西北工業(yè)大學(xué) 航天學(xué)院,陜西,西安 710072;2. 陜西省空天飛行器設(shè)計(jì)重點(diǎn)實(shí)驗(yàn)室,陜西,西安 710072)
多智能體系統(tǒng)(multi-agent systems,MASs)一致性是指由多個(gè)智能體組成的群體,能夠通過(guò)所設(shè)計(jì)的分布式協(xié)議進(jìn)行信息交互,以合作或競(jìng)爭(zhēng)等方式實(shí)現(xiàn)狀態(tài)的趨同及其任務(wù). 隨著MASs 規(guī)模的擴(kuò)大和任務(wù)復(fù)雜性的提高,MASs 通信傳輸數(shù)據(jù)的量級(jí)不斷提高. 針對(duì)多種通信問(wèn)題所設(shè)計(jì)的一致性協(xié)議,已經(jīng)無(wú)法高效、可靠地解決由軟硬件限制和大數(shù)據(jù)導(dǎo)致的傳輸延遲、數(shù)據(jù)丟包、帶寬限制等問(wèn)題以及系統(tǒng)資源消耗過(guò)大的問(wèn)題.
在20 世紀(jì)50 年代末,ELLIS[1]就已經(jīng)意識(shí)到最合適的采樣方法是指?jìng)鬏斢幸饬x的數(shù)據(jù),即當(dāng)數(shù)據(jù)以給定的增量改變獲得新值. 因此狀態(tài)變量可以進(jìn)行更稀疏地采樣而不會(huì)影響控制性能. 這種當(dāng)測(cè)量值超過(guò)一定限度才進(jìn)行采樣、依賴于信號(hào)的采樣方案被稱為L(zhǎng)ebesgue 采樣[2],即事件觸發(fā)采樣;依賴于時(shí)間軸的周期采樣被稱為Riemann 采樣[2],是事件觸發(fā)采樣的特例[3]. 事件觸發(fā)采樣的思想是根據(jù)所定義的事件滿足與否,使作用對(duì)象采取特定的動(dòng)作或決策. 相比于連續(xù)或周期通信的控制方案,事件觸發(fā)一致性方案能夠根據(jù)事件內(nèi)容使控制器更新或者通信連接進(jìn)行稀疏、有效、靈活地響應(yīng),實(shí)現(xiàn)和保持一致性性能. 事件觸發(fā)一致性控制是從大規(guī)模通信、資源消耗問(wèn)題的內(nèi)在因素出發(fā),在保證一致性實(shí)現(xiàn)的前提下,減少個(gè)體之間數(shù)據(jù)傳輸頻率,克服通信和資源的限制并提高通信傳輸效率;同時(shí),稀疏通信傳輸也能使通信網(wǎng)絡(luò)攻擊難度提高,進(jìn)而提高數(shù)據(jù)的安全性. 因此,事件觸發(fā)一致性控制方案是復(fù)雜大規(guī)模情況下有利于MASs 一致性表達(dá)和資源節(jié)省的重要手段.
OLFATI-SABER 等[4]給出了MASs 經(jīng)典一致性控制協(xié)議:
在該協(xié)議的作用下,所有智能體的狀態(tài)最終能夠收斂到初始狀態(tài)的平均值.
將事件觸發(fā)機(jī)制引入到MASs 一致性控制中,則事件觸發(fā)一致性協(xié)議可表示為
MASs 事件觸發(fā)一致性控制方案如圖1 所示.MASs 事件觸發(fā)一致性控制利用事件檢測(cè)器改變控制器輸入,其原理是:事件檢測(cè)器i對(duì)本地傳感器和外部通信網(wǎng)絡(luò)傳輸?shù)男畔⑦M(jìn)行采集,根據(jù)定義的事件觸發(fā)函數(shù)進(jìn)行解算,判斷是否滿足事件觸發(fā)的條件,在此基礎(chǔ)上對(duì)觸發(fā)信息的傳輸進(jìn)行決策. 如式(4)(5)所示,事件檢測(cè)器i對(duì)相關(guān)變量進(jìn)行監(jiān)聽(tīng),一旦發(fā)現(xiàn)誤差函數(shù)fi的數(shù)值大于閾值函數(shù)Vi的數(shù)值時(shí),觸發(fā)控制的開(kāi)關(guān)閉合,則智能體i的觸發(fā)信息將被發(fā)送給鄰居智能體、控制器i開(kāi)始進(jìn)行采樣更新且測(cè)量誤差ei(t)歸0;在相鄰的觸發(fā)間隔內(nèi),MASs 會(huì)采用零階保持器使得控制器的輸出保持為固定數(shù)值,因此執(zhí)行器i會(huì)得到一個(gè)分段連續(xù)的控制信號(hào).
圖1 事件觸發(fā)一致性控制方案Fig. 1 Event-triggered consensus control schemes
在事件觸發(fā)一致性的實(shí)現(xiàn)過(guò)程中,智能體i的事件檢測(cè)裝置仍需消耗資源去實(shí)現(xiàn)狀態(tài)監(jiān)聽(tīng)、事件檢測(cè)和觸發(fā)信號(hào)發(fā)送的功能;但對(duì)于分布式MASs 來(lái)說(shuō),來(lái)自遠(yuǎn)程節(jié)點(diǎn)的鄰居信息才是控制器i采樣收集的數(shù)據(jù)主體. 相比于原來(lái)的一致性控制方案,事件觸發(fā)一致性協(xié)議只使用智能體i自身和鄰居觸發(fā)時(shí)刻的狀態(tài)信息,減少了通信和計(jì)算的負(fù)載,降低了資源消耗,提升了系統(tǒng)的可靠性.
在保證所設(shè)計(jì)的事件觸發(fā)協(xié)議和事件觸發(fā)函數(shù)能夠使得系統(tǒng)實(shí)現(xiàn)一致后,事件觸發(fā)一致性控制方案還需排除Zeno 行為的發(fā)生. Zeno 行為是指在有限時(shí)間內(nèi)發(fā)生無(wú)限次觸發(fā);一旦Zeno 行為發(fā)生,事件會(huì)在某個(gè)有限時(shí)間內(nèi)發(fā)生連續(xù)觸發(fā),這就違背了引入事件觸發(fā)的目的,因此應(yīng)該盡量避免Zeno 行為.
事件觸發(fā)一致性的關(guān)鍵是設(shè)計(jì)事件檢測(cè)器. 事件檢測(cè)器的內(nèi)容和工作方式將決定事件觸發(fā)的機(jī)制,進(jìn)而影響系統(tǒng)通信計(jì)算頻率和一致性表現(xiàn). 經(jīng)典的事件檢測(cè)器結(jié)構(gòu)如圖2 所示. 事件觸發(fā)函數(shù)的輸入由事件檢測(cè)器的監(jiān)聽(tīng)對(duì)象和監(jiān)聽(tīng)方式定義,觸發(fā)函數(shù)的具體形式描述事件觸發(fā)的設(shè)計(jì)策略,事件檢測(cè)器輸入和輸出端口的位置影響事件檢測(cè)器的通信方式. 事件檢測(cè)器設(shè)計(jì)的差異會(huì)使得控制方案效果有所不同. 因此,本文將圍繞事件的監(jiān)聽(tīng)機(jī)制、觸發(fā)函數(shù)的結(jié)構(gòu)設(shè)計(jì)和事件檢測(cè)器間的通信機(jī)制3 個(gè)特征,介紹事件觸發(fā)的設(shè)計(jì)策略以及具體的控制方案.
圖2 事件檢測(cè)器的結(jié)構(gòu)Fig. 2 The structure of event detector
2.1.1 監(jiān)聽(tīng)對(duì)象
任務(wù)目標(biāo)和智能體動(dòng)態(tài)的差異以及限制條件等影響下,事件檢測(cè)器監(jiān)聽(tīng)對(duì)象zi(t)的定義是不同的.
表1 監(jiān)聽(tīng)對(duì)象的定義Tab. 1 Definition of monitored objects
特別地,為使觸發(fā)間隔內(nèi)的控制輸入不是常值信號(hào)而是隨時(shí)間變化的連續(xù)信號(hào),GARCIA 等[11]引入估計(jì)器的概念,其構(gòu)型為
此時(shí)事件檢測(cè)器的監(jiān)聽(tīng)對(duì)象是估計(jì)變量,即zi(t)=x?i(t). 式(6)是一個(gè)開(kāi)環(huán)估計(jì). 開(kāi)環(huán)估計(jì)器的設(shè)置可以使智能體之間進(jìn)行無(wú)連續(xù)通信的同時(shí),事件檢測(cè)器的監(jiān)聽(tīng)對(duì)象又具有一定的動(dòng)態(tài)特性,但會(huì)導(dǎo)致部分計(jì)算資源的占用.
2.1.2 監(jiān)聽(tīng)方式
① 連續(xù)/離散
事件檢測(cè)器對(duì)相關(guān)變量進(jìn)行實(shí)時(shí)監(jiān)聽(tīng)的方式包括連續(xù)和離散兩種方式. 連續(xù)監(jiān)聽(tīng)是指事件檢測(cè)器會(huì)在MASs 動(dòng)力學(xué)方程的每個(gè)時(shí)間步長(zhǎng)均進(jìn)行采樣,離散監(jiān)聽(tīng)則指檢測(cè)器會(huì)以動(dòng)力學(xué)方程時(shí)間步長(zhǎng)的倍數(shù)為時(shí)間間隔進(jìn)行采樣.
文獻(xiàn)[5,11]設(shè)計(jì)了基于連續(xù)監(jiān)聽(tīng)機(jī)制的事件觸發(fā)一致性控制方案,如式(3)(4)所示. MENG 等[12]和GUO 等[13]將采樣數(shù)據(jù)的思想應(yīng)用到事件觸發(fā)控制中,設(shè)計(jì)出基于離散監(jiān)聽(tīng)機(jī)制的事件觸發(fā),又稱為基于采樣數(shù)據(jù)的事件觸發(fā)方案,如下所示.
圖3 連續(xù)MASs 基于采樣數(shù)據(jù)的事件觸發(fā)機(jī)制Fig. 3 Sampled-based event-triggered mechanism of continuous-time MASs
除固定周期的采樣監(jiān)聽(tīng)以外,隨機(jī)采樣[14-16]的監(jiān)聽(tīng)方式也被應(yīng)用在一致性研究中. 隨機(jī)采樣的監(jiān)聽(tīng)機(jī)制中,事件檢測(cè)器的采樣間隔是完全隨機(jī)的序列或者以固定概率選擇某一大小的周期.
② 同步/異步
式(8)中,所有事件檢測(cè)器的采樣周期大小相同,這意味著所有智能體的監(jiān)聽(tīng)時(shí)序是周期同步的. 基于隨機(jī)采樣數(shù)據(jù)的事件觸發(fā)方案則是非周期同步的.當(dāng)每個(gè)智能體的事件檢測(cè)器擁有不同大小的采樣周期,則稱該觸發(fā)方案是異步的. 在離散監(jiān)聽(tīng)機(jī)制設(shè)計(jì)的基礎(chǔ)上,異步監(jiān)聽(tīng)事件觸發(fā)機(jī)制[17-19]設(shè)計(jì)如下:
① 依賴狀態(tài)/不依賴狀態(tài)的閾值設(shè)計(jì)
在早期研究中,事件觸發(fā)函數(shù)是通過(guò)對(duì)MASs 進(jìn)行一致性推導(dǎo)得出,式(5)中的閾值函數(shù)僅與狀態(tài)變量有關(guān),此時(shí)MASs 事件觸發(fā)的頻率會(huì)隨著系統(tǒng)規(guī)模的擴(kuò)大而提高,容易導(dǎo)致Zeno 行為的發(fā)生. 針對(duì)這一現(xiàn)象,不依賴狀態(tài)的閾值函數(shù)被提出,通過(guò)對(duì)觸發(fā)函數(shù)結(jié)構(gòu)進(jìn)行合適的設(shè)計(jì)并且調(diào)整不依賴狀態(tài)部分的相關(guān)參數(shù),可以在調(diào)整收斂速率的同時(shí),避免Zeno 行為發(fā)生. 根據(jù)依賴或不依賴狀態(tài)事件觸發(fā)函數(shù)的設(shè)計(jì)策略,式(5)中的閾值函數(shù)可總結(jié)如下:
式中:δ1(t)和δ2(t)為與狀態(tài)變量無(wú)關(guān)的閾值參數(shù);Vi1(·)為狀態(tài)變量的函數(shù).
當(dāng)δ1(t)≠0時(shí),閾值函數(shù)Vi依賴于狀態(tài)變量、狀態(tài)變量的組合以及時(shí)間變量,稱為依賴狀態(tài)的事件觸發(fā)函數(shù). CAO 等[10]設(shè)計(jì)出閾值函數(shù)為Vi(t)=δ1·(t)Θizi(t)的狀態(tài)依賴事件觸發(fā)控制方案,并指出其所研究的觸發(fā)方案只能使具有一般線性動(dòng)態(tài)的MASs 實(shí)現(xiàn)漸近一致卻不能避免Zeno 行為. 依賴狀態(tài)的事件觸發(fā)控制方案對(duì)狀態(tài)變化敏感,能夠充分利用當(dāng)前智能體的狀態(tài)信息,使系統(tǒng)實(shí)現(xiàn)一致.
當(dāng)δ1(t)=0且δ2(t)≠0時(shí),閾值函數(shù)Vi與狀態(tài)量無(wú)關(guān)僅與時(shí)間變量有關(guān),稱為不依賴狀態(tài)的事件觸發(fā)函數(shù). ZHANG 等[20]和YANG 等[21]設(shè)計(jì)不依賴狀態(tài)的事件觸發(fā)閾值函數(shù)為Vi(t)=αe-βt(α,β >0),包含該閾值函數(shù)的事件觸發(fā)方案使得一般線性MASs 在實(shí)現(xiàn)狀態(tài)一致或輸出一致的同時(shí),避免了Zeno 行為.在周期采樣MASs 中,YANG 等[22]提出Vi(t)=αβt的閾值函數(shù). 不依賴狀態(tài)的事件觸發(fā)函數(shù)計(jì)算量較少,其對(duì)應(yīng)的方案可以避免Zeno 行為的發(fā)生.
GARCIA 等[11]研究了閾值函數(shù)為Vi(t)=δ1·(t)Θi zi(t)+c的事件觸發(fā)方案,該方案能夠使系統(tǒng)避免Zeno 行為的發(fā)生但只能實(shí)現(xiàn)有界一致性;CUI 等[23]也在異構(gòu)MASs 中發(fā)現(xiàn)將常數(shù)閾值c引入依賴狀態(tài)的事件觸發(fā)函數(shù)中可以使得MASs 不會(huì)發(fā)生Zeno 行為,但會(huì)降低一致性控制性能表現(xiàn).
② 基于動(dòng)態(tài)參數(shù)的閾值設(shè)計(jì)
在MASs 事件觸發(fā)一致性方案的作用下,事件檢測(cè)器的監(jiān)聽(tīng)變量會(huì)逐漸達(dá)到收斂的狀態(tài),并且測(cè)量誤差變化的幅度逐漸降低,這會(huì)導(dǎo)致式(5)中的誤差函數(shù)和閾值函數(shù)的實(shí)時(shí)輸出接近,進(jìn)而使得事件觸發(fā)的頻率升高. 理想的觸發(fā)方案能夠在一致性協(xié)議作用初期以較大觸發(fā)間隔工作,在一致性快要實(shí)現(xiàn)時(shí)自動(dòng)降低觸發(fā)間隔的大小,因此提出了動(dòng)態(tài)事件觸發(fā)一致性方案,即對(duì)應(yīng)的閾值函數(shù)中δ1(t)或δ2(t)是由與狀態(tài)變量相關(guān)的微分方程或差分方程驅(qū)動(dòng)的輔助變量. 基于采樣數(shù)據(jù)的事件觸發(fā)函數(shù),YIN[24]和GE 等[25]設(shè)計(jì)智能體i對(duì)應(yīng)的觸發(fā)閾值δ1(t)是由差分方程驅(qū)動(dòng)的,且δ1(t)∈[0,1)是單調(diào)非增的時(shí)間序列. YI 等[26]提出了一類含有由微分方程驅(qū)動(dòng)的閾值項(xiàng)δ2(t)的事件觸發(fā)方案,避免了Zeno 行為. 時(shí)變的閾值參數(shù)能夠動(dòng)態(tài)地調(diào)整觸發(fā)時(shí)間間隔,以更好的響應(yīng)性去實(shí)現(xiàn)一致性的控制性能要求.
事件檢測(cè)器輸出端口的位置可以位于智能體內(nèi)部的傳感器和控制器之間,也可以處于智能體外部的觸發(fā)信息傳輸?shù)耐ㄐ胚B接上. 前者決定智能體自身的觸發(fā)時(shí)刻,使得智能體自身向其他所有鄰居智能體發(fā)送觸發(fā)信息,建立多條單向觸發(fā)數(shù)據(jù)鏈路;后者決定智能體之間的觸發(fā)信息傳輸時(shí)刻,使得通信連接邊兩端的智能體可以在觸發(fā)時(shí)刻共享觸發(fā)信息,建立單條雙向的觸發(fā)數(shù)據(jù)鏈路. 因此,根據(jù)事件檢測(cè)器輸出位置的設(shè)置MASs 觸發(fā)信息傳輸?shù)耐ㄐ啪W(wǎng)絡(luò)可以被分為廣播形式和點(diǎn)對(duì)點(diǎn)形式.
2.3.1 廣播形式
廣播通信形式是指智能體以一對(duì)多的方式廣播數(shù)據(jù)信息. 智能體i會(huì)在每次事件觸發(fā)時(shí)刻廣播信息,其鄰居智能體截獲到智能體i最新的觸發(fā)時(shí)刻信息并將該信息用于控制器的輸入. 根據(jù)事件檢測(cè)器利用其它智能體狀態(tài)信息的范圍大小,廣播形式的事件觸發(fā)器又可分為集中式、分布式、分散式.
① 集中式
一般的集中式事件觸發(fā)機(jī)制如圖4 所示,其控制方案如下:
圖4 集中式事件觸發(fā)機(jī)制(方案A1)Fig. 4 Centralized event-triggered mechanism (Scheme A1)
式中:Ui(·)代表智能體i的協(xié)議函數(shù).
集中式觸發(fā)方案的事件檢測(cè)器會(huì)對(duì)所有智能體發(fā)送的信息進(jìn)行監(jiān)聽(tīng),并會(huì)將當(dāng)前的觸發(fā)狀態(tài)同時(shí)發(fā)送給所有智能體. 因此集中式事件觸發(fā)方案的觸發(fā)時(shí)間和控制器采樣更新時(shí)刻都是同步的,有tk,i=sk,i=tk(?i). 該類型的事件觸發(fā)方式,要求MASs有一個(gè)能夠及時(shí)收發(fā)信息和具有充足計(jì)算存儲(chǔ)資源的個(gè)體或者外部基站. 集中式的特性無(wú)法有效減少資源的浪費(fèi),而且很容易造成信道堵塞.
② 分散式
一般的分散式事件觸發(fā)機(jī)制,如圖5 所示,其控制方案如下所示.
圖5 分散式事件觸發(fā)機(jī)制(方案A2)Fig. 5 Decentralized event-triggered mechanism (Scheme A2)
分散式的檢測(cè)器只利用智能體i自身信息進(jìn)行檢測(cè),因此所有智能體的觸發(fā)時(shí)刻是異步的;智能體i的控制器采樣更新時(shí)刻由自身及其鄰居智能體的最新觸發(fā)時(shí)刻所決定,故智能體的通信僅在控制器層面體現(xiàn). 相對(duì)于集中式的事件觸發(fā)一致性控制方案,分散式觸發(fā)設(shè)計(jì)對(duì)本地事件檢測(cè)器的接收信息和計(jì)算信息的能力要求不高,具有更好的響應(yīng)性以及一定的安全性保障;但事件檢測(cè)器僅利用自身信息檢測(cè),忽略了分布式系統(tǒng)廣播的鄰居觸發(fā)信息,對(duì)鄰居狀態(tài)的敏感性不高.
③ 分布式
文獻(xiàn)[5,29]提出如下的分布式事件觸發(fā)機(jī)制:
在事件觸發(fā)方案A3 中,智能體i的事件檢測(cè)器會(huì)連續(xù)監(jiān)聽(tīng)智能體i和鄰居智能體j的狀態(tài)信息,且在事件觸發(fā)時(shí)需要標(biāo)記存儲(chǔ)特定數(shù)據(jù). 相較于一般一致性方案,雖然方案A3 能夠減少控制器更新頻率,但整個(gè)MASs 通信計(jì)算資源的浪費(fèi)仍無(wú)法避免;相較于集中式和分散式事件觸發(fā)方案,智能體i對(duì)鄰居狀態(tài)的監(jiān)聽(tīng)有效整合局部信息,使事件內(nèi)涵更豐富.
對(duì)觸發(fā)方案A3 進(jìn)行改進(jìn),GARCIA 等[30]提出如圖6 所示的事件觸發(fā)機(jī)制,其控制方案為
圖6 分布式事件觸發(fā)機(jī)制(方案A4)Fig. 6 Distributed event-triggered mechanism (Scheme A4)
對(duì)于方案A4 而言,由于智能體i獲取鄰居的觸發(fā)信息是被動(dòng)地接收,導(dǎo)致一旦鄰居智能體的數(shù)量過(guò)大,控制器的更新頻率也越大;但控制器和事件檢測(cè)器都只利用自身信息和鄰居觸發(fā)信息,減少了對(duì)遠(yuǎn)程鄰居節(jié)點(diǎn)信息的獲取. 分布式的事件觸發(fā)機(jī)制多以該類型為主.
2.3.2 點(diǎn)對(duì)點(diǎn)形式
廣播形式的觸發(fā)一致性是由單點(diǎn)事件決定觸發(fā)時(shí)間,同理也可提出由邊事件驅(qū)動(dòng)的一致性方案. 邊事件會(huì)決策一條邊上兩個(gè)智能體的控制器何時(shí)共享觸發(fā)狀態(tài)信息,其觸發(fā)通信方式是點(diǎn)對(duì)點(diǎn)的.
CAO 等[10]提出如下形式的點(diǎn)對(duì)點(diǎn)事件觸發(fā)一致性控制方案:
式中:zij(t)=xi(t)-xj(t)為邊狀態(tài),F(xiàn)l(l=1,2,···)為基于邊(i,j)的多條事件觸發(fā)函數(shù)規(guī)則. 在邊事件驅(qū)動(dòng)的一致性框架下,通信邊上的兩個(gè)智能體的實(shí)時(shí)信息是一直共享的;當(dāng)所定義的多條事件觸發(fā)規(guī)則中的一條不被滿足時(shí)邊事件觸發(fā),與此同時(shí)智能體i與j之間的觸發(fā)邊狀態(tài)zij(tk,ij)更新. 方案A6 中的事件檢測(cè)器仍需與鄰居智能體進(jìn)行連續(xù)的通信,但智能體i的控制器只需在智能體i與其所有鄰居智能體之間最新的邊觸發(fā)時(shí)刻進(jìn)行更新.
無(wú)須保持鄰居間的連續(xù)通信,WU 等[32]僅利用觸發(fā)時(shí)刻的邊狀態(tài)信息進(jìn)行事件檢測(cè),如圖7 所示,具體控制方案為
圖7 點(diǎn)對(duì)點(diǎn)事件觸發(fā)機(jī)制(方案A7)Fig. 7 Node-to-node event-triggered mechanism (scheme A7)
事件觸發(fā)一致性控制方案要求事件檢測(cè)器至少要連續(xù)地對(duì)本地狀態(tài)信息進(jìn)行實(shí)時(shí)監(jiān)聽(tīng). 為進(jìn)一步減少本地連續(xù)監(jiān)聽(tīng)的頻率,文獻(xiàn)[5,34]設(shè)計(jì)了僅利用觸發(fā)信息的事件方案,如下所示.
自觸發(fā)機(jī)制也可分為集中式[34]和分布式[35-37].DIMAROGONASIS 等[5]和FAN 等[9]分別在事件觸發(fā)方案A3 和A5 的基礎(chǔ)上,設(shè)計(jì)了分布式自觸發(fā)迭代算法. 針對(duì)事件觸發(fā)方案A5 進(jìn)行改進(jìn),F(xiàn)AN 等[35]也提出一類分布式自觸發(fā)算法,并通過(guò)仿真實(shí)驗(yàn)與文獻(xiàn)[5]的分布式自觸發(fā)方案、文獻(xiàn)[9]的自觸發(fā)迭代算法進(jìn)行比較;其仿真對(duì)比實(shí)驗(yàn)表明事件觸發(fā)方案的選擇對(duì)自觸發(fā)迭代算法的設(shè)計(jì)有影響. 通過(guò)將事件觸發(fā)和自觸發(fā)控制方案作仿真比較,文獻(xiàn)[5,37]顯示自觸發(fā)方案比事件觸發(fā)控制的魯棒性更好. 在MASs 中,自觸發(fā)機(jī)制完全避免了連續(xù)監(jiān)聽(tīng)動(dòng)作的執(zhí)行,但其設(shè)計(jì)過(guò)程相對(duì)復(fù)雜.
將時(shí)間觸發(fā)和事件觸發(fā)結(jié)合起來(lái),便能得到混合觸發(fā)機(jī)制. 混合觸發(fā)設(shè)計(jì)思路有兩種,一種是在設(shè)計(jì)觸發(fā)方案時(shí)直接將時(shí)間和事件的觸發(fā)機(jī)制混合起來(lái),另一種是設(shè)計(jì)混雜MASs 的事件觸發(fā)控制方案.
基于采樣數(shù)據(jù)的事件觸發(fā)機(jī)制將事件檢測(cè)動(dòng)作固定在每個(gè)采樣點(diǎn),直接將事件驅(qū)動(dòng)和時(shí)間驅(qū)動(dòng)結(jié)合起來(lái). XING 等[38]在隨機(jī)MASs 中將分布式的事件觸發(fā)機(jī)制與分段時(shí)間結(jié)合,形式如下
式中:{Tl,l=0,1,···}為固定時(shí)間序列. 不同于方案A9,方案A10 在某一時(shí)間段內(nèi)控制輸入為0,其余時(shí)間正常工作. 方案A10 比方案A9 進(jìn)一步降低了控制器的更新頻率,也避免了Zeno 行為的發(fā)生.
針對(duì)離散時(shí)間和連續(xù)時(shí)間動(dòng)態(tài)構(gòu)成的混雜MASs,WANG 等[42]通過(guò)令連續(xù)子系統(tǒng)的離散監(jiān)聽(tīng)周期大小與離散子系統(tǒng)的采樣周期大小相等,統(tǒng)一觸發(fā)函數(shù)形式,解決了一致性問(wèn)題.
不同類型的事件觸發(fā)機(jī)制與設(shè)計(jì)策略將會(huì)影響MASs 收斂表現(xiàn). 除此以外,事件觸發(fā)還需考慮個(gè)體差異、通信連接和外部因素對(duì)一致性的影響. 諸多學(xué)者開(kāi)展了事件觸發(fā)一致性的相關(guān)研究,影響事件觸發(fā)一致性的主要因素可歸納為拓?fù)浣Y(jié)構(gòu)、網(wǎng)絡(luò)通信、個(gè)體動(dòng)態(tài)特性和外部作用4 個(gè)方面.
當(dāng)通信拓?fù)涔潭〞r(shí),一致性控制系統(tǒng)實(shí)際的信息流會(huì)在任務(wù)時(shí)段的每個(gè)時(shí)間節(jié)點(diǎn)形成符合要求的拓?fù)浣Y(jié)構(gòu),而事件觸發(fā)控制卻不一定. 在事件觸發(fā)方案A2、A4、A5 和A7 中,智能體僅需利用鄰居智能體的觸發(fā)信息,因此觸發(fā)信息的數(shù)據(jù)鏈路構(gòu)成的網(wǎng)絡(luò)就是MASs 實(shí)際的通信網(wǎng)絡(luò);由于每個(gè)智能體的事件觸發(fā)時(shí)刻序列不完全相同,智能體的觸發(fā)信息數(shù)據(jù)流將按照固定的次序流通,這會(huì)導(dǎo)致實(shí)際的通信網(wǎng)絡(luò)在任意時(shí)刻不總是滿足特定拓?fù)渚W(wǎng)絡(luò)的要求,而是在某些時(shí)間段內(nèi)以聯(lián)合地形式形成一定的拓?fù)浣Y(jié)構(gòu),如無(wú)向連通[9]、含有一個(gè)有向生成樹(shù)[13]、有向強(qiáng)連通權(quán)重平衡[43]和有向強(qiáng)連通[44]等.
文獻(xiàn)[45 - 47]在MASs 事件觸發(fā)一致性控制中考慮了切換拓?fù)涞那樾?,?dāng)通信拓?fù)湓诙鄠€(gè)無(wú)向連通圖之間進(jìn)行切換或者通信網(wǎng)絡(luò)聯(lián)合地包含有向生成樹(shù)時(shí),所設(shè)計(jì)的事件觸發(fā)方案使MASs 實(shí)現(xiàn)一致.除了給定的拓?fù)淝袚Q時(shí)間序列,事件觸發(fā)一致性控制也研究了拓?fù)淝袚Q是一個(gè)半馬爾科夫過(guò)程[48-49]的情形. 切換拓?fù)涞脑O(shè)定,使得事件檢測(cè)器會(huì)在拓?fù)淝袚Q時(shí)刻也進(jìn)行采樣計(jì)算或者使得本地控制器的采樣更新會(huì)直接使用最新切換時(shí)刻所有鄰居的狀態(tài)信息,因此控制器的更新計(jì)算頻率會(huì)有所提高.
雖然事件觸發(fā)一致性控制方案的設(shè)計(jì)使得MASs 信息傳輸頻率降低,但隨著智能體的規(guī)模擴(kuò)大以及任務(wù)環(huán)境的復(fù)雜性提高,MASs 仍無(wú)法完全避免通信網(wǎng)絡(luò)出現(xiàn)傳輸時(shí)滯、數(shù)據(jù)丟包等現(xiàn)象. 因此研究網(wǎng)絡(luò)通信情況對(duì)事件觸發(fā)一致性的影響也是必要的.
對(duì)于傳輸時(shí)滯和數(shù)據(jù)丟包的現(xiàn)象,事件觸發(fā)一致性控制方案的設(shè)計(jì)主要考慮存在固定時(shí)延[27,50]、時(shí)變時(shí)延[51-52]和隨機(jī)時(shí)延[53]的情況,以及數(shù)據(jù)丟包發(fā)生在通信網(wǎng)絡(luò)間[51]、傳感器內(nèi)部[54]、事件檢測(cè)器和控制器之間[55]、控制器內(nèi)部[56]的情形. 這些研究都是從通信問(wèn)題的表征著手.
造成通信網(wǎng)絡(luò)存在傳輸時(shí)滯、數(shù)據(jù)丟包的主要原因是,網(wǎng)絡(luò)傳輸數(shù)據(jù)過(guò)多但通信帶寬有限造成了網(wǎng)絡(luò)連接滿負(fù)載的情況. 為進(jìn)一步減少數(shù)據(jù)傳輸?shù)呢?fù)載,信號(hào)量化技術(shù)可對(duì)原始狀態(tài)信息進(jìn)行編碼和量化,降低數(shù)據(jù)存儲(chǔ)的大小. ZHANG 等[57-58]分別在連續(xù)監(jiān)聽(tīng)和固定周期采樣的事件觸發(fā)機(jī)制中應(yīng)用均勻量化器和對(duì)數(shù)量化器,使得智能體的狀態(tài)收斂到有界域內(nèi). ZHANG 等[57]還將經(jīng)過(guò)量化和未量化的MASs 事件觸發(fā)頻率進(jìn)行對(duì)比,結(jié)果表明使用量化信息的事件觸發(fā)機(jī)制的觸發(fā)次數(shù)更少. 針對(duì)應(yīng)用均勻量化器的MASs,WU 等[59]設(shè)計(jì)了不依賴狀態(tài)的事件觸發(fā)方案,使系統(tǒng)實(shí)現(xiàn)了有界一致性. 信號(hào)量化雖然能在事件觸發(fā)一致性控制的基礎(chǔ)上進(jìn)一步降低資源消耗,但會(huì)降低一致性表現(xiàn).
實(shí)際物理對(duì)象的動(dòng)態(tài)是高動(dòng)態(tài)、復(fù)雜的,因此以一階、二階線性MASs 為主要研究對(duì)象的事件觸發(fā)一致性在實(shí)際應(yīng)用中存在局限性. 為更好地將物理實(shí)體的特性映射到被控對(duì)象的數(shù)學(xué)模型上、更準(zhǔn)確清晰地描述物理現(xiàn)象,事件觸發(fā)控制需要研究由分?jǐn)?shù)階或非線性個(gè)體組成的MASs.
分?jǐn)?shù)階MASs 主要應(yīng)用Caputo 分?jǐn)?shù)階微分的概念和性質(zhì)建立個(gè)體的動(dòng)力學(xué)方程并實(shí)現(xiàn)相關(guān)理論證明,但其所設(shè)計(jì)的事件觸發(fā)一致性協(xié)議和事件觸發(fā)函數(shù)的形式仍舊是整數(shù)冪形式. 例如,WANG 等[60]和YE 等[61]在分?jǐn)?shù)階MASs 中分別設(shè)計(jì)了集中式和分散式的不依賴狀態(tài)事件觸發(fā)控制方案,使智能體能夠?qū)崿F(xiàn)跟蹤一致性;REN 等[62]則研究了分?jǐn)?shù)階MASs 依賴狀態(tài)的分布式事件觸發(fā)機(jī)制和自觸發(fā)算法.
為在非線性MASs 中設(shè)計(jì)合適的事件觸發(fā)方案,往往假設(shè)動(dòng)力學(xué)方程的非線性項(xiàng)滿足Lipschitz 條件.GIRARD 等[63]針對(duì)具有非線性動(dòng)態(tài)特性的智能體,提出了含有自適應(yīng)動(dòng)態(tài)項(xiàng)的集中式事件觸發(fā)機(jī)制,所設(shè)計(jì)的一致性協(xié)議能夠在給定非線性項(xiàng)滿足Lipschitz 條件假設(shè)下使系統(tǒng)實(shí)現(xiàn)漸近一致. PENG 等[64]則在非線性MASs 中,將依賴狀態(tài)和不依賴狀態(tài)的兩個(gè)分布式事件觸發(fā)函數(shù)進(jìn)行集成,設(shè)計(jì)了基于采樣數(shù)據(jù)的集成式事件觸發(fā)方案. 當(dāng)智能體動(dòng)力學(xué)的非線性項(xiàng)是不確定的或未知的,事件觸發(fā)一致性的理論推導(dǎo)已經(jīng)無(wú)法通過(guò)給定條件給出. 針對(duì)MASs具有未知光滑有界的非線性動(dòng)態(tài)時(shí),YANG 等[65]利用神經(jīng)網(wǎng)絡(luò)中多個(gè)已知激活函數(shù)的線性組合去逼近非線性項(xiàng),所設(shè)計(jì)的含有神經(jīng)網(wǎng)絡(luò)訓(xùn)練權(quán)重結(jié)果的事件觸發(fā)控制方案能使系統(tǒng)實(shí)現(xiàn)一致. ZHANG 等[66]則應(yīng)用RBF 神經(jīng)網(wǎng)絡(luò)估計(jì)未知光滑非線性函數(shù),設(shè)計(jì)了解決n階非嚴(yán)格反饋MASs 跟蹤問(wèn)題的事件觸發(fā)控制方案. 除神經(jīng)網(wǎng)絡(luò)技術(shù)外,ZHENG 等[67]和LI[68]還使用模糊邏輯系統(tǒng)去處理智能體動(dòng)力學(xué)的未知光滑非線性項(xiàng),研究自適應(yīng)分布式事件觸發(fā)一致控制方案.
在實(shí)際工程中,物理設(shè)備會(huì)產(chǎn)生噪聲,控制和傳感等零件的輸出量會(huì)受到限制,物理攻擊或其他原因也會(huì)使MASs 控制出現(xiàn)故障. 為了將事件觸發(fā)一致性理論推廣應(yīng)用于工程中,事件觸發(fā)一致性控制方案的設(shè)計(jì)需要考慮噪聲、飽和和故障等情況的發(fā)生.
在MASs 對(duì)噪聲模擬中,往往假設(shè)智能體動(dòng)力學(xué)方程存在有界隨機(jī)變量,在隨機(jī)因素作用下系統(tǒng)不能以一般收斂方式實(shí)現(xiàn)狀態(tài)一致. 例如,HU 等[69]和SU 等[70]針對(duì)含有獨(dú)立標(biāo)準(zhǔn)白噪聲MASs 設(shè)計(jì)的集中式事件觸發(fā)控制方案使系統(tǒng)以均方收斂的形式實(shí)現(xiàn)狀態(tài)一致.
當(dāng)系統(tǒng)的控制器或傳感器存在飽和時(shí),系統(tǒng)控制輸入或測(cè)量輸出的大小被限定在一定的范圍內(nèi),會(huì)影響系統(tǒng)的穩(wěn)定性. WANG 等[71]和MA 等[72]分別針對(duì)控制輸入和傳感輸出飽和的現(xiàn)象,設(shè)計(jì)的分布式事件觸發(fā)方案解決了一致性問(wèn)題.
MASs 會(huì)在實(shí)體物理層面和通信層面發(fā)生故障,影響系統(tǒng)的控制性能. 實(shí)體物理層面中,事件觸發(fā)一致性主要關(guān)注執(zhí)行機(jī)構(gòu)發(fā)生故障的情形. 為解決因執(zhí)行機(jī)構(gòu)故障導(dǎo)致未知的執(zhí)行效率降低以及執(zhí)行動(dòng)作發(fā)生偏移的問(wèn)題,LUO 等[73]和XU[74]提出了自適應(yīng)的事件觸發(fā)一致性控制方案. WANG 等[75]則研究了已知執(zhí)行機(jī)構(gòu)故障間歇發(fā)生下的不確定非線性MASs,通過(guò)狀態(tài)估計(jì)未知期望軌跡信息并設(shè)計(jì)分布式的事件觸發(fā)函數(shù)和自適應(yīng)的事件觸發(fā)一致性協(xié)議,實(shí)現(xiàn)了對(duì)期望軌跡的跟蹤. 通信層面發(fā)生的故障是由外部攻擊產(chǎn)生的,例如拒絕服務(wù)攻擊和欺騙攻擊,會(huì)使控制器無(wú)法接收到正常的傳輸數(shù)據(jù). 在拒絕服務(wù)攻擊發(fā)生下,PENG 等[76]提出了非脆弱的基于采樣數(shù)據(jù)的分布式事件觸發(fā)方案,所設(shè)計(jì)事件觸發(fā)機(jī)制使得在拒絕服務(wù)攻擊的間隔內(nèi)至少會(huì)發(fā)生一次事件觸發(fā),保證系統(tǒng)的一致性;XU 等[77]和PENG 等[78]利用估計(jì)器分別設(shè)計(jì)了點(diǎn)對(duì)點(diǎn)通信事件觸發(fā)機(jī)制和混合事件觸發(fā)機(jī)制,能夠保證MASs 在一定攻擊頻率和間隔設(shè)置的前提下安全地實(shí)現(xiàn)一致性. 針對(duì)可篡改信息的欺騙攻擊,王譽(yù)達(dá)等[79]設(shè)計(jì)了考慮給定欺騙攻擊發(fā)生概率的分散式事件觸發(fā)一致性控制方案.
面對(duì)因自身發(fā)生故障或者受到攻擊而傳播錯(cuò)誤信息的惡意智能體,可通過(guò)忽略異常狀態(tài)信息剔除惡意節(jié)點(diǎn)對(duì)一致性的影響. 基于該思路,WANG 等[80]和AMIRIAN 等[81]分別應(yīng)用MSR(mean subsequencereduced)算法和W-MSR(weighted-MSR)算法,設(shè)計(jì)了事件觸發(fā)彈性一致性控制方案.
證明MASs 事件觸發(fā)一致性的方法主要有兩種:一種方法是直接利用矩陣論和圖論等數(shù)學(xué)知識(shí)直接推導(dǎo)目標(biāo)狀態(tài)的收斂特性[21];另一種方法是是應(yīng)用Lyapunov 穩(wěn)定性理論分析系統(tǒng)一致性表現(xiàn). 在保證事件觸發(fā)一致性的控制性能后,需要給出排除控制方案出現(xiàn)Zeno 行為的分析,目前有兩種思路.
思路一:直接證明事件觸發(fā)間隔的下界嚴(yán)格大于0,以保證有限時(shí)間內(nèi)不會(huì)發(fā)生無(wú)限次觸發(fā). 文獻(xiàn)[5,63]應(yīng)用微分方程中的比較定理給出測(cè)量誤差的上界,并與事件觸發(fā)的邊界條件進(jìn)行聯(lián)合求解,驗(yàn)證了最小觸發(fā)間隔的存在性. FAN 等[9]則通過(guò)對(duì)測(cè)量誤差求導(dǎo),利用微分的基本概念和事件觸發(fā)條件,直接得出觸發(fā)間隔正下界的數(shù)值.
思路二:利用反證法間接證明Zeno 行為不會(huì)出現(xiàn). 文獻(xiàn)[26,82 - 83]利用反證法和觸發(fā)信息證明不存在觸發(fā)時(shí)間序列收斂的智能體. 根據(jù)Zeno 行為的定義,YU 等[84]將驗(yàn)證目標(biāo)定位為相關(guān)狀態(tài)有限時(shí)間的收斂性,推導(dǎo)得出發(fā)生Zeno 行為的智能體集合為空集.
事件觸發(fā)機(jī)制的設(shè)計(jì)決定了事件觸發(fā)一致性方案的控制效果和觸發(fā)效率. 為避免Zeno 行為,連續(xù)MASs 可以應(yīng)用基于采樣數(shù)據(jù)的事件觸發(fā)方案,一般MASs 可以采用包含駐留時(shí)間或者間歇通信的混合觸發(fā)機(jī)制,但這兩類方案會(huì)導(dǎo)致事件檢測(cè)器對(duì)系統(tǒng)部分關(guān)鍵數(shù)據(jù)的忽略. 僅與時(shí)間相關(guān)的閾值函數(shù)可以排除Zeno 行為,但其構(gòu)建的事件觸發(fā)機(jī)制缺乏對(duì)鄰居智能體狀態(tài)的敏感性. 含有常數(shù)項(xiàng)的事件觸發(fā)函數(shù)也能保證Zeno 行為不會(huì)發(fā)生,卻只能使系統(tǒng)實(shí)現(xiàn)有界一致性. 因此,應(yīng)用上述避免Zeno 行為的觸發(fā)機(jī)制會(huì)對(duì)事件觸發(fā)效率或者一致性控制性能有影響.
對(duì)目標(biāo)狀態(tài)進(jìn)行連續(xù)監(jiān)聽(tīng)、閾值函數(shù)依賴狀態(tài)且不含常數(shù)項(xiàng)的分布式事件觸發(fā)方案,能夠使得事件檢測(cè)器對(duì)自身和鄰居智能體的狀態(tài)進(jìn)行充分利用.但一般的分布式事件觸發(fā)方案無(wú)法有效避免Zeno行為. 針對(duì)一致性問(wèn)題,DIMAROGONAS 等[5]設(shè)計(jì)的事件觸發(fā)條件如下.
式(21)形式的動(dòng)態(tài)事件觸發(fā)方案能夠有效避免Zeno 行為,且其觸發(fā)間隔會(huì)隨著一致性誤差的減小而增大,比一般的靜態(tài)事件觸發(fā)方案更高效.
MASs 事件觸發(fā)一致性主要應(yīng)用在以無(wú)人機(jī)、機(jī)器人、航天器等實(shí)體為對(duì)象的編隊(duì)控制和姿態(tài)控制問(wèn)題中. ZHOU 等[85]針對(duì)隨機(jī)切換通信拓?fù)涞亩嗨男頍o(wú)人機(jī)系統(tǒng),研究了動(dòng)態(tài)事件觸發(fā)編隊(duì)跟蹤一致性方案. 蘇博等[86]設(shè)計(jì)的基于自適應(yīng)模糊干擾觀測(cè)器的事件觸發(fā)編隊(duì)控制方案,提升了多自主水下機(jī)器人的編隊(duì)效率. NAIR 等[87]為存在干擾的多機(jī)器人系統(tǒng)設(shè)計(jì)了事件觸發(fā)的快速有限時(shí)間收斂積分滑膜控制器. VILLARREAL-CERVANTES 等[88]針對(duì)多移動(dòng)機(jī)器人系統(tǒng)的編隊(duì)控制問(wèn)題設(shè)計(jì)了周期事件觸發(fā)控制策略,顯著減小了控制更新的頻率. MU 等[89]考慮時(shí)變通信延遲,提出了多移動(dòng)機(jī)器人的異步周期事件觸發(fā)交會(huì)控制方法. 針對(duì)非完整移動(dòng)機(jī)器人,YANG 等[90]研究了無(wú)速度測(cè)量信息的事件觸發(fā)編隊(duì)跟蹤方案. YI 等[91]考慮航天器執(zhí)行機(jī)構(gòu)故障和外部擾動(dòng),設(shè)計(jì)了分布式事件觸發(fā)航天器編隊(duì)自適應(yīng)容錯(cuò)姿態(tài)一致性算法. XU 等[92]對(duì)存在模型不確定性、外部擾動(dòng)和通信受限情況下的航天器編隊(duì)姿態(tài)同步跟蹤問(wèn)題,提出了分布式自適應(yīng)事件觸發(fā)控制律. 基于衛(wèi)星編隊(duì)的Euler-Lagrange 姿態(tài)動(dòng)力學(xué)模型,王智鵬等[93]研究了分布式事件觸發(fā)的相對(duì)姿態(tài)自適應(yīng)控制算法.
除此以外,事件觸發(fā)一致性還被應(yīng)用于傳感網(wǎng)絡(luò)濾波器[94]的設(shè)計(jì),神經(jīng)網(wǎng)絡(luò)[95]和基因調(diào)控網(wǎng)絡(luò)[96]的同步問(wèn)題研究,以及微電網(wǎng)的電壓同步[97]和無(wú)功功率平衡[98-99]的方案設(shè)計(jì).
① 在邊一致性框架下設(shè)計(jì)事件觸發(fā)方案. 在當(dāng)前的研究中,點(diǎn)對(duì)點(diǎn)事件觸發(fā)通信是建立在對(duì)邊狀態(tài)信息監(jiān)聽(tīng)的基礎(chǔ)上,其對(duì)應(yīng)的控制方案目標(biāo)是實(shí)現(xiàn)所有智能體個(gè)體狀態(tài)同步. 個(gè)體狀態(tài)的同步目標(biāo)實(shí)際上可以轉(zhuǎn)換為對(duì)邊狀態(tài)收斂于0 的要求,如文獻(xiàn)[100]. 直接在邊一致性的框架下設(shè)計(jì)有效的事件觸發(fā)方案仍待研究,且邊一致性的視角能否為邊事件觸發(fā)方案的設(shè)計(jì)提供更多的思路和靈感也值得商榷.
② 設(shè)計(jì)完全分布式的事件觸發(fā)一致性方案. 一些分布式的事件觸發(fā)方案的控制增益和觸發(fā)參數(shù)設(shè)計(jì)仍舊需要部分全局信息,例如智能體的總數(shù)和通信拓?fù)鋵?duì)應(yīng)的拉普拉斯矩陣信息等. 而依賴全局信息設(shè)計(jì)的控制方案不利于在大規(guī)模系統(tǒng)中應(yīng)用. 因此,設(shè)計(jì)真正完全分布式的事件觸發(fā)一致性控制方案也是一個(gè)挑戰(zhàn).
③ 在兩跳或多跳通信下設(shè)計(jì)事件觸發(fā)一致性方案. 針對(duì)存在惡意節(jié)點(diǎn)的MASs,YUAN 等[101]基于兩跳通信方式,設(shè)計(jì)了擁有分布式檢測(cè)能力的彈性一致性方案. 雖然在YUAN 等[101]中兩跳通信的應(yīng)用提升了系統(tǒng)可靠性,但同時(shí)也增加了通信傳輸負(fù)擔(dān).此時(shí),應(yīng)用事件觸發(fā)技術(shù)降低兩跳甚至多跳通信下MASs 分布式一致性控制方案的通信頻率就顯得尤為重要.
④ 事件觸發(fā)控制方案在大規(guī)模集群的實(shí)物驗(yàn)證. 事件觸發(fā)一致性在大規(guī)模編隊(duì)、集群等方面均有理論研究和仿真實(shí)驗(yàn),但其半實(shí)物或者實(shí)物驗(yàn)證比較少.