張 普, 薛惠鋒, 高 山, 左 軒
(西北工業(yè)大學(xué)自動(dòng)化學(xué)院, 陜西 西安 710129)
近年來(lái),多智能體系統(tǒng)協(xié)同控制技術(shù)在人工智能發(fā)展中具有重要作用,吸引了大量學(xué)術(shù)界和工業(yè)界學(xué)者的研究目光。其在軍事和民用方面均有廣泛的應(yīng)用,例如無(wú)人機(jī)集群、機(jī)器人協(xié)作,森林火災(zāi)救援等方面。這些應(yīng)用對(duì)多智能體系統(tǒng)協(xié)同控制技術(shù)的可靠性和控制精度均有較高的要求,然而,隨著智能體系統(tǒng)的復(fù)雜程度逐漸增大,系統(tǒng)發(fā)生故障的可能性也越來(lái)越頻繁。尤其是執(zhí)行器故障問(wèn)題,如果不能及時(shí)地進(jìn)行有效的容錯(cuò)處理,不僅智能體系統(tǒng)的協(xié)同性能受到影響,甚至?xí)?dǎo)致整個(gè)目標(biāo)任務(wù)的失敗?;诖?本文著眼于研究多智能體系統(tǒng)中執(zhí)行器發(fā)生故障時(shí)的協(xié)同容錯(cuò)控制技術(shù)。
目前,學(xué)者們基于先進(jìn)控制理論已經(jīng)提出了很多關(guān)于具有執(zhí)行器故障的多智能體系統(tǒng)的容錯(cuò)控制方法。文獻(xiàn)[4]采用一種分層容錯(cuò)控制策略,底層為故障檢測(cè)、隔離及重構(gòu),上層為預(yù)測(cè)與補(bǔ)償故障,為一類四旋翼無(wú)人機(jī)編隊(duì)解決了執(zhí)行器卡死故障。文獻(xiàn)[5]針對(duì)嚴(yán)參數(shù)反饋非線性系統(tǒng),提出了一種完全分布式自適應(yīng)容錯(cuò)控制器,解決了部分失效型執(zhí)行器故障問(wèn)題。文獻(xiàn)[6]設(shè)計(jì)了一種魯棒自適應(yīng)容錯(cuò)控制律,補(bǔ)償執(zhí)行器偏置故障和部分失效執(zhí)行器故障。文獻(xiàn)[7]提出了一種事件觸發(fā)容錯(cuò)控制方法,用于解決執(zhí)行器故障問(wèn)題。文獻(xiàn)[8]基于自適應(yīng)滑模觀測(cè)器,構(gòu)建了一種分布式協(xié)同容錯(cuò)控制器,補(bǔ)償執(zhí)行器失效故障和偏置故障。文獻(xiàn)[9]提出了一種基于在線重構(gòu)的自適應(yīng)協(xié)同容錯(cuò)控制策略,用于補(bǔ)償異構(gòu)多智能體系統(tǒng)的時(shí)變失效故障和加性執(zhí)行器故障。文獻(xiàn)[10]采用delta算子的方法設(shè)計(jì)了一種H/H模型預(yù)測(cè)容錯(cuò)控制方案,解決時(shí)變執(zhí)行器故障問(wèn)題。文獻(xiàn)[11]設(shè)計(jì)了一種基于虛擬執(zhí)行器的協(xié)同容錯(cuò)策略,通過(guò)對(duì)稱控制器和觀測(cè)器相結(jié)合,來(lái)隱藏執(zhí)行器故障對(duì)系統(tǒng)的影響。在上述研究中,大多是基于執(zhí)行器故障模型中具有一種或兩種類型故障展開的研究。然而,在實(shí)際工程中,非線性多智能體的執(zhí)行器故障類型不僅未知,而且不止一種或兩種,并可能伴隨有混合故障類型的現(xiàn)象。此外,除了未知故障問(wèn)題,系統(tǒng)模型中的控制增益參數(shù)一般也不具有先驗(yàn)性。因此,有必要針對(duì)同時(shí)具有未知混合執(zhí)行器故障及未知?jiǎng)討B(tài)控制增益的非線性多智能體系統(tǒng)的容錯(cuò)控制問(wèn)題展開深入研究。
值得關(guān)注的是,上述研究主要針對(duì)未知故障和未知控制增益參數(shù)所引起的多智能體系統(tǒng)不穩(wěn)態(tài)性能,沒(méi)有涉及到瞬態(tài)性能問(wèn)題,即有限時(shí)間內(nèi)穩(wěn)定問(wèn)題。而在諸多有關(guān)多智能體系統(tǒng)的實(shí)際工程應(yīng)用中,諸如無(wú)人機(jī)、航天器以及機(jī)器人的姿態(tài)等,不僅需要有效克服執(zhí)行器故障所引起的系統(tǒng)不穩(wěn)定,并且需要系統(tǒng)在有限時(shí)間收斂到零或者零點(diǎn)的鄰域內(nèi),最終使多智能體系統(tǒng)實(shí)現(xiàn)漸近穩(wěn)定。因此,盡管上述文獻(xiàn)提出了很多解決多智能體系統(tǒng)執(zhí)行器故障的容錯(cuò)控制方法,然而很少能夠在有限時(shí)間內(nèi)有效地解決具有混合執(zhí)行器故障和未知控制增益的多智能體系統(tǒng)協(xié)同容錯(cuò)問(wèn)題,并且保持沿預(yù)設(shè)編隊(duì)軌跡運(yùn)動(dòng)。
因此,本文針對(duì)一類高階嚴(yán)反饋非線性多智能體系統(tǒng),基于動(dòng)態(tài)面控制和自適應(yīng)反推技術(shù)相結(jié)合,提出了一種自適應(yīng)協(xié)同容錯(cuò)控制策略,解決系統(tǒng)模型中含混合執(zhí)行器故障和不確定非線性參數(shù)問(wèn)題。主要貢獻(xiàn)有以下幾點(diǎn):
(1) 考慮了混合執(zhí)行器故障,針對(duì)一類更具一般性的具有未知混合執(zhí)行器故障的干擾高階非線性多智能體系統(tǒng),提出了一種新穎的基于動(dòng)態(tài)面控制的自適應(yīng)容錯(cuò)控制策略。在文獻(xiàn)[4-11]中,作者僅能解決一種或兩種執(zhí)行器故障。與上述文獻(xiàn)相比,本文所提方法同時(shí)考慮了不同類型的執(zhí)行器故障,在拓寬應(yīng)用潛力方面具有重要意義。
(2) 與現(xiàn)有文獻(xiàn)的神經(jīng)網(wǎng)絡(luò)估計(jì)技術(shù)相比,本文所提的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(radial basis function neural networks, RBFNNs)自適應(yīng)技術(shù),不僅能夠在線精確估計(jì)不同類型故障,實(shí)時(shí)補(bǔ)償未知的混合執(zhí)行器故障,并對(duì)系統(tǒng)模型中的未知?jiǎng)討B(tài)參數(shù)實(shí)現(xiàn)局部最優(yōu)估計(jì)。因此,所提方法在混合故障情形下依舊能夠保持良好的容錯(cuò)能力。
(3) 與現(xiàn)有方法相比,所設(shè)計(jì)的分布式有限時(shí)間控制器,基于有限時(shí)間理論與一致性協(xié)議,能夠確保多智能體系統(tǒng)在有限時(shí)間達(dá)到穩(wěn)定狀態(tài),并以預(yù)設(shè)隊(duì)形運(yùn)動(dòng)。
一個(gè)有向網(wǎng)絡(luò)可以用=(,,)表示,是用于建立智能體之間通訊模式的數(shù)學(xué)工具。其中={,,…,}是個(gè)節(jié)點(diǎn)的集合,?×是有向邊的集合,=()×∈×是加權(quán)鄰接矩陣,滿足>0。而且,中有向邊表示一個(gè)有序點(diǎn)對(duì)(,),即從到的有向信息流,也就是說(shuō)節(jié)點(diǎn)可以獲得節(jié)點(diǎn)的信息。當(dāng)且僅當(dāng)中存在有向邊(,),鄰接矩陣中的每個(gè)元素>0,否則=0(≠;,=1,2,…,)。此外,本文均不考慮自環(huán),即=0(=1,2,…,)。若鄰接矩陣滿足=,則稱該特殊情況下的=(,,)為無(wú)向網(wǎng)絡(luò)。
信息交互是多智能體系統(tǒng)實(shí)現(xiàn)協(xié)同控制的必要條件。
()=()+()
(1)
式中:∈?表示RBFNNs的輸入向量;=[,,…,]表示權(quán)重向量;表示隱藏層;()是徑向基函數(shù)向量。
本文所選的徑向基函數(shù)為高斯函數(shù),其表達(dá)式為
(2)
理想的權(quán)重是由最小估計(jì)誤差優(yōu)化而來(lái)。
(3)
式中:表示實(shí)數(shù)?;诶硐霗?quán)重,()是給定的光滑函數(shù),對(duì)式(1)進(jìn)一步求解,可得未知的非線性函數(shù)如下:
()=()+()
(4)
原點(diǎn)是有限時(shí)間穩(wěn)定平衡的,當(dāng)且僅當(dāng)原點(diǎn)是Lyapunov穩(wěn)定且存在原點(diǎn)的開鄰域?和一個(gè)被稱為設(shè)定時(shí)間的正定義函數(shù)():→使得對(duì)于所有(0)∈{0},有
(5)
此外,如果原點(diǎn)在=上是有限時(shí)間穩(wěn)定的,則原點(diǎn)是全局有限時(shí)間穩(wěn)定平衡的。而且,原點(diǎn)的有限時(shí)間穩(wěn)定性也意味著原點(diǎn)的漸近穩(wěn)定性。
(6)
對(duì)于非線性系統(tǒng),假設(shè)存在一個(gè)連續(xù)光滑正定函數(shù)()和標(biāo)量>0, 0<<1,>0使得
(7)
(8)
對(duì)于,∈,0<<1,有如下不等式成立:
(+)≤+
(9)
(10)
智能體的執(zhí)行器故障主要是由于智能體出現(xiàn)老化、損傷,通訊失效以及傳感器失效等形成部分失效故障、完全失效故障、偏置故障、卡死故障等4種故障,其數(shù)學(xué)模型如下:
(11)
表1 執(zhí)行器故障類型Table 1 Actuator failure types
綜合分析,可得系統(tǒng)執(zhí)行器故障模型如下:
(12)
多智能體編隊(duì)系統(tǒng)在實(shí)現(xiàn)預(yù)期控制目標(biāo)過(guò)程中,當(dāng)某一個(gè)智能體的執(zhí)行器出現(xiàn)部分失效故障時(shí),多智能體系統(tǒng)由于通信的中斷,有可能引起執(zhí)行器不能正常運(yùn)行,表現(xiàn)為部分失效現(xiàn)象。
多智能體編隊(duì)系統(tǒng)預(yù)設(shè)的隊(duì)形編隊(duì)運(yùn)動(dòng),每個(gè)智能體的軌跡均為一條光滑的函數(shù),存在一個(gè)正常數(shù),使得滿足以下緊集:
(13)
考慮一類包含個(gè)智能體的多智能體系統(tǒng),每個(gè)智能體具有不確定性的嚴(yán)反饋非線性動(dòng)態(tài)性能,模型表示為
(14)
時(shí)變參考軌跡是連續(xù)有界的,則控制系統(tǒng)式(14)是一個(gè)閉環(huán)穩(wěn)定系統(tǒng)且能夠追蹤給定的參考軌跡信號(hào)。
基于執(zhí)行器故障模型式(12)和系統(tǒng)模型式(14)進(jìn)行容錯(cuò)控制律設(shè)計(jì),其過(guò)程如下。
定義跟蹤誤差:
(15)
(16)
(17)
式中:=∑∈+。
根據(jù)RBFNNs,式(17)可進(jìn)一步改寫為
(18)
構(gòu)建Lyapunov函數(shù)如下:
(19)
對(duì)式(19)時(shí)間求導(dǎo),得
(20)
應(yīng)用第12節(jié)的RBFNNs,對(duì)未知函數(shù),1和,1逼近處理,得
(21)
根據(jù)引理5和Young’s不等式,可知
(22)
將式(21)和式(22)代入式(20),可得
4)訓(xùn)練方式、手段及步驟:將學(xué)生分成幾個(gè)小組(5人一組),每個(gè)小組確定說(shuō)話的類型,小組內(nèi)進(jìn)行談?wù)?,要求每位學(xué)生都參與,說(shuō)話時(shí)間至少3分鐘;小組訓(xùn)練結(jié)束后,教師在隨機(jī)抽取各小組幾名學(xué)生,進(jìn)行即興說(shuō)話,學(xué)生和老師按照既定標(biāo)準(zhǔn)進(jìn)行的評(píng)分和點(diǎn)評(píng)。
(23)
(24)
(25)
(26)
式中:,1、,1、,1、,,為設(shè)計(jì)常數(shù)。
(27)
將式(25)和式(26)代入式(27),則有
(28)
(29)
由此可知
(30)
(31)
根據(jù)引理4和引理5,則有
(32)
定義新誤差如下:
(33)
對(duì)式(33)求導(dǎo),可得
(34)
同理,選取構(gòu)建Lyapunov函數(shù)如下:
(35)
對(duì)式(35)時(shí)間求導(dǎo),可得
(36)
根據(jù)式(12),式(36)進(jìn)一步化簡(jiǎn)為
(37)
根據(jù)RBFNNs逼近理論,可得
(38)
聯(lián)立式(37)和式(38),可得
(39)
(40)
(41)
(42)
將式(39)~式(42)代入式(37),可得
(43)
根據(jù)引理4和引理5,可得
(44)
將式(44)代入式(43),則有
(45)
根據(jù)引理5,對(duì)式(45)進(jìn)行變換,則有
(46)
根據(jù)有限時(shí)間定理,式(46)可進(jìn)一步簡(jiǎn)化為
(47)
式中:
于是,可進(jìn)一步得出給定時(shí)間如下:
(48)
高階非線性多智能體系統(tǒng)式(13)在滿足假設(shè)1至假設(shè)3的前提下,利用分布式動(dòng)態(tài)面控制和分布式自適應(yīng)控制,能保證控制系統(tǒng)目標(biāo)的實(shí)現(xiàn),即高階非線性多智能體系統(tǒng)式(14)的狀態(tài)能最終以預(yù)設(shè)隊(duì)形實(shí)現(xiàn)漸近一致追蹤的目的。
為了分析所設(shè)計(jì)控制律的穩(wěn)定性,構(gòu)建整個(gè)閉環(huán)系統(tǒng)的Lyapunov函數(shù)如下:
=1+2
(49)
對(duì)式(49)求導(dǎo),可得
(50)
于是,可得
(51)
根據(jù)引理5、追蹤誤差式(15)、邊界誤差式(16)、RBFNNs式(1)以及有限時(shí)間理論式(5),式(51)可進(jìn)一步重寫為
(52)
同理,2的導(dǎo)數(shù)如下:
(53)
式中:
于是,聯(lián)立式(52)和式(53),可得
(54)
式中:
(55)
因此,當(dāng)時(shí)間足夠大時(shí),多智能體系統(tǒng)的跟蹤誤差,,…,在有限時(shí)間收斂,而且均為有界的,從而實(shí)現(xiàn)多智能體系統(tǒng)在執(zhí)行器故障的情形下有限時(shí)間集結(jié)預(yù)設(shè)隊(duì)形,并保持該隊(duì)形追蹤運(yùn)動(dòng)目標(biāo)。
證畢
在本節(jié)中,采用由(=10)個(gè)智能體組成的多智能體系統(tǒng)有向拓?fù)浣Y(jié)構(gòu),其中包括一個(gè)領(lǐng)航者和-1個(gè)跟隨者(見(jiàn)圖1)。
圖1 多智能體系統(tǒng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖(N=10)Fig.1 Multi-agent systems network topology diagram (N=10)
多智能體系統(tǒng)在執(zhí)行器故障情形下編隊(duì)飛行過(guò)程中,需要彼此之間進(jìn)行信息的交互與共享,才能實(shí)現(xiàn)協(xié)同飛行。根據(jù)第21節(jié)圖論知識(shí),智能體#與智能體#之間信息存在信息的交互,則鄰接矩陣中的元素(,)=1,2,3,…,10取值取決于它們之間的方向,即=1,否則=0。基于此,可得鄰接矩陣和度矩陣:
于是,進(jìn)一步可得拉普拉斯矩陣=-。同時(shí),設(shè)定每個(gè)智能體的質(zhì)量=10 kg,每個(gè)智能體的集結(jié)速度=2 m/s,集結(jié)的角速度=59°/s。期望的參考軌跡=2 cos,=98 m/s。此外,選取=002,根據(jù)式≥(2),可取=002??刂茀?shù)可選取為=15,=20,=30,=25;=002,=004,=002,=002;=diag{3},=diag{10},=diag{5},=diag{8};====0005;同時(shí)需要逼近的兩個(gè)參數(shù)為和,逼近的函數(shù)為,以及(,),重構(gòu)函數(shù)(,)=(,5sin(15))。除此之外,多智能體系統(tǒng)的初始位置、線速度以及角速度,如表2所示。
表2 多智能體系統(tǒng)的初始狀態(tài)Table 2 Initial state of the multi-agent systems
(56)
除此之外,在仿真過(guò)程中,考慮的兩個(gè)算例,如下所示。
考慮以下非線性系統(tǒng)
(57)
根據(jù)以上非線性系統(tǒng)、初始條件以及前述假設(shè),其仿真結(jié)果如圖2~圖5所示。
圖2 控制參數(shù)β1和β2的估計(jì)值曲線圖Fig.2 Estimation curves of control parameters β1and β2
圖3 f1/β1的神經(jīng)網(wǎng)絡(luò)逼近Fig.3 Neural network approximation curve of f1/β1
圖4 f2/β2的神經(jīng)網(wǎng)絡(luò)逼近Fig.4 Neural network approximation curve of f2/β2
圖5 f(x1,x2)的神經(jīng)網(wǎng)絡(luò)逼近Fig.5 Neural network approximation curve of f(x1,x2)
由仿真結(jié)果可知,所提出的RBFNNs可以有效逼近未知非線性項(xiàng),使得在控制器設(shè)計(jì)過(guò)程中避免對(duì)高階系統(tǒng)多次求導(dǎo)。而且,對(duì)含有執(zhí)行器故障的多智能體系統(tǒng),具有良好的容錯(cuò)效果。
為了進(jìn)一步說(shuō)明所設(shè)計(jì)的控制律的有效性,將其應(yīng)用于由10個(gè)機(jī)器人組成的編隊(duì),進(jìn)行容錯(cuò)控制研究,每一個(gè)機(jī)器人的動(dòng)力學(xué)模型如下:
(58)
為了減少參數(shù)估計(jì)數(shù)量,作以下變換:
(59)
在本節(jié)中,采用相同的仿真環(huán)境,控制參數(shù)和初始條件,其仿真結(jié)果如圖6~圖9所示。
圖6 機(jī)器人編隊(duì)運(yùn)動(dòng)軌跡曲線圖Fig.6 Trajectory curve of robot formation
圖7 機(jī)器人偏航角及其誤差曲線圖Fig.7 Yaw angle and error curves of the robot
圖8 機(jī)器人#1控制輸入信號(hào)u變化曲線圖Fig.8 Control input signal variation u curve of robot#1
圖9 機(jī)器人#5在控制參數(shù)β1和β2的偏航角速率r1和r2的變化曲線圖Fig.9 Variation curves of the yaw rate r1 and r2 of robot #5 in control parameters β1 and β2
由仿真結(jié)果可得,所提出的控制方法,能夠提高具有執(zhí)行器故障的多機(jī)器人編隊(duì)的容錯(cuò)能力,同時(shí)也能夠有效實(shí)現(xiàn)其追蹤運(yùn)動(dòng)目標(biāo)的目的。此外,所提出的控制方案,能夠使得機(jī)器人編隊(duì)系統(tǒng)在整個(gè)追蹤過(guò)程中,具有良好的容錯(cuò)效果。
本文提出了一種基于RBFNNs的動(dòng)態(tài)面協(xié)同容錯(cuò)控制方法,能夠有效解決故障情形下系統(tǒng)參數(shù)不確定以及系統(tǒng)瞬態(tài)不穩(wěn)定問(wèn)題。首先,利用RBFNNs對(duì)系統(tǒng)模型中的未知光滑非線性函數(shù)進(jìn)行了實(shí)時(shí)估計(jì)。其次,采用反推技術(shù)與動(dòng)態(tài)面技術(shù)相結(jié)合,設(shè)計(jì)了容錯(cuò)控制器,該控制器能夠在執(zhí)行器發(fā)生卡死故障和部分失效故障與外部干擾作用下實(shí)現(xiàn)多智能體的穩(wěn)定控制,并保證智能體之間的一致性。隨后,利用有限時(shí)間理論,實(shí)現(xiàn)了系統(tǒng)在預(yù)設(shè)時(shí)間內(nèi)快速恢復(fù)穩(wěn)定性能的需求。下一步的研究方向聚焦于以下兩個(gè)方面:帶有惡性攻擊下的多智能體系統(tǒng)協(xié)同一致跟蹤控制研究;基于彈性事件觸發(fā)機(jī)制下帶有惡意攻擊的多智能體編隊(duì)系統(tǒng)的協(xié)同容錯(cuò)跟蹤控制研究。