徐振,李勝,陳慶偉,季蔡娟
(南京理工大學(xué)自動(dòng)化學(xué)院,210094,南京)
近年來(lái),旋翼無(wú)人機(jī)以其成本低、操作簡(jiǎn)單的特點(diǎn)和優(yōu)異的中低空機(jī)動(dòng)性能,受到了使用者的青睞。如今在物資運(yùn)輸、森林滅火、目標(biāo)追蹤、戰(zhàn)場(chǎng)偵察與打擊、電力巡線等場(chǎng)景,無(wú)人機(jī)發(fā)揮著越來(lái)越重要的作用。目前,無(wú)人機(jī)之間的通信延遲和變質(zhì)量慣量等行為,制約著無(wú)人機(jī)編隊(duì)的精度及其執(zhí)行任務(wù)的能力,而無(wú)人機(jī)的編隊(duì)是提高無(wú)人機(jī)工作效率的有效方式。
常見(jiàn)的編隊(duì)方法有領(lǐng)航跟隨法、虛擬結(jié)構(gòu)法、基于行為法、一致性算法等。基于行為法實(shí)現(xiàn)簡(jiǎn)單,多適用于未知環(huán)境,但編隊(duì)收斂性很難進(jìn)行精確的數(shù)學(xué)證明;虛擬結(jié)構(gòu)法和領(lǐng)航跟隨法類(lèi)似,要求核心無(wú)人機(jī)的全狀態(tài)反饋信息,原理簡(jiǎn)單,便于工程實(shí)現(xiàn),但對(duì)核心無(wú)人機(jī)的安全性和魯棒性要求較高,當(dāng)智能體增多時(shí),運(yùn)算量較大[1];一致性算法最早由Ren[2]和Liu等[3]引入到多智能體系統(tǒng)的編隊(duì)控制中,其分布式的特點(diǎn)具有良好的魯棒性,在智能體較多的情況下優(yōu)勢(shì)明顯。文獻(xiàn)[4]中用一致性理論進(jìn)行多機(jī)器人的隊(duì)形控制和穩(wěn)定性分析;文獻(xiàn)[5]對(duì)高階線性模型的一致性協(xié)議運(yùn)用中的時(shí)變隊(duì)形和時(shí)延問(wèn)題進(jìn)行了討論。本文考慮小型無(wú)人機(jī)編隊(duì),結(jié)合全文側(cè)重點(diǎn)和文獻(xiàn)[15],采用領(lǐng)航跟隨法進(jìn)行編隊(duì)飛行。
一方面,針對(duì)無(wú)人機(jī)編隊(duì)在復(fù)雜環(huán)境中的通信延遲問(wèn)題,學(xué)者們已提出多種處理方法,例如:文獻(xiàn)[6]針對(duì)一類(lèi)二階異質(zhì)多智能體系統(tǒng)的時(shí)延問(wèn)題,提出了一種無(wú)假設(shè)條件的異質(zhì)多智能體系統(tǒng)靜態(tài)組一致性算法;文獻(xiàn)[7]通過(guò)變量代換,將時(shí)延條件下的線性群系統(tǒng)編隊(duì)控制問(wèn)題轉(zhuǎn)化為時(shí)延系統(tǒng)的鎮(zhèn)定問(wèn)題,以構(gòu)造李雅普諾夫函數(shù);文獻(xiàn)[8]針對(duì)一類(lèi)無(wú)速度傳感器的靈巧型噴氣式無(wú)人機(jī)設(shè)計(jì)時(shí)延觀測(cè)器,用于估算自身狀態(tài)?,F(xiàn)階段的文獻(xiàn)中,時(shí)變時(shí)延多采用被動(dòng)的處理方式,即通過(guò)一致性協(xié)議設(shè)計(jì),在得知通信延遲變化率等先驗(yàn)條件的前提下,實(shí)現(xiàn)無(wú)人機(jī)群系統(tǒng)跟蹤誤差有界,但通常誤差無(wú)法收斂到0,或具有一定的保守性,收斂速度較慢,而將時(shí)延狀態(tài)觀測(cè)器用于旋翼無(wú)人機(jī)編隊(duì)的可參考案例也相對(duì)較少。
另一方面,無(wú)人機(jī)擔(dān)任的工作角色,如投擲彈藥、拋灑干冰、運(yùn)輸貨物等,極易引起質(zhì)量和慣量的變化。這不僅影響單個(gè)無(wú)人機(jī)的工作狀態(tài),影響時(shí)延狀態(tài)觀測(cè)器的收斂性,而且影響編隊(duì)的全局控制性能。文獻(xiàn)[9]利用非線性自適應(yīng)控制對(duì)未知定常參數(shù)進(jìn)行辨識(shí);文獻(xiàn)[10]基于自適應(yīng)反步法和非線性阻尼算法,提出了一種魯棒自適應(yīng)控制器,實(shí)現(xiàn)了對(duì)慣量參數(shù)的估計(jì),最終實(shí)現(xiàn)了航天器姿態(tài)控制系統(tǒng)全局一致有界;文獻(xiàn)[11]針對(duì)具有未知常數(shù)慣量不確定性和外界干擾的航天器,設(shè)計(jì)了一種有限時(shí)間自適應(yīng)滑模姿態(tài)跟蹤控制器,使得期望姿態(tài)實(shí)現(xiàn)有限時(shí)間一致;文獻(xiàn)[12]針對(duì)機(jī)械系統(tǒng)高頻扭矩振動(dòng)帶來(lái)的系統(tǒng)慣量變化,采用抗共振濾波器和自適應(yīng)神經(jīng)控制器的協(xié)同作用解決了這一問(wèn)題。以上文獻(xiàn)中,系統(tǒng)質(zhì)量和慣量多為未知定常,或僅有其一發(fā)生變化的情況,然而這兩者往往是密不可分的;同時(shí),在依據(jù)李雅普諾夫函數(shù)法設(shè)計(jì)控制律時(shí),將待估計(jì)值處理為緩變量,只適用于部分場(chǎng)景,適用范圍較小。
本文針對(duì)上述兩個(gè)方面的問(wèn)題,采用領(lǐng)航跟隨法的編隊(duì)方式,應(yīng)用編隊(duì)參數(shù)生成虛擬無(wú)人機(jī)位置,然后根據(jù)編隊(duì)誤差,設(shè)計(jì)基于時(shí)延觀測(cè)器的旋翼無(wú)人機(jī)自適應(yīng)編隊(duì)控制器。在通信存在變時(shí)延的情況下,跟隨者可以準(zhǔn)確跟蹤虛擬無(wú)人機(jī)位置,實(shí)現(xiàn)對(duì)各類(lèi)變慣量行為的自適應(yīng)調(diào)整,提高編隊(duì)收斂速度和精度。設(shè)計(jì)2組仿真實(shí)驗(yàn),通過(guò)跟蹤不同路徑和慣量變化方式,驗(yàn)證所提方法的有效性。
根據(jù)牛頓歐拉建模原理,參考文獻(xiàn)[13],建立四旋翼無(wú)人機(jī)系統(tǒng)的動(dòng)態(tài)模型
(1)
(2)
該模型遵循如下假設(shè):
(3)
式中:p、q、r分別為機(jī)體坐標(biāo)下的滾轉(zhuǎn)、俯仰、偏航角速度。
由于四旋翼無(wú)人機(jī)通常做小角度運(yùn)動(dòng),可利用小角度近似得
(4)
(2)四旋翼的結(jié)構(gòu)是剛性且對(duì)稱(chēng)的。
(3)四旋翼質(zhì)心與機(jī)體坐標(biāo)系原點(diǎn)一致。
需要說(shuō)明的是,由于四旋翼無(wú)人機(jī)欠驅(qū)動(dòng)的特點(diǎn),不可能對(duì)輸出ξ中的6個(gè)自由度都進(jìn)行控制。一種合理的方案是:控制質(zhì)心位置[xyz]T和偏航角ψ,同時(shí)保證另外兩個(gè)歐拉角[φθ]穩(wěn)定有界。
在領(lǐng)航跟隨法中,領(lǐng)航者沿著預(yù)先設(shè)定好的路徑行進(jìn),跟隨者則需要獲得領(lǐng)航者的位置和角度信息,結(jié)合自身位姿進(jìn)行控制。編隊(duì)的主軌跡通常由領(lǐng)航無(wú)人機(jī)Rl決定。跟隨無(wú)人機(jī)Rf的參考軌跡由領(lǐng)航無(wú)人機(jī)和結(jié)構(gòu)參數(shù)生成的虛擬無(wú)人機(jī)Rv軌跡決定。一個(gè)典型的三角形編隊(duì)如圖1所示,編隊(duì)拓?fù)鋱D見(jiàn)圖2,圖中所有無(wú)人機(jī)具有相同的運(yùn)動(dòng)學(xué)模型。
圖1 三角形編隊(duì)圖
圖2 編隊(duì)拓?fù)鋱D
從一致性的角度分析領(lǐng)航跟隨編隊(duì)系統(tǒng)。定義控制目標(biāo)ξ=[xyzψ]T,多智能體系統(tǒng)被稱(chēng)作滿(mǎn)足一致性,當(dāng)存在一個(gè)向量函數(shù)ci(t)∈Rn時(shí),對(duì)第i個(gè)無(wú)人機(jī)有
(5)
式中:i∈{f1,f2};
被稱(chēng)作一致參考函數(shù),表示一個(gè)基于三維極坐標(biāo)的虛擬無(wú)人機(jī)的位置;h(t)=[hd(t),hφ1(t),hφ2(t)]∈R3為分段連續(xù)可微的時(shí)變編隊(duì)信息,hd、hφ1、hφ2分別表示虛擬無(wú)人機(jī)與領(lǐng)航者的編隊(duì)距離、水平方向夾角以及垂直方向夾角。
從控制的角度來(lái)看,即Rf1與Rf2在歐拉坐標(biāo)系下,通過(guò)尋求適當(dāng)?shù)目刂破鱱i(i=1,2,3,4)完成對(duì)位姿誤差e(t)=ξi(t)-ξvi(t)的跟蹤,使得e(t)漸近穩(wěn)定。這樣,領(lǐng)航跟隨法下的編隊(duì)控制問(wèn)題就轉(zhuǎn)化成了跟隨無(wú)人機(jī)Rfi對(duì)虛擬無(wú)人機(jī)Rvi的位置姿態(tài)ξvi(t)=ci(t)的跟蹤問(wèn)題。這種考慮適用于小型編隊(duì),主要采用集中控制的方式進(jìn)行通信,運(yùn)算量較小。
在編隊(duì)過(guò)程中,受通信條件、設(shè)備負(fù)載以及無(wú)人機(jī)系統(tǒng)自身存在時(shí)延等情況的限制,領(lǐng)航者的部分輸出信息
{x1[t-δ(t)]y1[t-δ(t)]z1[t-δ(t)]
ψ1[t-δ(t)]}T=ξ1[t-δ(t)]
(6)
式中:δ(t)∈[0,Δ]為已知有界時(shí)變時(shí)延信號(hào)。
此時(shí),跟隨者無(wú)法準(zhǔn)確獲取領(lǐng)導(dǎo)者的實(shí)時(shí)位置信息。當(dāng)時(shí)延大于一定閾值時(shí),可能會(huì)出現(xiàn)跟隨者無(wú)法有效跟蹤、編隊(duì)隊(duì)形發(fā)散的情況。針對(duì)這種情況,本文提出一種時(shí)延狀態(tài)觀測(cè)器設(shè)計(jì)方法。
Σ是弱可觀的,當(dāng)且僅當(dāng)對(duì)于1≤p≤m,觀測(cè)矩陣
(7)
是滿(mǎn)秩矩陣。
為了計(jì)算Om的秩,引入向量場(chǎng)h關(guān)于向量場(chǎng)f的李導(dǎo)數(shù)Lfh(X)
(8)
(9)
(10)
據(jù)此可以一步步構(gòu)造出一組n=12的線性無(wú)關(guān)向量組,它是由輸出向量的李導(dǎo)數(shù)及其梯度的所有有限線性組合得來(lái)的。第一個(gè)得到的線性無(wú)關(guān)向量組為
(11)
可得
(12)
由det(Om)=-1可知,矩陣Om是滿(mǎn)秩的。由此可以得出,該系統(tǒng)是弱局部可觀的。
基于2.1節(jié)的分析,針對(duì)系統(tǒng)
(13)
式中:C為輸出矩陣;
設(shè)計(jì)如下觀測(cè)器
(14)
引理1[8]若形如式(13)的系統(tǒng)符合
(1)M(X,t,u)滿(mǎn)足利普希茨連續(xù)條件,
(2)時(shí)變時(shí)延δ(t)∈[0,Δ]有界,
則有
(15)
證明:對(duì)本文采用的旋翼無(wú)人機(jī)系統(tǒng)模型而言,設(shè)
則
有界,M21滿(mǎn)足利普希茨連續(xù)條件,記為L(zhǎng)=L21。
由于M(X,t,u)各元素偏導(dǎo)數(shù)均有界,不失一般性,M(X,t,u)滿(mǎn)足利普希茨連續(xù)條件,L=max(Lij),i∈{1,2},j∈{1,2,3}。
(16)
式中:D=-KC;
M(t,X,u)-M(t,X,u)
(17)
當(dāng)t>Δ時(shí),有
e(t)-e[t-δ(t)]=
(18)
將式(18)代入式(16)中,得
(19)
選取李雅普諾夫函數(shù)
V=eTPe
(20)
可得
(21)
由文獻(xiàn)[16]中定理1可得
(22)
(23)
證畢。在該觀測(cè)器中,
為使其滿(mǎn)足赫爾維茨定理,根據(jù)分塊矩陣的性質(zhì),|A-KC|=|A1‖A2‖A3‖A4‖A5‖A6|,有
λ(A-KC)=
λ(A1)∪λ(A2)∪λ(A3)∪λ(A4)∪λ(A5)∪λ(A6)
(24)
(25)
由(λ+κ)2=0可得λ2+2κλ+κ2=0,κ>0,從而
k1=2κ;k2=κ2
(26)
進(jìn)一步組合可求得K。通過(guò)參數(shù)整定可以得出,當(dāng)κ=0.6時(shí),觀測(cè)器經(jīng)過(guò)短暫的調(diào)整,可以很好地獲得通信延遲下的虛擬領(lǐng)導(dǎo)者位置,為自身提供準(zhǔn)確的目標(biāo)點(diǎn)。同時(shí)需要注意的是,此類(lèi)觀測(cè)器設(shè)計(jì)時(shí)要求被觀測(cè)者的精確模型,而無(wú)人機(jī)工作時(shí),往往帶有拋灑、投擲等變質(zhì)量、變慣量的行為。為此需要一類(lèi)具有自適應(yīng)能力的控制器,以適應(yīng)此類(lèi)系統(tǒng)變化,并為觀測(cè)器提供相對(duì)準(zhǔn)確的質(zhì)量與慣量變化。
定理1考慮四旋翼系統(tǒng)動(dòng)態(tài)模型如式(1)~式(2)所示,設(shè)計(jì)控制律
(27)
(28)
(29)
(30)
組成閉環(huán)控制系統(tǒng),則閉環(huán)系統(tǒng)漸進(jìn)穩(wěn)定。其中
(31)
(32)
(33)
(34)
(35)
(36)
(37)
(38)
(39)
(40)
(41)
(42)
(43)
(44)
(45)
(46)
(47)
證明:以滾轉(zhuǎn)通道為例,
(48)
可以重構(gòu)為
(49)
(50)
(51)
選取一個(gè)候選李雅普諾夫函數(shù)
(52)
(53)
(54)
(55)
(56)
(57)
(58)
(59)
(60)
代入V2,由此可得
(61)
綜上,在該控制器作用下,φ的漸進(jìn)穩(wěn)定性得到證明。考慮本文設(shè)計(jì)的其余滑模函數(shù)σi和控制器ui,其余通道的穩(wěn)定性證明可按照相同思路進(jìn)行,取李雅普諾夫函數(shù)
(62)
(63)
為驗(yàn)證觀測(cè)器及自適應(yīng)算法的收斂性和趨近律的有效性,本節(jié)選擇MATLABR2017a搭建仿真模型。實(shí)驗(yàn)以森林滅火為背景,測(cè)試跟隨無(wú)人機(jī)在完成編隊(duì)任務(wù)的同時(shí)投擲碘化銀增雨焰條和均勻噴灑干冰的控制效果。仿真初始參數(shù)設(shè)定如表1所示。
表1 仿真初始參數(shù)
虛擬無(wú)人機(jī)軌跡選取螺旋線方程,表達(dá)式為Pd=[0.5cos(0.5t)0.5sin(0.5t)2+0.1t]。設(shè)無(wú)人機(jī)質(zhì)量m=(3-0.03t) kg;轉(zhuǎn)動(dòng)慣量Ix=Iy=(0.04-0.000 6t) kg·m2,Iz=(0.08-0.000 6t) kg·m2;時(shí)變有界時(shí)延函數(shù)δ(t)∈[0,1];dFx=0.1sin(0.1πt),dFy=0.1cos(0.1πt),dFz=0.2cos(0.2πt)為各向擾動(dòng)。仿真結(jié)果如圖3~圖7所示。
圖3 螺旋線跟蹤位置變化
圖4 位姿觀測(cè)誤差
圖5 位置跟蹤誤差
圖6 質(zhì)量自適應(yīng)值
圖7 部分系數(shù)自適應(yīng)值
圖8 山區(qū)路徑跟蹤圖
選取桂林(110.61°E,25.07°N)處的高度值繪制如圖8所示地形,面積為512×512 m2。為驗(yàn)證間斷投擲時(shí)控制器對(duì)質(zhì)量階躍變的適應(yīng)能力,選取m0=3 kg,每隔6 s拋下一個(gè)Δm=0.5 kg的增雨焰條,共計(jì)i=5根,轉(zhuǎn)動(dòng)慣量Ix=Iy=0.04 kg·m2不變,Iz0=0.08 kg·m2且每次下降0.005 kg·m2。其他參數(shù)設(shè)定與4.1節(jié)相同,結(jié)果見(jiàn)圖8~圖11。
圖9 姿態(tài)跟蹤誤差
圖10 質(zhì)量自適應(yīng)值圖
圖11 部分系數(shù)自適應(yīng)值
從以上兩組仿真可以看出,利用本文所提方法,在變時(shí)延存在下的情況下,無(wú)人機(jī)偏隊(duì)對(duì)于變質(zhì)量變慣量行為具有良好的控制能力,編隊(duì)誤差快速收斂至0,且未出現(xiàn)時(shí)間滯后現(xiàn)象。
本文提出了一種基于時(shí)延觀測(cè)器的旋翼無(wú)人機(jī)自適應(yīng)編隊(duì)控制方法,在領(lǐng)航跟隨法的基礎(chǔ)上,抑制無(wú)人機(jī)編隊(duì)中的通信時(shí)延與工作引起的慣量變化?;跓o(wú)人機(jī)系統(tǒng)動(dòng)力學(xué)模型設(shè)計(jì)了變時(shí)延狀態(tài)觀測(cè)器,對(duì)領(lǐng)航無(wú)人機(jī)狀態(tài)進(jìn)行觀測(cè)和補(bǔ)償。在補(bǔ)償后的被控對(duì)象基礎(chǔ)上,設(shè)計(jì)了自適應(yīng)滑??刂破?對(duì)變負(fù)載工作狀態(tài)下的質(zhì)量和慣量進(jìn)行估計(jì)。仿真結(jié)果表明該方法對(duì)變時(shí)延和變慣量條件下的編隊(duì)控制有較強(qiáng)的魯棒性。
本文選擇領(lǐng)航跟隨法進(jìn)行編隊(duì)驗(yàn)證是基于其原理簡(jiǎn)單、便于實(shí)現(xiàn)的特點(diǎn)。下一步擬將時(shí)延觀測(cè)器的設(shè)計(jì)方法與基于一致性的編隊(duì)方法相結(jié)合,彌補(bǔ)其被動(dòng)式收斂的不足,提高控制精度和速度。