孫文涵,鮮 斌
(天津大學(xué)電氣自動化與信息工程學(xué)院,天津 300072)
近年來,無人機因其成本低、適用場景廣泛、機動性強等特點,在軍事與民事活動中被廣泛應(yīng)用[1–3].但是隨著無人機所執(zhí)行任務(wù)的難度不斷提升,單無人機系統(tǒng)已無法勝任日漸復(fù)雜的飛行任務(wù),于是國內(nèi)外研究者紛紛開始了對多無人機系統(tǒng)協(xié)同控制的研究.與單無人機系統(tǒng)相比,多無人機系統(tǒng)在區(qū)域搜索、搶險救災(zāi)等領(lǐng)域有著顯著的優(yōu)勢.但是多無人機系統(tǒng)中客觀存在的通信時延、易受氣流擾動、模型不確定性等諸多因素,為多無人機系統(tǒng)的控制帶來了挑戰(zhàn)[4–6].
無人機編隊控制是多無人機系統(tǒng)研究中的核心問題.針對這一問題,國內(nèi)外學(xué)者展開了深入研究,并提出了很多經(jīng)典的編隊控制方法[7–9],其中,Leader-Follower法的核心思路是將特定無人機設(shè)定為Leader進(jìn)行自主飛行,其余無人機則通過與Leader保持一定的相對位置,從而達(dá)到形成期望隊形的目的.文獻(xiàn)[10]基于Leader-Follower 方法,對Leader與Follower分別進(jìn)行軌跡規(guī)劃,在考慮無人機通信時延的情況下完成了密集編隊飛行試驗.文獻(xiàn)[11]提出虛擬剛體概念,將各無人機視作頂點,通過一個虛擬的剛體來定義期望隊形.在這種編隊方法中,隊形的運動視作剛體的平移與旋轉(zhuǎn),隊形的變換視作剛體形狀的切換.在此基礎(chǔ)上,該論文作者為各無人機設(shè)計了控制器使其達(dá)到期望位置,從而完成編隊控制任務(wù).為了解決上述工作中集中式編隊控制方法中存在的中心節(jié)點計算量大、通信負(fù)擔(dān)重、容易產(chǎn)生通信時延等問題,分布式編隊方法成為了當(dāng)前多無人機編隊系統(tǒng)的一個重要研究方向.文獻(xiàn)[12]將一致性方法應(yīng)用于無人機時變編隊的控制問題中,進(jìn)行了詳細(xì)的數(shù)學(xué)推導(dǎo),給出了多無人機系統(tǒng)實現(xiàn)時變編隊的充要條件.文中基于一致性方法設(shè)計時變編隊控制策略,進(jìn)行了室外實機飛行試驗,驗證了算法的有效性.文獻(xiàn)[13]在虛擬剛體編隊方法的基礎(chǔ)上,考慮部分無人機無法直接獲取虛擬剛體狀態(tài)約束的情況,通過引入相鄰無人機的跟蹤狀態(tài),實現(xiàn)了基于虛擬剛體法的分布式編隊控制.
然而,上述文獻(xiàn)所提出的控制策略中,都基于一個默認(rèn)的條件,即各機體(或系統(tǒng)中某幾個機體)可以獲得彼此之間的距離或位置信息.而在無GPS的環(huán)境下,這個條件需要無人機系統(tǒng)有很強的感知能力,這大大增加了多無人機編隊系統(tǒng)的設(shè)計難度與成本.為了應(yīng)對這一限制,近年來基于方位信息的編隊控制受到了研究人員的關(guān)注[14–17].基于方位信息的編隊控制僅需要機體獲得自身與鄰機的方位信息,無需機間進(jìn)行通訊,也無需獲取機體間的距離信息.這種控制策略對于無人機編隊控制而言,具有其自身的特定優(yōu)勢.首先,在實際情況中,各機體可以通過無源傳感器(如機載攝像頭)很便捷地獲取所需的方位信息[18],大大降低了對機體感知能力的要求.其次,各機體間無需進(jìn)行通信,可以有效地規(guī)避多機編隊問題中由于通信帶來的種種問題.文獻(xiàn)[14]將方位剛度理論推廣到了任意維度,提出了多智能體編隊隊形可由方位約束描述的條件,極大地推動了方位信息編隊控制的發(fā)展.文獻(xiàn)[15]采用類歐拉–拉格朗日形式將方位剛性理論推廣到非線性機器人系統(tǒng)問題的求解中,將受到非完整約束和動力學(xué)約束的單積分模型轉(zhuǎn)化為類歐拉–拉格朗日模型,實現(xiàn)了三維非完整約束模型的方位信息編隊形成與保持.數(shù)值仿真實驗驗證了這種算法的有效性.
文獻(xiàn)[16]考慮了方位信息編隊中的傳感器約束問題,包括相機的視場限制、飛行過程中可能存在的視野遮擋等實際飛行中切實存在的情況.該論文對上述傳感器約束問題進(jìn)行了數(shù)學(xué)描述,并進(jìn)行了實際飛行試驗.實驗結(jié)果表明,這種設(shè)計可以完成基于方位信息的編隊保持任務(wù).但是,上述設(shè)計沒有考慮外界擾動對編隊控制的影響,且無法完成編隊移動任務(wù).
對于僅依賴方位信息的編隊移動問題,文獻(xiàn)[17]研究了一類具有未知擾動的二階模型的方位信息編隊控制問題.文中通過反步法引入自適應(yīng)控制設(shè)計來抵消干擾對系統(tǒng)的影響,并通過對偏差系統(tǒng)嵌入速度級期望變量,實現(xiàn)了方位信息編隊的移動.但對于實際系統(tǒng)來說,完全無法獲得位置信息會產(chǎn)生位置漂移問題.針對這一問題,文獻(xiàn)[19]提出了方位拉普拉斯矩陣(bearing Laplacian)的概念,給出了采用錨點與方位信息約束構(gòu)造獨特編隊隊形的充要條件.在此基礎(chǔ)上,文獻(xiàn)[20]采取Leader-Follower式編隊方式,引入Leader的位置信息為整個編隊系統(tǒng)設(shè)定錨點,針對一階模型和二階模型設(shè)計了基于方位信息的目標(biāo)編隊跟蹤控制器.上述設(shè)計通過Lyapunov方法證明了跟蹤誤差的收斂與編隊系統(tǒng)的穩(wěn)定性,并通過數(shù)值仿真驗證了算法的有效性.文獻(xiàn)[21]通過在Leader-Follower式方位信息編隊中設(shè)置第一跟隨者,實現(xiàn)了方位信息編隊移動過程中的整體縮放,并通過數(shù)值仿真驗證了算法的有效性.
在以上研究成果的基礎(chǔ)上,本文針對多無人機系統(tǒng)基于方位信息的編隊問題進(jìn)行研究.本文主要通過反步法設(shè)計了一種Leader-Follower式的方位信息編隊控制策略,解決了基于方位信息編隊問題中存在的位置漂移現(xiàn)象,實現(xiàn)了多無人機系統(tǒng)基于方位信息的對目標(biāo)編隊的形成、保持與跟蹤任務(wù).本文的主要創(chuàng)新點列舉如下: 1)目前在多數(shù)基于方位信息的編隊策略中,考慮的多是較為簡單的一階、二階模型或目標(biāo)編隊靜止的隊形保持問題.本文基于多旋翼無人機的位置動力學(xué)模型,考慮實際飛行中存在的未知擾動與風(fēng)阻,設(shè)計了基于方位信息的編隊控制器,實現(xiàn)了對移動目標(biāo)編隊的跟蹤;2)基于Leader-Follower方法構(gòu)建編隊以解決基于方位信息編隊問題中存在的位置漂移現(xiàn)象.采用反步法設(shè)計方位信息編隊控制器,通過引入虛擬速度輸入,將自適應(yīng)控制方法與魯棒控制方法應(yīng)用到基于方位信息的編隊控制問題中,并用Lyapunov方法對編隊系統(tǒng)進(jìn)行了穩(wěn)定性分析;3)文獻(xiàn)檢索結(jié)果表明,當(dāng)前大部分方位信息編隊研究仍停留在仿真階段;基于方位信息的無人機編隊控制設(shè)計中,進(jìn)行了實驗驗證的研究成果極少.本文自主搭建了多無人機飛行實驗平臺,進(jìn)行了實物實驗,進(jìn)一步驗證了所提算法的實用性與有效性.
參考文獻(xiàn)[22–24],一個由n架無人機組成的編隊系統(tǒng),其中第i架無人機的動力學(xué)模型可寫作如下形式:
其中:pi(t)=[pix(t)piy(t)piz(t)]T∈R3×1和vi(t)=[vix(t)viy(t)viz(t)]T∈R3×1分別表示無人機的位置和線速度;mi為無人機的質(zhì)量;g為重力加速度常數(shù).式(1)中,Ri(t)∈R3×3為t時刻無人機機體坐標(biāo)系到慣性坐標(biāo)系下的姿態(tài)旋轉(zhuǎn)矩陣;fi(t)為無人機旋翼產(chǎn)生的總升力;e3=[0 0 1]T為一方向向量,Di=diag{Dix,Diy,Diz}∈R3×3為無人機阻力系數(shù).di ∈R3×1為無人機所受未知擾動.定義輔助控制輸入信號ui(t)∈R3×1為
則系統(tǒng)動力學(xué)模型可寫為
假設(shè)1擾動項di(t)為一未知函數(shù)且有界,設(shè)其上界為,有‖di(t)‖≤.
假設(shè)2各機體無人機初始位置不重合,且在編隊形成過程中不發(fā)生碰撞[17].
無人機編隊中各無人機間的連接關(guān)系可以用無向圖G=(V,E)表示,其中結(jié)點集V={1,2,···,n}表示各無人機個體集合,邊界集E ?V×V代表各無人機間的連接關(guān)系.在本文中,以(i,j)∈E表示無人機i可以測得無人機j相對于自身的方位信息gij,且無人機j為其鄰機,即Ni={j ∈V:(i,j)∈E}.由無向圖的連接特性可得,(i,j)∈E ?(j,i)∈E.其中方位信息gij定義為
其中:‖eij‖表示兩機體間的Euclidean距離.gij(t)∈R3×1為一單位向量,可以通過相機或無線陣列實際測得.gij(t)∈R3×1,pi(t),pj(t)∈R3×1定義正交投影矩陣Pgij ∈R3×3如下:
其中I ∈R3×3為單位陣.正交投影矩陣Pgij ∈R3×3可以將向量投影到gij的正交補集上,即對任意與gij平行的向量x,都有Pgijx=0成立.依序?qū)D中前nl個節(jié)點設(shè)置為Leader無人機對應(yīng)的節(jié)點,其余nf=n-nl個節(jié)點設(shè)置為Follower無人機節(jié)點,將第1個Follower節(jié)點的序號記作nff,即nff=nl+1.并將圖中前nl個節(jié)點歸于Leader集Vl={1,···,nl},后nf個節(jié)點歸于Follower集Vf={nff,···,n}.
本文設(shè)計Leader-Follower結(jié)構(gòu)的方位信息編隊.其中Leader無人機按期望軌跡進(jìn)行自主飛行,且各Leader無人機之間滿足期望方位約束.然后,基于無人機動力學(xué)模型(1),對各Follower無人機設(shè)計基于方位信息的編隊控制律{ui}i∈Vf,使得各無人機間的方位收斂于期望值.
目標(biāo)方位編隊隊形p?(t)由給定的方位約束與時變的Leader無人機位置{(t)}i∈Vt確定.與傳統(tǒng)的基于位置的編隊控制方法不同,由于缺少距離信息,在同樣的Leader位置與方位約束的條件下,可能有不同的編隊隊形.如圖1所示,當(dāng)只采用方位信息對期望隊形進(jìn)行描述時,對于同樣的期望隊形,不同的Leader與方位約束條件的選擇會對隊形的唯一性產(chǎn)生不同的影響.圖1(a)和1(b)的期望隊形選取方式會造成隊形的不唯一,當(dāng)Follower沿圖中箭頭方向同步移動時,即使編隊仍滿足方位約束條件,但其隊形已經(jīng)發(fā)生了變化.而對同樣的期望隊形選擇更加合理的Leader與方位約束條件,就可滿足其唯一性,如圖1(c)和1(d)所示.
圖1 方位編隊唯一性說明Fig.1 Description of bearing formation uniqueness
因此,為保證方位編隊隊形的唯一性,Leader與方位約束的選擇需要滿足一定條件.引入如下方位拉普拉斯陣[19]:
將機體按Leader到Follower的順序進(jìn)行排列,可將B劃分為如下形式:
值得注意的是,采用上述方法設(shè)計期望隊形,編隊中Leader無人機的數(shù)量不能少于2,更為詳細(xì)的理論解釋可見文獻(xiàn)[19].但即使要求編隊中至少有兩架機體充當(dāng)Leader,Leader無人機仍占其可以組成的編隊系統(tǒng)中很少的一部分[20].
本文的控制目標(biāo)為,對由各無人機(1)組成的多無人機系統(tǒng),為各Follower無人機設(shè)計基于方位信息的控制律{ui}i∈Vf,使得各無人機間的方位與各無人機速度收斂于期望值,即各無人機間形成期望隊形且以期望速度整體移動,完成多無人機系統(tǒng)對目標(biāo)編隊的形成、保持和跟蹤任務(wù).
定義無人機i與其鄰機之間的勢場函數(shù)為
對其沿eij方向求偏導(dǎo),可得
由此定義無人機i的總勢場函數(shù)為
對于式(11)編隊系統(tǒng)采用反步法進(jìn)行控制設(shè)計.選取非負(fù)函數(shù)V1(t)為
對V1(t)進(jìn)行求導(dǎo)可得
為簡化證明過程,將式(11)中的系統(tǒng)動力學(xué)方程改寫為
其中νi=diag{vix(t),viy(t),viz(t)},Di=[DixDiyDiz]T.對于式(19)系統(tǒng)定義非負(fù)函數(shù)V2(t)為
對V2(t)求導(dǎo),得
其中:k1,k2∈R3×1,λi ∈R3×1為正值參數(shù);v?(t)為可預(yù)先設(shè)定的目標(biāo)編隊移動速度;(t)為(t)更新律.
定理1對于由各無人機(1)組成的多無人機編隊系統(tǒng).在滿足假設(shè)1和假設(shè)2的條件下,通過選取合適的Leader無人機與方位約束使其期望目標(biāo)編隊(G,p?(t))滿足唯一性條件.對各Follower無人機設(shè)計基于方位信息的控制器(23),可使多無人機系統(tǒng)(G,p(t))完成對目標(biāo)編隊的形成、保持與跟蹤任務(wù).
證選取Lyapunov候選函數(shù)V3(t)為
對上式進(jìn)行求導(dǎo),并將所設(shè)計的控制律(23)代入,可得
根據(jù)Barbalat 引理[25],如果可微函數(shù)f(t),當(dāng)t→∞時存在有限極限,且一致連續(xù),那么當(dāng)t →∞時,(t)→0.
即各無人機間的方位都將漸進(jìn)收斂于期望值,即多無人機系統(tǒng)形成由Leader位置與期望方位決定的期望時變編隊.證畢.
為了驗證本文所設(shè)計的方位編隊控制算法的有效性與實用性,本文使用多無人機編隊飛行平臺進(jìn)行了實際飛行實驗.實物實驗中各無人機通過自身與鄰機的位置信息由式(4)獲取所需方位信息,編隊移動速度可預(yù)先給定.
如圖2所示,編隊飛行平臺由4架四旋翼無人機與地面站組成,各無人機的質(zhì)量分別為m1=0.923 kg,m2=0.926 kg,m3=0.905 kg,m4=0.935 kg,軸距皆為l=0.25 m.每架無人機上均搭載了ARM(advanced RISC machine)嵌入式計算板與飛行控制器.各無人機間通過Wifi進(jìn)行組網(wǎng),且可通過OptiTrack運動捕捉系統(tǒng)獲取自身與其它無人機的位置信息.ARM嵌入式計算板與飛行控制器間通過串口有線連接.其中ARM嵌入式計算板以50 Hz的頻率運行方位編隊控制算法,并將計算所得的控制指令以MavLink信息的形式發(fā)送給飛行控制器.飛行控制器負(fù)責(zé)無人機的底層姿態(tài)控制,在接收到控制輸入指令后進(jìn)行解算,轉(zhuǎn)化為各電機轉(zhuǎn)速,最終實現(xiàn)來自ARM嵌入式計算板的控制輸入指令.地面站用來遠(yuǎn)程登陸各機載ARM嵌入式計算板,以啟動編隊控制算法與實時檢測各項數(shù)據(jù)情況.飛行場地長5.5 m,寬3 m,高2.5 m.
圖2 實驗平臺Fig.2 Testbed for UAVs formation control
本文主要進(jìn)行了兩組飛行實驗: 實驗1為多無人機系統(tǒng)在本文所設(shè)計控制器的作用下,對目標(biāo)編隊的形成、保持和跟蹤飛行實驗;實驗2為對比實驗,采用文獻(xiàn)[20]所設(shè)計的基于方位信息的編隊控制器對多無人機系統(tǒng)進(jìn)行控制,進(jìn)行與實驗1同樣的飛行實驗.
首先,選取期望隊形,通過引理1設(shè)計合適的方位約束與Leader選擇.由于實驗場地大小的限制,各無人機飛行過程中始終保持同樣的期望高度.編隊期望隊形的平面示意圖如圖3所示.
其中,1,2 號機為Leader,兩Leader 間滿足約束‖e12‖=1.5,g12=[1,0].其它期望方位為=[0,1],[0,1].經(jīng)驗算,上述設(shè)計的期望編隊的方位拉普拉斯陣Bff非奇異,即上述期望編隊設(shè)計滿足方位編隊唯一性條件,期望隊形可由上述設(shè)計唯一確定.
4架無人機期望高度均設(shè)為1.5 m,初始期望位置分別設(shè)置為p1=[-0.75 2.5 1.5]Tm,p2=[0.75 2.5 1.5]Tm,p3=[-1 1.3 1.5]Tm,p4=[1 1.3 1.5]Tm.初始位置不滿足期望隊形.實驗參數(shù)選取如下:k1=[1.25 1.25]T,k2=[1.25 1]T,λi=[2 2]T,(0)=[0 0]T,=[0.5 0.5]T,i=3,4.
在進(jìn)行飛行實驗時,首先令各無人機飛行到文中設(shè)置的初始位置.到達(dá)初始期望位置點后,作為Follower的無人機運行本文設(shè)計的控制算法,在僅利用方位信息的條件下完成編隊的形成與跟蹤任務(wù);對2架作為Leader的無人機則通過位置信息進(jìn)行位置跟蹤控制,待到達(dá)初始期望位置后等待5 s,之后使2架Leader無人機在滿足上述約束的情況下沿y方向進(jìn)行vd=0.1 m/s的往返運動.飛行實驗中4架無人機的位置如圖4所示,圖中虛線分別表示4架無人機的軌跡,實線為編隊算法運行t0=16 s后4架無人機實時位置構(gòu)成的隊形,此時編隊已處于前向移動狀態(tài),從圖中可以看出,編隊系統(tǒng)有效的完成了對期望移動隊形的保持與跟蹤任務(wù).
圖4 三維位置圖Fig.4 UAVs’position in 3D space
飛行過程中各方位信息由單位向量表示,實際方位信息與期望方位值差值(δij(t)=gij-)如圖5所示,其中橫軸為從各機體到達(dá)期望起始點時開始計算的所設(shè)計控制算法運行時間.縱軸為各機體相關(guān)的δij值.
為了更直觀的表達(dá)各方位信息的控制效果,定義各Follower 方位總偏差為Vf,其隨時間變化趨勢如圖6所示.從圖5–6中可以看出,隨著程序的運行,各方位逐漸收斂至其期望值,即多無人機系統(tǒng)在所設(shè)計的控制律作用下順利完成了編隊形成與跟蹤任務(wù).
圖6 實驗1: 各Follower無人機方位總偏差Fig.6 Case1: Total bearing errors for the followers
圖7–8分別為Follower無人機3,4的控制輸入曲線.從圖中可以看出,控制量大小始終保持在一個合理的范圍內(nèi).
圖7 實驗1: 無人機3控制量曲線圖Fig.7 Case1: Control inputs of the UAV3
圖8 實驗1: 無人機4控制量曲線圖Fig.8 Case1: Control inputs of the UAV4
對于由Leader–方位約束決定的編隊隊形,相同隊形不同規(guī)模的隊形(如Leader間的間距不同),對于同樣的方位偏差δij(t)形成的編隊效果不同.為了更直觀的展示編隊飛行效果,本文給出各Follower位置與期望位置偏差δpi(t)=pi(t)-(t)的曲線圖.式中各Follower機體的期望位置(t)可由任意兩架Leader的實時位置與期望方位約束計算得到.
從圖9–10中可以看出,各Follower無人機在所設(shè)計控制器的作用下逐漸收斂到期望位置,并始終在期望位置附近的小范圍內(nèi)波動.由此可以直觀的看出本文設(shè)計的控制器較好的完成了編隊任務(wù),并通過引入Leader無人機解決了位置漂移問題.
圖9 實驗1: 無人機3位置偏差圖Fig.9 Case1: Position errors of the UAV3
圖10 實驗1: 無人機4位置偏差圖Fig.10 Case1: Position errors of the UAV4
文獻(xiàn)[20]采取Leader-Follower 式編隊方法,針對雙積分模型設(shè)計了一種基于方位信息的PD控制器來實現(xiàn)目標(biāo)編隊跟蹤任務(wù).根據(jù)文獻(xiàn)[20]設(shè)計各Follower的控制輸入為
選取參數(shù)kp=[2.5 2]T,kd=[2.5 2.5]T,按照第5.1,5.2節(jié)同樣的實驗環(huán)境與流程設(shè)計進(jìn)行對比實驗,實驗數(shù)據(jù)結(jié)果如圖11–15所示.
圖11 實驗2: 各Follower無人機方位總偏差Fig.11 Case2: Total bearing errors for the followers
對圖6,9–10 與圖11,14–15 中的數(shù)據(jù)的穩(wěn)態(tài)過程進(jìn)行定量對比分析,選取第10~70 s的數(shù)據(jù),分別對圖中各量求取最大偏差和均方根誤差,計算結(jié)果如表1與表2所示.對比圖7–8與圖12–13,可以發(fā)現(xiàn)在受到未知擾動,系統(tǒng)產(chǎn)生震蕩時,本文設(shè)計的非線性控制器可以在更短的時間內(nèi)用更合理的控制量進(jìn)行矯正.對比表1與表2,可以發(fā)現(xiàn)實驗1中?i與δpi的最大偏差與均方根誤差均為實驗1 中的50%~60%,這說明在本文所設(shè)計的控制器的作用下,多無人機系統(tǒng)形成的編隊更趨近于期望編隊,且波動更小.
表1 本文控制器Table 1 Control design proposed in this paper
表2 文獻(xiàn)[20]中設(shè)計的對比控制器Table 2 Control design proposed in[20]
圖12 實驗2: 無人機3控制量曲線圖Fig.12 Case2: Control inputs of the UAV3
圖13 實驗2: 無人機4控制量曲線圖Fig.13 Case2: Control inputs of the UAV4
圖14 實驗2: 無人機3位置偏差圖Fig.14 Case2: Position errors of the UAV3
圖15 實驗2: 無人機4位置偏差圖Fig.15 Case2: Position errors of the UAV4
結(jié)合上述圖表,可以看出本文所設(shè)計的控制器相較于文獻(xiàn)[20]中設(shè)計的控制器,在多無人機編隊系統(tǒng)基于方位信息完成對目標(biāo)編隊的形成、保持和追蹤任務(wù)時,具有更優(yōu)異的性能.
本文針對基于方位信息的多無人機系統(tǒng)編隊控制問題,通過設(shè)置Leader引入位置信息來矯正飛行過程中的位置漂移.采用反步法引入自適應(yīng)與魯棒控制項抑制無人機飛行過程中存在的未知擾動與風(fēng)阻,并基于Lyapunov方法對閉環(huán)系統(tǒng)的穩(wěn)定性進(jìn)行了證明.最后,在自主搭建的四旋翼無人機編隊實驗平臺上進(jìn)行了實際飛行實驗,并與PD(proportional derivative)控制器進(jìn)行了對比實驗.實驗結(jié)果表明本文設(shè)計的非線性控制器在對期望編隊的形成、保持與跟蹤過程中有著更好的表現(xiàn).
在本文設(shè)計的基于方位信息的編隊控制器中,未考慮實際飛行環(huán)境中存在障礙物的情況.在后續(xù)的工作中,將嘗試不依賴位置信息的避障方法,實現(xiàn)基于方位信息的無人機編隊的自主避障飛行控制.