孫玉嬌,楊洪勇,于美妍
(魯東大學(xué)信息與電氣工程學(xué)院,山東 煙臺(tái) 264025)
現(xiàn)在人工智能受到越來(lái)越多的關(guān)注,對(duì)于多機(jī)器人的編隊(duì)控制逐漸成為研究熱點(diǎn)。隨著機(jī)器人技術(shù)的發(fā)展,機(jī)器人被應(yīng)用到越來(lái)越多的領(lǐng)域,包括家庭、工作和社區(qū)等,機(jī)器人從各方面改變著我們的生活方式。
作為機(jī)器人家族的一種,輪式機(jī)器人是機(jī)器人運(yùn)動(dòng)控制的研究熱點(diǎn)之一。從輪式機(jī)器人運(yùn)動(dòng)控制入手[1],研究了在理想狀態(tài)下輪式機(jī)器人軌跡跟蹤的一般方法,通過(guò)仿真驗(yàn)證了運(yùn)動(dòng)控制方法可行性。通過(guò)對(duì)復(fù)雜多機(jī)器人的運(yùn)動(dòng)一致性問(wèn)題進(jìn)行研究[2],設(shè)計(jì)了一種分布式編隊(duì)控制協(xié)議,實(shí)現(xiàn)了多移動(dòng)機(jī)器人的動(dòng)態(tài)編隊(duì)。當(dāng)網(wǎng)絡(luò)出現(xiàn)數(shù)據(jù)包丟失和加性白噪聲等通信問(wèn)題時(shí),詹習(xí)生[3]等人采用頻域的方法研究了網(wǎng)絡(luò)化系統(tǒng)穩(wěn)定性問(wèn)題,得到了網(wǎng)絡(luò)化系統(tǒng)穩(wěn)定所需信噪比的最小(極限)值。馮磊[4]研究了針對(duì)復(fù)雜環(huán)境下的編隊(duì)控制算法,并通過(guò)仿真進(jìn)行了驗(yàn)證。根據(jù)機(jī)器人之間的局部信息交互,易國(guó)等[5]提出了領(lǐng)航—跟隨編隊(duì)分布式控制算法。針對(duì)非線性系統(tǒng),采用反步法和一致性理論對(duì)領(lǐng)航—跟隨編隊(duì)控制律進(jìn)行設(shè)計(jì)[6]。進(jìn)而研究了多智能體系統(tǒng)編隊(duì)避障控制算法[7],并用李雅譜諾夫穩(wěn)定性定理證明了控制器的穩(wěn)定性。后來(lái)針對(duì)基于領(lǐng)航—跟隨法的有限時(shí)間旋轉(zhuǎn)一致性問(wèn)題和編隊(duì)問(wèn)題進(jìn)行了研究[8]。劉海濤等[9]研究了具有參數(shù)不確定和外界干擾情況下機(jī)器人的軌跡跟蹤問(wèn)題,結(jié)合Backstepping的反推設(shè)計(jì)控制器方法,提出了一種有限時(shí)間穩(wěn)定的跟蹤控制方法。王芳等[10]證明了通信拓?fù)錇槁?lián)合連通時(shí)提出的二階多智能體系統(tǒng)有限時(shí)間一致性協(xié)議的穩(wěn)定性。對(duì)于多機(jī)器人系統(tǒng),需要將問(wèn)題轉(zhuǎn)換為軌跡追蹤問(wèn)題[11],采用反步法逐步構(gòu)造出李雅普諾夫函數(shù),研究線性多智能體系統(tǒng)的有限時(shí)間一致性。吳小重等[12]在控制輸入受限的多機(jī)器人系統(tǒng)模型下,基于有限時(shí)間一致性,提出了有限時(shí)間編隊(duì)控制方案。針對(duì)收斂速率這一問(wèn)題設(shè)計(jì)多機(jī)器人系統(tǒng)的一致性算法,應(yīng)用到多機(jī)器人編隊(duì)控制中,可以提高了收斂速率[13]。蔣國(guó)平等[14]討論了線性多機(jī)器人系統(tǒng)收斂時(shí)間的問(wèn)題。王慶領(lǐng)[15]構(gòu)建了非線性機(jī)器人運(yùn)動(dòng)系統(tǒng),研究了飽和受限的非線性多機(jī)器人系統(tǒng)的一致性問(wèn)題。
基于前面研究成果,本文擬研究非完整移動(dòng)機(jī)器人系統(tǒng)的有限時(shí)間編隊(duì)控制問(wèn)題。本文通過(guò)引入虛擬領(lǐng)航者把多機(jī)器人系統(tǒng)的編隊(duì)控制問(wèn)題轉(zhuǎn)化為路徑跟蹤問(wèn)題,構(gòu)建了具有輸入飽和受限約束的多機(jī)器人系統(tǒng)的有限時(shí)間編隊(duì)控制協(xié)議。
采用圖論知識(shí)描述非完整移動(dòng)機(jī)器人間的通信拓?fù)潢P(guān)系。定義圖G=(V(G),E(G)),其中,V(G)={v1,v2,…,vn}為有限節(jié)點(diǎn)集,表示機(jī)器人。E(G)={e1,e2,…em}為有限邊集,由有序?qū)?vi,vj)表示機(jī)器人之間的通信連接關(guān)系:當(dāng)且僅當(dāng)?shù)趈個(gè)節(jié)點(diǎn)能夠直接接收第i個(gè)節(jié)點(diǎn)的消息時(shí),此時(shí),節(jié)點(diǎn)vj稱作節(jié)點(diǎn)vi的父節(jié)點(diǎn),節(jié)點(diǎn)vi稱作節(jié)點(diǎn)vj的子節(jié)點(diǎn)。如果(vi,vj)∈E,則稱頂點(diǎn)i是頂點(diǎn)j的一個(gè)鄰居,節(jié)點(diǎn)vj的鄰居節(jié)點(diǎn)集合表示為其父節(jié)點(diǎn)的集合,即Nj=(vi∈V|(vj,vi)∈E)。文中,用子圖Gs的節(jié)點(diǎn)集V(Gs)={v1,v2,…,vn}表示跟隨者機(jī)器人集合,節(jié)點(diǎn)v0表示虛擬領(lǐng)導(dǎo)者機(jī)器人。跟隨者節(jié)點(diǎn)之間,A(Gs)=[aij]∈Rn×n,(j,i∈I,I={1,2,…,n})為加權(quán)鄰接矩陣,對(duì)于任意j,i∈I,ajj=0,aij=aji≥0(i≠j),當(dāng)(vj,vi)?E(Gs)時(shí),aij=0,否則aij=1。在圖G中,定義向量B=(b1,b2,…,bn),當(dāng)節(jié)點(diǎn)v0是節(jié)點(diǎn)vj的鄰居節(jié)點(diǎn)時(shí),bj=1,否則,bj=0。如果任意節(jié)點(diǎn)vj(j∈I)與節(jié)點(diǎn)v0之間都存在一條路徑,節(jié)點(diǎn)v0是全局可達(dá)的。節(jié)點(diǎn)vi與節(jié)點(diǎn)vj之間的路徑用一系列節(jié)點(diǎn)序列(vi,vk1),(vk1,vk2),…,(vkl,vj)表示,且若vj與vi之間有路徑存在,則稱vj與vi之間是可達(dá)的;否則稱vj與vi之間是不可達(dá)的。
定義1有向圖G的拉普拉斯矩陣定義為:
L=D-A
(1)
引理1考慮自治動(dòng)力學(xué)系統(tǒng),假設(shè)存在一個(gè)C1上的連續(xù)可微函數(shù)V(x)定義在原點(diǎn)的領(lǐng)域,且實(shí)數(shù)c>0,α∈(0,1),使得:
1)V(x)正定;
引理3對(duì)于無(wú)向通信拓?fù)浣Y(jié)構(gòu)圖G,L(A)=[lij]∈Rn×n代表該無(wú)向圖的Laplacian矩陣,有如下性質(zhì):
引理4對(duì)于無(wú)向通信拓?fù)鋱DG,假如存在一個(gè)函數(shù)φ:R2→R滿足φ(xi,xj)=-φ(xj,xi),?i,j∈I,i≠j那么就有一組數(shù)列y1,y2,…,yn滿足:
(2)
本文的研究對(duì)象為非完整約束條件下的輪式機(jī)器人,系統(tǒng)由n+1個(gè)機(jī)器人組成,機(jī)器人序列用編號(hào)ξ={0,1,2,…,n}來(lái)表示,編號(hào)0的機(jī)器人為虛擬領(lǐng)導(dǎo)者,其余n個(gè)為跟隨者。vj表示機(jī)器人的線速度,機(jī)器人的位姿可以表示為P=[xj,yj,θj],xj、yj表示機(jī)器人的位置,θj表示機(jī)器人運(yùn)動(dòng)的速度向量v和X軸正方向的夾角(X-Y為全局坐標(biāo)系),wj是機(jī)器人運(yùn)動(dòng)的角速度,在驅(qū)動(dòng)輪純滾動(dòng)無(wú)滑動(dòng)的情況下,機(jī)器人受非完整約束(如圖1所示),機(jī)器人j的動(dòng)力學(xué)模型為:
圖1 非完整移動(dòng)機(jī)器人圖
(3)
定義2非完整移動(dòng)多機(jī)器人系統(tǒng)的跟隨機(jī)器人j(1≤j≤n)位姿滿足式(3)的要求,則系統(tǒng)在有限時(shí)間內(nèi)實(shí)現(xiàn)預(yù)期編隊(duì)目標(biāo)。如果式(4)成立,
(4)
考慮到多機(jī)器人系統(tǒng)的控制輸入飽和受限的條件,將機(jī)器人的坐標(biāo)變換進(jìn)行定義:
(5)
其中1≤j≤n,u1j(t)和u2j(t)為待設(shè)計(jì)的控制輸入,σμ1(u1j(t))和σμ2(u2j(t))為飽和受限下的控制輸入。定義σμ:R→R為輸入飽和函數(shù),表達(dá)式為σμ(x)=sign(x)·min{|x|,μ},μ>0;定義函數(shù)sig(x)α=sign(x)·|x|α,sign(x)為符號(hào)函數(shù),α∈(0,1)。
基于以上的設(shè)計(jì),多機(jī)器人系統(tǒng)的動(dòng)力學(xué)模型可以定義為:
(6)
其中,領(lǐng)航機(jī)器人的坐標(biāo)變換后的狀態(tài)信息如式(7):
(7)
對(duì)于非完整移動(dòng)多機(jī)器人系統(tǒng),如果跟隨機(jī)器人j的各狀態(tài)量均在有限時(shí)間內(nèi)T∈[0,1)內(nèi)滿足一致性要求,則系統(tǒng)在有限時(shí)間內(nèi)收斂到預(yù)期編隊(duì)目標(biāo),即式(8)成立:
(8)
將式(5)分解為一個(gè)一階子系統(tǒng)式(9)和一個(gè)二階子系統(tǒng)式(10),設(shè)計(jì)有限時(shí)間一致性算法達(dá)到一致性要求,進(jìn)而實(shí)現(xiàn)編隊(duì)控制目標(biāo)。
(9)
(10)
下面將針對(duì)子系統(tǒng)設(shè)計(jì)有限時(shí)間一致性協(xié)議,并對(duì)一致性協(xié)議下的穩(wěn)定性進(jìn)行分析,證明非完整移動(dòng)多機(jī)器人系統(tǒng)在輸入飽和受限的條件下有限時(shí)間內(nèi)能夠完成編隊(duì)控制目標(biāo)。
定理1對(duì)于無(wú)向網(wǎng)絡(luò)中的非完整移動(dòng)多機(jī)器人系統(tǒng)(3),虛擬領(lǐng)導(dǎo)者是全局可達(dá)的,則對(duì)于任意初始狀態(tài),應(yīng)用設(shè)計(jì)的一致性協(xié)議,非完整移動(dòng)多機(jī)器人系統(tǒng)能夠?qū)崿F(xiàn)有限時(shí)間編隊(duì)控制目標(biāo)。
證明:首先對(duì)一階子系統(tǒng)一致性進(jìn)行證明,考慮到控制輸入飽和受限的條件,提出一致性控制算法:
(11)
其中,0<α1<1,Δ1<μ1。
令跟蹤誤差為:
(12)
將式(11)求導(dǎo)后并將式(10)代入可以得到:
(13)
(14)
再由引理2可以得到:
(15)
根據(jù)引理3可以得到:
(16)
由式(14)、(15)可以得到:
(17)
由引理1知,當(dāng)t≥T(t(0))時(shí)一階子系統(tǒng)可以在有限時(shí)間內(nèi)達(dá)到一致性,此時(shí)跟隨機(jī)器人跟蹤上領(lǐng)航機(jī)器人的運(yùn)動(dòng)狀態(tài)。
(18)
(19)
(20)
其中,k2=2k1。
(21)
(22)
再由引理2可以得到:
(23)
(24)
由引理1可以知道二階系統(tǒng)在有限時(shí)間內(nèi)達(dá)到穩(wěn)定。
因此,一、二階子系統(tǒng)均在有限時(shí)間內(nèi)達(dá)到一致性,此時(shí)跟隨機(jī)器人均跟蹤上領(lǐng)航機(jī)器人的運(yùn)動(dòng)狀態(tài),非完整移動(dòng)多機(jī)器人系統(tǒng)在有限時(shí)間完成編隊(duì)控制目標(biāo)。
本節(jié)對(duì)本文的理論結(jié)果進(jìn)行仿真驗(yàn)證,分析非完整移動(dòng)多機(jī)器人系統(tǒng)的有限時(shí)間編隊(duì)控制算法的有效性。
設(shè)由5個(gè)跟隨機(jī)器人和一個(gè)領(lǐng)航機(jī)器人組成的非完整移動(dòng)多機(jī)器人系統(tǒng),用p=(x,y,θ)表示位姿信息,每個(gè)機(jī)器人的初始信息如表1所示。
表1 系統(tǒng)初始參數(shù)設(shè)置
將本文所提一致性協(xié)議應(yīng)用于多機(jī)器人系統(tǒng),將協(xié)議參數(shù)設(shè)為α1=0.8,輸入飽和參數(shù)設(shè)為Δ1=1.33,Δ2=8。仿真時(shí)間設(shè)為30 s,系統(tǒng)中機(jī)器人通信拓?fù)潢P(guān)系對(duì)應(yīng)的A矩陣和B向量分別取為
基于以上對(duì)機(jī)器人的初始參數(shù)設(shè)置,接下來(lái)對(duì)非完整移動(dòng)多機(jī)器人系統(tǒng)輸入飽和受限條件下有限時(shí)間編隊(duì)控制進(jìn)行仿真,仿真結(jié)果如圖2~圖4所示。
圖2 狀態(tài)誤差z1j-z10變化曲線
圖3 狀態(tài)誤差z2j-z20變化曲線
圖4 狀態(tài)誤差z3j-z30變化曲線
圖2、圖3、圖4中的藍(lán)、橙、黃、紫、綠線分別表示跟隨機(jī)器人1-5的狀態(tài)信息,橫坐標(biāo)表示時(shí)間,單位為秒,縱坐標(biāo)分別表示角度狀態(tài)誤差,單位為弧度,x軸狀態(tài)誤差,單位為米,y軸狀態(tài)誤差,單位為米。從圖2~圖4可以看出,在一致性控制協(xié)議的作用下,隨著時(shí)間的推移,角度和位移分別在7 s,9 s,8 s的時(shí)候收斂到0,這時(shí)候表明跟隨機(jī)器人跟蹤上了領(lǐng)航機(jī)器人的運(yùn)動(dòng)狀態(tài)。
圖5表示機(jī)器人形成三角形編隊(duì)做圓周運(yùn)動(dòng)的過(guò)程,淺藍(lán)色實(shí)線表示虛擬領(lǐng)導(dǎo)者的運(yùn)動(dòng)軌跡,編隊(duì)由開始的正五邊形逐漸收斂成期望隊(duì)形——三角形,并一直重復(fù)進(jìn)行圓周運(yùn)動(dòng)。
圖5 多機(jī)器人系統(tǒng)編隊(duì)運(yùn)動(dòng)軌跡
把本文提出的多機(jī)器人編隊(duì)控制協(xié)議與已有成果進(jìn)行比較。圖6和圖7是機(jī)器人系統(tǒng)形成編隊(duì)所需的時(shí)間,圖6是應(yīng)用已有文獻(xiàn)[12]的控制協(xié)議得出的結(jié)果,大約6.5 s形成編隊(duì);圖7是應(yīng)用本文的控制方法得出的結(jié)果,大約3.5 s形成編隊(duì)。由此可以看出本文設(shè)計(jì)的多機(jī)器人有限時(shí)間一致性協(xié)議,可以更加快速收斂,實(shí)現(xiàn)多機(jī)器人的運(yùn)動(dòng)編隊(duì)。
圖6 位置誤差與時(shí)間的關(guān)系
圖7 位置誤差與時(shí)間的關(guān)系
本文以多智能體系統(tǒng)為研究背景,以圖論為工具,研究了飽和受限多智能體有限時(shí)間一致性問(wèn)題,提出了基于一致性理論的領(lǐng)導(dǎo)—跟隨方法編隊(duì)控制。隨著多智能體系統(tǒng)的廣泛應(yīng)用,關(guān)于一致性問(wèn)題的研究進(jìn)展非常迅速,仍有很多問(wèn)題值得進(jìn)一步探討,例如由于外界環(huán)境的干擾和系統(tǒng)模型本身的不確定性對(duì)系統(tǒng)穩(wěn)定性以及控制性能的影響,帶有模型不確定性的多智能體系統(tǒng)一致性等。