伍錫如,邢夢(mèng)媛
(桂林電子科技大學(xué)電子工程與自動(dòng)化學(xué)院,廣西桂林 541004)
近年來(lái),隨著機(jī)器人技術(shù)的崛起和發(fā)展,各式各樣的機(jī)器人技術(shù)成為了各個(gè)領(lǐng)域不可或缺的一部分,推動(dòng)著社會(huì)的發(fā)展和進(jìn)步.與此同時(shí),機(jī)器人面臨的任務(wù)也更加復(fù)雜,單個(gè)機(jī)器人已經(jīng)無(wú)法獨(dú)立完成應(yīng)盡的責(zé)任,這就使得多機(jī)器人之間相互協(xié)作、共同完成同一個(gè)給定任務(wù)成為當(dāng)前社會(huì)的研究熱點(diǎn).多機(jī)器人系統(tǒng)控制的研究主要集中在一致性問(wèn)題[1]、多機(jī)器人編隊(duì)控制問(wèn)題[2-3]、蜂擁問(wèn)題[4-5]等.其中,編隊(duì)控制問(wèn)題作為多機(jī)器人系統(tǒng)的主要研究方向之一,是國(guó)內(nèi)外研究學(xué)者關(guān)注的熱點(diǎn)問(wèn)題.編隊(duì)控制在生活生產(chǎn)、餐飲服務(wù)尤其是軍事作戰(zhàn)等領(lǐng)域都發(fā)揮著極大的作用.例如水下航行器在水中的自主航行和編隊(duì)控制、軍事作戰(zhàn)機(jī)對(duì)空中飛行器的打擊以及無(wú)人機(jī)在各行業(yè)的應(yīng)用等都是多機(jī)器人編隊(duì)控制上的用途[6-7].目前,多機(jī)器人編隊(duì)控制方法主要有3種,其中在多機(jī)器人系統(tǒng)編隊(duì)控制問(wèn)題上應(yīng)用最廣泛的是領(lǐng)航-跟隨法[8-10];除此之外,還有基于行為法和虛擬結(jié)構(gòu)法[11].基于行為的多機(jī)器人編隊(duì)方法在描述系統(tǒng)整體時(shí)不夠準(zhǔn)確高效,且不能保證系統(tǒng)控制的穩(wěn)定性;而虛擬結(jié)構(gòu)法則存在系統(tǒng)靈活性不足的缺陷.領(lǐng)航-跟隨型編隊(duì)控制法具有數(shù)學(xué)分析簡(jiǎn)單、易保持隊(duì)形、通信壓力小等優(yōu)點(diǎn),被廣泛應(yīng)用于多機(jī)器人系統(tǒng)編隊(duì)[12].例如,2017年,Hu等人采用分布式事件觸發(fā)策略,提出一種新的自觸發(fā)算法,實(shí)現(xiàn)了線性多機(jī)器人系統(tǒng)的一致性[13];Zuo等人利用李雅普諾夫函數(shù),構(gòu)造具有可變結(jié)構(gòu)的全局非線性一致控制律,研究多機(jī)器人系統(tǒng)的魯棒有限時(shí)間一致問(wèn)題[14].考慮到分?jǐn)?shù)微積分的存儲(chǔ)特性,開(kāi)發(fā)分?jǐn)?shù)階一致性控制的潛在應(yīng)用具有重要意義.時(shí)中等人于2016年設(shè)計(jì)了空間遙操作分?jǐn)?shù)階PID控制系統(tǒng),提高了機(jī)器人系統(tǒng)的跟蹤性能、抗干擾性、魯棒性和抗時(shí)延抖動(dòng)性能[15].2019年,Z Yang等人探討了分?jǐn)?shù)階多機(jī)器人系統(tǒng)的領(lǐng)航跟隨一致性問(wèn)題[16].而在多機(jī)器人的環(huán)形編隊(duì)控制中,對(duì)具有分?jǐn)?shù)階動(dòng)力學(xué)特性的多機(jī)器人系統(tǒng)的研究極其有限,大部分集中在整數(shù)階的階段.而采用分?jǐn)?shù)階對(duì)多機(jī)器人系統(tǒng)目標(biāo)包圍編隊(duì)控制進(jìn)行研究,綜合考慮了非局部分布式的影響,更好地描述具有遺傳性質(zhì)的動(dòng)力學(xué)模型.使得系統(tǒng)的模型能更準(zhǔn)確的反映系統(tǒng)的性態(tài),對(duì)多機(jī)器人編隊(duì)控制的研究非常有利.
目標(biāo)包圍控制問(wèn)題是編隊(duì)控制的一個(gè)分支,是多智能體編隊(duì)問(wèn)題的重點(diǎn)研究領(lǐng)域.隨著信息技術(shù)的高速發(fā)展,很多專家學(xué)者對(duì)多機(jī)器人系統(tǒng)的目標(biāo)包圍控制問(wèn)題進(jìn)行了研究探討.例如,Kim和Sugie于2017年基于一種循環(huán)追蹤策略設(shè)計(jì)分布式反饋控制律,保證了多機(jī)器人系統(tǒng)圍繞一個(gè)目標(biāo)機(jī)器人運(yùn)動(dòng)[17].在此基礎(chǔ)上,Lan和Yan進(jìn)行了拓展,研究了智能體包圍多個(gè)目標(biāo)智能體的問(wèn)題,并把這個(gè)問(wèn)題分為兩個(gè)步驟[18].Kowdiki K H和Barai K等人則研究了單個(gè)移動(dòng)機(jī)器人對(duì)任意時(shí)變曲線的跟蹤包圍問(wèn)題[19].Asif M考慮了機(jī)器人與目標(biāo)之間的避障問(wèn)題,提出了兩種包圍追蹤控制算法;并實(shí)現(xiàn)了移動(dòng)機(jī)器人對(duì)目標(biāo)機(jī)器人的包圍追蹤[20].
鑒于以上原因,本文采用了領(lǐng)航-跟隨型編隊(duì)控制方法來(lái)控制多機(jī)器人系統(tǒng)的環(huán)形編隊(duì)和目標(biāo)包圍,通過(guò)設(shè)計(jì)狀態(tài)估測(cè)器,實(shí)現(xiàn)對(duì)多機(jī)器人的狀態(tài)估計(jì).系統(tǒng)中目標(biāo)狀態(tài)信息只能由領(lǐng)航者獲取,確保整個(gè)多機(jī)器人系統(tǒng)編隊(duì)按照預(yù)期的理想編隊(duì)隊(duì)形進(jìn)行無(wú)碰撞運(yùn)動(dòng),并最終到達(dá)目標(biāo)位置,對(duì)目標(biāo)、領(lǐng)航者和跟隨者的位置分析如圖1(a)所示,圖1(b)為編隊(duì)控制后的狀態(tài).通過(guò)應(yīng)用李雅普諾夫穩(wěn)定性理論,得到實(shí)現(xiàn)多機(jī)器人系統(tǒng)環(huán)形編隊(duì)控制的充分條件.最后通過(guò)對(duì)一組多機(jī)器人隊(duì)列進(jìn)行目標(biāo)包圍仿真,驗(yàn)證了該方法的有效性.
圖1 目標(biāo)、領(lǐng)航者和追隨者的位置分析Fig.1 Location analysis of targets,pilots and followers
假定一個(gè)含有N個(gè)智能體的系統(tǒng),通訊網(wǎng)絡(luò)拓?fù)鋱D用G={v,ε}表示,定義ε=v×v為跟隨者節(jié)點(diǎn)之間邊的集合,v={vi,i=1,2,···,N}為跟隨者節(jié)點(diǎn)的集合.若(vi,vj)∈ε,則vi與vj為相鄰節(jié)點(diǎn),定義
考慮包含1個(gè)領(lǐng)航者和N個(gè)跟隨者的分?jǐn)?shù)階非線性多機(jī)器人系統(tǒng).領(lǐng)航者的動(dòng)力學(xué)方程為
式中:0<α<1,x0(t)∈R2是領(lǐng)航者的位置狀態(tài),u0(t)∈R2是領(lǐng)航者的控制輸入.跟隨者的動(dòng)力學(xué)模型如下:
式中:0<α<1,xi(t)∈R2是跟隨者的位置狀態(tài),ui(t)∈R2是跟隨者i在t時(shí)刻的控制輸入,I={1,2,···,N}.
對(duì)于領(lǐng)航者,選擇如下控制器:
根據(jù)引理1,得到該李雅普諾夫函數(shù)的α階導(dǎo)數(shù)如下:
在本文中,整個(gè)多機(jī)器人系統(tǒng)中領(lǐng)導(dǎo)者能夠直接獲得目標(biāo)的位置信息,將這些信息傳遞給追隨者,因此需要為每個(gè)追隨者設(shè)計(jì)觀測(cè)器來(lái)估計(jì)目標(biāo)的狀態(tài).令φi(t)∈R2由跟隨者對(duì)目標(biāo)i的狀態(tài)估計(jì),給出φi(t)的動(dòng)力學(xué)方程
本節(jié)通過(guò)仿真結(jié)果來(lái)驗(yàn)證本文所提出的方法.圖2為通信圖,其中:V={1,2,3,4}表示跟隨者集合,0代表領(lǐng)導(dǎo)者.以5個(gè)機(jī)器人組成的隊(duì)列為例進(jìn)行驗(yàn)證,根據(jù)領(lǐng)航者對(duì)目標(biāo)的跟隨軌跡,分別進(jìn)行了仿真.
圖2 通信圖Fig.2 Communication diagrams
假設(shè)系統(tǒng)中目標(biāo)機(jī)器人的動(dòng)態(tài)為
圖3 目標(biāo)、領(lǐng)航者和追隨者的位置分析Fig.3 Location analysis of target pilots and followers
綜合圖4-5曲線,跟隨者對(duì)領(lǐng)航者進(jìn)行漸進(jìn)跟蹤,領(lǐng)航者同目標(biāo)機(jī)器人的相對(duì)位置不變,表明該領(lǐng)航跟隨型多機(jī)器人系統(tǒng)最終能與目標(biāo)機(jī)器人保持期望的距離,并且不再變化.
圖4 領(lǐng)航者及其跟隨者的狀態(tài)估計(jì)誤差Fig.4 The state estimation error of the leader and followers
圖5 編隊(duì)形成時(shí)領(lǐng)航者與目標(biāo)的相對(duì)位置關(guān)系Fig.5 The relative position relationship between leader and target
仿真結(jié)果表明,多個(gè)機(jī)器人在對(duì)目標(biāo)物進(jìn)行包圍編隊(duì)時(shí),領(lǐng)航者會(huì)逐漸形成以目標(biāo)物運(yùn)動(dòng)軌跡為參照的運(yùn)動(dòng)路線,而跟隨者則漸近的完成對(duì)領(lǐng)航者的跟蹤(如圖6所示),跟隨者在對(duì)領(lǐng)航者進(jìn)行跟蹤時(shí),會(huì)出現(xiàn)一定頻率的抖振,但這些并不會(huì)影響該多機(jī)器人系統(tǒng)的目標(biāo)包圍編隊(duì)控制.
本文提出了多機(jī)器人的領(lǐng)航-跟隨型編隊(duì)控制方法,選定了一臺(tái)機(jī)器人作為領(lǐng)航者負(fù)責(zé)整個(gè)編隊(duì)的路徑規(guī)劃任務(wù),其余機(jī)器人作為跟隨者.跟隨機(jī)器人負(fù)責(zé)實(shí)時(shí)跟蹤領(lǐng)航者,并盡可能與領(lǐng)航機(jī)器人之間保持隊(duì)形所需的距離和角度,確保整個(gè)多機(jī)器人系統(tǒng)編隊(duì)按照預(yù)期的理想編隊(duì)隊(duì)形進(jìn)行無(wú)碰撞運(yùn)動(dòng),并最終到達(dá)目標(biāo)位置.通過(guò)建立李雅普諾夫函數(shù)和米塔格穩(wěn)定性理論,得到了實(shí)現(xiàn)多機(jī)器人系統(tǒng)環(huán)形編隊(duì)的充分條件,并通過(guò)對(duì)一組多機(jī)器人隊(duì)列的目標(biāo)包圍仿真,驗(yàn)證了該方法的有效性.
圖6 領(lǐng)航者與跟隨者對(duì)目標(biāo)的狀態(tài)估計(jì)Fig.6 State estimation of target by pilot and follower