彭積廣,肖涵臻
(廣東工業(yè)大學(xué) 自動(dòng)化學(xué)院,廣東 廣州 510006)
近些年來,移動(dòng)機(jī)器人的編隊(duì)控制與避障能力引起了許多研究者的興趣,是機(jī)器人領(lǐng)域中非常熱門的研究方向之一。基于分布式一致性的編隊(duì)控制獲得了快速且持續(xù)的發(fā)展,在基于一致性的編隊(duì)中,由于機(jī)器人之間的通信帶寬受到限制及機(jī)器人之間的信息傳輸應(yīng)具備高質(zhì)量和無延時(shí)的高標(biāo)準(zhǔn),因此考慮機(jī)器人只能與它的鄰居接收和發(fā)送信息是十分有必要的。在領(lǐng)導(dǎo)者?跟隨者機(jī)器人編隊(duì)形式中[1-3],有一個(gè)及以上機(jī)器人為領(lǐng)導(dǎo)者,領(lǐng)導(dǎo)者可以是其中的某個(gè)機(jī)器人或者為虛擬機(jī)器人,它決定整個(gè)編隊(duì)的運(yùn)動(dòng)軌跡和方向,其他移動(dòng)機(jī)器人作為跟隨者被領(lǐng)導(dǎo)者帶領(lǐng)運(yùn)動(dòng),并相互之間保持相對的距離與方位。文獻(xiàn)[4]實(shí)現(xiàn)了一種模型預(yù)測控制(Model Predictive Control, MPC)方法來控制一個(gè)領(lǐng)導(dǎo)者?跟隨者編隊(duì)系統(tǒng)。通過在分離度?姿態(tài)?方位模型(Separation-Bearing-Orientation Scheme, SBOS)和避障模型之間進(jìn)行切換,使編隊(duì)避免碰撞,達(dá)到理想的編隊(duì)狀態(tài),并對約束條件進(jìn)行處理。但是SBOS模型難以與避障模型相結(jié)合起來。于是文獻(xiàn)[5]提出了固定無向拓?fù)湎禄诰嚯x與速度的人工勢場方法的編隊(duì)避障系統(tǒng),但是沒有考慮有向拓?fù)淝彝負(fù)淇梢宰兓碌谋苷?,并且沒考慮機(jī)器人相互避免碰撞的同時(shí),能避免障礙物的問題。結(jié)合以上參考的工作,為在期望路徑上規(guī)劃機(jī)器人到達(dá)并與領(lǐng)導(dǎo)機(jī)器人保持期望距離,通過構(gòu)造編隊(duì)路徑規(guī)劃的控制輸入與避障系統(tǒng)結(jié)合起來。
研究者們提出了許多的控制算法來控制機(jī)器人編隊(duì),如一致控制[6-7]、自適應(yīng)控制[8]、滑模[9-10]和人工勢場[11]等。對于群體編隊(duì),需要考慮系統(tǒng)約束問題。然而,模型預(yù)測控制(MPC)能夠很好地考慮移動(dòng)機(jī)器人的物理約束問題。另一方面,模型預(yù)測控制(MPC)方法已成功地應(yīng)用于工業(yè)環(huán)境下的復(fù)雜系統(tǒng)的控制,是應(yīng)用最廣泛的最優(yōu)控制技術(shù)之一。其中,文獻(xiàn)[12-13]是一種模型預(yù)測控制(MPC),具有軌跡優(yōu)化能力,并充分考慮物理約束,適用于多機(jī)器人控制。一般來說,MPC可以解決包含約束的優(yōu)化問題。在預(yù)測控制范圍內(nèi),由最優(yōu)解得到的輸入序列總能考慮機(jī)器人的內(nèi)在物理約束。為解決預(yù)測控制的優(yōu)化問題,需要一種高效的優(yōu)化算法。文獻(xiàn)[14]將多機(jī)器人編隊(duì)控制(General Projection Neural Network,GPNN)方法與多機(jī)器人一致編隊(duì)相結(jié)合,來求解包含編隊(duì)最優(yōu)輸入的約束(Quadratic Programming,QP)問題的最優(yōu)解。與現(xiàn)有的領(lǐng)導(dǎo)者?跟隨者方法相比,所提出的MPC方法能夠考慮系統(tǒng)的輸入約束和狀態(tài)約束。本文利用投影神經(jīng)網(wǎng)絡(luò)優(yōu)化算法來處理基于MPC方法的優(yōu)化問題。
在實(shí)際機(jī)器人運(yùn)動(dòng)中,機(jī)器人處理避障的能力是十分重要的,研究者們對于這一問題進(jìn)行了深入的研究[15-18],其中一種較簡單且廣泛使用的避障方式為基于距離的人工勢場法。人工勢場法的主要思想是,當(dāng)一個(gè)機(jī)器人進(jìn)入其他機(jī)器人的勢場中時(shí),機(jī)器人會產(chǎn)生一種很強(qiáng)的排斥力,迫使它遠(yuǎn)離其他機(jī)器人,從而避免發(fā)生碰撞。然而,文獻(xiàn)[19-20]中的人工勢場方法僅基于機(jī)器人之間的距離進(jìn)行設(shè)計(jì),在很多情況下具有相當(dāng)大的局限性。例如:一機(jī)器人雖然進(jìn)入勢場中,但是兩機(jī)器人的移動(dòng)方向和速度不同,使得機(jī)器人之間不會產(chǎn)生碰撞,此時(shí),機(jī)器人也會因靠近產(chǎn)生排斥力,從而會增加機(jī)器人的能量消耗,并且易致編隊(duì)控制不穩(wěn)定。機(jī)器人也需有避開障礙物的能力,運(yùn)用人工勢場法來進(jìn)行避障處理?;谏鲜龇治觯疚睦靡环N基于距離和速度的人工勢場方法來處理多移動(dòng)機(jī)器人編隊(duì)控制的機(jī)器人間的避碰問題和人工勢場法來處理避免障礙物。
受以上文獻(xiàn)啟發(fā),本文首次將文獻(xiàn)[5]的基于距離與速度的人工勢場方法引入有向拓?fù)淝彝負(fù)淇梢宰兓驴紤]機(jī)器人相互避免碰撞避障。同時(shí),運(yùn)用人工勢場法[21]能避免障礙物的問題,且融合進(jìn)一階多移動(dòng)機(jī)器人的一致性編隊(duì)路徑規(guī)劃控制中。本文提出兩層編隊(duì)控制框架, 在編隊(duì)控制層面上,設(shè)計(jì)具有避碰的編隊(duì)控制律控制。可以使機(jī)器人在相對平滑的軌跡上運(yùn)動(dòng)且具有避障能力,并與相鄰機(jī)器人達(dá)到并保持預(yù)期的距離。在編隊(duì)跟蹤層,應(yīng)用GPNN結(jié)合MPC方法重構(gòu)并求解一個(gè)基于跟蹤誤差模型的約束QP問題。得到控制機(jī)器人的最優(yōu)輸入,同時(shí)考慮速度約束和系統(tǒng)狀態(tài)約束。該兩層群形成框架綜合了軌跡生成方法和算法的優(yōu)點(diǎn)。
在實(shí)際工作過程中,機(jī)器人的避障能力是十分必要的,不僅僅是避免對障礙物的碰撞,而且機(jī)器人相互之間也需要有良好的避障能力。對于基于距離的人工勢場法的避障系統(tǒng),當(dāng)某一機(jī)器人進(jìn)入另一機(jī)器人的勢場范圍內(nèi)或兩個(gè)及以上機(jī)器人的勢場范圍發(fā)生接觸時(shí),機(jī)器人之間就會迅速產(chǎn)生排斥力。但是如圖1所示,即使其進(jìn)入勢場的范圍內(nèi)時(shí),機(jī)器人之間也不會發(fā)生碰撞。此時(shí)機(jī)器人之間的碰撞不僅僅取決于機(jī)器人之間的距離,也與機(jī)器人之間的速度的大小和方向相關(guān)。根據(jù)文獻(xiàn)[5],可用基于距離和速度的避障方式來建立機(jī)器人躲避障礙的模型。
圖1 基于距離與速度的機(jī)器人避障圖Fig.1 Obstacle avoidance diagram of robot based on distance and speed
為了控制編隊(duì)跟蹤良好,采用MPC方法。在有限時(shí)間范圍之類,經(jīng)過歐拉離散化的系統(tǒng),可轉(zhuǎn)化為具有輸入和狀態(tài)飽和約束以及離散非線性模型方程的閉環(huán)離散時(shí)間最優(yōu)控制問題。因此,將系統(tǒng)的控制輸入和狀態(tài)方法轉(zhuǎn)化成離散時(shí)間狀態(tài)空間方程。編隊(duì)控制目標(biāo)、避障實(shí)現(xiàn)和軌跡跟蹤可以通過MPC方法轉(zhuǎn)化為離散時(shí)間閉環(huán)優(yōu)化控制問題。不失一般性,可得到廣義非線性離散仿射系統(tǒng):
模型預(yù)測控制是一種基于模型的閉環(huán)優(yōu)化控制策略,其算法的核心是:可預(yù)測未來的動(dòng)態(tài)模型,在線反復(fù)優(yōu)化計(jì)算并滾動(dòng)實(shí)施的控制作用和模型誤差的反饋校正。因此,對比于傳統(tǒng)或經(jīng)典的控制器,模型預(yù)測控制具有控制效果好、魯棒性強(qiáng)等優(yōu)點(diǎn),可有效地克服過程的不確定性、非線性和并聯(lián)性,并能方便地處理被控變量和操縱變量中的各種約束。因此,代價(jià)函數(shù)可表示為
為了在線模型預(yù)測控制中獲得已規(guī)劃的優(yōu)化問題的最優(yōu)解,需要尋求一種高效的最優(yōu)化方法來求解。因此,一種廣義投影神經(jīng)網(wǎng)絡(luò)優(yōu)化的方法被提出。為了解決二次規(guī)劃問題(19),開發(fā)了一種單層結(jié)構(gòu)一般投影神經(jīng)網(wǎng)絡(luò)(GPNN),它是一種遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)。廣義投影神經(jīng)網(wǎng)絡(luò)是一類求解更廣泛的單調(diào)變分不等式和相關(guān)的優(yōu)化問題。本文所提出的神經(jīng)網(wǎng)絡(luò)具有低模型復(fù)雜度的單層結(jié)構(gòu),包含了現(xiàn)有的用于約束優(yōu)化的神經(jīng)網(wǎng)絡(luò),如原始對偶神經(jīng)網(wǎng)絡(luò)、對偶神經(jīng)網(wǎng)絡(luò)和投影神經(jīng)網(wǎng)絡(luò),均為廣義投影神經(jīng)網(wǎng)絡(luò)的特殊情況。廣義投影神經(jīng)網(wǎng)絡(luò)的漸進(jìn)神經(jīng)網(wǎng)絡(luò)的遞歸神經(jīng)網(wǎng)絡(luò)(RNN)用于解 MPC 控制中產(chǎn)生的二次規(guī)劃問題,并表現(xiàn)出了較低的計(jì)算復(fù)雜度。通過GPNN方法,可得到具有全局指數(shù)收斂性和李雅普諾夫穩(wěn)定性的二次規(guī)劃問題最優(yōu)解。因此,有以下定理[20]:
在本節(jié)中,利用Matlab對一組編隊(duì)的非完整移動(dòng)機(jī)器人進(jìn)行軌跡跟蹤和避障仿真,以驗(yàn)證本文提出的避障與軌跡跟蹤的控制性能和有效性。本文以3個(gè)機(jī)器人和1個(gè)虛擬機(jī)器人為例進(jìn)行數(shù)值計(jì)算。機(jī)器人被標(biāo)記為R1~R3, 虛擬領(lǐng)導(dǎo)者被標(biāo)記為RL。
在本文中,圖2為機(jī)器人的通信拓?fù)浣Y(jié)構(gòu),在機(jī)器人運(yùn)動(dòng)過程中可選用兩種通信拓?fù)?。?shí)驗(yàn)1仿真結(jié)果如圖3~圖7所示。在圖3中,跟隨者可以實(shí)現(xiàn)并保持所期望的直線運(yùn)動(dòng)的規(guī)則三角形,跟隨者的幾何中心可以跟蹤領(lǐng)導(dǎo)者的軌跡。并且跟隨者即實(shí)際機(jī)器人可以實(shí)現(xiàn)良好的避障效果。與文獻(xiàn)[5]相比,本文不僅實(shí)現(xiàn)了良好的避障而且可以進(jìn)行編隊(duì)控制與跟蹤。在圖4~圖5中顯示了機(jī)器人的線速度和角速度的變化,可以看到線速度和角速度受到約束。圖6~圖7中,通過使用的一致性控制方法,所有的一致性誤差都可以穩(wěn)定到原點(diǎn)。
圖2 通信拓?fù)浣Y(jié)構(gòu)圖Fig.2 Communication topology
圖3 實(shí)驗(yàn)1編隊(duì)的跟蹤與避障Fig.3 Formation tracking and obstacle avoidance in test one
圖4 實(shí)驗(yàn)1機(jī)器人Ri 的線速度Fig.4Linear velocitiesofRiintest one
圖5 實(shí)驗(yàn)1機(jī)器人Ri 的角速度Fig.5Angularvelocities of Riin test one
圖6 實(shí)驗(yàn)1 xi的誤差演化Fig.6 Evolutions of errorsofxiin test one
圖7 實(shí)驗(yàn)1yi的誤差演化Fig.7 Evolutions oferrorsofyiin test one
實(shí)驗(yàn)2仿真結(jié)果如圖8~圖12所示。在圖8中,跟隨者可以實(shí)現(xiàn)并保持所期望的正弦曲線的規(guī)則三角形運(yùn)動(dòng),跟隨者的幾何中心可以跟蹤領(lǐng)導(dǎo)者的軌跡。并且跟隨者即實(shí)際機(jī)器人可以實(shí)現(xiàn)良好的避障效果。在圖9~圖10中顯示了機(jī)器人的線速度和角速度的變化,表示線速度和角速度受到約束。圖11~圖12中,通過使用的一致性控制方法,所有的一致性誤差都可以穩(wěn)定到零或趨于零。綜合上述仿真結(jié)果表明:采用所提出的控制策略,本文系統(tǒng)能夠在充分考慮輸入約束的前提下實(shí)現(xiàn)編隊(duì)跟蹤目標(biāo)與避障處理。通過上述實(shí)例,驗(yàn)證了該控制方法系統(tǒng)的有效性。
圖8 實(shí)驗(yàn)2編隊(duì)的跟蹤與避障Fig.8 Formation tracking and obstacle avoidance in test two
圖9實(shí)驗(yàn)2機(jī)器人Ri 的線速度Fig.9Linear velocitiesofRiintest two
圖10實(shí)驗(yàn)2機(jī)器人Ri 的角速度Fig.10Angularvelocities of Riin test two
圖11 實(shí)驗(yàn)2 xi 的誤差演化Fig.11 Evolutions of errorsofxiin test two
圖12 實(shí)驗(yàn)2yi的誤差演化Fig.12 Evolutions oferrorsofyiin test two
本文研究了在虛擬領(lǐng)導(dǎo)者下的具有一階多移動(dòng)機(jī)器人系統(tǒng)在基于位移與速度下的一致性編隊(duì)跟蹤與避障控制問題。首先設(shè)計(jì)多機(jī)器人的通信拓?fù)?,再設(shè)計(jì)具有避障功能的一致性編隊(duì)控制律,然后設(shè)計(jì)移動(dòng)機(jī)器人編隊(duì)跟蹤系統(tǒng),運(yùn)用模型預(yù)測控制(MPC)方法,將編隊(duì)誤差運(yùn)動(dòng)問題按代價(jià)函數(shù)轉(zhuǎn)化為最小優(yōu)化問題。利用廣義投影神經(jīng)網(wǎng)絡(luò)優(yōu)化的方法求解最優(yōu)值。本文給出的理論分析和仿真結(jié)果驗(yàn)證了該方法的有效性。