□ 趙 楠 □ 戴 威 □ 董文濤
1.海軍裝備部 北京 100071
2.中國艦船設計研究中心 武漢 430064
3.華中科技大學 機械科學與工程學院 武漢 430074
群集行為研究吸引了來自計算機科學、自動控制、統(tǒng)計物理等不同學科的研究學者,文獻[1,2]對系統(tǒng)狀態(tài)的一致性、一致性跟蹤、集結問題、群集控制等作了相應的研究。
研究群體機器人集結問題是一致性方法理論的重要應用,當前主要是基于圖論一致性的研究,通過無向圖來描述群體機器人之間的通信拓撲關系。R Olfati Saber[3]首次提出了使用有向圖來描述群體機器人之間的拓撲關系,并指出群體機器人形成一致的充分條件是有向圖是強連通的,同時還進行了在機器人之間的通信存在時間延遲情況下的一致性研究。W Ren[4]同樣使用有向圖來描述群體機器人系統(tǒng)之間的通信關系,并給出了群體機器人形成一致的充分必要條件是有向圖中包含有一條有向生成樹。W Ren[5]針對群體機器人系統(tǒng)中不同的拓撲結構,分別給出了一階動力系統(tǒng)與二階動力系統(tǒng)下的一致性跟蹤問題的解決方法,同樣針對各種不同的情形進行了詳細的分析,并給出了相應的一致性跟蹤方法。雷斌[6]通過對代數(shù)圖論的理解,相對于Laplace圖提出了一信息交互圖,在此基礎上研究群體機器人的一致性方法控制。
針對多機器人群集控制應用研究中的群集行為的可控研究:H Tanner[7]沒有考慮目標導向 agent,給出形成群集的控制方法;R Olfati Saber[8]提出虛擬領導者的方法并且所有個體都可以接收到虛擬領導者的信息;蘇厚勝[9]研究含有虛擬領導者具有連通性能的群集系統(tǒng)的蜂擁控制;R Olfati Saber[10]針對多移動機器人群集運動的實現(xiàn)及其避障問題,提出了一類融合跟蹤模式的有序化群集運動控制算法;程代展[11]也將群集控制方式運用于多機器人協(xié)調(diào)控制取得了很好的效果;Han J[12]等提出了軟控制方法,在不改變個體規(guī)則和行為的前提下,通過在群集中外加智能體來干預群集,使群集向預期方向運動;潘福臣[13]研究了一類群集模型的軟控制,通過在群中加入一個或多個可控智能體(CIA)來干擾群集行為,從而實現(xiàn)了在不改變?nèi)旱木植窟\動規(guī)則的前提下控制群體的運動參數(shù),加快了群集的收斂速度,并實現(xiàn)了群體的分化。
網(wǎng)絡連通性是群體機器人的一個重要性質(zhì),分布式連通控制算法是解決網(wǎng)絡連通性群體行為的重要手段,當前主要是通過構建勢函數(shù)來實現(xiàn)網(wǎng)絡連通性的群體行為控制。M M Zavlanos[14]等通過構造合適的勢場函數(shù)對二階系統(tǒng)的群集連通控制進行了研究。
本文在對機器人運動控制模型、群體機器人集結問題進行闡述的基礎上,構建了機器人的受力模型和機器人之間相互作用的勢場函數(shù),根據(jù)機器人的受力情況,針對系統(tǒng)沒有虛擬領導者的情形和考慮虛擬領導者的情形,分別提出相應的分布式連通控制算法,并通過理論分析和數(shù)值仿真,證明了所提出的控制算法的有效性。
考慮在n維空間中N個機器人組成的群體機器人系統(tǒng)G,在沒有機器人相對速度信息的約束下,根據(jù)機器人之間的相對位置信息研究群體機器人集結。每個機器人滿足相同的動態(tài)性能和通信半徑R,運用二階微分方程描述群體機器人個體的動態(tài)行為如式(1)所示:
式中:i=1,2,...,N;q 表示機器人在 n 空間的位置信息;p表示機器人在n空間的速度信息;u表示機器人的控制輸入。
運用無向圖 G(t)=[V,E(t)]來表示機器人之間的通信拓撲關系,其中 V=[1,2,...,N]表示機器人為頂點的集合,E(t)={(i,j)∈V×V}表示機器人之間的連邊關系,ε∈(0,R)為一常數(shù)。
群集系統(tǒng)G的加邊規(guī)則存在延遲效應,具體規(guī)則如下:
下面用函數(shù) δ(i,j)∈{0,1} 來表示機器人 i和機器人j在時刻t是否存在一條連邊,定義如下:
機器人 i在 t時刻的鄰居集 Ni(t)的定義為:Ni(t)={δ(i,j)[t]=1|j=1,2,...,N}。
圖1表示原來兩個機器人之間不存在連邊,當其在某時刻小于通信距離R時,則這兩個機器人之間會增加一條連邊,存在一個加邊延遲效應,這樣可以保證新加邊對系統(tǒng)勢場函數(shù)的影響可以控制在一個有限值范圍之內(nèi)。
假設1:群體機器人個體速度為一有限值,機器人的速度pi滿足-pmax≤pi≤pmax,其中pmax表示機器人個體速度的最大值。
本文的控制目標是在初始網(wǎng)絡保持連通的情況下,通過相對位置信息構造機器人之間的鄰居關系和相對速度狀態(tài)信息確定機器人的相互作用的慣性系數(shù),提出有效的分布式算法,實現(xiàn)以相同的速度到達期望的目標位置,完成機器人系統(tǒng)的集結。結合實際應用,研究群體機器人之間相互作用慣性系數(shù)的自適應控制,通過構建合適的控制方法實現(xiàn),對所有的機器人i、 j∈V,當 t→∞ 時,‖pi(t)-pj(t)‖→0 和‖qi(t)-qj(t)‖→0。
勢場函數(shù)是根據(jù)機器人之間的相對位置狀態(tài)信息,通過構造機器人之間的相互作用力來描述機器人群的分布。在群體機器人集結問題中,勢場函數(shù)需要滿足下面兩個性質(zhì):
通過勢場函數(shù)的性質(zhì)(1),可以知道勢場函數(shù)是一增函數(shù),這一性質(zhì)將會對相鄰機器人產(chǎn)生吸引作用;通過勢場函數(shù)的性質(zhì)(2),可知當機器人之間的距離趨于0時,勢場函數(shù)的梯度值與機器人之間的距離值存在一種聯(lián)系,當距離趨于0時,勢場函數(shù)的梯度值也會趨于0,這樣可以保證機器人位置狀態(tài)的集結。
根據(jù)上述兩性質(zhì)的分析,本文構造的勢場函數(shù)如式(3)所示:
根據(jù)勢場函數(shù)的定義注意到,當機器人之間的距離值趨于R時,機器人之間的勢場作用會趨于無窮大,表示相鄰的機器人距離值不會趨于無窮大,這一性質(zhì)對機器人的連通性質(zhì)有很大的作用。勢場函數(shù)ψ(‖qij‖)的曲線圖如圖2所示。
考慮到機器人之間的相對位置與相對速度信息,分析機器人的受力情況,為提出機器人的運動控制方法提供有效的思路??紤]虛擬領導者影響的機器人i的受力情況圖如圖3所示。
根據(jù)上面基于相對位置信息提出的勢場函數(shù)得到機器人之間的相互影響,得到機器人i受到其鄰居機器人的勢場作用力。機器人i所受機器人j的作用力fi,機器人之間的勢場的負梯度, fi=-▽qiψ(‖qij‖),則機器人i受到其鄰居機器人集合Ni內(nèi)總
▲圖1 系統(tǒng)加邊延遲規(guī)則
▲圖2 勢場函數(shù)ψ(||qij||)的曲線圖
▲圖3 機器人i的受力情況圖
考慮到機器人之間的相對速度信息,可以得到機器人i的慣性作用力Gi與機器人的相對速度信息有關,通過建立合適的權重系數(shù)aij,得到
如果系統(tǒng)中存在虛擬領導者并且機器人i能夠接收到虛擬領導者的狀態(tài)信息,則考慮虛擬領導者對機器人 i的受力影響,得到 fir=-c1(pi-pr),其中 c1>0 為常數(shù),表示虛擬領導者的影響系數(shù)。
通過對機器人i的受力分析得到,機器人主要受鄰居機器人的相對位置與相對速度狀態(tài)信息和虛擬領導者的狀態(tài)信息影響,通過機器人的受力情況可以確定機器人的動態(tài)性能,機器人的運動情況也主要受到這3個部分的影響。
針對群體行為控制中,機器人的鄰居關系由機器人之間的相對位置狀態(tài)信息來控制,而機器人之間相互作用的參數(shù)可以根據(jù)機器人之間的相對速度信息來控制,通過機器人之間的相對速度信息建立與機器人相互作用的權重系數(shù)之間的關系,以此來研究群體機器人的動態(tài)行為。
在上述研究群體機器人集結行為控制的基礎上,研究群體機器人之間的作用權重系數(shù)的參數(shù)自適應研究,研究系統(tǒng)的權重系數(shù)與機器人相對速度狀態(tài)信息之間的關系,構造權重系數(shù)的動態(tài)自適應方程,以此來研究群體機器人集結行為。
根據(jù)權重系數(shù)與機器人相對速度狀態(tài)信息之間的關系,結合上面提出的勢場函數(shù),提出的分布式控制算法如下:
式中:i,j=1,2,...,N;m 表示機器人的質(zhì)量;aij表示機器人i和j之間的作用權值;kij>0為一常數(shù),通過機器人的相對速度信息表示機器人的慣性系數(shù)動態(tài)變化,實現(xiàn)參數(shù)aij的自適應更新。
考慮N個機器人的系統(tǒng),運動方程由式(1)、每個機器人的控制輸入由式(4)決定,假設機器人組成的網(wǎng)絡初始狀態(tài)是連通的,并且系統(tǒng)初始的能量W0為一有限值,則可以得到下列結論。
(1)對任意時間 t≥0,機器人組成的網(wǎng)絡 G(t)始終是連通的;
(2)所有機器人最終會聚集到一起并且速度會形成一致。
證明:構造能量函數(shù)—Lyapunov函數(shù):
假設群集系統(tǒng) G 在時刻 tk(k=1,2,...)發(fā)生切換,則系統(tǒng)G在時間段[tk-1,tk]的拓撲結構保持不變,則在時間段[t0,t1],系統(tǒng)能量函數(shù)式(5)對時間 t求導得:
根據(jù)假設1可知,機器人的相對速度信息對權重系數(shù) aij(t)>0,并且由于pmax有界,則aij(t)為一有界的正值。則由元素aij(t)構成的矩陣 L(t)為一 Laplace 矩陣,滿足當 i≠j關注 Laplace 矩陣 L(t)的性質(zhì),矩陣L(t)有一0特征值,其對應的特征向量為1N,并且其它特征值都位于復平面的左半平面內(nèi)。
由于系統(tǒng)G在時間段[t0,t1]是保持連通的,初始狀態(tài)下系統(tǒng)機器人之間也是連通的,則系統(tǒng)對應的Laplacian 矩陣 L(t)為半正定,在時間段[t0,t1],可以得到 W
根據(jù)人工勢場函數(shù)的定義可知,ψ(R)→∞,由于W0為一有限值,則在時刻t1系統(tǒng)沒有連邊斷開。
(1)假設在時刻t1時,系統(tǒng)有m1條新邊加入,由于存在加邊延遲效應,新加入邊對系統(tǒng)能量影響為一有限值 ψ(R-ε),則系統(tǒng)能量 W1=W0+m1ψ(R-ε)同樣為一有限值。
運用相似的方法,可以得到系統(tǒng)能量W在時間段[tk-1,tk],對時間 t求導可以得到
在時間段[tk-1,tk],系統(tǒng)所有的連邊都不會趨于R,所有的連邊都不會在時刻tk斷開,由于存在加邊延遲效應,Wk的能量同樣為一有限值。則可以得到所有的連邊都不會趨于R,也就不會斷開。
因此,由于系統(tǒng)初始保持連通,并且所有的連邊都不會斷開,則系統(tǒng)始終保持連通。
(2) 假設 tk時刻系統(tǒng)有 mk條新邊加入,Wk≤[W1+(m1+m2+…+mk)ψ(R-ε)]≤[W0+Mψ(R-ε)],其中M=[N(N-1)]/2-(N-1)表示系統(tǒng)最多可以有 M 邊加入。 定義 Wmax=W0+Mψ(R-ε),則對任意時刻 t≥0,W≤Wmax,構造最大緊集 Ω={q∈Dg,p∈γNn|W(q,p)≤Wmax};
根據(jù)LaSalle不變性原理,可以得到始于最大緊集Ω內(nèi)的解,最終都會趨于最大的不變集也就是也就可以得到p1=p2=…=pN,所有的機器人最終速度收斂到一致。
在機器人的速度狀態(tài)信息趨于穩(wěn)定狀態(tài),此時多個機器人之間的速度已經(jīng)形成了一致,只需考慮機器人的任務狀態(tài)信息對機器人運動的影響,穩(wěn)定狀態(tài)下,控制算法可以寫成
根據(jù)權重系數(shù)與機器人相對速度狀態(tài)信息之間的關系,結合上面提出的勢場函數(shù),考慮虛擬領導者的影響,提出的分布式控制算法如下:
式中:pr表示虛擬領導者的位置狀態(tài)信息;參數(shù)c1同樣也可以研究其自適應變化以及群體行為的動態(tài)演化。
通過機器人的相對速度信息表示機器人的慣性系數(shù)動態(tài)變化,實現(xiàn)參數(shù)aij的自適應更新。針對這一算法重點研究系統(tǒng)的權值系數(shù)aij與機器人之間相對速度信息之間的關系,以此來研究群體行為的動態(tài)演化。
考慮N個機器人的系統(tǒng),運動方程由式(1),每個機器人的控制輸入由式(6)決定,假設機器人組成的網(wǎng)絡初始狀態(tài)是連通的,并且系統(tǒng)初始的能量W0為一有限值,則可以得到下列結論。
(1) 對任意時間 t≥0,機器人組成的網(wǎng)絡 G(t)始終是連通的;
(2)所有機器人最終會聚集到一起并且速度會形成一致。
證明:構造能量函數(shù)—Lyapunov函數(shù):
假設群集系統(tǒng) G 在時刻 tk(k=1,2,...)發(fā)生切換,則系統(tǒng)G在時間段[tk-1,tk]的拓撲結構保持不變,則在時間段[t0,t1),系統(tǒng)能量函數(shù)式(7)對時間 t求導得:
運用相似的方法也可以得到,群體機器人的速度會收斂到一致并且機器人也會聚集到一起。
根據(jù)權重系數(shù)與機器人相對速度狀態(tài)信息之間的關系,結合上面提出的勢場函數(shù),考慮虛擬領導者的影響,提出的分布式控制算法如下:
式中:hi=1表示機器人i可以接收到虛擬領導者的狀態(tài)信息,hi=0表示虛擬領導者不能接收到虛擬領導者的狀態(tài)信息。通過機器人的相對速度信息表示機器人的慣性系數(shù)動態(tài)變化,實現(xiàn)參數(shù)aij的自適應更新。
▲圖4 沒有考慮虛擬領導者狀態(tài)信息情形的群體機器人集結控制結果圖
考慮N個機器人的系統(tǒng),運動方程由式(1),每個機器人的控制輸入由式(8)決定,假設機器人組成的網(wǎng)絡初始狀態(tài)是連通的,并且系統(tǒng)初始的能量W0為一有限值,則可以得到下列結論:
(1) 對任意時間 t≥0,機器人組成的網(wǎng)絡 G(t)始終是連通的;
(2)所有機器人最終會聚集到一起并且速度會形成一致。
證明:構造能量函數(shù)—Lyapunov函數(shù),系統(tǒng)的穩(wěn)定性原理,給定:
假設群集系統(tǒng) G 在時刻 tk(k=1,2,...)發(fā)生切換,則系統(tǒng)G在時間段[tk-1,tk]的拓撲結構保持不變,則在時間段[t0,t1],系統(tǒng)能量函數(shù)式 (9)對時間求導得:
運用相似的方法可以得到,群體機器人的速度會收斂到一致并且機器人也會聚集到一起。
由10個機器人組成的群體隨機分布在 [0,10]×[0,10](m2)的平面上,機器人的初始速度是隨機產(chǎn)生在[0,2](m/s)上,機器人的通信半徑為 4 m,初始狀態(tài)機器人是滿足連通性條件的,通過仿真實驗來驗證上面提出的多機器人分布式控制方法。
在沒有考慮虛擬領導者的情形下,針對分布式控制方法式(4),仿真實驗結果如圖4所示:其中(a)表示機器人初始位置狀態(tài)圖,(b)表示機器人的運動軌跡,(c)表示X軸方向上機器人群的速度狀態(tài)信息,(d)表示Y軸方向上機器人群的速度狀態(tài)信息,(e)表示X軸方向上機器人群的位置狀態(tài)信息,(f)表示Y軸方向上機器人群的位置狀態(tài)信息。
在所有機器人都可以接收到虛擬領導者狀態(tài)信息的情形下,針對分布式控制方法式(6),仿真實驗結果如圖5所示:其中(a)表示機器人初始位置狀態(tài)圖,(b)表示機器人的運動軌跡,(c)表示X軸方向上機器人群的速度狀態(tài)信息,(d)表示Y軸方向上機器人群的速度狀態(tài)信息,(e)表示X軸方向上機器人群的位置狀態(tài)信息,(f)表示Y軸方向上機器人群的位置狀態(tài)信息。
在部分機器人可以接收到虛擬領導者狀態(tài)控制信息的情形下,針對分布式控制方法式(8),仿真實驗結果如圖6所示:其中(a)表示機器人初始位置狀態(tài)圖,(b)表示機器人的運動軌跡,(c)表示X軸方向上機器人群的速度狀態(tài)信息,(d)表示Y軸方向上機器人群的速度狀態(tài)信息,(e)表示X軸方向上機器人群的位置狀態(tài)信息,(f)表示Y軸方向上機器人群的位置狀態(tài)信息。
▲圖5 考慮虛擬領導者狀態(tài)信息情形的群體機器人集結控制結果圖
▲圖6 部分考慮虛擬領導者狀態(tài)信息情形的群體機器人集結控制結果圖
本文針對群體機器人集結問題,提出了群體機器人參數(shù)自適應控制網(wǎng)絡連通性保持的分布式控制算法,所提出的控制算法以機器人網(wǎng)絡的連通性作為控制目標,在此基礎上研究群體機器人的集結行為。研究控制模型中的權值慣性系數(shù)的動態(tài)自適應變化對群體動態(tài)行為的影響,通過機器人之間的相對速度信息構建慣性動態(tài)變化的動態(tài)模型。根據(jù)機器人之間的相對速度信息和相對位置信息,考慮沒有虛擬領導者與帶有虛擬領導者的情形,分別提出網(wǎng)絡連通性保持參數(shù)自適應的分布式控制算法。理論分析證明了所提出的分布式控制算法能夠解決群體機器人的集結問題,數(shù)值仿真實驗也驗證了所提出的控制算法的有效性。
考慮群體行為參數(shù)的自適應變化在實際中可以找到很多應用場景,可以有效地將相對速度信息更好地反映到群體行為控制模型及算法中。群體機器人集結控制問題將在群體搜救、一致性搜索中得到廣泛應用,將為群體機器人的具體應用提供一個良好的平臺,群體機器人集結問題在機器人目標搜索,動態(tài)目標跟蹤等領域中具有很好的應用場景,同時本文提出的群體機器人集結控制算法對分析群體行為和設計群體行為有很好的作用。
[1] Jadbabaie A,Lin J, Morse A S.Coordination of Groups of Mobile Autonomous Agents Using Nearest Neighbor Rules[J].IEEE Transactions on Automatic Control,2003,48(6):988-1001.
[2] Ren W,Beard R.Consensus of Information under Dynamically Changing Interaction Topologies [C].Proceedings of the 2004 American Control Conference,Boston,2005.
[3] R Olfati Saber,Murray R M.Consensus Problems in Networks of Agents with s Witching Topology and Time-Delays[J].IEEE Transactions on Automatic Control,2004,49(9):1520-1533.
[4] W Ren.On Consensus Algorithms for Double-integrator Dynamics [J].IEEE Transactions on Automatic Control,2008,53(6):1505-1509.
[5] W Ren.Multi-vehicle Consensus with a Time-varying Reference State [J].Systems and Control Letters,2007,56(7-8):474-485.
[6] 雷斌.群體機器人系統(tǒng)合作控制問題研究[D].武漢:武漢理工大學,2009.
[7] H Tanner,Jadbabaie A, Pappas G.Flocking in Fixed and Switching Networks [J].IEEE Transactions on Automatic Control, 2007,52(5):863-868.
[8] R Olfati Saber.Flocking for Multi-Agent Dynamic Systems:Algorithms and Theory [J].IEEE Transactions on Automatic Control,2006,51(3):401-420.
[9] 蘇厚勝.多智能體蜂擁控制問題研究[D].上海:上海交通大學,2008.
[10] R Olfati Saber.Flocking with Obstacle Avoidance [R].California:California Institute of Technology,2003.
[11]程代展,陳翰馥.從群集到社會行為控制 [J].科技導報,2004(8):4-7.
[12] Han J,Li Ming,Guo Lei.Soft Control on Collective Behavior of a Group of Autonomous Agents By a Shill Agent[J].Journal of Systems Science and Complexity, 2006,19(1):54-62.
[13]潘福臣,陳雪波,李琳.群集模型的軟控制研究[J].科學技術與工程,2009(17):4905-4909.
[14] M M Zavlanos,Jadbabaie A, George J Pappas.Flocking while Preserving Network Connectivity [C].Proceedings of the 46th IEEE Conference on Decision and Control,New Orleans,2007.