田晉宇, 王創(chuàng)創(chuàng), 何 平
(1.四川輕化工大學自動化與信息工程學院, 四川 自貢 643000;2.暨南大學智能科學與工程學院, 廣東 珠海 519072)
過去的幾年里,多智能體系統(tǒng)的分布式協(xié)同控制因其廣泛的應用而受到關(guān)注。其中包括集群、蜂擁和編隊控制[1-5]。作為經(jīng)典的非線性系統(tǒng),非完整系統(tǒng)引起了眾多研究人員的興趣[6-8]。對于非完整系統(tǒng),目前已經(jīng)考慮了兩個關(guān)于一致性的問題。第一個為無領(lǐng)航者的一致性問題,該控制器可以使多個非完整系統(tǒng)的狀態(tài)收斂到一個常數(shù)[9-10];第二個是有領(lǐng)航者的一致性問題,該控制器可以使多個非完整系統(tǒng)的狀態(tài)與領(lǐng)航者的狀態(tài)相同[11-13]。文獻[14]討論了多個無人車的編隊控制問題。文獻[15-16]研究了非完整移動機器人系統(tǒng)的一致性問題,提出了一個線性時不變連續(xù)狀態(tài)反饋,使系統(tǒng)的狀態(tài)變量達到了一致。文獻[13]針對多個非完整約束鏈式系統(tǒng)提出了基于分布式觀測器的有限時間一致性控制算法。文獻[17]通過坐標變換將機器人的運動模型變換成鏈式結(jié)構(gòu),利用反步法設(shè)計的軌跡跟蹤控制器達到了期望的效果。文獻[18]將有限時間一致性控制方法用到了多個非完整約束移動機器人的編隊控制中,使得多個移動機器人能在有限時間內(nèi)達到預期的編隊隊形。本文主要參考了文獻[9]、文獻[10]和文獻[19]的思想,研究了(2,1)[19]非完整移動機器人編隊控制的問題,設(shè)計了一種分布式協(xié)同控制器,該控制器容許多非完整系統(tǒng)的通信拓撲為一般的無向圖,并考慮到通信時延存在的情況。在此控制器的作用下,N個非完整機器人的狀態(tài)將達到一致。
本文首先介紹非完整移動機器人的運動學模型、圖論的基本知識以及相關(guān)引理;然后提出針對模型設(shè)計的控制算法并利用Lyapunov理論和LaSalle不變原理證明了該算法的可行性;最后通過數(shù)值仿真,驗證了算法的可行性。
文獻[20]提出了非完整輪式移動機器人有(2,0)類型、(2,1)類型、(1,1)類型和(1,2)類型??紤]一組(2,1)型的非完整移動機器人,第i個機器人的非完整約束定義為:
(1)
非完整系統(tǒng)(1)可以通過坐標變換轉(zhuǎn)換為非完整鏈式系統(tǒng)[21]:
zi1=θi+βi
zi2=-xicos(θi+βi)-yisin(θi+βi)
zi3=βi
zi4=-xisin(θi+βi)+yicos(θi+βi)
ui1=ωi+φi
ui2=-vi+[xisin(θi+βi)-yicos(θi+βi)]
(ωi+φi)ui3=φi
(2)
(3)
對式(3)求導,得:
(4)
在多自主體系統(tǒng)一致性的研究中,圖論是一個重要的分析工具。如果用節(jié)點代表智能體,用節(jié)點間的有向邊來表示智能體間的信息傳遞關(guān)系,則可以用圖論中的有向圖(也稱為有向連接拓撲)來描述網(wǎng)絡(luò)結(jié)構(gòu)。本文考慮了一個具有N個非完整移動機器人的通信網(wǎng)絡(luò)。假設(shè)互連圖內(nèi)部是相互連接的,即存在一個結(jié)點使得其他所有的結(jié)點都能通過一條定向的路徑與它相連。智能體獲得互相通信的協(xié)議,在該協(xié)議下達成指定智能體間的信息交換。它的通信拓撲為加權(quán)無向圖為G=(V,ε,A),其中V={1,2...,N}為對應點集,ε∈V×V為對應邊界集。如果鄰接矩陣的元素aij為一般的非負實數(shù),則稱其為加權(quán)鄰接矩陣,相應的圖稱為加權(quán)圖。若aij>0表示智能體i和智能體j之間存在信息交換,否則aij=0。假設(shè)智能體本身不存在信息交換,即aii=0。圖G的Laplacian矩陣L=lij∈RN×N定義為[22]:
當智能體間的拓撲關(guān)系為雙向通信時,則L為對稱矩陣并且半正定[16]。
引理2[19]對于第i個變換系統(tǒng)(4),如果ui1-ω,zi2,zi4有界且漸進收斂于0,則zi3有界且漸近收斂于0。
引理3[19]如果ui1-ω,uj1-ω,zi2,zj2,zi4,zj4有界且ui1-ω,uj1-ω,zi2-zj2,zi4-zj4漸近收斂于0,則zi3,zj3有界且zi3-zj3漸近收斂于0。
每個系統(tǒng)從相鄰的系統(tǒng)獲取狀態(tài)信息,所以該控制器為分布式控制結(jié)構(gòu)。控制器由與之相鄰系統(tǒng)狀態(tài)差的項構(gòu)成,但是加權(quán)系數(shù)由自身狀態(tài)決定。所以該控制器可以視為基于通信拓撲的控制器。由上述分析,設(shè)計如下分布式控制器。
(5)
其中,ω=ρsint,ρ>0,γ>0。
將控制器式(5)帶入式(4)得閉環(huán)系統(tǒng):
(6)
定理1分布式控制器式(5)對閉環(huán)系統(tǒng)式(6)達成狀態(tài)一致。
證明由式(6)可得:
(7)
其中,Zq=[z1q,z2q,…,zNq],q=1,2,4,L為拉普拉斯矩陣,則:
Z1=e-LtZ1(0)
Z2=e-LtZ2(0)
Z4=e-LtZ4(0)
(8)
由引理1可知:
limZ1(t)=1ωTZ1(0)=:c11
lim Z2(t)=1ωTZ2(0)=:c21
lim Z4(t)=1ωTZ4(0)=:c41
(9)
可以看出
1≤i≠j≤N。
由式(6)與式(9)可知,ul1-ω,l=1,…,N有界且漸進收斂于0。由引理3可知zl3有界,zi3-zj3,1≤i≠j≤N漸進收斂于0,即lim(zl3(t)-c3(t))=0,其中c3(t)為未知有界函數(shù)。
每個系統(tǒng)從相鄰的系統(tǒng)獲取狀態(tài)信息,所以該控制器為分布式控制結(jié)構(gòu)??刂破饔膳c之相鄰系統(tǒng)狀態(tài)差的項構(gòu)成,但是加權(quán)系數(shù)由自身狀態(tài)決定。所以該控制器可以視為基于通信拓撲的控制器。由上述分析,設(shè)計如下分布式控制器:
(10)
其中,ω=ρsint,ρ>0,γ>0。
將控制器式(5)帶入式(10)得閉環(huán)系統(tǒng):
(11)
定理2分布式控制器式(10)對閉環(huán)系統(tǒng)式(11)達成狀態(tài)一致。
證明選取如下函數(shù)作為Lyapunov備選函數(shù)
(12)
對式(12)求導得:
由LaSalle不變原理可知,zl1,zl2,zl4將收斂到常數(shù)。
用兩個例子來說明所提出的設(shè)計方案并驗證所證明的理論結(jié)果。
考慮共有4個式(1)非完整移動機器人,機器人之間的通信拓撲關(guān)系如圖1所示。
圖1 通信拓撲圖
每個機器人的初始狀態(tài)值為:
對于每個機器人,可以通過變換式(2)化為鏈式模型。再計算出鏈式模型下的初始值:
(z11,z12,z13,z14)=(-0.84,1.72,1.05,5.57)
(z21,z22,z23,z24)=(1.42,-0.84,0.52,1.14)
(z31,z32,z33,z34)=(0.70,4.87,-1.05,-1.13)
(z41,z42,z43,z44)=(-1.57,-2.00,-0.52,2.00)
由1.2節(jié)的分析可知,該系統(tǒng)的拉普拉斯矩陣為:
設(shè)置控制器式(5)的參數(shù)ρ=1,γ=1,狀態(tài)軌跡如圖2~圖5所示。
圖2 zi1軌跡
圖3 zi2軌跡
圖4 zi3軌跡
圖5 zi4軌跡
圖2~圖5中,藍色實線表示第一個機器人的狀態(tài),橙色虛線表示第二個機器人的狀態(tài),黃色虛點線表示第三個機器人的狀態(tài),紫色點線表示第四個機器人的狀態(tài)。圖2描述的是所有機器人的第一個狀態(tài)軌跡圖。圖3描述的是所有機器人的第二個狀態(tài)軌跡圖。圖4描述的是所有機器人的第三個狀態(tài)軌跡圖。圖5描述的是所有機器人的第四個狀態(tài)軌跡圖。由圖2可知,z11,z21,z31,z41在3 s內(nèi)達到了狀態(tài)一致。由圖3可知z12,z22,z32,z42在3 s內(nèi)達到了狀態(tài)一致。由圖4可知,z13,z23,z33,z43在8 s左右達到了狀態(tài)一致。由圖5可知,z14,z24,z34,z44在3 s內(nèi)達到了狀態(tài)一致。根據(jù)上述分析可知,該仿真結(jié)果驗證了控制算法的有效性。該仿真圖也驗證了:如果zi1,zi2,zi4收斂到非零常數(shù),則zi3為有界函數(shù)。
設(shè)置控制器式(10)的參數(shù)ρ=1,γ=1。為了便于仿真,假設(shè)所有的通信時延對每一個系統(tǒng)都是常數(shù),即τ1=τ2=τ3=τ4=τ=2.5 s,狀態(tài)軌跡如圖6~圖9所示。
圖6 zi1軌跡
圖7 zi2軌跡
圖8 zi3軌跡
圖9 zi4軌跡
圖6~圖9中,藍色實線表示第一個機器人的狀態(tài),橙色虛線表示第二個機器人的狀態(tài),黃色虛點線表示第三個機器人的狀態(tài),紫色點線表示第四個機器人的狀態(tài)。圖6描述的是所有機器人的第一個狀態(tài)軌跡圖。圖7描述的是所有機器人的第二個狀態(tài)軌跡圖。圖8描述的是所有機器人的第三個狀態(tài)軌跡圖。圖9描述的是所有機器人的第四個狀態(tài)軌跡圖。控制算法要使所有機器人的相同狀態(tài)趨于一致。由圖6可知,z11,z21,z31,z41在15 s左右達到了狀態(tài)一致。由圖7,可知z12,z22,z32,z42在20 s左右達到了狀態(tài)一致。由圖8可知,z13,z23,z33,z43在20 s左右達到了狀態(tài)一致。由圖9可知,z14,z24,z34,z44在20 s左右達到了狀態(tài)一致。相比沒有通信時延的情況,有通信時延達到狀態(tài)一致需要更長的時間。由上述分析可知,該仿真結(jié)果驗證了控制算法的有效性。
本文針對多個非完整鏈式系統(tǒng)無領(lǐng)航者的一致性問題,設(shè)計了一種分布式控制器。該控制器允許通信拓撲為一般的無向圖,并考慮到通信時延的存在,運用Lyapunov定理和LaSalle不變原理證明了自適應控制算法的穩(wěn)定性,并用數(shù)值仿真驗證了算法的有效性??刂破髦泄灿袃蓚€自由參數(shù),可以在處理復雜情況時進行調(diào)整,因此該控制器具有較大的實用價值。本文假設(shè)智能體之間的通信時延均為恒定值,然而實際系統(tǒng)中時延可能是時變的,在下一步的研究中,筆者會進一步考慮時變時延對于系統(tǒng)收斂性的影響。