郭海峰,魯寧波
(沈陽理工大學(xué) 自動(dòng)化與電氣工程學(xué)院,沈陽 110159)
由于移動(dòng)機(jī)器人在深空探測、安全與搜救、采礦、農(nóng)業(yè)、林業(yè)、物流以及軍事等領(lǐng)域有著廣闊的應(yīng)用前景,近年來已經(jīng)發(fā)展成為研究的熱點(diǎn)[1-7]。在移動(dòng)機(jī)器人軌跡跟蹤的理論研究中,一般假設(shè)輪子與地面間只發(fā)生純滾動(dòng)無側(cè)向和縱向滑動(dòng)運(yùn)動(dòng),這種理想假設(shè)使輪式移動(dòng)機(jī)器人成為一種典型的多輸入多輸出的非完整約束動(dòng)力學(xué)系統(tǒng)。另外在工程實(shí)踐中,移動(dòng)機(jī)器人軌跡跟蹤控制問題存在大量的不確定性,如由于負(fù)載變化導(dǎo)致機(jī)器人平臺(tái)的質(zhì)量及慣性參數(shù)的不確定、因磨損等導(dǎo)致機(jī)器人結(jié)構(gòu)參數(shù)的不確定以及外部干擾的不確定性等,這使得非完整機(jī)器人系統(tǒng)是一類高度非線性、強(qiáng)耦合、欠驅(qū)動(dòng)、時(shí)變的動(dòng)力學(xué)不確定系統(tǒng),難以找到一種通用的、效果較好的控制方法實(shí)現(xiàn)其運(yùn)動(dòng)軌跡跟蹤控制。目前的研究主要有自適應(yīng)控制、滑模變結(jié)構(gòu)控制、模糊控制、神經(jīng)網(wǎng)絡(luò)等智能控制方法[1-7],雖然在特定情況下取得較好的控制效果,但各種方法都有其局限性,如自適應(yīng)控制具有固定的結(jié)構(gòu)和可變的參數(shù),對(duì)結(jié)構(gòu)不確定性有較好的適應(yīng)能力,但卻無法解決非結(jié)構(gòu)不確定性問題[1]。處理這種具有外部干擾條件和內(nèi)部參數(shù)攝動(dòng)的復(fù)雜不確定非線性的非完整機(jī)器人系統(tǒng),魯棒H∞控制理論具有一定的優(yōu)勢。而非線性系統(tǒng)的控制問題很多時(shí)候可以轉(zhuǎn)化為變增益控制問題,這種方法在航空航天領(lǐng)域已經(jīng)得到應(yīng)用[8-9]。此方法首先設(shè)計(jì)局部控制器,然后在已有局部控制器的基礎(chǔ)上綜合得到全局控制器。近年來,由于魯棒控制的不斷發(fā)展,變增益控制也得到一定的發(fā)展,其中線性變參數(shù)(Linear parameter varying,LPV)方法已經(jīng)得到實(shí)際應(yīng)用[9]。
本文針對(duì)非完整機(jī)器人非線性動(dòng)力學(xué)模型,在外部擾動(dòng)和內(nèi)部參數(shù)攝動(dòng)情況下進(jìn)行魯棒H∞控制設(shè)計(jì),使得機(jī)器人軌跡跟隨理想軌跡。本文的主要工作:1)根據(jù)Euler- Lagrange方程建立非完整移動(dòng)機(jī)器人的動(dòng)力學(xué)模型;2) 確定非完整機(jī)器人的運(yùn)動(dòng)范圍,利用變增益LPV凸分解技術(shù),將這一動(dòng)態(tài)模型轉(zhuǎn)化為具有凸多面體結(jié)構(gòu)的LPV模型;3) 根據(jù)魯棒控制理論和線性矩陣不等式理論,在凸多面體的各個(gè)頂點(diǎn)設(shè)計(jì)變增益控制器,然后利用各個(gè)頂點(diǎn)控制器綜合得到全局變增益控制器; 4) 最后給出一個(gè)仿真算例。結(jié)果表明,對(duì)于非完整機(jī)器人軌跡跟蹤問題,這種算法得到的控制器具有較好的跟蹤性能。
圖1為非完整機(jī)器人結(jié)構(gòu)。
圖1 非完整移動(dòng)機(jī)器人的結(jié)構(gòu)
圖1所示非完整移動(dòng)機(jī)器人包含一個(gè)前面的隨動(dòng)輪和后面兩個(gè)安裝在同一個(gè)軸上的差速驅(qū)動(dòng)輪,分別由兩個(gè)直流電機(jī)驅(qū)動(dòng)。使得移動(dòng)平臺(tái)直行或轉(zhuǎn)彎。機(jī)器人關(guān)注點(diǎn)的廣義位置坐標(biāo)q=[x,y,θ]T,兩個(gè)輪子有相同的半徑r,兩個(gè)驅(qū)動(dòng)輪的距離為2L;F為移動(dòng)平臺(tái)的關(guān)注點(diǎn),其坐標(biāo)為(xF,yF),G為兩輪軸線的重點(diǎn),G點(diǎn)的坐標(biāo)為(xG,yG);左右輪的力矩分別為τl、τr, G點(diǎn)與F點(diǎn)的之間的距離為d。
根據(jù)圖1,可知F、G兩點(diǎn)的位置存在如下關(guān)系
(1)
根據(jù)(1)可以得到兩點(diǎn)的速度關(guān)系
(2)
假設(shè)移動(dòng)平臺(tái)在低速狀態(tài)下運(yùn)行,且驅(qū)動(dòng)輪與地面之間僅有滾動(dòng)無滑動(dòng)。那么F點(diǎn)的速度滿足以下約束方程
(3)
寫成矩陣形式
(4)
式中,AT(q)=[sinθ-cosθd],
根據(jù)文獻(xiàn)[2],推導(dǎo)出移動(dòng)平臺(tái)關(guān)注點(diǎn)速度以及平臺(tái)轉(zhuǎn)動(dòng)角度與左右輪速度之間的運(yùn)動(dòng)方程。
(5)
式中vl、vr分別為左輪和右輪的速度。
通過(5)式,可得到關(guān)注點(diǎn)F的速度與左右輪速度的關(guān)系及其雅克比矩陣。
(6)
將(6)式寫成如下形式
(7)
J是左右輪轉(zhuǎn)速到移動(dòng)平臺(tái)關(guān)注點(diǎn)速度的雅克比矩陣,反映了輪子轉(zhuǎn)速與關(guān)注點(diǎn)速度之間的關(guān)系。
直接應(yīng)用拉格朗日方程不能得到關(guān)于非完整約束的機(jī)器人動(dòng)力學(xué)方程。通常,非完整移動(dòng)機(jī)器人有n個(gè)廣義坐標(biāo),且服從m維約束,通過修正后的拉格朗日方程可以得到機(jī)器人的動(dòng)力學(xué)模型[3]
(8)
式中:M(q)∈Rn×n是正定的對(duì)稱慣量矩陣,
B(q)∈Rn×r是輸入轉(zhuǎn)換矩陣,
τ∈Rr×1是輸入向量;A(q)∈Rn×m是與約束相關(guān)的矩陣;λ∈Rm×1是約束力項(xiàng)。
(9)
矩陣S(q)包含了AT(q)零空間的基向量,基向量的選擇很重要,這里令速度矢量有實(shí)際意義,分別取左輪和右輪的速度,所以S(q)選取如下
(10)
對(duì)式(9)兩邊取微分得
(11)
將式(11)帶入到式(8),兩邊同時(shí)左乘ST(q)得到下式
(12)
式中:
所以式(12)簡化為下式
(13)
式(6)帶入到式(13),可得到關(guān)注點(diǎn)F的加速度與力矩之間的關(guān)系
(14)
式(14)中M2、V2依賴于參數(shù)θ。所以處理后的系統(tǒng)是一個(gè)參數(shù)依賴系統(tǒng),這為后面的控制器設(shè)計(jì)提供了極大方便。
本文控制目標(biāo)是移動(dòng)平臺(tái)的關(guān)注點(diǎn)的軌跡能夠跟蹤參考軌跡,對(duì)系統(tǒng)(14)設(shè)計(jì)如下控制器
(15)
式(15)帶入到式(14),有
(16)
狀態(tài)方程為
(17)
考慮文獻(xiàn)[9]的方法,由于矩陣A、B都依賴于參數(shù)θ,其范圍是:0≤θ≤2π,所以取0和2π作為頂點(diǎn),利用LPV方法對(duì)式(17)進(jìn)行處理得到
(18)
首先給出LMI區(qū)域的定義。
定義1[10]對(duì)復(fù)平面區(qū)域D,如果存在矩陣LT=L∈Rm×m和矩陣M∈Rm×m滿足以下條件
D={s∈C∶fD(z)<0}
則稱D是一個(gè)以fD(z)為特征函數(shù)的線性矩陣不等式區(qū)域(LMI區(qū)域)。其中,fD(z)是埃爾米特矩陣。實(shí)際上LMI區(qū)域就是一個(gè)線性矩陣不等式的可行解區(qū)域。
下面對(duì)于任意的LMI區(qū)域D,將移動(dòng)機(jī)器人的LPV模型在頂點(diǎn)處設(shè)計(jì)滿足極點(diǎn)配置的控制器。對(duì)于式(18)分別在θ=0和θ=2π設(shè)計(jì)滿足極點(diǎn)配置和H∞性能要求的狀態(tài)反饋增益矩陣K1、K2,則對(duì)于任意的θ,可利用以下方法得到相應(yīng)的控制器:
K=ρ1(θ)K1+ρ2(θ)K2
(19)
在每個(gè)頂點(diǎn)的位置,LPV模型退化為LTI模型
(20)
式中:w為機(jī)器人的外部擾動(dòng),這里令其為參考軌跡;z為誤差輸出,要求機(jī)器人能夠準(zhǔn)確跟蹤參考軌跡,既要求在w輸入下,z具有H∞性能。
對(duì)于系統(tǒng)(20),設(shè)計(jì)一個(gè)狀態(tài)反饋控制器
u=Kx
(21)
將式(9)帶入到式(8)中,得到閉環(huán)控制系統(tǒng)
(22)
則系統(tǒng)(10)的閉環(huán)傳遞函數(shù)為
Twz=(sI-A-B2K)-1B1
(23)
本文的目的是設(shè)計(jì)狀態(tài)反饋控制器(21)滿足以下兩個(gè)條件:
1) 閉環(huán)極點(diǎn)配置到一定的LMI區(qū)域;
2) 保證閉環(huán)系統(tǒng)H∞性能‖Twz‖∞<γ,γ為給定常數(shù)。
為取得滿意的性能,這里將閉環(huán)極點(diǎn)配置要求α=2(在復(fù)平面-2的左邊),這樣可以保證衰減速率。XD是正定矩陣,根據(jù)特征函數(shù)可以得到描述該區(qū)域的線性矩陣不等式
(A+B2K)XD+XD(A+B2K)T+2αXD<0
(24)
有界實(shí)引理[10]:假設(shè)γ>0,設(shè)計(jì)的控制器(21)要求滿足以下性質(zhì):
1)閉環(huán)系統(tǒng)內(nèi)穩(wěn)定并且
‖TwZ‖∞=‖(SI-A-B2K)-1B1‖∞<γ。
(25)
成立。
定理:對(duì)于系統(tǒng)(20),給定γ>0,?XT=X>0,和矩陣W=KX,滿足以下不等式約束
(A+B2K)XD+XD(A+B2K)T+2αXD<0
如果X*和W*為上述不等式的可行解,則系統(tǒng)的狀態(tài)反饋控制器為u=W*(X*)-1x,該控制器不僅可保證H∞性能,且可以保證把閉環(huán)系統(tǒng)的極點(diǎn)配置到相應(yīng)的區(qū)域。
用LMI中的feasp來求解該線性矩陣不等式。
根據(jù)以上所述,在頂點(diǎn)處綜合局部控制器,根據(jù)式(19)可得到任意θ的控制器。
圖2 主仿真界面
圖3 子系統(tǒng)界面
相關(guān)參數(shù)如表1所示。
表1 移動(dòng)機(jī)器人的參數(shù)
K2=
以及與定點(diǎn)相對(duì)應(yīng)的閉環(huán)極點(diǎn)
(-3.8535±3.5438i),(-2.8004±0.8134i)
由以上兩個(gè)反饋增益矩陣,通過式(19)得到整個(gè)LPV變增益反饋矩陣,通過在線計(jì)算ρi(i=1,2),可得到具體位置的增益反饋矩陣
K=ρ1(q)K1+ρ2(q)K2,且ρ1+ρ2=1
據(jù)以上所述,得到系統(tǒng)的變增益控制器u=Kx。
在仿真中,移動(dòng)機(jī)器人末端理想軌跡方程為xd=cos(t)和yd=sin(t),根據(jù)本文所提出的方法設(shè)計(jì)控制器,機(jī)器人在x、y方向的運(yùn)動(dòng)軌跡如圖4所示。
圖4是機(jī)器人在參考輸入下,分別在x、y方向的運(yùn)動(dòng)軌跡方程。圖5給出兩關(guān)節(jié)控制器輸出控制力矩的響應(yīng)曲線。圖6顯示移動(dòng)機(jī)器人軌跡跟蹤曲線,關(guān)注點(diǎn)軌跡的相應(yīng)曲線基本與參考軌跡重合,圖6中實(shí)線為實(shí)際運(yùn)動(dòng)軌跡,虛線為參考軌跡。結(jié)果表明,采用這種控制方法,移動(dòng)機(jī)器人關(guān)注點(diǎn)的位置變化具有良好的跟蹤性能。
圖4 機(jī)器人在x、y方向的運(yùn)動(dòng)軌跡
圖5 兩關(guān)節(jié)控制力矩響應(yīng)曲線
圖6 機(jī)器人軌跡跟蹤曲線
移動(dòng)機(jī)器人軌跡跟蹤模型中存在動(dòng)態(tài)不確定性和外部干擾的不確定性,使得模型具有時(shí)變、強(qiáng)耦合、非線性等復(fù)雜的動(dòng)力學(xué)特性。本文引入變增益LPV魯棒H∞控制方法,設(shè)計(jì)了移動(dòng)機(jī)器人軌跡跟蹤控制器。仿真結(jié)果表明:機(jī)器人手臂關(guān)節(jié)位置的變化始終具有良好的跟蹤性能。
參考文獻(xiàn):
[1] 吳忻生,任華瑛.非完整移動(dòng)機(jī)器人軌跡跟蹤的最優(yōu)模糊控制[J].華南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2004,32(3):44-49.
[2] Das T,Kar I N.Design and implementation of an adaptive fuzzy logic-based controller fo-r wheeled mobile robots[J].IEEE Transactions on Control Systems Technology,2006,14(3):501-510.
[3] Lih-chang Lin,Hao-yin Shih.Modeling and Adaptive Control of an Omni-Wheeled Robot[J].Intelligent Control and Automation,2013(4):166-179.
[4] 吳菁,陳罡,孟靜.基于預(yù)測控制的非連續(xù)路段下移動(dòng)機(jī)器人的軌跡跟蹤[J].計(jì)算機(jī)測量與控制,2016,24(10):74-78.
[5] 鄭偉勇,李艷瑋.基于前饋-反饋的移動(dòng)機(jī)器人軌跡跟蹤控制[J].計(jì)算機(jī)工程與設(shè)計(jì),2017,38(2):539-543.
[6] 康升征,吳洪濤.全向移動(dòng)機(jī)器人模糊自適應(yīng)滑??刂品椒ㄑ芯縖J].機(jī)械設(shè)計(jì)與制造工程,2017,46(3):70-75.
[7] 葉錦華,吳海彬.不確定輪式移動(dòng)機(jī)器人統(tǒng)一自適應(yīng)神經(jīng)網(wǎng)絡(luò)H∞控制[J].中國機(jī)械工程,2017,28(2):150-155.
[8] 張弛,王向東.多項(xiàng)式LPV模型的航空發(fā)動(dòng)機(jī)變增益切換控制研究[J].科技創(chuàng)新與應(yīng)用,2017(6):99-100.
[9] 虞忠偉,陳輝堂,王月娟.基于LMI方法的機(jī)器人LPV魯棒H∞控制器設(shè)計(jì)[J].控制與決策,2001,16(2):146-150.
[10] 俞立.魯棒控制:線性矩陣不等式處理方法[M].清華大學(xué)出版社,2002.
[11] Gahinet P,Apkarian P.A linear matrix inequality approach toH∞control[J].Int J Robust Nonlinear Control,1994,4(3):421-448.