鄭斌 苗中華 周進(jìn),2?
(1. 上海大學(xué) 上海市應(yīng)用數(shù)學(xué)和力學(xué)研究所, 力學(xué)與工程科學(xué)學(xué)院, 上海 200072)
(2. 上海飛行器力學(xué)與控制研究院,上海 200092)
(3. 上海大學(xué) 機(jī)電工程與自動化學(xué)院, 上海 200072)
近十年多來,網(wǎng)絡(luò)化Euler-Lagrange (EL)系統(tǒng)的合作行為與協(xié)調(diào)控制, 作為一類具有代表性的多智能體系統(tǒng),它的分布式同步和一致性控制已經(jīng)成為包括動力學(xué)與控制等許多領(lǐng)域備受矚目的熱點課題之一[1-5]. 這主要是由于EL動力學(xué)能夠描述包括機(jī)器人操縱機(jī)械臂,自主車輛和無人航天器等無數(shù)的物理和力學(xué)對象,尤其是在大規(guī)模的集成化的生產(chǎn)過程中,在靈活性、并行性、可操作性和可拓展性方面表現(xiàn)出潛在而又獨(dú)有的優(yōu)點. 一般來說,多個機(jī)器人的合作行為與協(xié)調(diào)控制從理論上可以歸結(jié)為網(wǎng)絡(luò)化EL系統(tǒng)的同步和一致性問題,現(xiàn)有大量同步和一致性問題的研究主要集中在EL網(wǎng)絡(luò)在無引導(dǎo)者和有引導(dǎo)者-跟隨者的兩種情形[6-14].
雖然近年來許多學(xué)者對于網(wǎng)絡(luò)化EL系統(tǒng)提出和發(fā)展了大量的同步和一致性協(xié)議和算法,但這些結(jié)果大多涉及到完全驅(qū)動的EL動力學(xué)系統(tǒng). 然而在實際工程應(yīng)用中,如協(xié)作的柔性機(jī)械臂系統(tǒng),航天器的姿態(tài)同步,水下探測的機(jī)器人都是典型的欠驅(qū)動EL系統(tǒng),由于其控制輸入的數(shù)量嚴(yán)格小于系統(tǒng)自由度(DOF). 同時網(wǎng)絡(luò)化欠驅(qū)動EL系統(tǒng)是一個涉及多重動力學(xué)高度非線性和強(qiáng)耦合的復(fù)雜動態(tài)系統(tǒng),尤其是考慮到當(dāng)網(wǎng)絡(luò)中涉及不同個體之間的信息交互時,使得對網(wǎng)絡(luò)化欠驅(qū)動EL系統(tǒng)協(xié)同控制方案的設(shè)計相對于完全驅(qū)動EL系統(tǒng)更為復(fù)雜并具有挑戰(zhàn)性. 因此,近年來一些學(xué)者致力于研究不同類型欠驅(qū)動EL系統(tǒng)的同步和一致性問題[15-19]. 例如,Nuo等[16]提出了一類比例加阻尼的控制器實現(xiàn)了非恒同欠驅(qū)動EL網(wǎng)絡(luò)漸近地達(dá)到一致性. Ortega等[19]通過坐標(biāo)變換,在不需要知道初始條件情況下來解決通信渠道存在未知延遲的一致性問題.
能量整形技術(shù)是一種基于無源控制(PBC)結(jié)構(gòu)的有效方案,近年來已被廣泛用于處理大量各種復(fù)雜互聯(lián)結(jié)構(gòu)模式的物理和機(jī)械系統(tǒng)的動力學(xué)與控制問題. 這個控制方案的基本思想可以追溯到早期的開創(chuàng)性工作[20],其核心是整合系統(tǒng)各個部分能量和控制器能量作為一個系統(tǒng)的總能量,它被用來構(gòu)造作為一個合適的Lyapunov函數(shù),并進(jìn)一步通過阻尼注入來確保整個閉環(huán)控制系統(tǒng)的穩(wěn)定性. 能量整形另一個重要的特征是它不需要速度測量,從而可以避免速度傳感器裝置在實際應(yīng)用中的不精確性甚至失效. 近來,Nuo等[21]應(yīng)用能量整形和阻尼注入控制方案,提出了一種分散式控制協(xié)議用于求解完全驅(qū)動EL網(wǎng)絡(luò)在無引導(dǎo)者和有引導(dǎo)者兩種情形下的一致性問題. Cruz-Zavala等[22]利用基于PBC結(jié)構(gòu)的能量整形技術(shù),給出了完全驅(qū)動EL系統(tǒng)在有限時間內(nèi)達(dá)到一致性的算法. 另一方面,由于涉及諸如個體間直接或間接相互作用,網(wǎng)絡(luò)化控制系統(tǒng)(NCS)中傳感、通訊、計算與執(zhí)行等環(huán)節(jié)不可避免地存在時滯效應(yīng)[23]. 其中通訊時滯是影響協(xié)作機(jī)器人之間信息交互的關(guān)鍵因素之一,它通常是由傳輸信號延遲、信道噪聲、量化誤差等網(wǎng)絡(luò)環(huán)境的不確定性隨機(jī)因素引起的,它能極大影響NCS的性能甚至最終改變系統(tǒng)的穩(wěn)定性[16,22]. 然而,目前尚未見到利用能量整形方案來實現(xiàn)具有通訊時滯欠驅(qū)動EL網(wǎng)絡(luò)的一致性問題. 因此,無論從理論上還是從工程應(yīng)用背景來看,這是一個極其重要而不可缺少的挑戰(zhàn)性的研究問題.
本文的主要目的是利用能量整形方案無源控制的技術(shù)特征,來研究由欠驅(qū)動EL動力學(xué)所描述網(wǎng)絡(luò)化柔性機(jī)械臂系統(tǒng)一致性跟蹤控制問題. 通過結(jié)合互連分配加上阻尼注入策略,將具有通訊時滯EL網(wǎng)絡(luò)欠驅(qū)動和驅(qū)動部分,以及控制器三部分能量有機(jī)地整合一個總的系統(tǒng)能量,從而使得導(dǎo)出的一致性協(xié)議能夠確保網(wǎng)絡(luò)化欠驅(qū)動EL系統(tǒng)達(dá)到無引導(dǎo)者和有引導(dǎo)者-追隨者兩種情形下所期望的跟蹤一致性問題. 所獲得的一致性協(xié)議是充足分布式的,同時也不需要速度測量,因而它能很方便地應(yīng)用于實際中協(xié)作的網(wǎng)絡(luò)化機(jī)器人系統(tǒng).
本文的組織結(jié)構(gòu)具體如下:第1節(jié)介紹一些相關(guān)符號、圖論知識和網(wǎng)絡(luò)化欠驅(qū)動EL系統(tǒng)動力學(xué)模型. 第2節(jié)介紹了本文的主要結(jié)果,分別在無引導(dǎo)者和有引導(dǎo)者-跟隨者的情況下,討論具有通訊時滯欠驅(qū)動EL網(wǎng)絡(luò)的一致性問題. 第3節(jié)通過數(shù)值仿真驗證所提出控制算法有效性,并分析通訊時滯對一致性的效應(yīng). 第4節(jié)最后對本文給出一個簡短的總結(jié).
在本文中,如圖1所示,所考慮的機(jī)器人個體通過一個有向拓?fù)鋱D(或有向連通網(wǎng)絡(luò))交換信息,每個機(jī)器人可以被視為圖的一個節(jié)點,假設(shè)機(jī)器人i通過有向路徑獲得機(jī)器人j的信息,那么aij=1,否則aij=0.一般來說與鄰接矩陣A=(aij)∈N×N相關(guān)的有向圖的拉普拉斯矩陣L=(lij)∈N×N定義為:和lii=-aij,i≠j.易知lij≤0,i≠j,以及一棵有向生成樹是由個節(jié)點組成的網(wǎng)絡(luò),其中一個節(jié)點稱為根節(jié)點,它有一條通往其他每個節(jié)點的有向路徑. 關(guān)于圖的相關(guān)知識可以在在文獻(xiàn)[24,25]中找到.
圖1 有向網(wǎng)絡(luò)通訊拓?fù)銯ig.1 Directed network communication topology
考慮由N個柔性機(jī)械臂系統(tǒng)構(gòu)成的網(wǎng)絡(luò)化欠驅(qū)動EL系統(tǒng), 其中第i個個體的欠驅(qū)動EL動力學(xué)可由如下方程表示:
Ki(qi-xi)=0n
(1)
其中i=1,2,…,N,qi∈n是連桿角度位置,xi∈n是電機(jī)(關(guān)節(jié))角度位置.Mi(qi)∈n×n是對稱正定的慣性矩陣,n為科氏力和離心力,gi(qi)∈n×n是重力矩,Ji∈n×n是電機(jī)轉(zhuǎn)子的轉(zhuǎn)動慣量,Ki∈n×n為柔性關(guān)節(jié)剛度系數(shù),τi∈n是電機(jī)受到的驅(qū)動力矩.
通過借助于文獻(xiàn)[25],我們可以定義新的變量變換:
(2)
相應(yīng)地可以設(shè)計出以下形式的控制器:
(3)
通過利用方程(2)和(3),欠驅(qū)動EL網(wǎng)絡(luò)(1)可以被約化為:
Ki(qi-yi)=0n
(4)
一般地,欠驅(qū)動EL系統(tǒng)(1)具有以下性質(zhì)[24,25]:
為了研究網(wǎng)絡(luò)化欠驅(qū)動EL系統(tǒng)分布式控制方案的設(shè)計,以下給出在無引導(dǎo)者和有引導(dǎo)者-跟隨者兩種情形下一致性定義如下:
定義1:考慮由N個非恒同柔性機(jī)械臂系統(tǒng)構(gòu)成的欠驅(qū)動EL網(wǎng)絡(luò)(1),通過使用分布式控制器τi∈n,使得相應(yīng)的連桿角度位置qi將漸近地趨于一個共同常值. 也就是說存在一個常數(shù)向量qc∈n,對于所有i∈[1,N],有以下結(jié)論成立:
(5)
定義2:考慮由N個非恒同柔性機(jī)械臂系統(tǒng)構(gòu)成的欠驅(qū)動EL網(wǎng)絡(luò)(1),通過使用分布式控制器τi∈,使得相應(yīng)的連桿角度位置將漸近地趨于一個期望常值ql∈n,同時需要至少有一個個體可以直接獲取引導(dǎo)者的位置信息ql,這樣對于所有i∈[1,N],有以下結(jié)論成立:
(6)
基于文獻(xiàn)[21],約化系統(tǒng)(4)中有如下能量函數(shù):
(7)
相應(yīng)的動能函數(shù)定義為:
(8)
和勢能函數(shù)的定義為:
(9)
我們注意到sT是正定的,對于欠驅(qū)動EL系統(tǒng),我們可以有
(10)
首先,讓控制器的廣義坐標(biāo)定義為θ∈Nn,通過應(yīng)用EL系統(tǒng)的運(yùn)動方程,我們可以相應(yīng)得到反映控制器動力學(xué)特征的方程
(11)
和相應(yīng)地總能量函數(shù):
(12)
為了方便后面的計算,我們選擇Mc=INn,控制器的勢能函數(shù)為
(13)
其中H=diag(hiIn),是一個Nn×Nn的彈簧剛度系數(shù)矩陣,這里hi>0.B=diag(bi)是一個N×N的增益矩陣,其中bi>0.
接下來,我們將對欠驅(qū)動EL網(wǎng)絡(luò)(1)的約化系統(tǒng)(4)設(shè)計控制信號如下
(14)
由于網(wǎng)絡(luò)中機(jī)器人個體之間存在通訊時滯的信息交互,考慮如下控制器動力學(xué)方程
(15)
這里假定從第i個個體到第j個個體的通信交互存在著一個可變的時間延遲Tji(t),進(jìn)一步假設(shè)0≤Tji(t)≤*Tji<∞成立.
因此,對網(wǎng)絡(luò)化欠驅(qū)動EL系統(tǒng)(1)的驅(qū)動部分所施加的控制輸入具有以下形式:
(16)
為了方便地得出網(wǎng)絡(luò)化欠驅(qū)動EL系統(tǒng)分布一致性的主要結(jié)果,我們引進(jìn)如下引理:
引理1[16]: 對于任何矢量信號α,β,任何可變時間延遲0≤T(t)≤*T<∞和任意常數(shù)c,有
(17)
定理1:對于網(wǎng)絡(luò)化的欠驅(qū)動EL系統(tǒng)(1),通過選擇控制輸入(16),只要注入阻尼滿足以下條件
(18)
則在能量整形加阻尼注入的無源控制方案下,能夠?qū)崿F(xiàn)如定義1所述無引導(dǎo)者情形下的一致性問題.
證明:考慮到如下的Lyapunov函數(shù):
(19)
結(jié)合利用上述性質(zhì)1,2,容易求得的導(dǎo)數(shù):
θj[t-Tji(t)]}}
(20)
因為
(21)
綜合以上,我們可以得出:
(22)
同時對(22)進(jìn)行積分
V1(t)-V1(0)=
(23)
因為V1(t)≥0和根據(jù)引理1:
(24)
現(xiàn)在對公式(15)進(jìn)行微分可以得到:
(25)
接下來的證明主要分為以下兩個部分:第一是證明控制器的廣義坐標(biāo)θ收斂于一個共同常值;第二是證明變量y收斂于控制器的廣義坐標(biāo)和最終證明變量收斂于連桿角度位置.
這節(jié)來討論有引導(dǎo)者-跟隨者情形的一致性,在討論之前先介紹一個引理.
引理2:[21]考慮對角矩陣是一個矩陣R=diag(ri)是一個N×N矩陣,假設(shè)至少有一個元素是嚴(yán)格的正數(shù),即ri>0,那么矩陣Ll=L+R是對稱正定的并且是滿秩的.
與無引導(dǎo)者一致性問題的情況不同,我們選擇上述對角矩陣R=diag(ri)來建立引導(dǎo)者-跟隨者的互連關(guān)系.當(dāng)引導(dǎo)者可以發(fā)出信息到第i個跟隨者時,ri>0,否則ri=0,即存在至少一條從引導(dǎo)者到任何N個跟隨者的有向邊.
(26)
(27)
所以,最終導(dǎo)出的控制輸入為以下形式:
(28)
定理2:對于網(wǎng)絡(luò)化的欠驅(qū)動EL系統(tǒng)(1),通過選擇上述控制輸入(28),只要注入阻尼滿足條件 (18),則在能量整形加阻尼注入的無源控制方案下,能夠?qū)崿F(xiàn)如定義2所述有引導(dǎo)者-跟隨者情形下的一致性問題.
證明:考慮到如下的Lyapunov函數(shù):
(29)
結(jié)合上述性質(zhì)1,2,很容易得到V2的導(dǎo)數(shù):
(30)
(31)
同樣利用有向圖拉普拉斯矩陣的性質(zhì)上述公式(31)可以表述為:
(32)
又因為
(33)
那么
(34)
本節(jié)通過數(shù)值模擬來驗證上述基于能量整形方案提出的分布式一致性協(xié)議的正確性和有效性.如圖2所示,給出了柔性關(guān)節(jié)的示意圖. 這里選取5個柔性機(jī)械臂系統(tǒng)構(gòu)成欠驅(qū)動EL網(wǎng)絡(luò)[如圖3(a)所示],第i(i=1,2,…,5)個欠驅(qū)動EL系統(tǒng)的
圖2 柔性關(guān)節(jié)模型Fig.2 Flexible-joint model
圖3 網(wǎng)絡(luò)通訊拓?fù)銰1和G2Fig.3 Network Communication Topology G1 and G2
qi=[qii,qi2]T,xi=[xii,xi2]T
從圖3(a)可以得出Laplacian矩陣為
根據(jù)定理1,我們所設(shè)計的控制輸入的參數(shù)選取hi=60,di=10,bi=5,不難驗證它們是滿足本文的假設(shè)和定理1的條件. 在這節(jié)中我們分別選取5個欠驅(qū)動EL系統(tǒng)初始位置
q1(0)=[4.0,3.6]T,q2(0)=[5.1,4.8]T,
q3(0)=[3.3,3.1]T,q4(0)=[4.6,4.2]T,
q5(0)=[5.4,5.1]T,x1(0)=[4.4,3.8]T,
x2(0)=[5.4,5.7]T,x3(0)=[3.6,4.1]T,
x4(0)=[4.9,5.2]T.
5個欠驅(qū)動的EL系統(tǒng)初始速度分別選擇如下:
在網(wǎng)絡(luò)通訊拓?fù)銰1下,考慮不同大小的通訊時滯Tji(t)=0,0.1+0.01cost,1+0.01cost,圖4、圖6和圖8描述了在上述不同通訊時滯下,連桿位置的變化狀態(tài). 圖5、圖7和圖9分別描述了當(dāng)時滯Tji(t)=0,0.1+0.01cost,1+0.01cost時,控制器的廣義坐標(biāo)θ的變化狀態(tài). 此外,比較上述6個圖,不難看出,隨著通訊延遲的增加,5個欠驅(qū)動EL系統(tǒng)達(dá)到一致性狀態(tài)的時間變長. 因此可以得到以下結(jié)論:機(jī)器人個體之間的通訊時滯可以降低網(wǎng)絡(luò)一致性的協(xié)同性能,較大的通訊時滯能夠減緩達(dá)到一致性的進(jìn)程, 但并不影響系統(tǒng)一致性的穩(wěn)定性,這也證實了所提出的控制算法的正確性和有效性. 另外,當(dāng)d=0不滿足定理的條件時,連桿位置q的變化狀態(tài)如圖10所示,5個欠驅(qū)動EL系統(tǒng)沒有達(dá)到一致性. 這一模擬結(jié)果與定理1是一致的.
圖4 當(dāng)Tji(t)=0時,連桿位置q在時間t=0s~40s的變化狀態(tài)Fig.4 When Tji(t)=0, the state of change of the link angular position q at time t=0s~40s
圖5 當(dāng)Tji(t)=0時,控制器的廣義坐標(biāo)θ在時間t=0s~40s內(nèi)的變化狀態(tài)Fig.5 When Tji(t)=0, the state of change of the generalized coordinate of the controller θ at time t=0s~40s
圖6 當(dāng)Tji(t)=0.1+0.01cos(t)時,連桿位置q在時間t=0s~40s的變化狀態(tài)Fig.6 When Tji(t)=0.1+0.01cos(t), the state of change of the link angular position q at time t=0s~40s
圖7 當(dāng)Tji(t)=0.1+0.01cos(t)時,控制器的廣義坐標(biāo)θ在時間t=0s~40s內(nèi)的變化狀態(tài)Fig.7 When Tji(t)=0.1+0.01cos(t), the state of change of the generalized coordinate of the controller θ at time t=0s~40s
圖8 當(dāng)Tji(t)=1+0.01cos(t)時,連桿位置q在時間t=0s~80s的變化狀態(tài)Fig.8 When Tji(t)=1+0.01cos(t), the state of change of the link angular position q at time t=0s~80s
圖9 當(dāng)Tji(t)=1+0.01cos(t)時,控制器的廣義坐標(biāo)θ在時間t=0s~80s內(nèi)的變化狀態(tài)Fig.9 When Tji(t)=1+0.01cos(t), the state of change of the generalized coordinate of the controller θ at time t=0s~80s
圖10 當(dāng)Tji(t)=0.1+0.01cos(t),d=0時,連桿位置q不能達(dá)到一致性Fig.10 When Tji(t)=0.1+0.01cos(t),d=0, the link angular position q can not achieve consensus
在圖3(a)的基礎(chǔ)上,我們讓引導(dǎo)者(標(biāo)記為0)的信息只傳輸給機(jī)器人個體1,通信拓?fù)浣Y(jié)構(gòu)如圖3(b)所示. 選取hi=60,di=10,bi=5和ri=6,虛擬引導(dǎo)者的位置為ql=[1,-1]T,其它的初始條件和系統(tǒng)的物理參數(shù)一樣.
圖11 當(dāng)Tji(t)=0.1+0.01cos(t)時,連桿位置q在時間t=0s~60s的變化狀態(tài)Fig.11 When Tji(t)=0.1+0.01cos(t), the state of change of the link angular position q at time t=0s~80s
圖12 當(dāng)Tji(t)=0.1+0.01cos(t)時,控制器的廣義坐標(biāo)θ在時間t=0s~60s內(nèi)的變化狀態(tài)Fig.12 When Tji(t)=0.1+0.01cos(t), the state of change of the generalized coordinate of the controller θ at time t=0s~60s
本文在無引導(dǎo)者和有引導(dǎo)者-跟隨者的兩種情況下,通過充分利用能量整形方案無源控制的特征,將具有通訊時滯EL網(wǎng)絡(luò)欠驅(qū)動和驅(qū)動部分以及控制器三部分能量有機(jī)地整合一個總的系統(tǒng)能量,這個總能量被選擇作為一個合適的Lyapunov函數(shù),使得該分布式協(xié)議能夠確保網(wǎng)絡(luò)化欠驅(qū)動EL系統(tǒng)實現(xiàn)所期望的跟蹤一致性. 它是充足分布式的同時也不需要速度測量,因而它將很方便地應(yīng)用于實際工程中網(wǎng)絡(luò)化機(jī)器人的控制與協(xié)作. 最后,以欠驅(qū)動EL網(wǎng)絡(luò)的數(shù)值模擬來驗證理論算法的有效性同時分析不同通訊時滯對一致性性能的影響.