武 星 余文康 樓佩煌 樓航飛 翟晶晶 胡子寒
南京航空航天大學機電學院,南京,210016
異形重載大部件的搬運移載操作普遍存在于大型裝備的生產(chǎn)和運輸環(huán)節(jié)。例如,大型飛機的生產(chǎn)過程中,既存在大質(zhì)量、大尺寸的機身類部件,也存在大尺寸、小剛度的機翼類部件。用于支承定位機翼類部件的工裝夾具可能比部件本身的載荷大得多。飛機部件的工裝夾具規(guī)格多,難以達到類似汽車生產(chǎn)的標準化程度。大型飛機部件的小批量生產(chǎn)模式下,針對數(shù)百種工裝分別設(shè)計開發(fā)不同的重載搬運機器人是極不現(xiàn)實的。因此,采用多機器人系統(tǒng)合作搬運異形重載大部件具有十分重要的現(xiàn)實意義。
多機器人合作搬運是指采用多個機器人共同支承一個目標對象,通過機器人之間的協(xié)同運動控制來保證組群移動的一致性,實現(xiàn)目標對象的移動。機器人與目標對象的連接方式有抓取[1-3]、拖拉[4-5]、搬抬[6-7]以及推動[8]等。
合作搬運可視為動態(tài)環(huán)境下具有約束條件的多機器人系統(tǒng)編隊控制問題,參與搬運的每個機器人之間的相對位置不變,并具有相同或協(xié)調(diào)的運動速度和方向[9-10]。如果每個機器人能沿各自期望軌跡達到目的地,且機器人編隊能保持編隊隊形不變,則目標對象作為一個整體能被搬運到目的地。合作搬運可采用領(lǐng)航者-跟隨者(leader-follower)策略[6,11-13]、基于行為(behavior-based)法[14]和虛擬力/結(jié)構(gòu)(virtual force/structure)法[15-17]等多機器人編隊控制方法。相對于其他編隊控制方法,領(lǐng)航者-跟隨者策略在多機器人系統(tǒng)中獲得了廣泛應(yīng)用。
相對于常規(guī)的編隊控制方法,合作搬運對機器人位姿誤差非常敏感。針對2臺輪式機器人的合作搬運,YAMAGUCHI等[4]采用轉(zhuǎn)動副連接2臺輪式機器人阿克曼底盤與1個搬運對象,并基于運動學模型的鏈式變換提出一種新型反饋控制律。針對2臺人形機器人的合作搬運,LOUIS等[7]提出了一種包含全局規(guī)劃器、局部規(guī)劃器、零力矩點預(yù)測控制器和手臂柔順控制器的協(xié)同控制架構(gòu)。針對多無人機的合作搬運,UMEMOTO等[3]采用無人機自帶的轉(zhuǎn)子護罩夾持搬運對象,通過接觸力分配及分布式擾動觀測控制調(diào)整搬運對象的位姿;LIU等[5]對搬運對象采用無人機繩系連接方式,研究了基于張力分布算法的軌跡規(guī)劃,以及基于擴展狀態(tài)觀測器的反饋控制。
上述合作搬運都涉及搬運方式與控制方法,但文獻卻均未關(guān)注合作搬運過程中導(dǎo)引與控制的協(xié)同問題。因此,筆者以輪式機器人的合作搬運為對象,對協(xié)同導(dǎo)引控制構(gòu)型、模型、架構(gòu)與方法等方面開展了一系列研究。
導(dǎo)引控制構(gòu)型研究主要分析不同傳感器布局和驅(qū)動輪(常規(guī)輪或以Mecanum輪為代表的全向輪)配置的組合對協(xié)同導(dǎo)引控制性能的影響。多機器人系統(tǒng)的組成單元既可以是單臺移動機器人,也可以是具有導(dǎo)引、控制和驅(qū)動功能的導(dǎo)引驅(qū)動單元,如圖1所示。該單元包含上層的彈性減振裝置和下層的導(dǎo)引驅(qū)動底盤,底盤兩側(cè)對稱安裝2個由伺服電機(6)和鏈輪機構(gòu)(8、9)驅(qū)動的差速驅(qū)動輪(7),并在前方安裝有一個視覺導(dǎo)引相機(10)。
1.頂板 2.底板 3.垂直軸 4.導(dǎo)引相機 5.電機 6.水平軸 7.驅(qū)動輪 8.小鏈輪 9.鏈條 10.轉(zhuǎn)向架圖1 導(dǎo)引驅(qū)動單元Fig.1 Guided driving unit
根據(jù)傳感器布局和驅(qū)動輪配置的不同,本文提出3種導(dǎo)引控制構(gòu)型:單目-雙驅(qū)動、雙目-雙驅(qū)動、雙目-多運動副全向。采用多個導(dǎo)引驅(qū)動單元組成合作搬運構(gòu)型時,最直觀的方案為2個驅(qū)動單元前后布置并在2個驅(qū)動單元間安裝視覺導(dǎo)引相機,如圖2所示。由于驅(qū)動單元均無導(dǎo)引相機,因此前部的驅(qū)動單元(驅(qū)動單元1)只能依靠導(dǎo)引相機獲取整個機器人與導(dǎo)引路徑的位姿偏差,導(dǎo)致偏差數(shù)據(jù)不可避免地存在滯后。即使采用融合偏差智能轉(zhuǎn)化和指數(shù)穩(wěn)定控制的混合控制律[18],合作搬運構(gòu)型的路徑跟蹤性能仍受位姿偏差檢測滯后的影響,可見導(dǎo)引控制構(gòu)型對運動控制方法具有很大影響。
圖2 單目-雙驅(qū)動構(gòu)型Fig.2 Mono-camera dual-unit configuration
單目-雙驅(qū)動構(gòu)型的根本問題在于導(dǎo)引相機與驅(qū)動單元的分離。更有利于導(dǎo)引控制的方案是將導(dǎo)引相機配置于驅(qū)動單元前方,如圖1所示,該導(dǎo)引驅(qū)動單元本質(zhì)上是一種具有感知、規(guī)劃、控制和驅(qū)動的機器人。將多個導(dǎo)引驅(qū)動單元按直線布置,構(gòu)成合作搬運構(gòu)型,如圖3所示。為進行協(xié)同運動控制,需要針對多個單元上的導(dǎo)引相機進行傳感器標定,即利用多目視覺系統(tǒng)標定方法[19]建立各個視覺測量坐標系與多機器人系統(tǒng)測量坐標系、控制坐標系之間的變換關(guān)系。這是采用雙目-雙驅(qū)動構(gòu)型進行合作搬運的前提條件。
圖3 雙目-雙驅(qū)動構(gòu)型Fig.3 Dual-camera dual-unit configuration
由于采用兩輪差速驅(qū)動方式,因此導(dǎo)引驅(qū)動單元受到非完整運動約束,這給路徑跟蹤控制帶來困難。雙目-雙驅(qū)動構(gòu)型中,2個單元分別采用轉(zhuǎn)動副與系統(tǒng)平臺相連。該構(gòu)型的轉(zhuǎn)動自由度僅允許多個單元之間具有不同的姿態(tài)角,即在協(xié)同運動中僅可存在微小的姿態(tài)角誤差。為進一步消除位置誤差對機器人合作搬運的不利影響,即協(xié)同運動中可能存在的微小距離誤差,筆者開發(fā)了導(dǎo)引相機中心配置的Mecanum輪全向移動機器人,并通過轉(zhuǎn)動副和移動副連接多個全向機器人,組成雙目-多運動副全向構(gòu)型,如圖4所示。該構(gòu)型包括機器人上的轉(zhuǎn)動副、連接運載工裝與第二轉(zhuǎn)動副的第一移動副,具有容許全向機器人姿態(tài)角誤差和位置誤差的兩個自由度,有利于協(xié)同運動控制。
圖4 雙目-多運動副全向構(gòu)型Fig.4 Dual-camera multi-kinematic-pair omni-directional configuration
為進行合作搬運的協(xié)同運動控制,針對雙目-雙驅(qū)動構(gòu)型和雙目-多運動副全向構(gòu)型分別建立運動控制模型。
如圖5所示,點Gi、XiGiYi分別為導(dǎo)引驅(qū)動單元i(i=1,2)的中心和局部坐標系,X0G0Y0為系統(tǒng)坐標系,線段G1G2的長度為b,G0為其中點。
圖5 雙目-雙驅(qū)動運動簡圖Fig.5 Dual-camera dual-unit kinematic sketch
對于導(dǎo)引驅(qū)動單元i,edi、eθi分別是它與導(dǎo)引路徑的側(cè)向位置偏差和姿態(tài)角偏差,αi是它與系統(tǒng)平臺的轉(zhuǎn)角差,vli、vri是其左右驅(qū)動輪的線速度,vi是其中心的線速度,Δvi是vli和vri的速度差,ωi是由差速產(chǎn)生的轉(zhuǎn)向角速度。v0、ω0分別是系統(tǒng)平臺的線速度和轉(zhuǎn)向角速度。d為兩驅(qū)動輪間距的一半。
導(dǎo)引驅(qū)動單元采用兩輪差速驅(qū)動方式,因此線速度與轉(zhuǎn)向角速度之間存在以下關(guān)系:
vi=(vli+vri)/2
(1)
ωi=(vli-vri)/(2d)=Δvi/d
(2)
針對直線型或小曲率導(dǎo)引路徑,路徑偏差與單元速度之間存在以下關(guān)系:
(3)
(4)
針對圖5所示的多剛體機械系統(tǒng),要保證Y0方向上2個導(dǎo)引驅(qū)動單元的距離不變,則2個導(dǎo)引驅(qū)動單元的速度需滿足剛體連接約束:
v1cosα1=v2cosα2
(5)
系統(tǒng)平臺的轉(zhuǎn)向角速度為
(6)
單元i相對于系統(tǒng)平臺的轉(zhuǎn)角差變化率為
(7)
綜上,可得雙目-雙驅(qū)動運動模型:
(8)
該構(gòu)型采用的全向移動機器人i在全局坐標系中具有3個獨立的運動速度即vxi、vyi和ωi,如圖6所示。每個機器人中心安裝1個垂直向下的導(dǎo)引相機,兩機器人與運載工裝通過轉(zhuǎn)動副連接于點Oi,機器人與運載工裝的轉(zhuǎn)角差為αi。跟隨機器人與運載工裝間設(shè)置有移動副,所以兩機器人間的Y向距離可能在運動過程中發(fā)生變化,假設(shè)其期望值為L0,實際值為L,則縱向距離偏差ΔL=L-L0。以桿件O1O2上的運載工裝為對象,建立桿件坐標系O2XY,其轉(zhuǎn)向角速度為ω0。
圖6 雙目-多運動副運動簡圖Fig.6 Dual-camera multi-kinematic-pair omni-directional kinematic sketch
與圖5類似,edi、eθi分別為全向移動機器人與導(dǎo)引路徑的側(cè)向位置偏差和姿態(tài)角偏差。假設(shè)控制周期為T,則單個移動機器人的運動模型為[20]
(9)
(10)
機器人與運載工裝通過轉(zhuǎn)動副連接,機器人與運載工裝的轉(zhuǎn)角差αi變化率取決于機器人與運載工裝的轉(zhuǎn)角差變化率(式(7))。運載工裝的轉(zhuǎn)向角速度為
(11)
跟隨機器人與運載工裝間還設(shè)置有Y向移動副,將機器人的平動速度沿桿件坐標系O2XY投影,如圖6所示,則兩機器人間的Y向距離誤差變化率為
(12)
與雙驅(qū)動構(gòu)型的剛體連接約束(式(5))相比,多運動副全向構(gòu)型存在移動副,因而增加了1個縱向的移動自由度。綜上,可得雙目-多運動副全向運動模型:
(13)
為實現(xiàn)多機器人合作搬運,針對不同運動模型,基于領(lǐng)航者-跟隨者策略設(shè)計了協(xié)同路徑跟蹤控制架構(gòu),研究了2種協(xié)同跟蹤控制方法。
針對式(8)所示的雙目-雙驅(qū)動運動模型,在傳感器量程約束、電機驅(qū)動性能約束、平臺轉(zhuǎn)向半徑約束等多約束條件下[13],直接求解運動模型的控制量是比較困難的。因此,本文融合領(lǐng)航者-跟隨者策略、剛體連接約束(式(5))、路徑跟蹤方法和參數(shù)調(diào)節(jié)方法,設(shè)計了協(xié)同路徑跟蹤同構(gòu)控制架構(gòu),如圖7所示。運動控制模型構(gòu)建為一個六輸入-六輸出的確定性系統(tǒng):
(14)
式中,Lexi為導(dǎo)引驅(qū)動單元i的期望跟蹤距離。
圖7 協(xié)同路徑跟蹤同構(gòu)控制架構(gòu)Fig.7 Homogeneous control framework for coordinated path tracking
導(dǎo)引驅(qū)動單元經(jīng)過長度為Lexi的期望跟蹤距離后,側(cè)向位置偏差和姿態(tài)角偏差逐漸消除,導(dǎo)引驅(qū)動單元逼近并跟蹤導(dǎo)引路徑。
如圖5所示,將前單元作為領(lǐng)航者,后單元作為跟隨者。單元i有獨立跟蹤導(dǎo)引路徑的視覺導(dǎo)引控制系統(tǒng),產(chǎn)生進行糾偏控制的速度差Δvi。將前單元的線速度v1作為系統(tǒng)平臺的運行速度v0。由于剛體連接約束(式(5))的存在,因此后單元的線速度v2取決于前單元的線速度v1,以及兩單元的轉(zhuǎn)角差α1和α2。路徑跟蹤技術(shù)用于構(gòu)建聯(lián)系速度差Δvi與側(cè)向位置偏差edi、姿態(tài)角偏差eθi、期望跟蹤距離Lexi的模型。Lexi是反映兩單元運動協(xié)同度的耦合參數(shù),與本單元的側(cè)向位置偏差、姿態(tài)角偏差,以及兩單元的轉(zhuǎn)角差有關(guān)。
在圖7所示的該協(xié)同路徑跟蹤控制架構(gòu)中,每個單元獨立并發(fā)地進行視覺導(dǎo)引和路徑跟蹤的處理,但相互之間的運動行為通過期望跟蹤距離Lexi和協(xié)同運動控制約束進行耦合聯(lián)系。Lexi、v2與協(xié)同運動控制相關(guān),因此該控制構(gòu)架可分為兩部分:①各單元并行的路徑跟蹤控制;②多單元之間的耦合參數(shù)調(diào)節(jié)。前者意味著每個單元都可采用相同的導(dǎo)引控制流程(同構(gòu)控制構(gòu)架),它包括路徑偏差分類、軌跡轉(zhuǎn)化預(yù)測和路徑跟蹤控制。后者反映了跟隨者與領(lǐng)航者的協(xié)同運動,是通過運動參數(shù)耦合來實現(xiàn)的。
同構(gòu)控制架構(gòu)中,每個單元采用相同的導(dǎo)引控制方法。根據(jù)路徑偏差特征和傳感控制約束,定義了6種路徑偏差狀態(tài)及其相關(guān)的糾偏軌跡,分析了各種糾偏軌跡相互轉(zhuǎn)化的狀態(tài)遷移機制,研究了可同步消除側(cè)向位置偏差和姿態(tài)角偏差的同步糾偏軌跡,提出了其他糾偏軌跡遷移到同步糾偏軌跡的軌跡控制方法[13,21],其中,期望跟蹤距離是影響路徑跟蹤控制效率、軌跡轉(zhuǎn)化安全裕度和多機器人運動協(xié)同度的耦合參數(shù)。為自適應(yīng)調(diào)節(jié)該耦合參數(shù),設(shè)計了一種二階模糊邏輯調(diào)節(jié)器,以單元i的側(cè)向位置偏差edi、姿態(tài)角偏差eθi、兩單元與系統(tǒng)平臺的轉(zhuǎn)角差之差α1-α2為輸入,先通過三角隸屬度函數(shù)進行模糊邏輯推理,再利用重心法輸出期望跟蹤距離的精確估計值[13]。
如圖6所示,在雙目-多運動副全向構(gòu)型中采用領(lǐng)航者-跟隨者策略,前機器人作為領(lǐng)航者,后機器人作為跟隨者。每個機器人都有獨立跟蹤導(dǎo)引路徑的視覺導(dǎo)引控制系統(tǒng),并分別產(chǎn)生進行糾偏控制的側(cè)移速度vxi和轉(zhuǎn)向角速度ωi。領(lǐng)航者的前移速度vy1為合作搬運的領(lǐng)航速度。由于運載工裝的移動副允許兩機器人沿Y向發(fā)生相對運動,因而如式(12)所示,跟隨者的前移速度vy2相對于領(lǐng)航者的前移速度vy1具有更靈活的變化過程,而非式(5)所示的嚴格協(xié)調(diào)關(guān)系。針對雙目-多運動副全向構(gòu)型,設(shè)計了一種協(xié)同路徑跟蹤異構(gòu)控制架構(gòu),如圖8所示,其中,領(lǐng)航者采用模型預(yù)測控制方法,跟隨者采用反演控制方法,且反演控制參數(shù)由強化學習和神經(jīng)網(wǎng)絡(luò)技術(shù)調(diào)節(jié)。
圖8 協(xié)同路徑跟蹤異構(gòu)控制架構(gòu)Fig.8 Heterogeneous control framework for coordinated path tracking
異構(gòu)控制架構(gòu)中,領(lǐng)航者和跟隨者采用不同的導(dǎo)引控制方法。領(lǐng)航者根據(jù)式(9)、式(10)所示的側(cè)向位置偏差模型和姿態(tài)角偏差模型,分別規(guī)劃N步控制序列,建立預(yù)測控制的代價函數(shù),通過二次規(guī)劃方法求解滿足代價函數(shù)的最優(yōu)控制量序列,該序列的第一項控制量作為當前控制周期內(nèi)路徑跟蹤的控制量輸出[16,22]。
側(cè)向位置偏差模型中,系數(shù)hi與姿態(tài)角偏差eθi、轉(zhuǎn)向角速度ωi有關(guān)。由于全向移動機器人的側(cè)移速度vxi和轉(zhuǎn)向角速度ωi無控制耦合,所以可分別求解ωi、vxi的最優(yōu)控制量序列。首先,根據(jù)式(10)所示的姿態(tài)角偏差模型求解ωi的最優(yōu)控制量序列εθ,并根據(jù)該序列預(yù)測eθi的變化序列W。其次,根據(jù)序列εθ和W計算側(cè)向位置偏差的系數(shù)序列H。再次,根據(jù)式(9)所示的側(cè)向位置偏差模型求解vxi的最優(yōu)控制量序列Vx。
跟隨者采用反演控制方法同時跟蹤地面的導(dǎo)引路徑和領(lǐng)航者牽引的運載工裝。為保證跟隨者的協(xié)同運動控制過程具有全局漸近穩(wěn)定性,設(shè)計了如下的跟蹤控制律:
(15)
反演控制器設(shè)計過程中,側(cè)向位置偏差模型采用了線性化近似處理。為解決模型失真可能引起的控制器性能退化問題,本文采用行動者-評論者(Actor-Critic,AC)強化學習方法對反演控制器中的控制參數(shù)k1、k2、k3進行自適應(yīng)調(diào)整,如圖9所示。
圖9 基于強化學習的控制參數(shù)自調(diào)整Fig.9 Adaptive adjustment of control parameters based on reinforcement learning
強化學習模型中,Actor在連續(xù)動作空間內(nèi)基于概率選擇合適的動作,Critic針對參考模型/環(huán)境的狀態(tài)更新來評價actor的行為(給予獎勵值),Actor根據(jù)Critic的獎勵值來更新行為選擇的概率。如圖9所示,該模型采用徑向基神經(jīng)網(wǎng)絡(luò)實現(xiàn)Actor的行為選擇即控制參數(shù)調(diào)整,并實現(xiàn)Critic的環(huán)境狀態(tài)更新(估計下一時刻的機器人位姿偏差)與獎勵值計算。采用時序差分算法的相鄰狀態(tài)值函數(shù)偏差定義強化學習目標,并通過梯度下降近似估計算法更新神經(jīng)網(wǎng)絡(luò)的權(quán)重。
為驗證本文所提的協(xié)同導(dǎo)引控制構(gòu)型、模型和方法,設(shè)計雙目-雙驅(qū)動構(gòu)型和雙目-多運動副全向構(gòu)型的多機器人合作搬運原型系統(tǒng)完成協(xié)同導(dǎo)引控制實驗。
雙目-雙驅(qū)動運動構(gòu)型的原型系統(tǒng)前后布置2個視覺導(dǎo)引驅(qū)動單元,如圖10所示。系統(tǒng)尺寸為1800 mm×800 mm×360 mm,每個驅(qū)動單元采用2臺400 W的伺服電機獨立驅(qū)動φ125 mm的實心輪,原型系統(tǒng)的框架采用4個萬向輪作為輔助支撐,有效承載能力為1000 kg。
圖10 雙目-雙驅(qū)動原型系統(tǒng)Fig.10 Dual-camera dual-unit prototype
單元i的導(dǎo)引相機實時獲取地面導(dǎo)引路徑的圖像,通過圖像DSP(digital signal processor)完成圖像分割、目標識別、路徑擬合和偏差測量,以25 Hz的頻率檢測導(dǎo)引驅(qū)動單元的側(cè)向位置偏差edi和姿態(tài)角偏差eθi,測量精度為±0.5 mm和±0.5°。單元i彈性減振裝置的下承載板(圖1中的部件2)上安裝有角度傳感器,以25 Hz的頻率測量單元與系統(tǒng)平臺的轉(zhuǎn)角差αi,測量精度為±0.1°。嵌入式控制器通過串口接收DSP輸出的側(cè)向位置偏差和姿態(tài)角偏差,通過AD轉(zhuǎn)換接口讀取角度傳感器的轉(zhuǎn)角差電壓信號;再執(zhí)行協(xié)同路徑跟蹤控制算法,獲得導(dǎo)引驅(qū)動單元的線速度和速度差;然后根據(jù)差速驅(qū)動逆運動學模型求解驅(qū)動輪轉(zhuǎn)速,并輸出給電機驅(qū)動器完成伺服驅(qū)動控制。
將地面上設(shè)置的一圈藍色色帶作為閉環(huán)導(dǎo)引路徑,該路徑包括4個直線段和1個半徑1.2 m的圓弧轉(zhuǎn)彎段。前導(dǎo)引驅(qū)動單元的線速度v1為800 mm/s,后單元的線速度v2根據(jù)剛體連接約束實時調(diào)節(jié)。兩個單元的初始偏差狀態(tài)如表1所示。
表1 導(dǎo)引驅(qū)動單元的初始偏差狀態(tài)
協(xié)同路徑跟蹤實驗中,兩單元在轉(zhuǎn)彎前的直線段、圓弧轉(zhuǎn)彎段,以及轉(zhuǎn)彎后直線段的側(cè)向位置偏差和姿態(tài)角偏差變化如圖11所示,轉(zhuǎn)角差變化如圖12所示。
(a)前單元
(b)后單元圖11 協(xié)同路徑跟蹤的路徑偏差Fig.11 Path deviations in coordinated path tracking
圖12 協(xié)同路徑跟蹤的轉(zhuǎn)角差Fig.12 Steering angles in coordinated path tracking
如圖11a所示,前單元0~3 s運行在轉(zhuǎn)彎前的直線段上,其糾偏軌跡在6種路徑偏差狀態(tài)之間相互轉(zhuǎn)化,ed1和eθ1由初始值快速減小;2.28 s時,前單元沿同步糾偏軌跡運行,將兩種路徑偏差消除到|ed1|<2 mm,|eθ1|<2°的穩(wěn)定狀態(tài)。前單元在3 s后進入圓弧轉(zhuǎn)彎段,ed1急劇反向增大到負極值,其糾偏軌跡在2種路徑偏差狀態(tài)之間反復(fù)轉(zhuǎn)化,整個圓弧路徑的跟蹤精度為11 mm<|ed1|<16 mm,|eθ1|<4°,這比直線路徑的跟蹤精度稍低。7.96 s時,前單元進入轉(zhuǎn)彎后的直線段,其糾偏軌跡在5種路徑偏差狀態(tài)之間相互轉(zhuǎn)化,最后進入直線路徑的穩(wěn)定跟蹤狀態(tài)。
如圖11b所示,后單元在轉(zhuǎn)彎前的直線段經(jīng)歷了4種糾偏軌跡的轉(zhuǎn)化而進入穩(wěn)定跟蹤狀態(tài),直線路徑的跟蹤精度與前單元相似。4.12~9.16 s范圍內(nèi),后單元在圓弧轉(zhuǎn)彎段上運行,也通過2種糾偏軌跡在2種路徑偏差狀態(tài)之間反復(fù)轉(zhuǎn)化,圓弧路徑的跟蹤精度也與前單元相似。由圖11可知,各種糾偏軌跡相互轉(zhuǎn)化的狀態(tài)遷移機制是有效的,同步糾偏軌跡可同時有效消除側(cè)向位置偏差和姿態(tài)角偏差。
如圖12所示,在轉(zhuǎn)彎前的直線段上,轉(zhuǎn)角差α1、α2的初始值分別為-5°和30°。由于后單元應(yīng)跟隨前單元的運動,所以α2快速減小到0并反向增大以趨近α1。隨后,α2跟隨α1依次經(jīng)歷峰值和谷值而向0收斂,|α1|<3°時,α2在-3°~3°范圍內(nèi)波動。圓弧轉(zhuǎn)彎段內(nèi),為保證兩導(dǎo)引驅(qū)動單元的速度瞬心重合,導(dǎo)引驅(qū)動單元與系統(tǒng)平臺間的轉(zhuǎn)角差需滿足多體機械系統(tǒng)的運動約束。系統(tǒng)平臺的轉(zhuǎn)彎半徑越小,單元與系統(tǒng)平臺間的轉(zhuǎn)角差越大,因此,兩單元在圓弧路徑上的轉(zhuǎn)角差明顯大于其在直線路徑上的穩(wěn)態(tài)值。兩單元重新進入直線路徑后,轉(zhuǎn)角差快速減小至其穩(wěn)態(tài)值。
雙目-多運動副全向構(gòu)型的原型系統(tǒng)前后布置2個Mecanum輪全向移動機器人,如圖13所示。前后機器人分別通過第一轉(zhuǎn)臺和第二轉(zhuǎn)臺連接管狀大部件,且在第二轉(zhuǎn)臺的上下兩塊圓形承載板之間設(shè)置有導(dǎo)軌。全向機器人的尺寸為1090 mm×720 mm×360 mm,分別采用4臺750 W的伺服電機獨立驅(qū)動φ254 mm的Mecanum輪。管狀大部件的尺寸為φ160 mm×3000 mm,轉(zhuǎn)臺直徑為600 mm,導(dǎo)軌長度為430 mm。
全向機器人i中心垂直向下安裝有導(dǎo)引相機,實時獲取地面導(dǎo)引路徑的圖像,再通過圖像DSP識別側(cè)向位置偏差edi和姿態(tài)角偏差eθi。機器人i的轉(zhuǎn)臺安裝有角度傳感器,測量機器人i與管狀大部件的轉(zhuǎn)角差αi。第二轉(zhuǎn)臺導(dǎo)軌副安裝的距離傳感器以25 Hz的頻率測量2個機器人之間的縱向距離偏差ΔL,測量精度為±0.01 mm。嵌入式控制器采集DSP和其他傳感器輸出的側(cè)向位置偏差、姿態(tài)角偏差、轉(zhuǎn)角差、Y向距離誤差等數(shù)據(jù);再通過協(xié)同路徑跟蹤控制算法,計算全向機器人的平移速度和轉(zhuǎn)向角速度;最后根據(jù)Mecanum輪驅(qū)動逆運動學模型求解Mecanum輪轉(zhuǎn)速,并輸出給電機驅(qū)動器完成伺服驅(qū)動控制。
以地面設(shè)置的藍色色帶作為閉環(huán)導(dǎo)引路徑(包括4個直線段和1個半徑1.5 m的圓弧轉(zhuǎn)彎段)。前機器人的前移速度vy1為400 mm/s,后機器人的前移速度vy2根據(jù)縱向距離約束實時調(diào)節(jié)。協(xié)同路徑跟蹤算法分別通過預(yù)測控制和反演控制計算側(cè)移速度vxi和轉(zhuǎn)向角速度ωi。兩機器人的初始偏差狀態(tài)如表2所示。
表2 全向機器人的初始偏差狀態(tài)
該合作搬運原型系統(tǒng)在閉環(huán)導(dǎo)引路徑上完成了連續(xù)多圈的協(xié)同路徑跟蹤實驗。以第一圈第一個圓弧轉(zhuǎn)彎段為例,分析轉(zhuǎn)彎前的直線段、圓弧轉(zhuǎn)彎段、轉(zhuǎn)彎后的直線段中,兩機器人的側(cè)向位置偏差、姿態(tài)角偏差,以及機器人間縱向距離偏差的變化,其中,前機器人的側(cè)向位置偏差和姿態(tài)角偏差變化如圖14所示。
(a)側(cè)向位置偏差
(b)姿態(tài)角偏差圖14 前機器人路徑偏差Fig.14 Path deviations of leader robot
0~6 s內(nèi),前機器人在轉(zhuǎn)彎前的直線段上運行,預(yù)測控制器自2.5 s后進入穩(wěn)態(tài),|ed1|<3 mm,|eθ1|<3°。6~12 s時,前機器人進入圓弧轉(zhuǎn)彎段。由于Mecanum輪機器人的全向移動能力,ed1并未出現(xiàn)類似差速機器人的急劇反向增大,而是在-5~0 mm 之間周期性波動。同時,eθ1在-5°~0°之間周期性波動,全向機器人具有較高的跟蹤控制精度。12 s后,前機器人進入轉(zhuǎn)彎后的直線段,ed1、eθ1快速減小至其穩(wěn)態(tài)值。
針對多圈協(xié)同路徑跟蹤的實驗數(shù)據(jù)進行統(tǒng)計處理。在直線段上,前機器人的側(cè)向位置偏差均值為0.7 mm,均方差為1.2 mm;姿態(tài)角偏差均值為0.8°,均方差為1.2°。在圓弧轉(zhuǎn)彎段上,前機器人的側(cè)向位置偏差均值為-1.9 mm,均方差為2.1 mm;姿態(tài)角偏差均值為-2.6°,均方差為1.2°??梢?,前機器人在直線段上的兩種偏差均值和均方差都小于圓弧轉(zhuǎn)彎段。
后機器人在路徑跟蹤過程中采用反演控制法,其控制參數(shù)可設(shè)置為固定值或通過AC強化學習方法優(yōu)化。在實驗中對比了這兩組控制參數(shù)的跟蹤控制效果,側(cè)向位置偏差和姿態(tài)角偏差的變化如圖15所示。
(a)側(cè)向位置偏差
如圖15所示,強化學習優(yōu)化后,ed2、eθ2在直線路徑上更快收斂到穩(wěn)態(tài)值,且其穩(wěn)態(tài)偏差明顯減小。后機器人在圓弧轉(zhuǎn)彎段上運行時,固定參數(shù)控制下的ed2在-9~0 mm 之間周期性波動,而強化學習優(yōu)化后的ed2僅在-3~0 mm之間波動,圓弧轉(zhuǎn)彎段的跟蹤誤差明顯減小。
分別對固定參數(shù)控制與強化學習優(yōu)化控制的多圈協(xié)同路徑跟蹤實驗數(shù)據(jù)進行統(tǒng)計處理。采用固定參數(shù)控制時,后機器人在圓弧轉(zhuǎn)彎段上的側(cè)向位置偏差均值為-5.6 mm,均方差為1.9 mm;姿態(tài)角偏差均值為-2.7°,均方差為1.7°。采用強化學習優(yōu)化控制時,后機器人在圓弧轉(zhuǎn)彎段上的側(cè)向位置偏差均值為-2.8 mm,均方差為1.0 mm;姿態(tài)角偏差均值為-1.8°,均方差為1.1°。采用強化學習優(yōu)化控制后,后機器人兩種偏差的均值和均方差都顯著減小。
協(xié)同路徑跟蹤實驗中,兩機器人之間的縱向距離偏差變化如圖16所示。強化學習優(yōu)化后,ΔL在直線路徑上更快收斂到穩(wěn)態(tài)值,且其穩(wěn)態(tài)偏差明顯減小。無論兩機器人位于導(dǎo)引路徑的直線段還是圓弧段,或是一個機器人位于直線段而另一個位于圓弧段,ΔL的波動幅值都沒有明顯的變化,但強化學習優(yōu)化后的ΔL波動明顯減小。對比實驗的ed2、eθ2和ΔL驗證了強化學習優(yōu)化控制參數(shù)的有效性。
圖16 機器人間縱向距離偏差Fig.16 Longitudinal distance deviation between robots
進一步,對協(xié)同路徑跟蹤的實驗數(shù)據(jù)進行統(tǒng)計分析,采用固定參數(shù)控制時,ΔL的均值為-0.03 mm,均方差為3.78 mm;采用強化學習優(yōu)化控制時,ΔL的均值為-0.04 mm,均方差為2.26 mm??梢姡捎脧娀瘜W習優(yōu)化控制后,ΔL的均值雖然與固定參數(shù)控制時接近,但均方差顯著減小,說明采用強化學習后,機器人間縱向距離的控制過程比較平穩(wěn)。
對比雙目-雙驅(qū)動構(gòu)型與雙目-多運動副全向構(gòu)型的協(xié)同路徑跟蹤實驗數(shù)據(jù),發(fā)現(xiàn)兩者在直線段上的穩(wěn)態(tài)側(cè)向位置偏差和姿態(tài)角偏差基本相同。雙目-多運動副全向構(gòu)型采用全向Mecanum輪并在兩機器人間增加縱向移動自由度,這有效增強了機器人直接消除側(cè)向位置偏差的靈活度,顯著提高了合作搬運系統(tǒng)對ΔL的容忍度。因此,雙目-多運動副全向構(gòu)型中的兩機器人在圓弧轉(zhuǎn)彎段上的側(cè)向位置偏差顯著減小,且跟隨者采用強化學習優(yōu)化控制后的側(cè)向位置偏差更小。協(xié)同路徑跟蹤的實驗結(jié)果驗證了所提協(xié)同導(dǎo)引控制構(gòu)型、模型、架構(gòu)與方法的可行性和有效性。
采用多機器人系統(tǒng)合作搬運異形重載大部件具有顯著的作業(yè)靈活性和工況適應(yīng)性。首先,研究了單目-雙驅(qū)動、雙目-雙驅(qū)動、雙目-多運動副全向等合作搬運導(dǎo)引控制構(gòu)型,分析了不同傳感器布局對協(xié)同導(dǎo)引控制的影響。其次,針對后兩種構(gòu)型分別建立了多輸入-多輸出運動控制模型,并基于領(lǐng)航者-跟隨者策略,設(shè)計了協(xié)同路徑跟蹤的同構(gòu)控制架構(gòu)和異構(gòu)控制構(gòu)架。同構(gòu)架構(gòu)下,兩導(dǎo)引驅(qū)動單元采用偏差轉(zhuǎn)化預(yù)測控制方法,其跟蹤距離參數(shù)由模糊邏輯調(diào)節(jié)器優(yōu)化。異構(gòu)架構(gòu)下,領(lǐng)航者采用模型預(yù)測控制方法,跟隨者采用反演控制方法,反演控制的參數(shù)由AC強化學習方法優(yōu)化。最后,針對雙目-雙驅(qū)動和雙目-多運動副全向構(gòu)型,開發(fā)了多機器人合作搬運原型系統(tǒng),完成了協(xié)同導(dǎo)引控制實驗,實驗結(jié)果驗證了所提協(xié)同導(dǎo)引控制構(gòu)型、模型、架構(gòu)與方法的可行性和有效性。
值得注意的是,上述構(gòu)型、模型與架構(gòu)都是針對2個導(dǎo)引驅(qū)動單元或全向移動機器人進行分析與推導(dǎo)的。雖然理論上可以推廣到3個及以上機器人的情況,但無論是雙目-雙驅(qū)動構(gòu)型還是雙目-多運動副全向構(gòu)型,其系統(tǒng)控制模型都面臨協(xié)同運動約束不斷增加的問題,這將導(dǎo)致協(xié)同導(dǎo)引控制的難度逐漸增大。因此,該問題需要在未來工作中繼續(xù)深入研究。