呂曉靜,徐智浩,徐恩華
(1.廣州民航職業(yè)技術學院飛機維修工程學院,廣東廣州 510403;2.廣東省科學院智能制造研究所,廣東省現代控制技術重點實驗室,廣東廣州 510070;3.廣州民航職業(yè)技術學院民航經營管理學院,廣東廣州 510403)
隨著智能制造國家戰(zhàn)略的縱深發(fā)展,以多品種、多型號為導向的智能柔性制造成為機器人化制造的一種重要趨勢。人機協(xié)作融合了人類的操作智慧和機器人的操作穩(wěn)定性,是實現智能柔性生產的重要途徑。
在人機協(xié)作模式下,機器人與人類的作業(yè)空間更加緊湊,導致機器人與人類作業(yè)空間高度重疊,如圖1所示。由于空間的限制,機器人的實際工作空間被限制在一個狹窄的范圍內。這些狹窄的空間是靈活的,盡管機器人不必嚴格遵守,但人類希望機器人主要在其中活動。上述愿景給機器人的運動控制帶來了巨大挑戰(zhàn),主要體現在以下幾個方面:(1)機器人任務的動態(tài)性。在有人參與的生產線上,由于人為操作和任務變化引入的不確定性,機器人要完成的任務往往不是固定、重復的,這將使傳統(tǒng)的離線計劃控制方法難以適應任務要求;(2)在部署機器人的過程中,要求快速定義和修改首選領域;(3)在機器人的實時控制過程中,必須同時滿足系統(tǒng)的物理約束。
圖1 機器人機協(xié)作工作場景示例
在已有研究中,基于RRT的軌跡規(guī)劃方法應用較多。文獻[1]在RRT邊界探索算法的基礎上,引入GFE算法進行細化搜索,并提取連續(xù)邊界域的形心作為探索目標點,該方法在多機器人協(xié)同空間探索任務中效率更高。文獻[2]針對傳統(tǒng)RRT算法在機械臂的運動規(guī)劃上缺乏導向性導致收斂速度慢的問題,提出一種擴展點選擇策略和自適應步長策略,有效避免了算法陷入極小值。文獻[3]提出一種快速探索隨機樹固定節(jié)點算法,該算法在搜索過程中限制節(jié)點數,同時對采樣節(jié)點擴展和父節(jié)點選擇方法進行了類似的設計。文獻[4]提出在生成新點之前先確定父節(jié)點可以提高搜索性能,但該方法存在局部最小值問題。
針對狹小的工作空間,主流的規(guī)劃方法是將空間的限制描述為避障問題。文獻[5]提出一種基于水平集的機器人避障方法,其主要思想是用一組幾何基元逼近狹窄空間的邊界,然后通過組合一組水平集函數得到的不等式約束重新表述避障問題。文獻[6]在規(guī)劃過程中考慮了機器人的運動學模型,構造了運動態(tài)勢感知圖(MSAM),使機器人能夠更好地感知周圍環(huán)境信息以做出最佳決策。文獻[7]提出一種基于距離計算和離散檢測的路徑規(guī)劃方法。文獻[8]針對人工勢場法容易出現的局部極小值問題和目標不可達問題進行分析,引入了虛擬障礙物模型,較好地解決了人工勢場法的局部極小值問題;文獻[9]提出一種基于采樣的規(guī)劃方法,其主要思想是使用基于學習的運動建模方法來預測障礙物,該方法在移動障礙物等較為雜亂的環(huán)境中顯示出優(yōu)越性。
近年來,隨著深度學習和神經網絡的快速發(fā)展,智能無碰撞路徑規(guī)劃方法得到了廣泛的研究。文獻[10]提出一種改進的基于梯度投影的偽逆方法來獲得任務空間中的無碰撞軌跡,針對可調增益選擇引起的軌跡不連續(xù)問題,建立了一種反向傳播神經網絡來產生更平滑的路徑。模型驅動神經網絡結合了神經網絡的學習性能和自適應性能,以及機器人模型所帶來的客觀物理規(guī)律和穩(wěn)定性,在機器人控制領域得到了廣泛的應用。文獻[11]提出一種基于不等式的避障方法,首先討論了4種不同的QP在線算法,然后在關節(jié)速度層面建立了基于LVI的原始對偶神經網絡。
在上述研究的基礎上,本文作者提出一種基于環(huán)境吸引域的新型運動控制與位型優(yōu)化方法。該方法采用一組關鍵點定義人類對機器人的預設工作區(qū)域,并構建了機器人本體與該關鍵點集的距離指標;設計了兼顧末端執(zhí)行器跟蹤、環(huán)境吸引域指標優(yōu)化與物理約束不等式的控制問題模型,并建立了遞歸神經網絡進行實時求解。該方法能夠在保證機器人末端完成高精度運動控制的同時,使機器人的工作區(qū)域盡可能收縮到人類預設的區(qū)域,從而有效保證人機協(xié)作安全性。
不失一般性,文中所考慮的機器人具有串聯結構,所有關節(jié)都是旋轉關節(jié),沒有結構柔性。對于自由度為n的冗余機器人,其正向運動學模型可以描述為
x=f(θ)
(1)
其中:θ(t)∈Rn是關節(jié)角向量;x(t)∈Rm是描述末端執(zhí)行器在笛卡爾空間中位置的向量;f(?):Rn→Rm是一個非線性函數,描述了從關節(jié)空間到笛卡爾空間的映射。對式(1)求導可得:
(2)
為了便于對機器人本體位形進行描述,利用機器人本體上的關鍵點(Body Key Points,BKP)進行表征。如圖2所示,通過選取機器人的BKP,可以對機器人本體在笛卡爾空間中的分布情況進行刻畫。BKP通常是每個關節(jié)中心以及連桿上均勻分布的離散點。
圖2 機器人的關鍵點和環(huán)境原理
與BKPs類似,定義關鍵點集P={P1,P2,…,Pn1}近似描述偏好工作區(qū)域,則偏好工作區(qū)域與機器人本體之間的廣義距離可描述為點集P與K之間距離綜合:
(3)
(4a)
(4b)
θ-≤θ≤θ+
(4c)
(4d)
在實時解決原始動態(tài)規(guī)劃問題時,優(yōu)化指標與實際需要解決方案的決策變量角速度隱相關。此外,機器人的角速度與優(yōu)化指標的變化率直接相關。將式(4a)在時間維度上展開,并假設吸引域為靜態(tài)或準靜態(tài),可以得到虛擬吸引力與機器人運動之間的關系:
(5)
在時間維度上對優(yōu)化指標進行重構,可得:
(6a)
(6b)
θ-≤θ≤θ+
(6c)
(6d)
(7a)
(7b)
(7c)
(8a)
(8b)
(8c)
其中:c1和c2是兩個可調的正參數。對于式(8),其高度非線性的性質使機器人的實時控制量獲取變得困難。
提出一種模型驅動的神經網絡來實時解決非線性約束優(yōu)化問題。引入一個用于處理等式約束(8b)的對偶變量λ,拉格朗日函數L可以定義為
(9)
根據Karush-Kuhn-Tucker條件,式(9)的最優(yōu)解滿足
(10)
其中,
(11)
由此可得:
(12)
(13)
其中:∈為正參數,主要用于調節(jié)控制器的收斂速度。
式(13)為所構造控制器的一般形式。在實際控制過程中,為了盡可能簡化控制器,可以選擇適當的參數和變量來減少控制器的結構。例如取c2=1,式(13)可以簡化為
此處為對提出控制器的進一步討論。在后面的證明中,為了驗證控制器的通用性,仍然選擇公式(13)作為對象分析系統(tǒng)穩(wěn)定性。
(14)
(15)
根據F(ξ)的定義,將式(13)進一步改寫為
(16)
(17)
對應于式(13)的最優(yōu)解。
分別以平面四自由度機器人與七自由度協(xié)作機器人FRANKA PANDA為仿真對象,通過與傳統(tǒng)方法的對比,說明文中所提算法的有效性。
以平面四自由度機器人為對象,其各連桿長度為l1=0.296 m、l2=0.296 m、l3=0.296 m、l4=0.212 m;選擇機器人每個連桿的中點和節(jié)點作為BKP;選取機器人初始關節(jié)為θ(0)=[π/2,-π/3,-π/4,0]T;調整控制參數為c1=1、c2=1、∈=0.001、k=5、κ=10,定義機器人的期望軌跡為xd=[0.4+0.1cos(0.5t),0.35+0.1sin(0.5t)]T,并與JMPI方法進行對比。設J-1為雅克比矩陣J的偽逆,并在機器人接近奇異位形時引入阻尼,同時對機器人角速度進行限幅處理。為保證對比試驗的一致性,k同樣設置為5。對比結果如圖3、4所示。對比圖3(a)和圖3(b)可以看出:兩種控制方法都可以跟蹤期望的軌跡,收斂時間約為1.5 s,穩(wěn)態(tài)誤差分別為2×10-6、2×10-4m,表明所提方法在軌跡跟蹤方面與主流方法相差不大。圖3(c)和圖3(d)為兩種算法下機器人關節(jié)角度的對比?;贘MPI方法,機器人的關節(jié)角1在t=0.8~15 s時間段內超過了物理極限;相比之下,基于文中提出的方法,機器人的關節(jié)角度可以保持在最大(小)值,從而保證了系統(tǒng)的安全。在角速度方面,JMPI方法與文中提出的模型驅動方法(圖3(f))不同,無法保證仿真初始階段(圖3(e))機器人角速度的有界性(t=0~0.5 s)。
圖3 所提算法與JMPI方法在平面四自由度機器人的仿真對比
在此基礎上,進一步驗證引入環(huán)境吸引域優(yōu)化之后的控制效果。采用[0.3;0.55]作為單一環(huán)境吸引域描述點,并選擇機器人的關鍵點1作為吸引對象,仿真結果如圖4所示。
圖4 引入環(huán)境吸引域前后的平面四自由度機器人仿真對比
由圖4(a)可以看出:無論是否考慮虛擬環(huán)境優(yōu)化,機器人的軌跡跟蹤誤差均收斂于0,收斂時間約為1 s,兩種情況幾乎沒有差異;引入環(huán)境吸引域后,機器人關鍵點到傾斜工作空間的距離對比如圖4(d)所示,平均距離從3.6 m減小到3.4 m。引入環(huán)境吸引機制后,可以直觀地看到機器人的構型變化,機器人的第二個關節(jié)進入偏好區(qū)域。在這種情況下,機器人的關節(jié)角1和關節(jié)角2保證了機器人的關鍵點靠近期望區(qū)域,關節(jié)角3和關節(jié)角4的變化更承擔了軌跡跟蹤的任務。
為進一步驗證所提方法的有效性,選擇FRANKA PANDA機器人作為仿真對象。分別選取[0.346 2;-0.675;0.210][-0.253 8;-0.675;0.210]為機器人運動的始末點,以模仿機器人的抓放任務。機器人關節(jié)角的初始值為[-0.5;0.33;-1;-1.7;0;2.3;0]rad,空間吸引域的點選擇為[0.4;-0.1;0.7]m,實驗結果如圖5所示。t=0時,機器人末端執(zhí)行器的位置[0.08,-0.674,0.40]m,相應的跟蹤誤差約為[-0.25;0;0.2]m。在該控制器的作用下,機器人末端執(zhí)行器可以快速跟蹤期望的軌跡。跟蹤誤差在t=3.14、6.28、9.42、12.57 s等處存在一定的抖動,這主要是由于機器人在這些點的期望軌跡導數不連續(xù)(主要指機器人抓取和放置點時的反向速度,即速度幅值相同但方向相反)。這也證明了所提控制器的適應性,即使在期望軌跡速度不平穩(wěn)的情況下,系統(tǒng)也能實現高精度的軌跡跟蹤。
圖5 FRANKA PANDA機器人的仿真結果對比
針對冗余機械手同步運動控制過程,提出一種基于環(huán)境吸引域的構型優(yōu)化方法。將人類定義的機器人偏好工作空間簡單地建模為一組關鍵點,并建立一個稱為環(huán)境吸引域的勢函數。在APF方法的啟發(fā)下,從優(yōu)化的角度建立一個有吸引力的方案。將物理約束下的運動控制與構型優(yōu)化問題表述為QP問題,建立模型驅動神經網絡實現閉環(huán)系統(tǒng)的全局收斂,以軟限制的方式在物理約束下同時進行運動控制和構型優(yōu)化。通過仿真驗證了所提方法的有效性。