鄒澤成
伯明翰大學(xué) 英國(guó) 伯明翰 B15 2TT
在拆卸過(guò)程中,軸孔拆卸是一項(xiàng)常見(jiàn)的高重復(fù)性任務(wù),機(jī)器人執(zhí)行起來(lái)并不容易。究其原因,主要是在軸栓和軸孔剛性高、柔度不夠的情況下,即使在位置或方向上稍有偏差,也會(huì)產(chǎn)生無(wú)約束的接觸力,從而導(dǎo)致拆卸失敗[1]。在本研究中,我們?cè)O(shè)計(jì)了一個(gè)完整機(jī)器學(xué)習(xí)的演示方法,以克服卡阻和楔入的問(wèn)題,生成能夠?qū)崿F(xiàn)軸孔自動(dòng)化拆卸控制策略。在KUKA iiwa上,應(yīng)用該控制策略進(jìn)行自動(dòng)軸孔拆卸。
2.1 演示前的過(guò)程分解 軸孔拆卸過(guò)程分為三個(gè)主要階段:(1)抓取階段:機(jī)器人上的夾持器移動(dòng)到預(yù)設(shè)位置,抓住軸栓的頭部。(2)方位調(diào)整階段:夾鉗夾緊軸栓,繞自由端旋轉(zhuǎn),使軸栓與軸孔的軸線平行對(duì)齊。(3)分離階段:在垂直向上的方向施加適當(dāng)?shù)牧?使其分離。在分離階段,力的大小和方向是不斷調(diào)整,以盡量減少軸栓和軸孔之間的阻力。
圖表1 Peg-hole disassembly process
在控制策略訓(xùn)練之前,演示數(shù)據(jù)要進(jìn)行時(shí)域同步。因?yàn)槿祟?lèi)無(wú)法高精度地重復(fù)同一動(dòng)作,而不一致會(huì)對(duì)控制策略產(chǎn)生不利影響。在DTW 算法中,假設(shè)在時(shí)域上數(shù)據(jù)有兩組演示數(shù)據(jù)P'A(t)和P'B(t)。數(shù)據(jù)P'A(t)和P'Bt()的序列分別為m 和n,排列在網(wǎng)格板的兩側(cè)。網(wǎng)格表示時(shí)間間隔。如圖6所示,在m×n網(wǎng)格板中,每個(gè)網(wǎng)格都有一個(gè)坐標(biāo)(i,j)。
為了對(duì)齊這兩個(gè)序列,點(diǎn)上(i,j)的數(shù)字是到這兩個(gè)點(diǎn)Ai和Bj的距離d
由于精確的定位系統(tǒng),機(jī)器人(KUKA iiwa14)在給定位置信息的情況下,抓取軸栓頭部并不困難。同時(shí),軸栓與軸孔之間的卡阻和楔入一般發(fā)生在第二、第三階段。因此,演示的重點(diǎn)是如何調(diào)整方向偏差和運(yùn)用適當(dāng)?shù)淖饔昧Α?/p>
2.2 拆卸過(guò)程的演示 演示過(guò)程由人類(lèi)握住低剛度的機(jī)械臂,并且執(zhí)行被夾持器抓住的軸栓與孔分離。從夾具抓住軸栓起,傳感器開(kāi)始同時(shí)記錄腕部信息W 和軸栓的姿勢(shì)信息P,直到拆卸完成。若剛度太高,人很難移動(dòng)機(jī)械臂。反之剛度太低,機(jī)械臂無(wú)法承受其重量并跌落到地面。因此,應(yīng)改變軸X,Y,Z的剛度以適應(yīng)不同階段。
傳感器記錄的數(shù)據(jù)要能夠提供足夠的信息以便充分學(xué)習(xí)。軸孔拆卸在三維空間中,坐標(biāo)原點(diǎn)OH位于孔的中心,栓頭部中心為OP。軸栓姿勢(shì)信息為P=[x,y,z,α,β,γ]T。(x,y,z)表示位置,(α,β,γ)表示以z-x-z順序的歐拉角。腕部信息表示為W=[Fx,Fy,Fz,Mx,My,Mz]T。(Fx,Fy,Fz)表示施加的力,(Mx,My,Mz)表示力矩。由于整體形成十二維數(shù)據(jù)組,將導(dǎo)致額外的訓(xùn)練,且控制策略不可靠。因而需要將數(shù)據(jù)減少到低維度進(jìn)行訓(xùn)練,執(zhí)行運(yùn)動(dòng)時(shí)恢復(fù)高維度。訓(xùn)練前三維減少到二維,忽略切向方向上的數(shù)據(jù)。
將樁孔拆卸壓縮成二維平面。其中栓的姿態(tài)信息可以表示為三個(gè)變量P'= [r ,z',φ]T,腕部信息也表示為三個(gè)W'=[Fz',Fr,M]T.映射函數(shù)計(jì)算如下:(Ai,Bj)。這是序列A 和序列B各點(diǎn)之間的相似性。距離越小,相似性越高。兩點(diǎn)之間的歐氏距離是。DTW 的目標(biāo)是通過(guò)從左下角(1,1)到右上角(m,n)的連續(xù)點(diǎn)找到最佳路徑。通過(guò)計(jì)算,構(gòu)成路徑的點(diǎn)是兩個(gè)序列的對(duì)齊點(diǎn)。沿著這條路徑,累積歐氏距離D(m,n)最小,其中K 為對(duì)齊點(diǎn)的總數(shù)。累積距離表示為:
本文使用高斯混合回歸來(lái)計(jì)算輸入和輸出之間的關(guān)系。輸入最直觀影響的是速度的變化,因此,選擇位置的導(dǎo)數(shù)(相對(duì)速度)作為輸出。
既,
該控制策略是建立在給定腕部W 的基礎(chǔ)上,它將產(chǎn)生最佳的校正速度,使p( W)最大化。校正速度的具體函數(shù)如下所示。
由于所確定的參數(shù)較多,計(jì)算負(fù)擔(dān)較低,能夠?qū)崟r(shí)生成校正速度。用速度在KUKA iiwa上實(shí)現(xiàn)了速度控制策略。
第二個(gè)測(cè)試是將軸孔放置到距離原來(lái)位置30 cm 的位置,測(cè)試結(jié)果與第一組對(duì)比如下,實(shí)驗(yàn)結(jié)果表明,成功率均為100%,可以實(shí)現(xiàn)自主軸孔拆卸。兩種情況下的平均試驗(yàn)時(shí)間小于演示的平均時(shí)間,表明機(jī)器人在學(xué)習(xí)了人類(lèi)的技能后可以很快執(zhí)行。演示中X-Y 平面有一些偏差,使所學(xué)的技能在新的位置上有過(guò)多的修正。平均時(shí)間誤差和接觸力誤差分別為7.1%和4.9%,對(duì)計(jì)算結(jié)果沒(méi)有顯著影響,這種控制策略仍然可以被認(rèn)為是有用的。
在本課題中,介紹了一種基于人體演示的軸孔拆卸方法,達(dá)到了自主拆卸軸孔的目的。與其他費(fèi)時(shí)的學(xué)習(xí)方法相比,該方法實(shí)驗(yàn)次數(shù)少,學(xué)習(xí)范圍大大縮小,易于在實(shí)際中應(yīng)用。提高學(xué)習(xí)的效率,同時(shí)提高控制的效率。