李成,周紫菱,湯卿
基于動態(tài)運動基元的機器人電子元器件裝配軌跡規(guī)劃方法研究
李成,周紫菱,湯卿*
(四川大學(xué) 機械工程學(xué)院,四川 成都 610065)
針對電子元器件裝配任務(wù)中電子元器件和PCB板種類較多,以及生產(chǎn)過程中產(chǎn)品種類更換頻繁所導(dǎo)致的裝配軌跡多變等問題,提出一種基于動態(tài)運動基元的機器人軌跡規(guī)劃方法。首先,建立動態(tài)運動基元系統(tǒng)方程,對機器人的運動進行建模;其次,根據(jù)演示軌跡對非線性函數(shù)的參數(shù)進行學(xué)習(xí),利用非線性最優(yōu)化的局部加權(quán)回歸方法求得演示軌跡的權(quán)重系數(shù);然后,對方程中的非線性函數(shù)項進行分段加權(quán),使系統(tǒng)能夠穩(wěn)定收斂到目標(biāo)裝配點;最后,設(shè)計具有末端姿態(tài)約束的機器人拖動算法在Panda機器人上進行軌跡演示,根據(jù)目標(biāo)位姿不發(fā)生變化與發(fā)生變化兩種情況生成機器人的自主裝配軌跡,并在Panda機器人上對三種不同的電子元器件進行裝配驗證。結(jié)果表明:基于改進后的動態(tài)運動基元方法學(xué)習(xí)到的機器人運動軌跡,不僅能夠很好地模仿演示軌跡的運動趨勢,而且可以以較高的精度到達目標(biāo)指定位姿,很好地完成了機器人電子元器件裝配任務(wù)。
裝配;動態(tài)運動基元;軌跡規(guī)劃
機器人技術(shù)日趨成熟,正在向智能化、模塊化和系統(tǒng)化的方向發(fā)展[1],并逐步廣泛應(yīng)用于工業(yè)生產(chǎn)中的鑄造、鍛造、焊接等領(lǐng)域[2-3]。近些年,隨著電視、電腦、手機等電子產(chǎn)品的發(fā)展與普及,越來越多的電子產(chǎn)品生產(chǎn)企業(yè)需要根據(jù)不同的功能需求,設(shè)計不同用途和不同規(guī)格的印制電路板(Printed Circuit Board,PCB),并在PCB板上裝配焊接不同的電子元器件。在實際生產(chǎn)裝配過程中,存在各類不同形狀的電子元件,因其形狀的特殊性與結(jié)構(gòu)的復(fù)雜性,仍需進行人工插裝作業(yè),這大大降低了工業(yè)生產(chǎn)的效率,增加了產(chǎn)品的生產(chǎn)成本。為實現(xiàn)印制電路板的自動化裝配、提高生產(chǎn)裝配效率,許多企業(yè)將機器人引入流水線中。
目前機器人的運動通常需要事先規(guī)劃好參考軌跡。機器人可以根據(jù)事先編寫好的運動軌跡重復(fù)地執(zhí)行任務(wù),這種方法在簡單的流水線化的任務(wù)場景中有較多應(yīng)用。當(dāng)任務(wù)參數(shù)發(fā)生變化時,規(guī)劃的軌跡也需要隨之變化,從而需要對機器人進行二次編程。當(dāng)任務(wù)環(huán)境中存在障礙物時,還需提前對障礙物進行建模,然后將障礙物導(dǎo)入規(guī)劃化環(huán)境中,此時機器人編程的難度與復(fù)雜度也會隨之上升。對于復(fù)雜的機器人運動路徑,通常還需要編程人員反復(fù)進行編程和調(diào)試。通過編程規(guī)劃的機器人任務(wù)軌跡缺乏適應(yīng)能力,當(dāng)設(shè)置不同的任務(wù)軌跡的起點和終點時還需要編程人員對機器人重新進行路徑規(guī)劃。
演示學(xué)習(xí)是一種新興的編程方式,使機器人能夠從人的演示動作中提取操作信息,并由該操作信息生成新的機器人運動控制指令,從而使機器人學(xué)習(xí)到相應(yīng)的運動技能[4]?;谘菔緦W(xué)習(xí)的機器人編程方式操作簡單、人機交互友好,可以大大降低對編程人員的技術(shù)要求。采用演示學(xué)習(xí)編程方式通常先由操作人員牽引機器人完成一次或多次任務(wù),然后讓機器人自主學(xué)習(xí)并復(fù)現(xiàn)該任務(wù)的運動軌跡[5-6]。當(dāng)機械臂末端軌跡的起始位置和目標(biāo)位置發(fā)生改變時,基于演示學(xué)習(xí)的機器人軌跡規(guī)劃方法應(yīng)當(dāng)能夠?qū)κ窘誊壽E進行泛化,使其能夠完成新的任務(wù)?;谘菔緦W(xué)習(xí)的機器人軌跡規(guī)劃方法不僅能提高機器人編程的效率,而且能夠提高機器人的適應(yīng)能力,從而更加靈活地完成實際任務(wù)。
動態(tài)運動基元方法(Dynamic Movement Primitives,DMPs)[7–9]是一種基于演示學(xué)習(xí)的軌跡規(guī)劃方法。它不僅能夠在不同的任務(wù)環(huán)境中模仿演示軌跡的運動趨勢,而且能夠針對不同的起點和終點進行運動軌跡泛化。不過該方法仍存在如目標(biāo)點收斂不精確、參數(shù)選擇的不確定性等問題。
本文提出一種基于動態(tài)運動基元的適用于電子元器件裝配的機器人軌跡規(guī)劃方法。該方法不僅能夠?qū)W習(xí)演示軌跡的特征,而且可以以較高的精度到達目標(biāo)指定位姿,從而更高效地實現(xiàn)高精度的電子元器件裝配。最后在基于Franka Emika Panda機器人的PCB板電子元件裝配實驗平臺上對本文提出的改進動態(tài)運動基元的電子元件裝配運動軌跡規(guī)劃方法進行驗證。實驗結(jié)果表明:該方法能根據(jù)操作人員的演示動作裝配三種不同結(jié)構(gòu)的電子元件產(chǎn)品。
動態(tài)運動基元算法系統(tǒng)的定義為[7–8]:
式(1)右側(cè)第一項可以看作一個PD控制器。不考慮的情況下,可寫為如下狀態(tài)方程:
由于強迫函數(shù)的存在,會導(dǎo)致軌跡很難收斂到目標(biāo)點,不能保證電子元件能夠成功地插入PCB板中,因此,本文提出在最后時間段內(nèi)將非線性函數(shù)項減小為0,使得學(xué)習(xí)到的軌跡能夠準(zhǔn)確收斂到目標(biāo)點。改進后的強迫函數(shù)定義為:
由于非線性強迫函數(shù)為通過高斯基函數(shù)及其權(quán)重加權(quán)所得,因此還需要構(gòu)造損失函數(shù),然后采用局部加權(quán)回歸(Locally Weighted Regression,LWR)方法計算得到高斯基函數(shù)的基本參數(shù)。
將式(6)的上半部分代入式(9)并展開,構(gòu)造損失函數(shù)為:
其中:
式中:為整條軌跡的總時間步長。
當(dāng)機器人存在冗余自由度時,如冗余機器人或者任務(wù)自由度小于機器人自由度,機械臂會有無窮多的逆解。這會導(dǎo)致在笛卡爾空間學(xué)習(xí)到的軌跡雖在末端滿足相似度要求,但關(guān)節(jié)空間的軌跡卻不能保證和演示軌跡相似,進而導(dǎo)致機器人可能會與示教過程中刻意避開的障礙物發(fā)生碰撞。所以演示過程中需采集關(guān)節(jié)空間軌跡,進行關(guān)節(jié)空間運動軌跡的學(xué)習(xí)。
對于動態(tài)運動基元算法在機器人中的應(yīng)用,需要在機器人的各個自由度上分別進行學(xué)習(xí)。多自由度的DMPs可以通過式(5)將各個自由度上的運動耦合成為整體的運動。這使得DMPs算法可以方便地應(yīng)用于多自由度機械臂中。如圖1所示,將采集的關(guān)節(jié)空間演示軌跡在式(5)下分解成各個關(guān)節(jié)上的一維運動,然后在各個自由度上建立DMPs的運動模型,分別學(xué)習(xí)各個模型的參數(shù),從而實現(xiàn)演示軌跡的學(xué)習(xí)。
圖1 關(guān)節(jié)空間多自由度DMP耦合
為了將提出的改進DMPs算法用于電子元件的裝配,本文基于Franka Emika Panda機器人搭建了一個電子元件裝配平臺,如圖2所示。
圖2 裝配系統(tǒng)實驗平臺搭建
Panda機器人為一款7自由度協(xié)作機器人,其各關(guān)節(jié)均安裝有力矩傳感器,可以感知人的外部作用力,用于本實驗中機器人軌跡演示。實驗過程為:
(1)利用笛卡爾阻抗控制[10]進行拖動示教。操作人員根據(jù)裝配要求,拖動機器人演示合適的裝配路徑,避開環(huán)境中的障礙物。通過機器人的數(shù)據(jù)接口記錄裝配過程中的機器人各關(guān)節(jié)角度。
(2)利用線性二次型最優(yōu)控制系統(tǒng)對演示軌跡數(shù)據(jù)中的噪聲進行濾波;利用DMPs算法對演示軌跡進行學(xué)習(xí),實現(xiàn)演示軌跡的裝配復(fù)現(xiàn);修改裝配任務(wù)的目標(biāo)位置,生成新的軌跡完成裝配任務(wù),從而驗證本文提出算法的可行性和有效性。
擬安裝三種不同的電子元器件到PCB板,并使電子元件緊貼PCB板底部。如圖3所示。
圖3 裝配產(chǎn)品實物圖
考慮到電子元件的引腳需與PCB板完全垂直,為了降低操作人員演示裝配軌跡的難度,順利地將電子元件輕松插入PCB板中,本文限制了演示過程中末端夾爪繞軸、軸旋轉(zhuǎn)的兩個自由度,使其始終垂直于PCB板。具體實現(xiàn)方法為:采用笛卡爾阻抗控制算法來控制機器人,將阻抗參數(shù)中繞軸、軸旋轉(zhuǎn)的剛度和阻尼設(shè)置為較大的值。
針對電子元件裝配,其示教過程如圖4所示。控制機器人夾爪抓取三個電子元件中的任意一個,雙手拖動末端夾爪,從夾取起始位置開始,按圖4(a)~(d)的順序示教出一條能避開障礙物的軌跡。
最終將電子元件插入PCB板中對應(yīng)位置完成裝配任務(wù)。并在示教過程中實時獲取當(dāng)前軌跡點數(shù)據(jù)。
圖4 裝配軌跡演示
將演示的裝配軌跡經(jīng)線性二次型最優(yōu)控制方法濾波后,再利用改進的動態(tài)運動基元方法對演示軌跡進行學(xué)習(xí)。為了驗證DMPs算法在機器人電子元件裝配過程中對演示軌跡的學(xué)習(xí)能力,在不改變裝配目標(biāo)點的情況下,利用DMPs算法復(fù)現(xiàn)演示軌跡;再將裝配目標(biāo)點改變?yōu)閷嶋H插入點,利用DMPs算法得到新的軌跡。演示的目標(biāo)點和實際裝配點在PCB板的位置如圖5所示。
3.2.1 目標(biāo)位形不發(fā)生變化的運動軌跡規(guī)劃
對于機器人關(guān)節(jié)空間運動軌跡的學(xué)習(xí),設(shè)置DMPs的維度為7;高斯基函數(shù)的數(shù)量為600;時間步長為0.001 s。在不改變裝配目標(biāo)關(guān)節(jié)位置時,DMPs生成的復(fù)現(xiàn)軌跡與演示軌跡的對比如圖6所示。其中圖6(a)是通過正運動學(xué)計算得到的末端軌跡點。
圖5 裝配位置插入點示意圖
由圖6可知,不改變裝配目標(biāo)位置時,經(jīng)過DMPs生成得到的復(fù)現(xiàn)軌跡與演示軌跡基本重合。計算復(fù)現(xiàn)軌跡與演示軌跡在七個關(guān)節(jié)上的誤差,并對該誤差取均值得表1,可以看出,當(dāng)不改變裝配目標(biāo)關(guān)節(jié)位置時,DMPs算法學(xué)習(xí)到的軌跡與原始演示軌跡重合精度較高,證明了該算法能夠有效地學(xué)習(xí)并復(fù)現(xiàn)機器人關(guān)節(jié)空間的運動軌跡。
表1 復(fù)現(xiàn)軌跡與演示軌跡誤差對比
3.2.2 目標(biāo)位形發(fā)生變化的運動軌跡規(guī)劃
將圖6中的運動軌跡作為演示軌跡,改變產(chǎn)品裝配的目標(biāo)位置,通過DMPs算法學(xué)習(xí)得到新的裝配軌跡。
圖6 末端及機械臂各個關(guān)節(jié)的演示軌跡與復(fù)現(xiàn)軌跡對比圖
演示軌跡的目標(biāo)關(guān)節(jié)位置為(-0.4225 rad, 0.0525 rad, -0.0940 rad, -2.2803 rad, -0.0625 rad, 2.3389 rad, 0.3501 rad);產(chǎn)品裝配的目標(biāo)關(guān)節(jié)位置變?yōu)椋?0.3422 rad, 0.1106 rad, -0.0243 rad, -2.2133 rad, -0.0651 rad, 2.3221 rad, 0.5012 rad),其中,改變的目標(biāo)關(guān)節(jié)位置是根據(jù)圖5中PCB上產(chǎn)品的實際安放位置得到;實際學(xué)習(xí)到的軌跡的目標(biāo)關(guān)節(jié)位置為(-0.3421 rad, 0.1105 rad, -0.0246 rad, -2.2131 rad, -0.0653 rad, 2.3223 rad, 0.5013 rad),與給定目標(biāo)位置誤差為0.0002 rad。通過機器人正運動學(xué)計算得到實際目標(biāo)位置的坐標(biāo)為(0.5031 m, -0.2000 m, 0.2253 m),理想位置坐標(biāo)為(0.5030 m, -0.1999 m, 0.2251 m),兩者之間誤差的平均值為0.00013 m。
由此可見,在修改演示軌跡的目標(biāo)關(guān)節(jié)位置后,DMPs算法能夠很好地收斂到新的目標(biāo)位置。
改變產(chǎn)品裝配的目標(biāo)關(guān)節(jié)位置后,DMPs生成的裝配軌跡與演示軌跡對比如圖7所示。
圖7(a)是通過正運動學(xué)計算得到的末端軌跡點,可以看出,通過DMPs算法生成的裝配軌跡仍保持了演示軌跡的運動趨勢。
由圖7(b)~(h)可以看出,通過DMPs算法生成的裝配軌跡與演示軌跡在各個自由度上的運動趨勢相似,僅是收斂的目標(biāo)點位置發(fā)生了變化,從而證明本文提出的改進DMPs算法能夠有效地應(yīng)用于目標(biāo)關(guān)節(jié)位置發(fā)生改變的裝配任務(wù)。
圖7 末端及機械臂各個關(guān)節(jié)的演示軌跡與改變目標(biāo)值后的新軌跡對比圖
3.2.3 機器人裝配過程
將本文所提出的算法應(yīng)用于實際機器人裝配,如圖8所示。機器人可以按照學(xué)習(xí)到的軌跡進行運動,并最終將電子元件插入PCB板中。
圖8 修改任務(wù)目標(biāo)點裝配過程
對于圖3中三種不同的電子元件,機器人都能夠根據(jù)演示軌跡和實際安裝位置,很好地學(xué)習(xí)出新的軌跡來完成裝配任務(wù),將電子元件準(zhǔn)確地插入PCB板上給定的位置中。由此可以得出:本文提出的基于動態(tài)運動基元的運動規(guī)劃方法能夠很好地應(yīng)用于機器人PCB板的裝配任務(wù)。該方法不僅適用于具有障礙物的裝配任務(wù)環(huán)境,而且適用于安裝位置經(jīng)常發(fā)生改變的任務(wù),提高了機器人電子元件裝配過程中軌跡規(guī)劃的效率,從而驗證了本文所建立的基于動態(tài)運動基元的機器人電子元件裝配平臺具有適用性和實用性。
本文搭建了一個基于DMPs方法的機器人PCB板電子元件裝配平臺,并在Franka Emika Panda機器人上對三種不同的電子元器件進行了裝配實驗。利用笛卡爾阻抗控制演示了從障礙物前方通過的裝配軌跡,在演示過程中實現(xiàn)避障;對DMPs算法進行了改進,使之能適用于實際的機器人電子元器件裝配,利用改進的DMPs方法對演示的裝配運動軌跡進行學(xué)習(xí),實現(xiàn)裝配過程的復(fù)現(xiàn);修改任務(wù)點的目標(biāo)位置,實現(xiàn)對裝配運動軌跡的泛化。實驗結(jié)果表明:本文提出的基于動態(tài)運動基元的機器人電子元器件裝配方法可以快速有效地完成至少三種不同類型電子元器件的裝配任務(wù)。未來可以加入視覺處理,從而更方便地獲取新任務(wù)點以及障礙物位置。
[1]未來10年工業(yè)機器人與協(xié)作機器人市場發(fā)展預(yù)測[J]. 機械,2017,44(10):54.
[2]劉乃軍,魯濤,蔡瑩皓,等. 機器人操作技能學(xué)習(xí)方法綜述[J]. 自動化學(xué)報,2019,45(3):458-470.
[3]計時鳴,黃希歡. 工業(yè)機器人技術(shù)的發(fā)展與應(yīng)用綜述[J]. 機電工程,2015,32(1):1-13.
[4]周忠祥,胡晉,王越,等. 機器人演示編程技術(shù)的研究進展[J]. 自動化博覽,2020,37(6):48-57.
[5]張愛紅,張秋菊. 機器人示教編程方法[J]. 組合機床與自動化加工技術(shù),2003(4):49-51.
[6]Ravichandar H,Salehi I,Dani A. Learning Partially Contracting Dynamical Systems from Demonstrations[C]. Proceedings of the 1st Annual Conference on Robot Learning. PMLR,2017:369-378.
[7]Schaal S. Dynamic movement primitives-a framework for motor control in humans and humanoid robotics[J]. Adaptive motion of animals and machines, 2006:261-280.
[8]Karlsson M,Carlson F B,Robertsson A,et al. Two-Degree-of- Freedom Control for Trajectory Tracking and Perturbation Recovery during Execution of Dynamical Movement Primitives[J]. Ifac Papersonline,2017,50(1):1923-1930.
[9]Kulvicius T,Ning K,Tamosiunaite M,et al. Joining Movement Sequences:Modified Dynamic Movement Primitives for Robotics Applications Exemplified on Handwriting[J]. IEEE Transactions on Robotics,2012,28(1):145-157.
[10]Albu-Schffer A,Hirzinger G. Cartesian impedance control techniques for torque controlled light-weight robots[C]. IEEE International Conference on Robotics & Automation. 2002:657-663.
Research on Assembly Trajectory Planning Method of Robot Electronic Components Based on Dynamic Movement Primitives
LI Cheng,ZHOU Ziling,TANG Qing
( School of Mechanical Engineering, Sichuan University, Chengdu 610065, China )
Considering that the variety of electronic components and PCB boards in the electronic component assembly task and the frequent replacement of product types in the production process leads to the change of assembly trajectories and other problems, in this paper, a robot trajectory planning method based on dynamic movement primitives for electronic component assembly is proposed. Firstly, the system equation of dynamic movement primitive is established to model the robot motion; secondly, the parameters of the nonlinear function are learned according to the demonstration trajectory, and the weight coefficient of the demonstration trajectory is obtained by using the local weighted regression method of nonlinear optimization; then, the nonlinear function term in the equation is weighted piecewise, so that the system can stably converge to the target assembly pose; finally, a robot dragging algorithm with end pose constraints is designed to demonstrate the trajectory on the Panda robot. The autonomous assembly trajectory of the robot is generated respectively when the target pose changes or do not change, and the assembly of three different electronic components is verified on the Panda robot. The results show that the robot motion trajectory learned based on the improved dynamic movement primitive method can not only imitate the motion trend of the demonstration trajectory well, but also reach the target specified pose with high precision, which completes the assembly task well.
assembly;dynamic movement primitives;trajectory planning
TP242.6
A
10.3969/j.issn.1006-0316.2023.01.010
1006-0316 (2023) 01-0059-09
2022-06-17
四川省科技計劃(2020YFG0116,2020YFG0074)
李成(1998-),男,四川達州人,碩士研究生,主要研究方向為機器人運動控制、人機協(xié)作,E-mail:15760469379@163.com。*通訊作者:湯卿(1982-),男,四川成都人,博士,副教授、碩士生導(dǎo)師,主要研究方向為機器人的設(shè)計與制造、機器人感知控制與規(guī)劃、人機協(xié)作與共融,E-mail:tangqing_scu@163.com。