楊琨 夏信凱 馬環(huán)洲 桑勝波
(太原理工大學信息與計算機學院,太原,030002)
在工業(yè)化進程中,人類一直在探索如何更大程度地解放雙手、解放勞動力,機器人作為一種自動執(zhí)行工作的機器裝置應運而生。自上世紀60年代機器人被部署在生產(chǎn)線之后,工業(yè)生產(chǎn)效率得到極大提升。隨著技術的進步,工業(yè)機器人越來越多地應用到工業(yè)生產(chǎn)的各個方面,人機共存、人機交互、多機協(xié)調(diào)等復雜工業(yè)場景日漸增多,如圖1所示。
圖1 工業(yè)機器人的人機交互場景
隨著人機交互的深入,人們發(fā)現(xiàn),傳統(tǒng)機器人慣量大、速度高,極易發(fā)生安全事故,尤其當操作人員與機器人手臂協(xié)作完成作業(yè)時,人與機械臂近距離頻繁接觸,這對操作人員的人身安全造成潛在威脅,甚至直接造成傷害。據(jù)統(tǒng)計顯示,機器人對人造成的傷害56%被歸類為夾傷,44%被歸類為撞擊傷,其中操作人員遭受傷害的風險最大。2016年,美國阿拉巴馬州一家汽車零部件生產(chǎn)商的操作工人被機器人壓傷致死;2019年12月,亞馬遜自動化倉庫發(fā)生機器人事故,造成24名員工受傷被緊急送往醫(yī)院。在我國也發(fā)生過多起類似的機器人安全事故,2018年安徽蕪湖耐世特凌云有限公司一名操作人員在為搬運機器人更換刀具時,被機器人夾傷,最終因傷重不治身亡;2019年,某冶煉廠一名操作員在對作業(yè)空間進行清掃時,被取錠機械臂擠壓胸腔,最終經(jīng)搶救無效死亡。生產(chǎn)過程中由機器人引發(fā)的事故頻發(fā),這不僅造成生產(chǎn)資源的浪費,更是給操作人員帶來沉重的身心負擔和傷害,長此以往對企業(yè)的生產(chǎn)進程造成極大阻礙。
針對頻繁發(fā)生的由機器人引發(fā)的工業(yè)生產(chǎn)安全事故,我國在2013 年和2015年分別頒布了《機器人與機器人裝備:工業(yè)機器人的安全要求》國家標準[1]和《〈中國制造2025〉重點領域技術路線圖》[2],二者都明確提出了對協(xié)作機器人的安全要求:協(xié)作機器人在其協(xié)作工作空間內(nèi)須能夠提供必要的保護措施以確保操作員的安全。因此,在我國由傳統(tǒng)制造向智能制造轉(zhuǎn)型的關鍵時期,開展機械臂安全交互問題的研究、建立安全運行的工業(yè)機器人平臺,對于減少人員傷亡、促進制造業(yè)的發(fā)展具有重要的現(xiàn)實意義,并且與國家戰(zhàn)略規(guī)劃提出的安全要求相契合。
工業(yè)機器人安全主要包括主動安全和被動安全兩種方式。目前在制造業(yè)生產(chǎn)中,企業(yè)通常采用電子圍欄或行業(yè)規(guī)范等被動安全方式保證工作場景的安全,但這些方式存在靈活性和安全實時性差等問題。因此,如何變被動防護為主動規(guī)避、提升機械臂的主動安全性能成為新興的研究方向。
工業(yè)機器人的主動安全技術研究主要從主動安全交互感知方法、主動安全柔順控制及機器人運動規(guī)劃方法三方面開展,下面分別介紹。
機器人—環(huán)境物理交互控制要求機器人具有力感知能力[3]。在傳統(tǒng)的操作任務中,機械臂末端的靜態(tài)接觸力可以通過多維力傳感器來測量。但對于動態(tài)操作任務,末端執(zhí)行器的慣性力/力矩對于末端力傳感器的測量精度有著不可忽視的影響,并且這些方法大多是基于安裝在機器人末端上的多維力傳感器,只能感知到機器人末端執(zhí)行器上的接觸力,無法實現(xiàn)全機身外力感知[4]。在工業(yè)機器人的實際運行過程中,機器人與環(huán)境之間的接觸局域并不僅僅局限于末端執(zhí)行器,僅針對末端監(jiān)測的交互方法具有很大的局限性,因此,研究具有全機身外力感知能力的機器人系統(tǒng)并研究其柔順控制技術,對協(xié)作機器人的發(fā)展具有重要的理論意義和應用價值。
常見機械臂全身的主動安全交互感知方式主要有無傳感器檢測、視覺檢測及觸覺檢測等。
無傳感器交互感知是指不借助外部傳感器實現(xiàn)人機交互感知,其中應用最為廣泛的是基于廣義動量擾動觀測器的碰撞檢測方法。該方法由Luca等人[5]于2003年首次提出,利用機械臂廣義動量與外力矩相互解耦的特點,設計了動量觀測器間接獲取碰撞力,只需獲得機器人關節(jié)位置信息即可實現(xiàn)碰撞實時檢測。Luca等人[6-7]采用該方法,在機械臂上完成了對氣球及人體的良好碰撞檢測,如圖2所示。在隨后的研究當中,Haddadin等人[8]基于該方法在LWR-III平臺上實現(xiàn)了對人體頭部、前胸及手部的快速碰撞檢測及響應,避免機器人對人皮膚造成損害。
圖2 基于廣義動量擾動觀測器的碰撞檢測方法
雖然采用基于廣義動量擾動觀測器的方法進行碰撞檢測時,可以減少傳感器的使用,但在該方法建模過程中,對碰撞力矩進行的近似計算,使得檢測精度下降,無法實現(xiàn)對具體交互位置的精準定位與檢測,因此需要使用傳感器進行交互感知以進一步提高檢測精度。
視覺傳感器實現(xiàn)交互感知是指利用攝像機或激光傳感器等獲得環(huán)境信息,并采用相應的圖像處理算法實現(xiàn)碰撞預測或檢測。Kulic等人[9]通過機器視覺檢測操作人員的肢體位置,構造危險系數(shù),實時計算潛在碰撞點;Flacco等人[10]提出了一種基于縱深空間概念的快速檢測機械臂與障礙間距的方法,在七自由度機械臂平臺中實現(xiàn)了障礙物的動態(tài)躲避,如圖3所示。國內(nèi)學者也針對視覺檢測方法進行了研究。居鶴華等人[11]提出了基于虛擬傳感器的巡視器機械臂碰撞檢測算法,用于避免機械臂與環(huán)境發(fā)生干涉,提高了碰撞檢測精度;郝慧琴[12]等提出采用單目視覺技術完成障礙物的檢測,計算人機相對距離,并根據(jù)所得的信息對機械臂進行避障規(guī)劃。
圖3 基于縱深空間概念的視覺碰撞檢測
為了更好地實現(xiàn)人機交互,科學家們從仿生角度出發(fā),開展了基于觸覺的交互感知研究,其中應用較廣的是電子皮膚方式。電子皮膚是一種可以使機器人產(chǎn)生觸覺的系統(tǒng),它可被加工成多種形狀,并作為機器人的本體感知系統(tǒng)附著在機器人表面。
早在2004年,日本的Takao Smeya團隊[13]便研制出了可以同時獲取接觸力及溫度信息的電子皮膚,并將電子皮膚用于機器人手進行壓力測試,實現(xiàn)機械手的抓取。
隨著電子皮膚集成及檢測技術的不斷發(fā)展,國外一些廠商開發(fā)了基于電子皮膚的工業(yè)機械臂平臺。德國博世(BOSCH)公司[14]研發(fā)了一套基于安全的APAS人機操作系統(tǒng),該系統(tǒng)帶有的傳感器皮膚可保障人與機器之間的安全協(xié)作,系統(tǒng)中保留了前端視覺系統(tǒng)以實現(xiàn)空間內(nèi)的物體識別和定位;奧地利Blue Danube Robotics公司設計了AIRSKIN電子皮膚系統(tǒng),可以簡單方便地安裝在機器人上,它幾乎適用于任何機器人和應用程序,也是機器人末端工具(EOAT)有效的安全解決方案[15],如圖4(a)所示。
國內(nèi)一些單位也針對電子皮膚開展了研究。合肥工業(yè)大學的黃英等人[16]基于炭黑—硅橡膠顯著的壓阻效應設計了四電極對稱結構的三位力傳感器,可應用于機器人的敏感皮膚;在此電子皮膚的基礎上,郭小輝[17-18]對電子皮膚的柔性觸覺感知方法進行了研究,設計出主從手操作平臺,實現(xiàn)主從手映射下機器人靈巧手對目標物抓取穩(wěn)定性信息的獲取;本文作者所在太原理工大學的微納系統(tǒng)研究中心團隊設計了一種具有多孔透氣結構的壓阻式電子皮膚觸覺傳感陣列,如圖4(b)所示,并研究了非可展開曲面上基于3D打印技術的電子柔性陣列制造工藝技術[19-20],為傳感器在機械臂表面的包裹安裝奠定良好基礎。
圖4 基于觸覺電子皮膚的交互感知
除接觸式交互感知外,具有接近感知能力的電子皮膚也得到了廣泛關注。物體接近信息的感知可以通過超聲波、紅外等多種方式實現(xiàn),其中電容式傳感原理傳感器由于其較好的柔性、集成性及可擴展性等優(yōu)勢而得到更多研究者的青睞。意大利理工學院的Viry等人[21]設計了一種全柔性電容式三軸力觸覺傳感器,通過檢測電容變化可實現(xiàn)對多維力的高靈敏度檢測;韓國首爾大學的Joo等人[22]研發(fā)了一種電容式電子皮膚觸覺傳感器,該傳感器的表層和底層電極是銀納米線,介質(zhì)層是PDMS,最小可檢測到物體的質(zhì)量是0.04g,其壓力的靈敏度高:在45~100 Pa 的低壓區(qū)為3.80kPa-1。國產(chǎn)機器人企業(yè)越疆公司研發(fā)了如圖5所示的CR系列機械臂[23],該機械臂采用Dobot SafeSkin安全皮膚技術,無需提前預警降速,在即將發(fā)生碰撞時對自身行為迅速做出干預,中低速運動時能夠完全避免碰撞發(fā)生,高速運動下碰撞損傷降低90%,避免傷害的發(fā)生,充分滿足工業(yè)生產(chǎn)的高效率與高安全性需求。
圖5 越疆公司CR系列協(xié)作機器人
當代工業(yè)機器人的應用場景對機器人的柔順性提出了更高的要求,根據(jù)機械臂輸出反饋信號(位置、力、速度)和輸入信號的不同,柔順控制方法可分為經(jīng)典柔順控制方法、先進柔順控制方法和智能柔順控制方法。
柔順控制一般有兩種不同的方式,一種是通過機器人本身的柔順部件,例如彈簧、消震器等來適應外部環(huán)境的變化,稱為被動柔順;另一種是通過力傳感器獲取機器人與環(huán)境的相互作用力信息,使機器人能夠快速響應力信息并保持運動的平穩(wěn)性,稱為主動柔順控制。主動柔順控制在上世紀70年代就被提出,經(jīng)歷了很長時間的發(fā)展,現(xiàn)如今經(jīng)典柔順控制可以分為力/位混合控制與阻抗控制。
2.1.1 力/位混合控制
根據(jù)力與位置的正交關系,Raibert和Craig[24]于1981年提出了力/位置混合控制的概念。這種方法基于交互操作時機器人位置子空間與力子空間的互補性和正交性進行力和位置的解耦控制,也就是在位置子空間進行位置控制,在力子空間進行力控制,主要用于需要精確力控的場合,其結構框圖如圖6所示。
圖6 力/位混合控制框圖
機器人力/位置混合控制過程可以分成接觸和非接觸兩個基本運動狀態(tài)以及這兩個狀態(tài)之間的轉(zhuǎn)換。此類力控制方法可以控制作用力跟隨期望值變化,但控制器的結構依賴于機器人與接觸環(huán)境的動力學特性,當機器人在接觸環(huán)境不同的空間之間運動時需變換控制器。
孫海波[25]通過對機器人剛體變形進行了分析,提出一種基于零空間矢量的六自由度機械手臂的力/位混合控制算法,利用機械手臂末端的冗余性來對其進行關節(jié)角速度的冗余求解,通過設置優(yōu)化性能指標來對力進行優(yōu)化控制,實現(xiàn)了對機械臂的穩(wěn)定控制。Chaudhary等人[26]提出了一種混合式AFSPD+I力/位置控制器,用于在實際約束環(huán)境中具有不確定的機器人動力學和外部干擾的機器人操縱臂的軌跡控制;Huang等人[27]為避免計算常規(guī)混合位置和力控制中使用的雅可比逆矩陣,提出了兩種差分逆運動學方法,將約束坐標的位置誤差和姿態(tài)誤差返回到關節(jié)坐標的角度誤差,建立了一種混合控制結構,以提供控制精度和實用性,并使用RPY型6自由度機械手進行了白板字符擦除實驗,如圖7所示。實驗的結果證實了該混合控制在表面接觸工作中的有效性。
圖7 RPY型六自由度機械手進行字符擦除實驗
經(jīng)過多年發(fā)展,力/位混合控制的研究己經(jīng)越來越成熟,但是力/位混合控制嚴重依賴環(huán)境建模的準確度,不精確的環(huán)境建模將會轉(zhuǎn)化為接觸時的碰撞力,可能會對機械臂造成不可預估的影響。
2.1.2 阻抗控制
力/位置混合控制對位置和力進行分別控制,存在魯棒性差、依賴環(huán)境建模、編程計算量大等問題。阻抗控制在未知環(huán)境中具有抗干擾魯棒性高等特點,而且編程簡單計算量少,更加適用于復雜的接觸環(huán)境。
阻抗控制是指對機器人的期望機械阻抗進行控制,將交互點處速度到交互力之間的傳遞關系用“阻抗”來描述。Hogan[28-30]在1985年根據(jù)電路中阻抗的概念與特點提出了阻抗控制。阻抗控制的特點是不直接控制機器人與接觸環(huán)境的作用力,而是根據(jù)機器人末端的位置(或速度)和末端作用力之間的關系,調(diào)整反饋位置誤差、速度誤差或剛度來控制作用力。
Seraji等人[31]設計了兩個在線方案用于阻抗控制框架內(nèi)進行力跟蹤,并用一個7自由度機器臂進行動力學仿真研究,證明了該方案能夠補償環(huán)境剛度與位置的不確定性;Calanca等人[32]在激勵和促進阻抗控制中積極的加速反饋方面進行了研究,論證了相對于現(xiàn)有解決方案的更高的穩(wěn)定性與優(yōu)越的準確性,通過SEA的阻抗控制解決方案的缺失無源結果。該結果顯示了通用的Z寬度限制,適用于除基于加速度的控制之外的所有架構;Li等人[33]設計了一種由串聯(lián)彈性執(zhí)行器(SEA)驅(qū)動的康復機器人的迭代學習阻抗控制器,通過迭代方式獲得所需的阻抗模型,該模型通過重復任務學習治療過程,可以實現(xiàn)所需阻抗到零的收斂,并保證機器人的瞬態(tài)性能,如圖8所示;Li等人[34]提出了一種針對機器人操作器的新型自適應阻抗控制,其末端執(zhí)行器的運動受到人體手臂運動極限的限制;并通過實驗驗證了所提出的控制器在協(xié)作操作員執(zhí)行人機協(xié)作任務方面是有效的,可以最大程度地減少運動跟蹤誤差。
圖8 上肢康復機器人
經(jīng)典柔順控制在簡單操作任務中可以有效地控制力和位置,但在完成復雜任務時,面臨著模型參數(shù)不確定、接觸環(huán)境不確定及外界干擾等問題,從控制效果和適用范圍來看仍有不足,無法使其推廣應用,從而需要研究先進柔順控制方法來克服這些問題。
先進柔順控制可分為自適應柔順控制與魯棒柔順控制等方式。
2.2.1 自適應柔順控制
自適應控制的研究對象是具有一定程度不確定性的系統(tǒng),這里所謂的“不確定性”是指被控對象及其環(huán)境的數(shù)學模型不是完全確定的,其中包含一些未知因素和隨機因素,自適應控制能修正自己的特性以適應對象和擾動的動態(tài)特性的變化。
自適應柔順控制是在經(jīng)典柔順控制方法中加入了一些自適應策略,使得當機器人和環(huán)境存在不確定因素與未知參數(shù)時仍然可以獲得需要的阻尼或阻抗。如圖9為自適應柔順控制的一般結構框圖。
圖9 自適應柔順控制框圖
機器人自適應柔順控制方法可以分為兩類:間接自適應方法[35-40]和直接自適應方法[41-46]。
間接自適應方法中存在一個參數(shù)估計器對機器人柔順控制系統(tǒng)中的未知參數(shù)進行估計,估計器得到的參數(shù)用于設計自適應律。Mendes等人[37]研究了在混合力/運動解決方案中作用力控制器的間接自適應模糊控制器的行為,提出的自適應控制器將模糊系統(tǒng)的參數(shù)初始化為零,不需要機器人的數(shù)學模型以及確??刂谱兞康氖諗啃?;Mohanty等人[38]合成了一種間接自適應魯棒控制器(IARC),提議的IARC著重于對未知參數(shù)的準確估計,用于單桿液壓執(zhí)行器驅(qū)動電液的精確運動控制,可以適應系統(tǒng)的不確定性。
由于間接自適應方法需要精確的機器人參數(shù)和接觸環(huán)境的模型,在實際應用中往往比較困難或者難以實現(xiàn),所以直接自適應方法在機器人力控制中得到越來越多的應用。Zirkohi等人[44]利用Legendre多項式(LP)和Fourier級數(shù)(FS)等函數(shù)逼近技術(FAT),提出了一種簡單的電動機械手無模型控制器,根據(jù)正交函數(shù)定理,LP與FS可以以任意小的逼近誤差逼近非線性函數(shù),直接自適應函數(shù)逼近技術可以作為控制器來控制機器人機械手的運動;Yin等人[46]提出了一種直接自適應魯棒跟蹤控制方法,該控制器是根據(jù)六自由度機器人末端執(zhí)行器的工作空間中的動態(tài)特性設計的,應用于存在參數(shù)不確定性、外部干擾和非線性不確定性等情況的六自由度工業(yè)機器人的軌跡跟蹤,并用六自由度裝配工業(yè)機器人驗證了所設計的控制器可以實現(xiàn)更好的軌跡跟蹤性能,如圖10所示。
圖10 六自由度裝配工業(yè)機器人實驗平臺
2.2.2 魯棒柔順控制
自適應控制存在控制精度與系統(tǒng)穩(wěn)定性問題,所以需要在自適應控制中引入魯棒控制來提高系統(tǒng)的穩(wěn)定性。魯棒性(robustness)就是系統(tǒng)的健壯性,它是在異常和危險情況下系統(tǒng)生存的關鍵。所謂“魯棒性”,是指控制系統(tǒng)在一定(結構,大?。┑膮?shù)攝動下,維持某些性能的特性。
魯棒控制是一個著重控制算法可靠性研究的控制器設計方法,一旦設計好這個控制器,它的參數(shù)不能改變。魯棒性一般定義為在實際環(huán)境中為保證安全要求控制系統(tǒng)最小必須滿足的要求。魯棒控制方法,是對時間域或頻率域來說,一般假設過程動態(tài)特性的信息和它的變化范圍。一些算法不需要精確的過程模型但需要一些離線辨識。
魯棒柔順控制器基于對不確定性的描述參數(shù)和標稱系統(tǒng)的數(shù)學模型來設計,以固定的控制器保證在機器人和環(huán)境之間存在模型誤差時,系統(tǒng)能穩(wěn)定并且達到需要的動態(tài)性能,無需自適應算法,運算速度快,實時性好。圖11為魯棒柔順控制結構簡圖,魯棒柔順控制器的輸出包括兩部分:魯棒控制律和反饋控制律,反饋控制律通常為PI、PD、PID等,魯棒柔順控制的難點在于如何設計一個好的魯棒控制律,魯棒控制律通常采用李雅普諾夫直接方法得到。
圖11 魯棒柔順控制框圖
葉正茂等人[47]提出基于六自由度并聯(lián)機器人位置內(nèi)環(huán)的柔順力控制策略,綜合考慮參數(shù)變化、模型變動和外來的干擾等不確定性,利用了綜合控制理論設計魯棒力控制器,并通過分析比較魯棒力控制器和經(jīng)典力控制器的魯棒穩(wěn)定性與魯棒性能,得出魯棒力控制器的有效性與優(yōu)越性;陳棟金[48]研究了基于混合位置/力矩控制策略的機器人靈巧手指基關節(jié)的柔順控制方法,在自由空間中和約束空間的位置控制方向上,采用具有魯棒性平滑非線性反饋(SRNF)的補償器的PD位置控制算法實現(xiàn)精確、平滑的軌跡跟蹤;在約束空間的力控制上,采用改進的純積分力控制算法實現(xiàn)精確的力控制;Jin等人[49]結合時延估計技術和理想速度反饋提出了一種簡單的魯棒柔順運動控制技術,用于具有非線性摩擦的機器人操作器,所提出的控制器具有簡單的結構,且無需建模摩擦即可提供良好的在線摩擦補償,如圖12所示,用工業(yè)機器人進行實驗,顯示其具有良好的魯棒性。
圖12 一種簡單柔順技術控制工業(yè)機器人運動
隨著計算機技術與控制理論發(fā)展水平的不斷提高,智能控制方法得到廣泛的應用。傅京孫教授于1971年首先提出了智能控制的二元交集理論,即人工智能和自動控制的交叉,美國的薩里迪斯(G.N.Saridis)于1977年把傅京孫教授的二元結構擴展為三元結構,即人工智能、自動控制和運籌學的交叉,后來中南大學的蔡自興教授又將三元結構擴展為四元結構即人工智能、自動控制、運籌學和信息論的交叉,從而進一步完善了智能控制的結構理論,形成智能控制的理論體系。
智能柔順控制可分為神經(jīng)網(wǎng)絡控制與機器學習控制等。
2.3.1 神經(jīng)網(wǎng)絡柔順控制
神經(jīng)網(wǎng)絡控制是20世紀80年代末期發(fā)展起來的自動控制領域的前沿學科之一。它是智能控制的一個新的分支,為解決復雜的非線性、不確定、不確知系統(tǒng)的控制問題開辟了新途徑。神經(jīng)網(wǎng)絡控制是指在控制系統(tǒng)中,應用神經(jīng)網(wǎng)絡技術,對難以精確建模的復雜非線性對象進行神經(jīng)網(wǎng)絡模型辨識,或作為控制器,或進行優(yōu)化計算,或進行推理,或進行故障診斷,或同時兼有上述多種功能。
近年來,將神經(jīng)網(wǎng)絡應用于機器人力控制的研究引起學者極大的關注,這是由于神經(jīng)網(wǎng)絡具有自適應性和自學習性的特點,與傳統(tǒng)控制方法相比具有很大的優(yōu)越性。這方面的研究大體可分為兩類:一類是假定機器人動力學模型完全未知,神經(jīng)網(wǎng)絡通過學習來逼近系統(tǒng)的動力學或逆動力學模型,以實現(xiàn)反饋控制或逆動力學控制;另一類是假定機器人動力學模型為部分已知的,神經(jīng)網(wǎng)絡被用來學習模型中的未知參數(shù),以減少在線計算的負擔。
Connolly等人[50]將多層前向神經(jīng)網(wǎng)絡用于機器人力/位置混合控制,根據(jù)檢測到的作用力和位置,利用神經(jīng)網(wǎng)絡計算出人為約束和選擇矩陣,并進行了插孔實驗;Masatoshi等人[51]用四層前饋神經(jīng)網(wǎng)絡構造神經(jīng)網(wǎng)絡控制器,能將接觸力控制到不穿破紙的極小范圍,但此控制方法針對性強,缺少普遍性;Fukuda等人[52]將機器人力控制系統(tǒng)作為大系統(tǒng)進行研究,基于大系統(tǒng)理論、模糊理論和神經(jīng)網(wǎng)絡提出的“智能力/位置并環(huán)控制策略”,智能力/位置并環(huán)控制的基本原理是將力和位置并行輸入,利用模糊神經(jīng)網(wǎng)絡進行綜合,輸出為位置量,不改變機器人本身的位置伺服系統(tǒng),充分利用原來機器人位置控制的高精度;He等人[53]研究了一種基于阻抗學習的自適應模糊神經(jīng)網(wǎng)絡控制方法,用于約束機器人在未知的系統(tǒng)動力學、狀態(tài)約束的影響以及不確定的柔性環(huán)境下的控制;Liu等人[54]提出了一種基于BP神經(jīng)網(wǎng)絡的DELTA并聯(lián)機器人運動學求解方法,來解決DELTA并聯(lián)機器人復雜的運動學正解和多解問題,并用MATLAB進行仿真,結果表明,采用遺傳算法改進的BP神經(jīng)網(wǎng)絡模型來解決DELTA并聯(lián)機器人的運動學正解問題是可行的,可以達到對DELTA并聯(lián)機器人控制速度和精度要求較高的目的,在一定程度上避免了傳統(tǒng)方法的缺點,而且確保安全生產(chǎn)的可靠性。
2.3.2 機器學習柔順控制
機器學習(Machine Learning,ML)是一門多領域交叉學科,涉及概率論知識、統(tǒng)計學知識、近似理論知識和復雜算法知識,使用計算機作為工具致力于真實、實時地模擬人類學習方式,并將現(xiàn)有內(nèi)容進行知識結構劃分來有效提高學習效率,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。
機器學習是研究怎樣使用計算機模擬或?qū)崿F(xiàn)人類學習活動的科學,是人工智能中最具智能特征、最前沿的研究領域之一。自20世紀80年代以來,機器學習作為實現(xiàn)人工智能的途徑,在人工智能界引起了廣泛的興趣,特別是近十幾年來,機器學習領域的研究工作發(fā)展很快,它已成為人工智能的重要課題之一。機器學習不僅在基于知識的系統(tǒng)中得到應用,而且在自然語言理解、非單調(diào)推理、機器視覺、模式識別等許多領域也得到了廣泛應用。
Rahman[55]開發(fā)了一種強化學習方法來預測產(chǎn)生最佳/最優(yōu)控制性能的控制參數(shù)。同時,Rahman還提出了一種新的基于人的特性的自適應控制算法,來處理各行各業(yè)的大型和重型材料和物體,從而提高人機交互(HRIs)和系統(tǒng)性能。Lin等人[56]基于Unity3D引擎,采用深度強化學習策略,通過獎勵函數(shù)對機械臂進行訓練,實現(xiàn)機械臂的機器學習和智能控制,經(jīng)過訓練和學習,機器人手臂能夠快速準確地在環(huán)境中找到運動點,具有較高的環(huán)境適應性,如圖13所示。
圖13 機械臂訓練結果圖
軌跡規(guī)劃,是機器人(機械臂)領域的一個重要課題,也是重難點攻克方向之一。工業(yè)機器人的軌跡規(guī)劃是機械臂動作軌跡的規(guī)劃,其包含了機械臂末端運動軌跡曲線,也包含了運動過程中的位移、速度、加速度等變量的曲線軌跡。軌跡規(guī)劃直接影響機械臂的工作效率以及操作安全性,而機械臂工作的效率以及安全性和可靠性,是衡量機械臂最直接的指標[57]。
在機械臂發(fā)展初期階段,機械臂多采用示教模式執(zhí)行動作,目前該模式仍廣泛用于工業(yè)機器人中。該模式缺點明顯,只能完成簡單的重復動作,對于多變的任務場景、復雜的任務環(huán)境(如處理動態(tài)目標),該模式已經(jīng)無法完成工作,機械臂自主軌跡規(guī)劃則可較好解決上述問題。
針對機械臂避障規(guī)劃問題,許多學者提出了不同的避障軌跡規(guī)劃方法,按照方法的作用范圍定義,可分為全局方法和局部方法,分別對應兩種分類的兩種典型方法為自由空間法和人工勢場法[58-59],其中常見的自由空間法有A*算法、蟻群算法、快速拓展隨機樹算法、遺傳算法等方法,現(xiàn)對各種軌跡方法進行介紹。
A*(A-star)算法,是由Hart于1968年提出的一種基于靜態(tài)網(wǎng)路的最短路徑搜索方法[60],是最常用的啟發(fā)式算法之一,廣泛用于機器人路徑規(guī)劃問題之中。A*算法的核心部分在于估價函數(shù)和迭代計算。估價函數(shù)是用于評估路徑代價的計算函數(shù),估價函數(shù)設計的優(yōu)劣直接影響到整個算法的收斂計算。A*算法通常配合柵格法使用,柵格地圖建立精度也將直接影響規(guī)劃效率和計算成本。
賈慶軒等[61]通過仿真實驗,驗證了A*算法在機械臂路徑中具有有效性和可行性。宗成星等[58]在機械臂軌跡規(guī)劃實驗中同樣采用了基于A*算法的規(guī)劃算法,并使用幾何體包絡的方法簡化障礙物的構建問題。針對傳統(tǒng)A*算法固定步長導致的缺陷,汪首坤等[62]改進了步長方法,提出了變步長分段搜索法,通過大步長找出中間點,再使用小步長搜索起始點至中間點路徑和中間點至目標點路徑,并通過仿真實驗驗證了該方法的可行性。李得偉等[63]提出了一種通過逆序搜索和優(yōu)化估價函數(shù)方法,將無向A*搜搜算法轉(zhuǎn)化為有向搜索,將全局估價轉(zhuǎn)變?yōu)榫植抗纼r,提高了算法效率,使之更適合處理大規(guī)模的路徑優(yōu)化問題,消除了復雜環(huán)境下路徑搜索中可能出現(xiàn)的“假死”現(xiàn)象,同時也提供了一種提高大規(guī)模仿真速度的新思路——路徑搜索與仿真過程分離。
A*系列算法因其求解最優(yōu)路徑的良好效果被廣泛使用在移動機器人路徑規(guī)劃上,在機械臂規(guī)劃領域,在環(huán)境簡單、障礙物較少而又對最短路徑要求較高的場景中也有廣泛使用,如水下機器人的能量最優(yōu)控制等,但對于實時性要求較高的動態(tài)任務場景,其龐大的計算量限制了算法的應用。
蟻群算法是由Marco Dorigo于1992年提出的一種智能路徑搜索算法[64],它是一種源于螞蟻覓食機制的智能仿生算法,對于路徑搜索和組合優(yōu)化等問題,具有較好的特性。
蟻群算法的優(yōu)點在于其采用正反饋、分布式計算以及貪婪啟發(fā)式,利用正反饋算法在迭代中不斷收斂到最優(yōu)解,而分布式計算防止了算法的過早收斂問題,貪婪啟發(fā)式在算法早期群找到一個可行解,利于后續(xù)的迭代計算。算法在釋放蟻群時,采用并行計算,多個螞蟻同時進行搜索,搜索效率較高。但算法系統(tǒng)參數(shù)不易調(diào)節(jié),多由經(jīng)驗確定,在處理復雜度較高問題時,算法的實時性較差。其次,地圖精度建立高,則螞蟻數(shù)量較多,并行計算量大。
張敬賢等[65]提出改進蟻群算法并運用與實驗中,引入了可選節(jié)點周圍可行的安全子節(jié)點對蟻群算法轉(zhuǎn)移概率進行改進,計算得到末端執(zhí)行器的運動軌跡,根據(jù)該軌跡通過偽逆法進行逆運算求得各關節(jié)運動量,實驗表明,該改進方法比原蟻群算法有更快收斂速度,避障軌跡更加合理,如圖14所示??岛撇66]將粒子群算法與蟻群算法相結合,作為機械臂軌跡規(guī)劃方法,其通過粒子群算法作為優(yōu)化手段,優(yōu)化蟻群算法得出結果,使最終解為最優(yōu)解,并通過實驗驗證了該方案的可行性。王芳等[67]將蟻群算法和人工勢場法相結合,通過人工勢場法所規(guī)劃結果作為蟻群算法規(guī)劃的先驗信息,改變了蟻群算法初始信息素的均勻分配,并通過構建勢場導向權改變螞蟻概率轉(zhuǎn)移函數(shù),使算法更快收斂,提高了計算效率,但存在易陷入局部最優(yōu)值的問題。Jiao等[68]提出一種用于解決路徑規(guī)劃中局部最優(yōu)問題的多態(tài)蟻群優(yōu)化算法,采用自適應的狀態(tài)轉(zhuǎn)移以及信息素更新策略,保證了信息素濃度和啟發(fā)信息在算法迭代計算過程中的重要性。
圖14 原蟻群算法實驗效果對比
快速拓展隨機樹(Rapidly-exploring Random Trees,RRT)算法,是由Steven M.LaValle提出的一種基于隨機采樣的運動規(guī)劃算法,其算法的核心與樹生長分叉相似,廣泛用于機械臂運動軌跡規(guī)劃以及移動機器人路徑規(guī)劃。其算法的基本思想在于,以起始點為根節(jié)點,隨機在地圖或自由空間中分布隨機節(jié)點,以根節(jié)點起始隨機采樣生長,遇到隨機節(jié)點則為一棵樹干,隨后再以該節(jié)點繼續(xù)隨機生長,不斷生成樹干和樹枝,直至生長到目標點為止,形成一條可行路徑。 RRT算法采用隨機采樣拓展生長節(jié)點,采樣范圍為整個自由空間,避免了算法陷入局部最小值,且每次采樣都會檢測生長樹末梢是否達到了目標點附近區(qū)域(小于一個較小范圍)或碰到障礙區(qū)域,生長樹隨算法不斷迭代而生成樹干樹枝,當生長到目標點附近,即可形成一條可行的生長樹路徑。
傳統(tǒng)RRT算法的樹枝生長方向是隨機的,其無向性導致了算法計算出的結果往往不是最優(yōu)解,前期大量的非收斂計算也導致算法運行速度降低。為降低其計算量,一些學者提出和運用了雙向擴展隨機樹[69],融入退火算法的隨機樹等算法。蔡文濤等[70]提出一種目標概率偏置與步長控制的改進RRT算法(I-RRT),該I-RRT算法在生長過程中,采樣點有一定概率偏向目標點,改善了RRT算法無導向性的問題和規(guī)劃空間增大時算法時間復雜度高的問題,并由實驗驗證I-RRT算法較RRT算法時間復雜度優(yōu)化至30%,如圖15所示。
Denny等[71]提出一種自適應RRT算法,對于空曠區(qū)域和有障礙物區(qū)域使用不同的處理,采用兩級生長選擇機制使RRT的生長適應當前的搜索區(qū)域。最佳RRT算法(RRT*)算法對原RRT算法進行優(yōu)化,解決了RRT算法計算結果往往不是最優(yōu)解的問題,使算法能夠最終趨近于最佳解決方案,但該方法所需計算成本較大,效率較低。Burget等[72]提出一種雙向知情RRT*算法(BI 2 RRT *),在知情RRT*算法[73]的基礎上融合雙向擴展原理,機械臂規(guī)劃實驗結果表明,該算法比知情RRT*算法和雙向擴展隨機樹有更好的效果。
遺傳算法(Genetic Algorithm,GA) 是由Holland提出的一種仿生模擬啟發(fā)式算法,該算法模擬生物在自然環(huán)境中的遺傳和進化的過程和規(guī)律,得出全局優(yōu)化概率的搜索策略。生物界的遺傳特性在于“優(yōu)勝劣汰”,適應環(huán)境好的基因遺傳到下一代概率更高,而遺傳算法的核心在于算子模仿了生物遺傳,通過交叉、選擇、變異操作,使個體間基因信息交換,篩選出適應度較高的優(yōu)良個體遺傳到下一代,保證了算法收斂性。遺傳算法由于其優(yōu)良遺傳特性,被廣泛應用于自動控制、機器人路徑規(guī)劃等研究領域。
張秀林[74]使用遺傳算法求解機械臂時間最優(yōu)軌跡規(guī)劃,并且通過實驗驗證了遺傳算法在軌跡規(guī)劃中具有良好特性。但基本遺傳算法具有局部搜索能力差的問題,在基本遺傳算法的基礎上,混合遺傳算法不斷發(fā)展,一些學者提出了與模擬退火算法結合的模擬退火遺傳算法、融合模糊優(yōu)化設計理念的模糊遺傳算法等優(yōu)化遺傳算法。戈新生等[75]將空間機械臂的運動規(guī)劃問題轉(zhuǎn)化為非線性系統(tǒng)的最優(yōu)控制問題,并在最優(yōu)控制算法之中引入了遺傳算法作為求解手段,通過仿真實驗驗證了該方法的有效性;祁若龍等[76]同樣利用了遺傳算法作為規(guī)劃算法,并首先利用分段描述方程建立軌跡,將軌跡信息轉(zhuǎn)化為確定參數(shù)和待求參數(shù),即把機械臂的軌跡規(guī)劃轉(zhuǎn)變?yōu)槎嗄繕饲蠼獾膯栴},隨后利用遺傳算法進行求解,如圖16所示。
圖16 一種基于遺傳算法的避障實驗運動過程
基于自由空間的規(guī)劃算法由于存在計算空間較大,局部性較差的問題,往往難以單獨運用在機械臂實時路徑規(guī)劃上。為此,Khatib提出了人工勢場法,該算法的核心思想在于構建笛卡爾運動空間的虛擬力場,目標點對機械臂的吸引力以及障礙物對機械臂的斥力,兩種力驅(qū)動機械臂運動,引力是對末端執(zhí)行器作用,斥力則是對機械臂上距離障礙物最近點作用。人工勢場法具有良好的實時性特點,無需完備的障礙構型映射,對于動態(tài)變化環(huán)境響應較好,模型建立簡單,計算量小。同時,該方法規(guī)劃的運動軌跡是連續(xù)平滑的,無需加入插補算法。由于人工勢場法的優(yōu)良性能,被廣泛采用在機械臂運動規(guī)劃中。但作為一種局部規(guī)劃算法,人工勢場法存在一定的局限性,同全局算法相比,人工勢場法以犧牲對全局信息的導入換取實時性。
針對傳統(tǒng)人工勢場法存在的局部最小等問題,許多學者提出了不同的改進方案。針對局部最小值問題,一些學者提出采用修改勢場和目標的方法。Volpe[77]等提出了不存在局部最小值的超二次曲面勢場函數(shù),該函數(shù)形成的斥力勢場在距離障礙物較遠處,等勢面為球?qū)ΨQ形狀,避免了同引力函數(shù)勢場疊加形成局部最小值;Sato[78-79]提出了基于拉普拉斯方程的人工勢場法,該方法通過修改勢能函數(shù),消除局部最小值點;王俊龍[80]提出添加虛擬障礙物,改變機械臂和勢能,引導機械臂跳出局部最小值,并采用關節(jié)空間作為機械臂搜索空間以減少計算量和避免奇異點出現(xiàn),如圖17所示。
圖17 人工勢場法中機械臂障礙點與機械臂位置關系
馬黎鵬[81]在實驗中將蟻群算法與基于負反饋的人工勢場法相結合,提高了規(guī)劃算法的全局能力并且加快了收斂的速度,同時采用了虛擬目標點方法擺脫局部最小值。何兆楚等[82]利用RRT算法不易陷入局部最小值特點,將人工勢場法融合RRT算法,當機械臂陷入局部最小值時,由改進RRT算法自適應設置臨時目標點,脫離局部最小值,仿真實驗表明,該方法在復雜環(huán)境中也具有可行性,如圖18所示。
圖18 存在不同障礙物下的機械臂末端運動軌跡
眾多學者和研究人員采用了人工勢場法規(guī)劃機械臂運動軌跡,驗證了人工勢場法在該方面性能的優(yōu)秀。對于實時性要求較高、工作環(huán)境較復雜的動態(tài)變化場景,人工勢場法相較于其他方法有著巨大優(yōu)勢,以人工勢場法為主的動態(tài)避障算法也將持續(xù)被研究。
隨著工業(yè)生產(chǎn)場景和生產(chǎn)方式的轉(zhuǎn)變,工業(yè)機器人的主動安全性能將會得到越來越多的關注。交互監(jiān)測技術和控制技術的進步,勢必會推動工業(yè)機器人安全性能的提升,本質(zhì)安全將是理想機器人的必備且基礎的特征。
未來工業(yè)機器人的研究應在強化安全保證和高效操作的基礎上,探索提高工業(yè)機器人認知和自主操作能力,使工業(yè)機器人不僅能提高工序作業(yè)能力、減輕工人勞動強度,而且能降低對工人技術水平的要求,通過人機協(xié)作更好地完成復雜任務。與此同時,工業(yè)機器人與近年熱點交互機器人之間的界限將越來越模糊,協(xié)作機器人最終將變成一個過渡概念,隨著技術的發(fā)展,未來所有的機器人都應該具備與人類一起安全地協(xié)同工作的特性。