王 敏 蔣金偉 曹彥陶
(1. 安徽科技貿(mào)易學校,安徽 蚌埠 233080;2. 常州工業(yè)職業(yè)技術(shù)學院,江蘇 常州 213164;3. 江蘇大學,江蘇 鎮(zhèn)江 212013)
隨著工業(yè)4.0的興起和互聯(lián)網(wǎng)浪潮席卷全球,各國都將制造業(yè)的轉(zhuǎn)型升級作為重點,提高制造業(yè)和自動化水平是大勢所趨[1]。機器人是自動化時代的象征,是智能時代的基石。以工業(yè)機器人技術(shù)為代表的智能生產(chǎn)線越來越受到重視[2]。Delta機器人具有剛度高、運動速度快、負重比高等優(yōu)點,在食品、醫(yī)藥等輕工業(yè)中被廣泛應(yīng)用。但在實際應(yīng)用中,Delta機器人在食品分揀中存在運動不穩(wěn)定、分揀效率低等問題。
目前,國內(nèi)外許多學者對食品分揀機器人控制方法進行了研究,嘗試將智能控制算法用于抓取控制,提高系統(tǒng)魯棒性,主要包括粒子群算法、蟻群算法、遺傳算法等控制方法。倪鶴鵬等[3]提出了一種將牛頓迭代法用于機器人抓取控制。建立跟蹤模型,通過牛頓迭代法進行求解。結(jié)果表明,該方法的最快分選速度為1.5次/s,誤抓取率為0.2%,漏抓率為0,具有較高的精度和穩(wěn)定性。郝琳等[4]提出了一種將模糊神經(jīng)網(wǎng)絡(luò)與改進粒子群優(yōu)化算法相結(jié)合的控制方法。結(jié)果表明,該系統(tǒng)具有較低的誤抓取率和漏抓率,控制在0.1%以內(nèi),抓取精度高,能夠滿足食品包裝的要求。郝大孝等[5]提出了一種用于Delta機器人的動態(tài)抓取算法,完美融合機械視覺和抓取方法。結(jié)果表明,在目標排序和跟蹤過程中,Delta機器人的漏檢率控制在2%以內(nèi),誤檢率為0。郭俊等[6]針對三自由度并聯(lián)機器人在食物取放作業(yè)中運動不穩(wěn)的問題,提出了以最優(yōu)運動時間為目標的回轉(zhuǎn)與圓弧相結(jié)合的方法,并利用蟻群算法得到運動軌跡參數(shù)。結(jié)果表明,該方法能夠提高分揀機器人的穩(wěn)定性和分揀效率,減小了末端執(zhí)行器的抖動。上述方法可以滿足高速食品分揀機器人的一般要求,但在分揀操作中存在運行不穩(wěn)定、分揀效率低等問題,有一定的局限性,適應(yīng)性有待進一步提高。
針對食品分揀機器人抓取運動不穩(wěn)定、分揀效率低等問題,提出了一種基于改進粒子群(Particle Swarm Optimization,PSO)算法的多目標運動優(yōu)化策略用于食品分揀機器人的動態(tài)目標抓取控制。目前粒子群算法的改進方法眾多,但是大部分都較為復(fù)雜,而目標抓取需要快速性,因此,通過兩個方面對其進行改進,改進慣性權(quán)重利于跳出局部極值,改進學習因子提高全局最優(yōu)解的精度。協(xié)調(diào)抓取順序和分揀軌跡建立最短路徑模型,以末端加速度建立機構(gòu)穩(wěn)定性優(yōu)化模型,并通過改進粒子群優(yōu)化算法對目標進行優(yōu)化,以期為分揀機器人控制技術(shù)的發(fā)展提供依據(jù)。
圖1為高速并行食品分揀機器人的系統(tǒng)結(jié)構(gòu)。高速并聯(lián)食品分揀機器人系統(tǒng)主要由上位機系統(tǒng)和下位機系統(tǒng)組成。其中,下位機控制系統(tǒng)是Delta機器人的核心指令部分[7]。其主要功能是驅(qū)動機器人主體以穩(wěn)定、協(xié)調(diào)、快速的方式完成既定的運動規(guī)劃和抓取任務(wù),滿足工作要求。上位機系統(tǒng)其主要功能是可視化、模型分析、數(shù)據(jù)集成處理以及與下位機的信息交互。
圖1 系統(tǒng)結(jié)構(gòu)Figure 1 System structure
食品分揀機器模型人主要由7個部分組成:靜(動)平臺、主(從)動臂、伺服電阻、減速器、末端執(zhí)行器[8]。伺服電機安裝在靜平臺,末端執(zhí)行器安裝在動平臺。靜、動平臺之間通過運動鏈連接。從動臂由4個球鉸組成閉環(huán)平行四邊形。閉環(huán)與驅(qū)動臂剛性連接,驅(qū)動臂通過旋轉(zhuǎn)副與靜平臺連接。機器人通過平行四邊形對動平臺的運動方向進行約束,使靜、動平臺保持平行。
圖2 食品分揀機器人模型Figure 2 Food sorting robot model
現(xiàn)有的研究大多集中在單路徑優(yōu)化上,不能從整體上提高分揀效率[9]。文中提出了一種基于改進粒子群的多目標動態(tài)優(yōu)化算法用于抓取控制。
粒子群的機制是一種基于蜜蜂、螞蟻和鳥類習慣的搜索算法[10]。個體遵循不碰撞的規(guī)則,個體速度匹配,個體朝著共同的目標前進。相比于遺傳算法、模擬退火算法、蟻群算法,粒子群算法規(guī)則更為簡單、收斂速度快、計算時間短等。它適用于動態(tài)多目標優(yōu)化,在機器人控制、交通運輸?shù)阮I(lǐng)域應(yīng)用較為廣泛。簡言之,在粒子群優(yōu)化算法中,粒子通過目標函數(shù)確定適應(yīng)值,由速度來確定其飛行方向和距離,剩余粒子根據(jù)當前最優(yōu)粒子搜索解空間[11]。粒子通過多次迭代得到最優(yōu)解。在迭代過程中,粒子跟蹤極值并更新粒子本身。一種是個體極值,粒子本身檢測到的最優(yōu)解。一種是全局極值,即剩余粒子群檢測到的最優(yōu)解。
迭代之后,在所有粒子的最優(yōu)解之后,對速度和位置進行更新,如式(1)和式(2)所示[12]。
vid=ωvid+c1r1(pbest-xid)+c2r2(gbest-xid),
(1)
xid=xid+mvid,
(2)
式中:
c1、c2——自學習和社會學習的因子;
xid——d維數(shù)第i個粒子的位置;
vid——d維數(shù)第i個粒子的速度,mm/s;
ω——慣性的權(quán)重;
r1、r2——隨機數(shù);
m——約束因子,通常為1。
但粒子群算法也存在早熟收斂、局部尋優(yōu)能力差、易陷入局部極值等缺點,因此,文中通過兩個方面對其進行改進,改進慣性權(quán)重利于跳出局部極值,改進學習因子提高全局最優(yōu)解的精度。
2.1.1 慣性權(quán)重的改進 慣性權(quán)重越小局部搜索越有利,越大全局搜索越有利。隨著迭代次數(shù)的增加,問題的求解細節(jié)也隨之增加,固定值求解存在著許多缺陷。因此,引入可變慣性權(quán)重,通過式(3)進行動態(tài)慣性權(quán)重調(diào)整[13]。
(3)
式中:
λ——經(jīng)過迭代測試后可以得到的權(quán)重因子(值為0.01優(yōu)化效果最好);
N——粒子數(shù);
t——當前粒子迭代次數(shù);
pbest,i(t)——當前個體最優(yōu)值;
gbest——當前全局最優(yōu)。
2.1.2 學習因子的改進 采用對學習因子進行線性遞減和線性遞加的策略??梢栽谒阉髑捌谠鰪娙炙阉?,使之不易陷入局部最優(yōu),而在搜索后期增強局部搜索能力,提高全局最優(yōu)解的精度,具體方程如式(4)和式(5)所示[14]。
(4)
(5)
式中:
tm——最大迭代次數(shù);
c1max、c2max——最大學習因子;
c1min、c2min——最小學習因子;
t——粒子當前的迭代次數(shù)。
算法步驟:
步驟1:初始化。對粒子數(shù)、迭代次數(shù)等進行初始化[15]。
步驟2:計算每個粒子的目標函數(shù),求解全局最優(yōu)解和個體最優(yōu)解。
步驟3:對粒子位置和速度進行更新。
步驟4:確定是否達到停止條件。達到輸出最優(yōu)解,未達到轉(zhuǎn)到步驟2。改進算法的流程圖如圖3所示。
圖3 改進粒子群算法的優(yōu)化流程Figure 3 Optimization process of improved particle swarm algorithm
在食品生產(chǎn)中,需要對機器人抓取策略進行優(yōu)化,以提高機構(gòu)分揀效率。通過調(diào)整抓取食品的順序和分揀路徑,可以提高工作效率[16]。最短路徑模型的建立過程是:將食品放置在傳送帶上的同一水平線上,z方向上的坐標相同。為了方便計算,將其設(shè)置為0。將食物放置在(x0,y0,0)。傳送帶上第i個食物的位置是(xi,yi,0)。傳送帶沿x軸的速度設(shè)置為v,從第i個食品到第j個食品的抓取時間為ti,最短抓取路徑模型如式(6)所示[17]。
(6)
式中:
Sij——末端從i到j(luò)的抓取路徑,其計算如式(7)所示。
(7)
Xij為決策變量,決定從食品i到食品j的路徑是否執(zhí)行,如式(8)所示[18]。
(8)
機器人抓取中的穩(wěn)定性較低,容易產(chǎn)生振動或沖擊,以末端加速度建立機構(gòu)穩(wěn)定性優(yōu)化模型,如式(9)所示[19]。
(9)
式中:
aij——末端從i到j(luò)的加速度,mm/s2。
其次,需要對末端的速度和加速度進行限值。即aij1,aij2≤amax,vij1,vij2≤vmax,為防止機器人反復(fù)抓取食品,需要i≠j。
綜合2.2和2.3的模型建立目標函數(shù),如式(10)所示[20]。
minf(x)={f1(x),f2(x)},
(10)
式中:
minf1(x)=S;
minf2(x)=a。
通過改進的粒子群算法對多目標問題進行優(yōu)化,將兩個目標作為權(quán)重w∶1(兩個目標占比)的優(yōu)化目標,文中w=1,如式(11)所示[21]。
(11)
多目標優(yōu)化算法的步驟:
步驟1:初始化。對粒子數(shù)、迭代次數(shù)等進行初始化。
步驟2:獲取機器人相關(guān)參數(shù)和目標食品的位置等。
步驟3:對模型進行計算,更新粒子速度和位置。
步驟4:對是否為最優(yōu)解進行判斷。如果滿足該標準,則輸出最優(yōu)解。如果不符合標準,則轉(zhuǎn)到步驟3。圖4為多目標優(yōu)化算法的流程。
圖4 多目標優(yōu)化算法流程Figure 4 Algorithm flow of Multi-objective optimization
為了驗證多目標優(yōu)化方法的性能,仿真設(shè)備為聯(lián)想PC,操作系統(tǒng)為windows10 64位旗艦版,intel i5 2450M CPU,頻率2.5 GHz,matlab r2018a為仿真平臺。采用平均分布方式,每次識別的食品數(shù)設(shè)置為10個。文中優(yōu)化權(quán)重w=1,分布范圍為[-400,+400] mm,傳輸速度為100 mm/s。粒子數(shù)為100,最大迭代次數(shù)為100,為了保證模擬結(jié)果的準確性,文中選取了兩種分布密度(100,150個/min)進行驗證。
分揀機器人在優(yōu)化前抓取都是按照坐標順序進行,優(yōu)化后是多目標優(yōu)化,不同分布密度(100,150個/min)下的抓取分布圖如圖5所示。
由圖5可知,在不同分布密度(100,150個/min)下,優(yōu)化后抓取分布圖更加集中,工作區(qū)間也明顯縮短。驗證了文中多目標優(yōu)化算法的有效性,該算法可以在一定程度上提高系統(tǒng)的抓取穩(wěn)定性和分揀效率。
圖5 不同分布密度的多目標優(yōu)化前后抓取分布圖Figure 5 Grab distribution map before and after multi-objective optimization with different distribution density
通過分揀平臺對文中方法在抓取穩(wěn)定性和分揀效率方面的性能進行實驗驗證,為了盡可能地接近真實工況,將相機拍攝頻率設(shè)置為100幀。傳送速度分別設(shè)置為100,200 mm/s。末端的最大速度和最大加速度分別為Vm=4 m/s、am=300 m/s2,進行以下分析。
3.2.1 抓取成功率 通過實際抓取試驗對改進前后抓取的成功率進行對比分析,目標食品500個,確保每次試驗傳送帶上的食品種類數(shù)、分布密度、抓取速度等相同。利用3種分揀操作方法(不采用POS優(yōu)化、POS優(yōu)化、改進POS優(yōu)化),進行多次試驗取平均值,結(jié)果見表1。
表1 3種抓取策略的結(jié)果對比Table 1 Comparison of capture results of different capture strategies
由表1可以看出,在相同的食品輸送速度下,改進PSO優(yōu)化控制抓取成功率最高,隨著輸送速度的增加,3種控制的抓取成功率都有一定程度的下降。不采用PSO優(yōu)化控制從96.8%降低到94.2%,采用PSO優(yōu)化控制從98.6%降低到98.2%,改進PSO優(yōu)化控制從100.0%降低到99.8%。說明文中提出的方法在準確性、穩(wěn)定性和分揀效率方面都有所提高。
3.2.2 分揀效率 在輸送速度100 mm/s時,使物體分布密度相同。記錄抓取500個食品的總時間,重復(fù)30次。根據(jù)試驗數(shù)據(jù),計算不采用粒子群優(yōu)化控制、采用粒子群優(yōu)化控制、采用改進粒子群優(yōu)化控制策略抓取速率的平均值,結(jié)果如表2所示。
由表2可知,在相同帶速下,文中提出的優(yōu)化策略平均抓取效率最高,在一定程度上提高了分揀作業(yè)的工作效率。
表2 不同抓取策略抓取速率對比Table 2 Comparison of grab rates with different grab strategies
3.2.3 算法對比 在輸送速度100 mm/s時,使物體分布密度相同。采用改進粒子群優(yōu)化控制策略和文獻[3]中基于牛頓-拉夫森迭代的動態(tài)抓取策略進行抓取試驗,記錄抓取500個食品的總時間和抓取成功率,重復(fù)30次取平均值,結(jié)果如表3所示。
表3 改進粒子群優(yōu)化和牛頓-拉夫森迭代動態(tài)抓取策略的對比Table 3 Comparison between improved particle swarm optimization and Newton Raphson iterative dynamic grasping strategy
由表3可知,在相同帶速下,文中改進PSO優(yōu)化控制方法在抓取速率和抓取成功率方面都優(yōu)于文獻[3]牛頓—拉夫森迭代。通過對比試驗數(shù)據(jù)分析,文中提出的方法不僅提高了抓取成功率,而且降低了抓取時間,實現(xiàn)了提高分揀效率的目的。
文中提出了一種基于改進粒子群算法的多目標運動優(yōu)化策略用于食品分揀機器人的動態(tài)目標抓取控制方法。以協(xié)調(diào)抓取順序和分揀軌跡建立最短路徑模型,采用末端加速度建立機構(gòu)穩(wěn)定性優(yōu)化模型,并通過改進粒子群優(yōu)化算法對目標進行優(yōu)化。結(jié)果表明,改進后的算法能有效地提高系統(tǒng)的效率,在輸送速度100 mm/s時,抓取成功率由96.8%提高到100%,抓取效率由1.62個/s提高到1.98個/s,具有一定的實用價值。在現(xiàn)有的試驗條件下,高速并聯(lián)食品分揀機器人抓取控制策略的研究還處于試驗階段,后續(xù)將不斷完善整個高速并聯(lián)食品分揀機器人的功能。