亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于任務(wù)參數(shù)加權(quán)的動態(tài)運(yùn)動基元泛化方法

        2022-05-31 04:07:02方灶軍王聚幸顧丹寧
        中國機(jī)械工程 2022年10期
        關(guān)鍵詞:方法

        張 磊 方灶軍 王聚幸 何 晨 顧丹寧

        1.中國科學(xué)院寧波材料技術(shù)與工程研究所,寧波,3152012.中國科學(xué)院大學(xué),北京,1000493.浙江省機(jī)器人與智能制造裝備技術(shù)重點(diǎn)實(shí)驗(yàn)室,寧波,315201

        0 引言

        在不久的將來,機(jī)器人將成為人類社會不可或缺的一部分,在教育、醫(yī)療、家庭、災(zāi)害場景及太空探索等領(lǐng)域?yàn)槿藗兲峁﹨f(xié)助。機(jī)器人將不僅在結(jié)構(gòu)化環(huán)境下執(zhí)行單一任務(wù),而是會面臨非結(jié)構(gòu)化復(fù)雜環(huán)境下的多變?nèi)蝿?wù)。為所有場景和任務(wù)都進(jìn)行傳統(tǒng)的示教編程是非常耗時耗力的,因此,機(jī)器人需要依靠自身的學(xué)習(xí)能力完成相應(yīng)任務(wù)[1]。

        傳統(tǒng)的機(jī)器人示教編程類似于簡單的“復(fù)制粘貼”操作,對某一特定場景下的特定任務(wù)進(jìn)行示教,機(jī)器人只能在該場景下完成對應(yīng)任務(wù),若場景或任務(wù)條件稍有變化,任務(wù)便不能完成,需要對機(jī)器人重新示教。而機(jī)器人示教學(xué)習(xí)(learning from demonstration,LfD)通常也稱作機(jī)器人模仿學(xué)習(xí)(imitation learning),運(yùn)用機(jī)器學(xué)習(xí)的方法使機(jī)器人學(xué)習(xí)示教者的動作技巧從而掌握新的任務(wù)技能。與傳統(tǒng)機(jī)器人示教編程相比,LfD具有泛化能力,在場景和任務(wù)與示教不同的情況下,機(jī)器人仍然能憑借從示教過程中學(xué)習(xí)到的動作技巧和特征完成任務(wù)。

        針對單條運(yùn)動軌跡的示教學(xué)習(xí),IJSPEERT等[2]提出了一種基于動態(tài)運(yùn)動基元(dynamic movement primitive,DMP)的軌跡編碼方法,能夠?qū)⑹窘踢\(yùn)動軌跡的形狀特征以特征參數(shù)的形式保存,對于一個新的任務(wù)場景,可以通過學(xué)習(xí)到的特征參數(shù)重構(gòu)一條包含示教者運(yùn)動特征的運(yùn)動軌跡。針對多條運(yùn)動軌跡的示教學(xué)習(xí),在DMP的基礎(chǔ)上,UDE等[3]首先使用高斯過程回歸(Gaussian process regression,GPR)求出任務(wù)參數(shù)到DMP運(yùn)動軌跡目標(biāo)點(diǎn)g與時間縮放量τ的映射,其他模型參數(shù)固定為常數(shù);然后使用局部加權(quán)回歸(locally weighted regression,LWR)基于所有示教運(yùn)動軌跡的非線性項(xiàng)計(jì)算出新的特征參數(shù),最后根據(jù)新的特征參數(shù)重構(gòu)新的運(yùn)動軌跡。劉環(huán)等[4]首先使用LWR計(jì)算出所有示教運(yùn)動軌跡對應(yīng)的DMP特征參數(shù),對于一個新的任務(wù)參數(shù),基于計(jì)算得到所有的特征參數(shù),使用高斯過程回歸求出相應(yīng)的新的特征參數(shù),最后重構(gòu)新的運(yùn)動軌跡。

        以上兩種泛化方法存在計(jì)算效率不高以及在示教任務(wù)參數(shù)附近的泛化性能差等問題。本文提出了一種基于任務(wù)參數(shù)加權(quán)的動態(tài)運(yùn)動基元泛化方法。首先對于每條示教運(yùn)動軌跡,使用局部加權(quán)回歸計(jì)算出對應(yīng)的特征參數(shù);對于一個新的任務(wù),由各條示教運(yùn)動軌跡學(xué)習(xí)到的特征參數(shù)計(jì)算出在新的任務(wù)參數(shù)處的特征運(yùn)動軌跡;基于示教任務(wù)參數(shù)與新的任務(wù)參數(shù)的相似度給予各條特征運(yùn)動軌跡不同的權(quán)重,然后對各條特征運(yùn)動軌跡進(jìn)行加權(quán)疊加形成新的運(yùn)動軌跡;對動態(tài)運(yùn)動基元及常用的泛化方法進(jìn)行介紹,并重點(diǎn)闡述所提方法。

        1 動態(tài)運(yùn)動基元及其泛化分析

        1.1 動態(tài)運(yùn)動基元

        DMP模型是一個特征參數(shù)可學(xué)習(xí)的非線性吸引子系統(tǒng),可以用于編碼離散運(yùn)動軌跡,DMP模型表達(dá)式如下:

        (1)

        (2)

        (3)

        其中,式(1)、式(2)本質(zhì)上是一個彈簧阻尼系統(tǒng),式(3)是一個正則系統(tǒng)(canonical system),這樣設(shè)計(jì)是為了得到一個便于分析的穩(wěn)定系統(tǒng),并且可以通過調(diào)制非線性項(xiàng)達(dá)到期望的吸引子行為。式(1)~式(3)中,τ表示時間縮放量,用于調(diào)整運(yùn)動軌跡的持續(xù)時間;y和z分別表示運(yùn)動軌跡某時刻的位置和速度;y0和g分別表示運(yùn)動軌跡的起始點(diǎn)和終止點(diǎn);αz、βz是正常數(shù),其關(guān)系通常設(shè)置為βz=αz/4。通過選擇合適的值,可以使系統(tǒng)處于臨界阻尼狀態(tài),從而使運(yùn)動軌跡的終止位置y收斂到終止點(diǎn)g;αs是正則系統(tǒng)的常數(shù);s是相位變量,用來替代時間變量t,使系統(tǒng)擺脫對時間的顯式依賴,隨著t的增加,s逐漸從1單調(diào)遞減至0,由此可以保證系統(tǒng)最終收斂到終止點(diǎn)g;f(s)是系統(tǒng)中的非線性項(xiàng),它是關(guān)于相位變量s的一個函數(shù),可以通過調(diào)整不同時刻的吸引子行為來改變運(yùn)動軌跡的形狀。

        為了實(shí)現(xiàn)更加通用的吸引子表達(dá)形式,定義如下:

        (4)

        φi(x)=exp(-hi(s-ci)2)

        (5)

        對于具有多個自由度的動態(tài)系統(tǒng),需要對每個自由度分別單獨(dú)建立變換系統(tǒng),正則系統(tǒng)提供了各個自由度之間的時間耦合,而變換系統(tǒng)實(shí)現(xiàn)了每個自由度所需的吸引子動態(tài)特性。

        1.2 動態(tài)運(yùn)動基元泛化分析

        在機(jī)器人示教學(xué)習(xí)領(lǐng)域中,泛化性能指的是當(dāng)任務(wù)場景發(fā)生變化時,機(jī)器人仍能模仿示教運(yùn)動的特征完成相應(yīng)的任務(wù)。需要強(qiáng)調(diào)的是,單條示教運(yùn)動軌跡學(xué)習(xí)所得的DMP模型也具有一定的泛化能力,其泛化能力在該運(yùn)動軌跡任務(wù)參數(shù)附近具有較好的效果,但是當(dāng)新的任務(wù)參數(shù)偏離該示教任務(wù)參數(shù)較遠(yuǎn)時,其泛化能力不能夠令人滿意。就整個機(jī)器人工作空間而言,如果只用單個任務(wù)參數(shù)處的示教運(yùn)動軌跡的特征來代表整個工作空間的特征,顯然是不合理的。因此需要在機(jī)器人工作空間采集多組示教運(yùn)動軌跡,保證對應(yīng)示教運(yùn)動軌跡的任務(wù)參數(shù)盡可能均勻地覆蓋整個機(jī)器人工作空間。對于一個新的任務(wù)場景下的任務(wù)參數(shù),新的運(yùn)動軌跡由多條示教運(yùn)動軌跡生成。每條運(yùn)動軌跡的形狀特征由特征參數(shù){ωi}(i=1,2,…,N)唯一確定,因此生成一條新的任務(wù)參數(shù)下運(yùn)動軌跡可認(rèn)為是生成一組新的特征參數(shù)。每一條示教運(yùn)動軌跡對新的運(yùn)動軌跡生成的影響是不同的,可以做出合理的假設(shè):任務(wù)參數(shù)與新的任務(wù)參數(shù)越接近的示教運(yùn)動軌跡對新的運(yùn)動軌跡學(xué)習(xí)的貢獻(xiàn)越大,新的運(yùn)動軌跡的形狀特征與同其任務(wù)參數(shù)相近的示教運(yùn)動軌跡相似度更高。

        2 動態(tài)運(yùn)動基元泛化算法介紹

        (6)

        XW=f

        (7)

        (8)

        (9)

        其中,W和f分別為特征參數(shù)向量和非線性項(xiàng)向量,X為不同相位變量下的各個高斯基函數(shù)的值所構(gòu)造的矩陣,特征參數(shù)W可以由式(7)對應(yīng)的線性方程組的最小二乘解計(jì)算得到。

        2.1 基于LWR的動態(tài)運(yùn)動基元泛化

        給定一個新的任務(wù)參數(shù)q,首先使用GPR(關(guān)于GPR的算法介紹參照2.2節(jié))由q估計(jì)出運(yùn)動軌跡終止點(diǎn)g和時間縮放量τ:

        G(z):q[τ,g]

        (10)

        對于點(diǎn)到點(diǎn)的任務(wù),一般將時間縮放量τ設(shè)置為常數(shù),將任務(wù)參數(shù)q設(shè)置為運(yùn)動軌跡目標(biāo)位置g。

        對于特征參數(shù)的泛化,使用局部加權(quán)回歸,通過最小化目標(biāo)函數(shù)V得到在新的任務(wù)參數(shù)下的特征參數(shù)W*:

        (11)

        可以認(rèn)為,求出一組特征參數(shù)W*,使得新生成的運(yùn)動軌跡與所有示教運(yùn)動軌跡的差距最小,示教任務(wù)參數(shù)與q越接近的示教運(yùn)動軌跡對特征參數(shù)W*的生成影響越大。式(11)中,Xk由式(9)計(jì)算得出,fk可由式(8)計(jì)算得出。任務(wù)參數(shù)空間中的K和距離d決定了每條示教運(yùn)動軌跡對最終估計(jì)的控制策略的影響程度。K為核函數(shù),文獻(xiàn)[3]使用的是三次核函數(shù),因?yàn)樵摵撕瘮?shù)具有有限的范圍和連續(xù)的一階和二階導(dǎo)數(shù),并且在實(shí)驗(yàn)中表現(xiàn)效果較好,即

        (12)

        其中,d是任務(wù)參數(shù)q空間中的度量,由歐氏距離定義:

        (13)

        (14)

        由式(13)和(14)可知,參數(shù)D完全由參數(shù)c?R唯一決定,通過最小化驗(yàn)證集誤差來得到參數(shù)c。

        2.2 基于GPR的動態(tài)運(yùn)動基元泛化

        對于每條示教軌跡,使用局部加權(quán)回歸計(jì)算出對應(yīng)的特征參數(shù),對于每個ωi(i=1,2,…,N),通過最小化如下目標(biāo)函數(shù)Ji:

        Ji=(Sωi-f)TΓi(Sωi-f)

        (15)

        其中,f由式(8)計(jì)算得列;S為每個時刻t對應(yīng)的相位變量值x(t)所構(gòu)造的向量;Γi為ωi對應(yīng)的高斯基函數(shù)在所有相位變量x(t)的值構(gòu)造的對角矩陣。S和Γi定義如下:

        (16)

        由式(15)可以推導(dǎo)計(jì)算出對應(yīng)的特征參數(shù)ωi(i=1,2,…,N)的公式:

        (17)

        對于M條示教運(yùn)動軌跡,可由式(17)計(jì)算得到M組特征參數(shù)ωi(i=1,2,…,N)。

        在一個新的任務(wù)場景下,使用GPR求出新的任務(wù)參數(shù)到該場景下的特征參數(shù)的映射。高斯過程(Gaussian process,GP)定義為

        g(q)~GP(m(q),k(q,q′))

        (18)

        (19)

        其中,W和W*為已知特征參數(shù)矩陣和待求特征參數(shù);Q和q*為已知任務(wù)參數(shù)矩陣和新的任務(wù)參數(shù);K(·,·)為相應(yīng)的聯(lián)合協(xié)方差矩陣,一種常用的協(xié)方差函數(shù)定義如下:

        (20)

        其中,σf、l和σn為常數(shù),h(q,q′)定義為

        (21)

        (22)

        由式(22)可知,高斯過程回歸與局部加權(quán)回歸類似,與新的任務(wù)參數(shù)q*越接近的對應(yīng)任務(wù)參數(shù)的示教運(yùn)動軌跡對新的特征參數(shù)生成的影響越大。

        2.3 基于任務(wù)參數(shù)加權(quán)的動態(tài)運(yùn)動基元泛化

        在實(shí)時運(yùn)行的機(jī)器人模仿學(xué)習(xí)系統(tǒng)中,以上兩種泛化方法存在運(yùn)行速度較慢、在示教任務(wù)參數(shù)附近泛化性能較差等不足。本文提出了一種新的基于任務(wù)參數(shù)加權(quán)的動態(tài)運(yùn)動基元泛化方法,相比以上兩種動態(tài)運(yùn)動基元泛化方法,在計(jì)算速度和示教任務(wù)參數(shù)鄰近區(qū)域的泛化性能方面都有了較大的提高。

        (23)

        (24)

        (25)

        基于任務(wù)參數(shù)加權(quán)的動態(tài)運(yùn)動基元泛化方法流程圖如圖1所示,流程如下:

        圖1 方法流程圖Fig.1 Flowchart of the method

        (3)相機(jī)輸入。輸入新的任務(wù)參數(shù)q*。

        (4)映射。由式(10)計(jì)算q到g和τ的映射。

        對于一個實(shí)時運(yùn)行的機(jī)器人系統(tǒng),步驟(1)、(2)可以進(jìn)行離線處理,可以減少運(yùn)行過程中的計(jì)算量,提高實(shí)時運(yùn)行速度。

        3 實(shí)驗(yàn)結(jié)果與分析

        為了驗(yàn)證本文方法的有效性,設(shè)置了一個積木收納的任務(wù)場景,如圖2所示。實(shí)驗(yàn)中使用的機(jī)器人為Kukaiiwa協(xié)作機(jī)器人,視覺檢測裝備為Kinectv2深度相機(jī),使用筆記本電腦作為上位機(jī)接收相機(jī)拍攝的任務(wù)場景信息,然后對機(jī)器人進(jìn)行控制。該任務(wù)需要機(jī)器人將桌子上工作空間內(nèi)擺放的積木收納到積木桶中。首先,通過合適的示教方式獲取示教數(shù)據(jù),以示教數(shù)據(jù)為訓(xùn)練數(shù)據(jù)離線訓(xùn)練示教模型;對于一個新的任務(wù)場景,使用Kinectv2相機(jī)檢測出積木顏色和形狀特征以及位姿,獲取任務(wù)參數(shù),然后使用訓(xùn)練好的示教模型規(guī)劃出運(yùn)動軌跡;最后由PC機(jī)控制機(jī)器人按照指定運(yùn)動軌跡完成任務(wù),每次任務(wù)中機(jī)器人起始位置固定。

        圖2 積木收納任務(wù)場景Fig.2 Building block storage task scene

        3.1 數(shù)據(jù)采集與預(yù)處理

        圖3 動覺示教Fig.3 Kinesthetic teaching

        機(jī)器人示教方法主要有三種:動覺示教、視覺示教及遙操作示教方法,三種方法各有優(yōu)劣。本實(shí)驗(yàn)采用的是動覺示教方法,示教過程如圖3所示。動覺示教也稱作手把手示教,對示教者的技術(shù)要求較低,能夠使示教者與機(jī)器人進(jìn)行物理交互,感受機(jī)器人的運(yùn)動模式及關(guān)節(jié)極限,由機(jī)器人自身的傳感器記錄關(guān)節(jié)角度和力矩的信息,為示教模型提供可靠的訓(xùn)練數(shù)據(jù)[5]。

        示教區(qū)域與示教點(diǎn)布置如圖4所示。示教區(qū)域的選擇由機(jī)器人關(guān)節(jié)極限以及任務(wù)場景共同決定。對于示教軌跡數(shù)量M的選取,從理論上講,有效示教軌跡數(shù)量M越多,模型的泛化性能越好,但總體來看,示教軌跡數(shù)量M并不是越多越好。首先,示教軌跡數(shù)量過多會導(dǎo)致模型計(jì)算效率下降,不利于運(yùn)用在實(shí)時運(yùn)行的機(jī)器人操作系統(tǒng)上;其次,示教軌跡數(shù)量過多會導(dǎo)致產(chǎn)生無效示教軌跡的概率增大,反而會對模型性能產(chǎn)生負(fù)面影響;最后,由于機(jī)器人示教學(xué)習(xí)方法傾向于使用小樣本學(xué)習(xí),在保證模型有較好性能的基礎(chǔ)上,盡可能使用數(shù)量較少的樣本,以減輕示教者的工作負(fù)擔(dān)。示教軌跡數(shù)量M需要綜合以上幾個因素,根據(jù)具體的任務(wù)條件進(jìn)行確定。本文共選取13個示教點(diǎn),其中9個作為訓(xùn)練點(diǎn),編號為1~9,對應(yīng)的示教軌跡作為模型訓(xùn)練數(shù)據(jù),為了使示教運(yùn)動軌跡盡可能表示真實(shí)的工作空間特征,將9個示教點(diǎn)均勻布置在示教區(qū)域;另外4個示教點(diǎn)作為測試點(diǎn),編號為a~d,對應(yīng)的示教軌跡作為測試數(shù)據(jù),用來檢驗(yàn)泛化方法的泛化性能,不用于模型訓(xùn)練。

        圖4 示教區(qū)域與示教點(diǎn)布置Fig.4 Teaching area and teaching point arrangement

        以示教點(diǎn)的積木空間位置作為任務(wù)參數(shù),為了避免單條示教軌跡的隨機(jī)性,在每個示教點(diǎn)以50 Hz的采樣頻率采集8組關(guān)節(jié)角軌跡,經(jīng)過正向運(yùn)動學(xué)將關(guān)節(jié)角軌跡轉(zhuǎn)化為笛卡兒空間軌跡,對每個示教點(diǎn)的8組示教運(yùn)動軌跡使用高斯混合模型(Guassian mixture model,GMM)建模,使用高斯混合回歸(Guassianmixture regression,GMR)計(jì)算出均值作為該示教點(diǎn)的示教運(yùn)動軌跡[6],如圖5所示。

        圖5 示教運(yùn)動軌跡Fig.5 Teaching trajectories

        在使用三種泛化方法對訓(xùn)練數(shù)據(jù)進(jìn)行建模的過程中,三種泛化方法的DMP部分超參數(shù)設(shè)置相同,基函數(shù)數(shù)量N=100,時間縮放量τ=1,αz=60,αx=1。

        3.2 泛化性能分析

        單次示教模型只包含單個示教點(diǎn)示教軌跡的特征,只在該示教點(diǎn)附近區(qū)域具有較好的泛化性能[7-8];多次示教模型則包含多個示教點(diǎn)示教軌跡的特征,可以使工作空間更大區(qū)域具有較好的泛化性能。為了比較單次與多次示教運(yùn)動軌跡學(xué)習(xí)得到的DMP模型的泛化性能,以圖5所示的4個測試點(diǎn)的積木空間位置作為待泛化任務(wù)參數(shù),用兩種模型分別生成相應(yīng)的泛化運(yùn)動軌跡,其結(jié)果如圖6所示,多次示教模型泛化出的軌跡相比單次示教模型要更順滑,變形更小,并且與圖4的對應(yīng)測試運(yùn)動軌跡更加相似,可知多次示教模型泛化性能優(yōu)于單次示教模型。相似度為

        (26)

        圖6 單次與多次示教模型泛化性能比較Fig.6 Comparison of generalization performance between single and multiple teaching models

        表1 遠(yuǎn)離示教點(diǎn)時泛化軌跡相似度比較Tab.1 Similarity comparison of generalized trajectories far from teaching point mm

        表2 示教點(diǎn)處泛化軌跡相似度比較Tab.2 Similarity comparison of generalized trajectories at teaching points mm

        當(dāng)任務(wù)參數(shù)遠(yuǎn)離示教任務(wù)參數(shù)時,由表1的4組數(shù)據(jù)可以看出,三種泛化方法與測試運(yùn)動軌跡的相似度差別很小,加權(quán)方法對應(yīng)4組數(shù)據(jù)的平均值與LWR方法的差別只有2%左右,而與GPR方法的差別不足1%,由此可以推斷三種泛化方法在任務(wù)參數(shù)遠(yuǎn)離示教任務(wù)參數(shù)時泛化性能大致相同。當(dāng)任務(wù)參數(shù)接近示教任務(wù)參數(shù)時,由表2的9組數(shù)據(jù)可以看出,在極限情況下,加權(quán)泛化方法與測試運(yùn)動軌跡的相似度明顯優(yōu)于另外兩種方法。

        為了進(jìn)一步分析三種泛化算法在示教任務(wù)參數(shù)附近的泛化性能,如圖7a所示,對以第5個訓(xùn)練點(diǎn)為圓心、半徑為20 mm的鄰近區(qū)域進(jìn)行分析。對于圖中A、B、C、D四個方向,其中A、B分別與x軸和y軸平行,C、D為對角方向,以圓心為中心點(diǎn),在每個方向均勻選取包括中心點(diǎn)在內(nèi)的21個點(diǎn)作為泛化點(diǎn),其中相鄰兩個點(diǎn)的距離為2 mm;對于每個方向的21個泛化點(diǎn),分別用三種泛化算法生成相應(yīng)的泛化運(yùn)動軌跡,用式(26)計(jì)算出與示教運(yùn)動軌跡的相似度,結(jié)果如圖7 b~圖7e所示。可以看出,在4個方向上加權(quán)泛化方法與示教運(yùn)動軌跡的相似度都要優(yōu)于另外兩種方法。經(jīng)過分析可知,本文方法在示教任務(wù)參數(shù)鄰近區(qū)域的泛化性能好于另外兩種方法。這主要是由于當(dāng)示教軌跡數(shù)量M確定時,對比另三種方法,本文方法會給予離新的泛化點(diǎn)最近的示教點(diǎn)對應(yīng)示教軌跡更大的權(quán)重。

        (a)示教任務(wù)參數(shù)鄰近區(qū)域 (b)方向A (c)方向B

        (d)方向C (e)方向D圖7 示教任務(wù)參數(shù)附近泛化性能比較Fig.7 Performance comparison in the vicinity of teaching task parameters

        3.3 計(jì)算效率分析

        圖8 時間復(fù)雜度增長趨勢Fig.8 The growth trends of time complexity

        就計(jì)算效率而言,主要考慮三種算法在線處理時的計(jì)算時間。從理論上分析三種方法的計(jì)算效率,相對于示教軌跡數(shù)量M,本文方法時間復(fù)雜度為O(M);基于GPR的泛化方法在求解式(22)時,需要對矩陣(K(Q,Q)+σn2I)求逆,時間復(fù)雜度為O(M3);基于LWR的泛化方法的計(jì)算時間集中在對式(11)目標(biāo)函數(shù)的優(yōu)化上,單次迭代時間復(fù)雜度為O(M2),總體迭代時間復(fù)雜度為O(lM2),其中,l為迭代次數(shù)。三種方法的計(jì)算時間都隨著示教軌跡數(shù)量M的增加而增加,三種時間復(fù)雜度的增長趨勢如圖8所示,可以看出,本文方法的計(jì)算效率在理論上要優(yōu)于另外兩種方法。為了進(jìn)一步比較三種方法在實(shí)驗(yàn)中的計(jì)算效率,對于圖3所示的13個示教點(diǎn),在使用三種泛化方法計(jì)算其泛化運(yùn)動軌跡時記錄了對應(yīng)的計(jì)算時間,結(jié)果見表3??梢娒糠N泛化算法在計(jì)算每條運(yùn)動軌跡的時間大致相等,而且數(shù)值都在其平均值附近波動;加權(quán)和GPR泛化方法的計(jì)算時間遠(yuǎn)遠(yuǎn)小于LWR泛化方法的計(jì)算時間,這是因?yàn)長WR泛化方法在優(yōu)化式(11)的目標(biāo)函數(shù)時,迭代次數(shù)過多,平均約為432次,花費(fèi)了大量計(jì)算時間;同時,加權(quán)泛化方法計(jì)算時間明顯少于GPR泛化方法計(jì)算時間。分析可知,本文方法的計(jì)算效率相比另外兩種泛化方法有了較大的提高。

        3.4 積木收納任務(wù)實(shí)驗(yàn)驗(yàn)證

        為了驗(yàn)證所提方法的有效性,設(shè)置了積木收納任務(wù)進(jìn)行實(shí)驗(yàn)驗(yàn)證。在示教區(qū)域隨意設(shè)置20個泛化點(diǎn),如圖9所示。在泛化點(diǎn)放置積木,以積木的空間位置作為待泛化任務(wù)參數(shù),代入訓(xùn)練好的模型得到泛化運(yùn)動軌跡,由PC控制機(jī)器人按照該運(yùn)動軌跡完成積木收納任務(wù)。單次積木收納任務(wù)流程如圖10所示,分別表示各種場景。共進(jìn)行了20次積木收納實(shí)驗(yàn),其中成功了17次,成功率為85%,證明了本文方法的有效性。

        表3 計(jì)算時間比較Tab.3 Calculation time comparisons s

        圖9 積木收納任務(wù)泛化點(diǎn)布置Fig.9 Layout of generalization points for building block storage task

        (a)起始位置 (b)接近積木

        (c)夾取積木 (d)靠近積木桶

        (e)到達(dá)對應(yīng)積木孔上方 (f)放置積木圖10 積木收納任務(wù)流程Fig.10 Process of building block storage task

        4 結(jié)論與展望

        針對機(jī)器人示教學(xué)習(xí)在新的任務(wù)場景下的泛化問題,本文提出了一種基于任務(wù)參數(shù)加權(quán)的動態(tài)運(yùn)動基元泛化方法,與已有的基于LWR和基于GPR的泛化方法相比,在計(jì)算效率和示教任務(wù)參數(shù)附近的泛化性能方面有了明顯的提升,使用Kukaiiwa協(xié)作機(jī)器人就積木收納任務(wù)進(jìn)行了機(jī)器人示教學(xué)習(xí)實(shí)驗(yàn),證明了該方法的有效性。

        本文方法主要針對的是機(jī)器人示教學(xué)習(xí)的軌跡層次的泛化問題,對于軌跡層次結(jié)合語義層次的泛化問題,該方法并不能很好地解決,這是目前機(jī)器人示教學(xué)習(xí)研究領(lǐng)域的一個難點(diǎn)和熱點(diǎn)。一種可能的解決方法是將本文方法進(jìn)行拓展,使用兩種示教方式同時進(jìn)行示教:一種采用拖動示教方式進(jìn)行軌跡層次的泛化,另一種采用視覺示教方式進(jìn)行語義層次的泛化,后續(xù)將繼續(xù)開展所提方法的研究。

        猜你喜歡
        方法
        中醫(yī)特有的急救方法
        中老年保健(2021年9期)2021-08-24 03:52:04
        高中數(shù)學(xué)教學(xué)改革的方法
        河北畫報(2021年2期)2021-05-25 02:07:46
        化學(xué)反應(yīng)多變幻 “虛擬”方法幫大忙
        變快的方法
        兒童繪本(2020年5期)2020-04-07 17:46:30
        學(xué)習(xí)方法
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        最有效的簡單方法
        山東青年(2016年1期)2016-02-28 14:25:23
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        亚洲一区二区三区在线视频| 欧美黑人性色黄在线视频| 无码超乳爆乳中文字幕| 精品黑人一区二区三区久久hd| 熟女体下毛荫荫黑森林| 无码骚夜夜精品| 人妻丰满av无码中文字幕| 中文字幕日本五十路熟女| 亚洲综合极品美女av| 亚洲а∨天堂久久精品2021| 精品视频无码一区二区三区| 色婷婷五月综合亚洲小说| 手机AV片在线| 日韩精品综合在线视频| 青春草免费在线观看视频| 污污内射在线观看一区二区少妇| 国产成人综合久久久久久| 国产精品自拍视频免费看| 亚洲小说区图片区色综合网| 久久久亚洲色| 久久久久AV成人无码网站| 亚洲av香蕉一区二区三区av| 成 人 免费 在线电影| 午夜性刺激免费视频| 蜜桃av噜噜噜一区二区三区| 国产精品天天看天天狠| 亚洲永久无码7777kkk| 日本欧美在线播放| 国语自产啪在线观看对白| 精品国产粉嫩内射白浆内射双马尾| 全球av集中精品导航福利| 丰满人妻无套中出中文字幕| 亚洲av专区一区二区| 亚洲av无码一区二区三区乱子伦| 欧美理论在线| 日本熟妇免费一区二区三区| 天天做天天爱夜夜爽| 少妇人妻在线视频| 亚洲欧洲日韩另类自拍| 经典亚洲一区二区三区| 亚洲成av人综合在线观看|