亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        看見門就能開?美國卡耐基梅隆大學(xué)研發(fā)新型機器人算法

        2022-08-20 00:35:28
        海外星云 2022年14期
        關(guān)鍵詞:真實世界模擬器軌跡

        在日常生活中,我們接觸的家具多為“鉸接物體”。何謂鉸接物體呢?

        比如,抽屜有一條可以抽拉的軌道,門有一個垂直的旋轉(zhuǎn)軸,烤箱有一個水平的旋轉(zhuǎn)軸。這種由關(guān)節(jié)連接起來的物品,我們就叫它“鉸接物體 ”。由于特定關(guān)節(jié)的存在,鉸接物體的零件會受到關(guān)節(jié)的運動學(xué)約束,讓這些零件只有一個自由度(DoF)。

        鉸接物體在我們生活中無處不在,構(gòu)成了我們?nèi)粘I钪匾囊徊糠?。而作為人類的我們,無論是看到什么樣的鉸接結(jié)構(gòu)的家具,我們都能快速地知道如何去操縱以及開動它。就像我們知道這些物體的每個關(guān)節(jié)都是如何運動的。

        那么機器人能不能也像人類一樣,擁有這種可以預(yù)測家具如何開動的能力呢?如果可以的話,那將對居家機器人來說是一種很大的提升。

        美國卡耐基梅隆大學(xué)研發(fā)新算法

        近日,來自美國卡耐基梅隆大學(xué)機器人學(xué)院大衛(wèi)·海倫教授的R-PAD實驗室的兩名學(xué)生本和哈利在有效操控復(fù)雜鉸接物體方面取得了重大突破,推出了一種基于3D神經(jīng)網(wǎng)絡(luò),能有效表達和預(yù)測日常家具等鉸接物體的零件運動軌跡的算法FlowBot 3D。

        該算法包含兩個主要子策略,其一是利用3D深度神經(jīng)網(wǎng)絡(luò)(PointNet++)去預(yù)測被操縱的物體點云數(shù)據(jù)的瞬時運動軌跡(3D Articulated Flw/3DAF),其二是利用預(yù)測出來的運動軌跡去選擇機器人下一步的動作。二者完全在模擬器中學(xué)習(xí),并可以直接部署到真實世界中,不需要重新訓(xùn)練或者微調(diào)。在FlowBot 3D算法的幫助下,機器人可以像人一樣隨意操縱日常家具等鉸接物體。

        以往的日常家具操控要么是已知被操縱物體的幾何特征(比如連接軸的位置及方向),要么通過模仿人類去學(xué)習(xí)如何操控一個給定的物體。二者都沒有較好的可泛化性并且需要大量人類數(shù)據(jù)去訓(xùn)練。

        與這些不同,F(xiàn)lowBot 3D是第一個基于模擬器學(xué)習(xí),通過學(xué)習(xí)每個零件的瞬時運動軌跡,使機器人可以計算出一條最優(yōu)的物體操縱路徑。這個特性使FlowBot 3D可以泛化到訓(xùn)練沒有見到的物體上,并且可以直接部署到真實世界。

        具體來說,F(xiàn)loBot 3D完全在模擬器中進行監(jiān)督學(xué)習(xí),從而學(xué)習(xí)出日常家具等鉸接物體零件的瞬時運動軌跡(3D Articulated Flow/3DAF)。3DAF是一種3D視覺表達方式,它能夠極大簡化策略的復(fù)雜度,從而提高操縱效率。機器人只需要緊密跟隨這條瞬時軌跡,并閉環(huán)地重新預(yù)測,就能成功操縱一個鉸接物體。

        開動冰箱門

        開動馬桶蓋

        開動抽屜

        機器人是如何做到的?

        這里的紅色向量就代表預(yù)測出的門的運動軌跡

        手動編碼的策略可以提高機器人在受控環(huán)境中的性能,但是想要機器人真正的理解家用物品的操控方式,唯一的方法是教機器人像人一樣去預(yù)測這些物體的運動軌跡以及運動學(xué)約束。

        想要賦予機器人預(yù)測物體運動軌跡能力,研究者通過監(jiān)督學(xué)習(xí)在模擬器中訓(xùn)練機器人的視覺模塊,因為家用物體的運動軌跡在模擬器中可以準確計算出來。

        在訓(xùn)練中,機器人觀測到一個被操縱物體的點云數(shù)據(jù),然后在這個點云數(shù)據(jù)上,機器人的視覺模塊利用PointNet++來對每一個點預(yù)測其在受外力下的下一步的位置。此運動軌跡的真實數(shù)據(jù)可以通過順向運動學(xué)準確計算出來。將計算出來的下一步坐標減去目前的坐標就能得到被操控物體零件的運動軌跡(3DAF)。因此,訓(xùn)練的時候只需要去最小化預(yù)測出的3DAF和真實數(shù)據(jù)的3DAF的最小平方誤差 。

        FlowBot 3D通過在模擬器中學(xué)習(xí)多種鉸接物體在運動學(xué)約束下運動的軌跡,來預(yù)測新物體的操縱方向。常見的家用絞接物品分為抽動式和旋轉(zhuǎn)式兩種。對于這兩種類別,研究者用物理定律證明了直接跟隨長度最長的3DAF方向(比如最遠離門旋轉(zhuǎn)軸的點)是可以最大化物體的加速度來達到操縱目的最佳策略。

        有了理論加成,機器人只需要選擇可抓取的最大3DAF預(yù)測點就可以有效率地操控這些物體。由于機器人的視覺模塊學(xué)習(xí)的是在運動學(xué)約束下的每點運動軌跡,此視覺模塊對機器人對物體可能的遮擋有一定的魯棒性。另外,由于FlowBot 3D算法是閉環(huán)算法,機器人可以在下一步對自己可能出現(xiàn)的錯誤進行修正。

        在真實世界中部署

        FlowBot通過使用兩個子系統(tǒng)(視覺和操縱系統(tǒng))克服了泛化性的挑戰(zhàn)。在真實世界中,F(xiàn)lowBot 3D可以準確預(yù)測出3D AF物體運動軌跡。只要這個軌跡可以準確預(yù)測出,那么操縱物體就只需要跟隨這個軌跡這么簡單。在真實世界中,F(xiàn)lowBot 3D只需要使用模擬器中訓(xùn)練出來的一個模型就可以操控真實物體。

        FlowBot3D在真實世界中部署的設(shè)置

        即使真實世界中的物體和模擬器中的外貌上有很大不同,只要兩者的運動學(xué)約束相似(抽動式或者旋轉(zhuǎn)式),那么FlowBot 3D就可以準確預(yù)測出操控物體的策略。

        在模擬器中,機器人使用部分類別的家用物品進行訓(xùn)練。訓(xùn)練的物體包括訂書機、垃圾箱、抽屜、窗戶和冰箱等。研究者在模擬器中利用這些物體去訓(xùn)練出來一個能準確預(yù)測3DAF方向和大小的模型。

        通過高準確度視覺模塊和比較簡單的操作策略模塊的這種組合,機器人可以快速的預(yù)測并且操控沒見過的物體。

        相比較而言,先前基于模仿學(xué)習(xí)或者強化學(xué)習(xí)的方法訓(xùn)練的機器人需要幾百萬的訓(xùn)練數(shù)據(jù),有時還需要人工指導(dǎo)才會學(xué)習(xí)新型物體的操控方式,使得這些機器人在現(xiàn)實世界中,尤其是家用機器人場景中不現(xiàn)實。

        實驗表明,支持FlowBot 3D部署的機器人成功地在操控較有難度的新型鉸接物體時表現(xiàn)優(yōu)于基于模仿學(xué)習(xí)部署的機器人。研究者使用相同的策略執(zhí)行所有現(xiàn)實世界的部署,而不需要任何模擬校準或現(xiàn)實世界的微調(diào)。

        實驗結(jié)果顯示,F(xiàn)lowBot 3D在操作多數(shù)物體時都能將對“全開”的距離達到10%以下。然而其他基于模仿學(xué)習(xí)或者強化學(xué)習(xí)的方法差了很遠。

        FlowBot 3D是機器人技術(shù)一項激動人心的進步,它可以無需微調(diào)在現(xiàn)實世界中部署高效且準確性強的家用機器人。這項工作還表明,計算機視覺的進步可以改變機器人領(lǐng)域,增強機器人的能力,同時使這些改進更易于擴展到新的條件。純粹依靠模擬器學(xué)習(xí)的方法有可能在直接部署到真實世界里,并且有較強的泛化性,這將大大降低未來家用機器人訓(xùn)練和學(xué)習(xí)的成本。

        關(guān)于實驗室及課題組

        這些工作是在卡內(nèi)基梅隆大學(xué)機器人學(xué)院的Robots Doing and Perceiving (R-PAD) 實驗室進行及完成的。R-PAD實驗室在可變形物體操縱(如學(xué)習(xí)理解布料)課題上處于世界領(lǐng)先地位。實驗室的負責(zé)人是畢業(yè)于斯坦福大學(xué)的大衛(wèi)·海爾德副教授,師從薩瓦雷塞。實驗室的主旨是利用計算機視覺方法幫助機器人去完成復(fù)雜的任務(wù)。

        大衛(wèi)·海爾德副教授相信,即使端對端學(xué)習(xí)方式很簡單,但是真正部署到機器人上的時候會遇到許多問題,所以研究者應(yīng)該將視覺與策略分開考慮,但是同時思考二者如何互相增加能力。在FlowBot 3D算法中,這個主旨深度體現(xiàn)了出來:3D Articulated Flow是一個可以極大簡化策略和規(guī)劃的視覺表示方式,在正確3D Articulated Flow預(yù)測的基礎(chǔ)上,策略會被簡化成追蹤flow向量。

        本文的第一作者是R-PAD實驗室二年級學(xué)生本,他對3D視覺學(xué)習(xí)有極大興趣,本科畢業(yè)于普林斯頓大學(xué),加入CMU之前,本曾在谷歌和三星北美研究所工作,從事機器人學(xué)習(xí)的研究。本文的共同第一作者是RPAD實驗室一年級學(xué)生Harry Zhang,他對視覺和控制學(xué)都有極大興趣,本科畢業(yè)于加州大學(xué)伯克利分校,加入CMU之前,哈利張在伯克利的BAIR實驗室負責(zé)可變形物體動態(tài)操縱項目。

        下一步,論文作者在嘗試將這種視覺理解方式應(yīng)用到鉸接物體以外的物體上面,比如如何用預(yù)測6自由度的物體軌跡。同時,作者在嘗試將應(yīng)用到強化學(xué)習(xí)里,以增加強化學(xué)習(xí)的學(xué)習(xí)效率。

        猜你喜歡
        真實世界模擬器軌跡
        多替拉韋聯(lián)合拉米夫定簡化方案治療初治HIV感染者真實世界研究
        傳染病信息(2022年6期)2023-01-12 08:57:10
        參麥寧肺方治療223例新冠病毒感染者的真實世界研究
        飛行模擬器大揭秘
        航空世界(2022年3期)2022-06-01 06:13:42
        了不起的安檢模擬器
        盲盒模擬器
        劃船模擬器
        軌跡
        軌跡
        軌跡
        虛擬世界和真實世界的紐帶
        国产美女主播视频一二三区| 亚洲日本VA午夜在线电影| 亚洲国产成人av第一二三区 | 日本一区二区不卡二区| 日韩视频在线观看| 亚洲va中文字幕无码| 久久久精品456亚洲影院| 色综合久久精品中文字幕| 久久99精品久久久久久清纯| 精品一区二区三区免费播放| 久久精品性无码一区二区爱爱| 久久久国产精品三级av| 国产av无码专区亚洲精品| 无码粉嫩虎白一线天在线观看| 毛片av在线播放亚洲av网站| 亚洲永久精品日韩成人av| 少妇久久久久久人妻无码| 真人二十三式性视频(动)| 精品人妻av区乱码| 久久综合久久综合久久| 久久国产精品99精品国产| 五月中文字幕| 中文字幕日韩精品亚洲精品| 久久国产成人精品av| 蜜桃成人无码区免费视频网站| 麻豆国产成人AV网| 国产精品成人av一区二区三区| 亚洲成a∨人片在线观看不卡| 91国视频| 国产一区二区三区porn| 无码一区二区三区| 人成午夜免费大片| 久久精品国产成人午夜福利| 亚洲成人av在线蜜桃| 激情航班h版在线观看| 最新国产精品亚洲二区| 亚洲av日韩精品一区二区| 日本又色又爽又黄的a片18禁| 热99re久久精品这里都是免费| 一级黄色一区二区三区视频| 国产成人无码av一区二区在线观看|