中國科學院深圳先進技術(shù)研究院智能仿生研究中心歐勇盛團隊在機器人點到點運動的軌跡規(guī)劃的控制器學習問題研究取得進展。相應(yīng)成果為“Jin SK, Wang ZY, Ou YS, et al. Learning accurate and stable dynamical system under manifold immersion and submersion [J]. IEEE Transactions on Neural Networks and Learning Systems, 2019, 30(12): 3598-3610(基于流形浸入與浸沒的動態(tài)系統(tǒng)精確穩(wěn)定學習)”。
近年來,機器人操作的應(yīng)用需求逐漸凸顯,已從在工廠中拾取工件、搬運貨物,或在家庭中幫人取物、打掃衛(wèi)生,延伸到了在水下開展救援、在太空勘探巖石、或在危險區(qū)域代替人類開展排爆作業(yè)等。這些場景大部分都屬于非結(jié)構(gòu)化環(huán)境,所涉及的任務(wù)也都是較為復雜和精巧的操作任務(wù),這些對于現(xiàn)階段的機器人而言必然存在著一些尚未解決的困難。機器人示教學習(Learning from Demonstrations,LfD)方法為機器人在非結(jié)構(gòu)化環(huán)境下從事復雜操作任務(wù)提供了全新的解決方案。 該研究提出了一種基于流形浸入和浸沒的學習方法來解決基于動態(tài)系統(tǒng)的示教學習方法中普遍存在的精度和穩(wěn)定性的矛盾問題。其中,流形浸入是一種單射映射,它可以將低維數(shù)據(jù)映射到高維空間。流形浸沒是一種可以將高維數(shù)據(jù)投影到低維空間的滿射映射。根據(jù)這樣的性質(zhì),該研究構(gòu)造了一個流形浸入,將 d 維的人類示教數(shù)據(jù)轉(zhuǎn)化為 d+1 維數(shù)據(jù)。該 d+1 維數(shù)據(jù)能夠與 Lyapunov 候選函數(shù)一致,并包含 d 維演示的動力學特征。隨后用該轉(zhuǎn)換數(shù)據(jù)學習一個 d+1 維空間的動態(tài)系統(tǒng)。當學習到的動態(tài)系統(tǒng)在 d+1 維的虛擬空間中進行軌跡復現(xiàn)時,通過構(gòu)造一個流形浸沒,將 d+1 維的復現(xiàn)軌跡轉(zhuǎn)換到機器人原運動空間。在構(gòu)造的流形浸沒下,轉(zhuǎn)換到機器人原空間的 d 維復現(xiàn)軌跡能夠保留 d+1 維空間復現(xiàn)軌跡運動學特征和對目標位置的穩(wěn)定性,從而有效地解決精度與穩(wěn)定性的矛盾。
通過構(gòu)造流形浸入和浸沒解決穩(wěn)定性與精度的矛盾
結(jié)果顯示,基于瑞士洛桑聯(lián)邦理工學院 LASA 實驗室開發(fā)的手寫運動數(shù)據(jù)集上可以看出,所提出的方法可以較好地解決穩(wěn)定性和學習精度間的矛盾。更進一步地,基于該研究中所提出的希臘字母手寫數(shù)據(jù)集 GREEK 上可看出,所提出方法還能夠?qū)崿F(xiàn)對交叉軌跡的學習與復現(xiàn),并保證復現(xiàn)精度和穩(wěn)定性。
該研究所提出的方法在升維后的空間進行動態(tài)系統(tǒng)的學習,能夠更加有效地避免學習出的控制策略對 Lyapunov 函數(shù)的違背。在保證滿足精度和穩(wěn)定性的要求后,再將高維空間的復現(xiàn)軌跡投影回原機器人空間,從而在原機器人運動空間產(chǎn)生一個既穩(wěn)定且準確的復現(xiàn)軌跡。通過這種變換的思想巧妙地避免了低維空間中學習出的動態(tài)系統(tǒng)難以同時保證精度和穩(wěn)定性的問題。