鐘佩思 張大衛(wèi) 張超 王曉
摘 要:
為提升康復外骨骼機器人的步態(tài)跟蹤性能,提出一種基于改進渦流搜索算法的迭代學習控制方法。首先針對傳統(tǒng)迭代學習控制抗擾性差和控制信息缺失問題,引入PD控制器、自適應遺忘因子、誤差過渡曲線和控制信息搜索等策略,改進迭代學習控制律;其次,基于多種策略對渦流搜索算法進行改進,提出了一種改進渦流搜索算法,改進后的算法可優(yōu)化迭代學習控制的PD參數;最后進行行走實驗,將提出的迭代學習控制方法與現有的同類算法進行仿真和數值比較,并測試了擾動情況下的跟蹤性能。實驗結果表明,所提方法的誤差更小,跟蹤性能更強。該算法改進了迭代學習控制的不足,具有較強的抗擾性能,保證了使用時的穩(wěn)定性。
關鍵詞:迭代學習控制;渦流搜索算法;步態(tài)跟蹤;外骨骼機器人;軌跡過渡;參數優(yōu)化
中圖分類號:TP242.6?? 文獻標志碼:A??? 文章編號:1001-3695(2024)03-034-0873-07doi: 10.19734/j.issn.1001-3695.2023.07.0316
Iterative learning control of exoskeleton based on improved vortex search algorithm
Zhong Peisi, Zhang Dawei, Zhang Chao, Wang Xiao
(Advanced Technology Research Center, Shandong University of Science & Technology, Qingdao Shandong 266590, China)
Abstract:
In order to improve the gait tracking performance of the rehabilitation exoskeleton robot, this paper proposed an iterative learning control method based on improved vortex search algorithm. Firstly, for the problems of poor immunity and missing control information of traditional iterative learning control, it introduced strategies such as PD controller, adaptive forgetting factor, error transition curve and control information search to improve the iterative learning control law. Secondly, it proposed an improved vortex search algorithm based on multiple strategies, and the algorithm could optimize the PD parameters of iterative learning control. Finally, it simulated and numerically compared the proposed iterative learning control method with existing similar algorithms on walking experiments, and test the tracking performance under perturbation. The experimental results show that the proposed iterative learning control method has smaller error and stronger tracking performance. The algorithm improves the shortcomings of the iterative learning control, has strong anti-interference performance, and ensures stability in use. Key words:iterative learning control; vortex search algorithm; gait tracking; exoskeleton robot; trajectory transition; para-meter optimization
0 引言
肢體康復訓練是下肢殘疾患者恢復肢體功能的主要方法。臨床實驗表明,通過康復外骨骼機器人代替人工訓練可以提升訓練精度、提高效率[1]。在恢復前期,病患不能自主地進行康復訓練,這一時期被稱為被動康復階段,應遵循“機主人輔”原則,即通過外骨骼機器人牽引病肢進行重復的康復訓練[2]。
基于訓練的重復性,可將迭代學習控制(iterative learning control,ILC)作為外骨骼機器人控制方法。迭代學習控制適用于重復執(zhí)行同一任務的被控系統(tǒng),其目標是通過不斷迭代,最終實現對參考軌跡的精確跟蹤,其不依賴精確的系統(tǒng)數學模型,適應性強,易于實現,已被應用于工業(yè)機械臂[3]、輪式機器人[4]和康復外骨骼機器人[5,6]。但由于系統(tǒng)誤差和外界擾動的存在,迭代學習控制存在初值偏離期望值,迭代長度不一的缺點,造成控制信息缺失,降低了控制性能,且迭代學習控制屬于前饋控制,抗擾動性較差。
針對控制信息缺失問題,Zhuang等人[7]采用逐次投法設計了隨機變長度控制律,相比于傳統(tǒng)迭代學習控制提高了收斂精度,但無法保證系統(tǒng)的抗擾性和魯棒性。Zeng等人[8]提出一種初值校正機制,放寬了初值一致條件,并實現了機械臂的精確跟蹤,但需要在每次迭代中重新設計過渡軌跡,運算量較大。針對抗擾性差,戴寶林等人[9]提出一種帶遺忘因子的迭代學習控制方法,并引入了最優(yōu)化理論,計算出最優(yōu)控制增益,但其使用了固定的遺忘因子,抗擾動能力欠佳。張長勝等人[10]提出一種基于改進狼群算法的自適應迭代學習策略,通過狼群算法來優(yōu)化控制律的參數,有效降低了機械臂的跟蹤誤差,但誤差的收斂速度較慢。安欣等人[11]通過粒子群算法優(yōu)化控制律參數,減少了迭代次數,提高了地震波的復現精度,但對于粒子群算法的改進較少,當控制系統(tǒng)擾動較強或粒子群算法陷入局部最優(yōu)時可能無法獲取最佳參數。
綜上所述,迭代學習控制的改進應以避免控制信息缺失問題和增強抗擾性為目的,并設計性能較強的優(yōu)化算法對控制律參數進行尋優(yōu),以降低控制誤差。為此,本文通過引入PD控制器、自適應遺忘因子、過渡曲線和控制信息搜索等策略改進了控制律,以提升抗擾性,彌補信息缺失;并基于Doan等人[12]提出的渦流搜索算法(vortex search,VS),通過建立新的候選解生成、半徑更新和圓心調整機制,提出一種改進渦流搜索算法(improved vortex search algorithm,IVS),將改進后的算法應用于控制律增益參數優(yōu)化,以提升控制效果。
2 改進渦流搜索算法
渦流搜索算法的原理是通過嵌套圓來模擬渦流采樣策略。迭代開始前,計算初始圓心位置和初始半徑。迭代開始后,渦流搜索算法通過高斯分布產生候選解,代入目標函數求得每次迭代的適應度,在每次迭代結束后將最優(yōu)解作為下次迭代的圓心,并更新搜索半徑[12]。渦流搜索算法的優(yōu)點是參數較少,易于實現,但渦流搜索算法只通過高斯分布產生候選解,易陷入局部最優(yōu),且易提供收斂速度慢、精度低的解。本文通過改進候選解的生成、半徑更新和圓心調整等策略,進一步提升優(yōu)化性能。
2.1 候選解生成策略
良好的初始解生成機制可有效避免優(yōu)化算法易陷入局部最優(yōu),本文提出一種基于Hammersley點集采樣的候選解初始化策略。Hammersley點集基于Van der Corput序列變換而來,其優(yōu)點是易于實現,且分布均勻性強于Halton序列和普通隨機數序列[16],缺點是無法擴展,只能生成固定數目的樣本,因此適合用于候選解的初始化策略。
研究表明,引入Lévy飛行可以更有效地探索全局空間[17]。在候選解的生成機制中引入Lévy飛行策略,在迭代前期通過Lévy飛行更新候選解,增強其全局搜索能力;當適應度滿足一定條件后,通過高斯分布更新候選解,保證其局部搜索能力。具體實現形式如式(11)所示。
3 實驗驗證
3.1 IVS算法性能評估
為了評估IVS算法的性能,本文使用了17個基準測試函數,包括9個單峰函數和8個多峰函數,選取標準VS算法、MVS算法[20]、文獻[21,22]作為對比算法。設定種群數為50,最大迭代次數為10 000次,維度均為30維。繪制上述五種算法在17個基準函數的適應度變化,如圖3所示。保持參數設置不變,五種算法在每個函數上獨立運行30次,表1和2展示了各算法在單峰和多峰函數下的尋優(yōu)結果。
由圖3可知,IVS的收斂速度相較傳統(tǒng)VS更快,但在多數函數上弱于MVS和文獻[21]。由表1和2可知,IVS相較其他算法有著更高的收斂精度和更小的標準差。在sphere、Beale、Bohachevsky、Griewank、Rastrigin、Shubert、Eggholder和drop-wave函數上,IVS均收斂至最優(yōu),且在多數函數中以較少迭代次數收斂。綜上,IVS相較于對比算法具有收斂精度高,尋優(yōu)效果穩(wěn)定和適用性強的優(yōu)勢。
3.2 控制效果評估
為驗證本文算法在實際應用中的控制效果,通過外骨骼機器人進行了行走實驗,如圖4所示。
外骨骼機器人通過PC機作為上位機,進行控制程序編寫、數據傳輸和指令發(fā)送,各關節(jié)角度變化由姿態(tài)傳感器MPU6050測得并傳至PC機。數據預處理后,擬合得到四個關節(jié)在1 s內的角度變化曲線,將其作為期望曲線,如式(17)所示。
其中:q1、q2、q3、q4分別為擬合得到的左膝、右膝、左髖和右髖關節(jié)的期望關節(jié)曲線。
選取文獻[23,24]與本文算法進行跟蹤性能對比。文獻[23]為傳統(tǒng)PD型迭代學習控制,與本文改進PD型迭代學習控制對比,以突出本文算法的性能優(yōu)勢;文獻[24]則為一種新型迭代學習控制算法,將本文算法與之對比,以體現本文算法在同類迭代學習控制算法中的優(yōu)勢。兩者實現形式如式(18)(19)所示。文獻[24]高階參數α1=1.2、α2=-0.1、α3=-0.1,初值取10,其他控制參數設置如表3所示。其中本文算法增益系數由IVS算法優(yōu)化得出,需設置范圍。IVS種群數取50,優(yōu)化算法迭代次數取100。左膝、右膝、左髖和右髖的控制輸入初值u0均取0。
對每個時間變量的誤差取絕對值,從絕對值中取最大值作為當代最大誤差。下肢關節(jié)的誤差變化如圖5所示。
本文算法在圖5中存在采樣點缺失,這是由于該采樣點時刻誤差極小,已接近或等于0,其原理等同于圖3中測試函數適應度收斂至0后,后續(xù)采樣點數據缺失。由圖5可知,文獻[23]誤差最大,且存在波動;相比其他兩種算法,本文算法跟蹤精度在四種關節(jié)曲線上更高,在采樣點缺失時刻實現了軌跡的精確跟蹤。
為驗證本文算法對突發(fā)外界干擾的魯棒性和響應能力,對軌跡曲線施加擾動項,擾動項為基于Tent混沌映射產生的介于(-4,4)的隨機值,跟蹤效果如圖6所示。
迭代學習控制效果取決于能否在較少代數內實現低誤差。由圖6可知,第5次迭代時誤差較大,到第10次迭代時已基本實現良好的軌跡跟蹤,到第20次迭代已可以準確跟蹤期望曲線,說明當存在外界干擾時,控制系統(tǒng)能迅速響應,消除其帶來的誤差,以起到對穿戴者保護的作用。
在實際情況下,擾動通常伴隨整個行走過程。本文以左膝和左髖為實驗對象,在期望曲線中加入均值為0,標準差為0.5的高斯分布噪聲干擾項,跟蹤效果如圖7所示。由圖7可知,在整個行走周期內加入噪聲干擾后,本文算法跟蹤誤差在較少代數內依然能收斂至較低值。左膝最大誤差在第5次迭代為5.34,在第20次迭代為0.005 2;左髖最大誤差在第5次迭代為1.89,第20次迭代為0.002 9。其中左膝在迭代次數較少時出現誤差波動,當迭代次數增大后,誤差波動逐漸消失,保證了外骨骼機器人運作時的安全性和魯棒性。
4 結束語
本文針對傳統(tǒng)迭代學習控制抗擾性差、初值誤差和時間間隔不定等問題,改進了控制律,加入了PD控制器和遺忘因子,設計了過渡曲線和搜索機制,并基于改進的候選解更新策略、半徑更新策略和圓心變異策略,設計了IVS算法,將其應用于PD控制器的參數尋優(yōu),提出了一種新的迭代學習控制方法,并用于外骨骼的步態(tài)跟蹤。本文選取了幾種目前已有的改進渦流算法與IVS進行對比,仿真結果表明,IVS的優(yōu)化性能優(yōu)于同類算法;本文亦選取了幾種已有的迭代學習控制方法予以對比,證明了本文算法的跟蹤性能更強。但不足的是IVS本身仍存在如傳統(tǒng)VS算法類似的收斂速度慢的問題,未來可通過種群分組尋優(yōu)等策略以加快收斂速度,從而提高其在實際工程問題中的效率。
參考文獻:
[1]Azocar A F,Rouse E J. Characterization of open-loop impedance control and efficiency in wearable robots [J]. IEEE Robotics and Automation Letters,2022,7(2): 4313-4320.
[2]劉泉,謝先亮,孟偉,等. 柔性腳踝康復機器人自適應迭代學習控制 [J]. 華中科技大學學報: 自然科學版,2023,51(5): 53-59. (Liu Quan,Xie Xianliang,Meng Wei,et al. Adaptive iterative lear-ning control of flexible ankle rehabilitation robot [J]. Journal of Huazhong University of Science and Technology: Natural Science Edition,2023,51(5): 53-59.)
[3]Shi Huihui,Chen Qiang. Error-tracking iterative learning control for the constrained flexible-joint manipulator with initial errors [J]. Sustainability,2022,14(19): 12453.
[4]游東亞,崔立志,卜旭輝,等. 輪式機器人縱向滑移迭代學習軌跡跟蹤控制 [J]. 電光與控制,2022,29(9): 96-101. (You Dongya,Cui Lizhi,Bu Xuhui,et al. Longitudinal slippage iterative learning trajectory tracking control of wheeled robots [J]. Electro-nics Optics & Control,2022,29(9): 96-101.)
[5]胡鴻越,胡立坤,劉貽達,等. 一種柔性下肢外骨骼控制策略研究 [J]. 儀器儀表學報,2020,41(3): 184-191. (Hu Hongyue,Hu Likun,Liu Yida,et al. Control method for the soft lower limb exosuit [J]. Chinese Journal of Scientific Instrument,2020,41(3): 184-191.)
[6]Kun Qian,Li Zhenhong,Zhang Zhiqiang,et al. Data-driven adaptive iterative learning control of a compliant rehabilitation robot for repetitive ankle training [J]. IEEE Robotics and Automation Letters,2022,8(2): 656-663.
[7]Zhuang Zhihe,Tao Hongfeng,Chen Yiyang,et al. Iterative learning control for repetitive tasks with randomly varying trial lengths using successive projection [J]. International Journal of Adaptive Control and Signal Processing,2022,36(5): 1196-1215.
[8]Zeng Chun,Shen Dong,Wang Jinrong. Adaptive learning tracking for robot manipulators with varying trial lengths [J]. Journal of The Franklin Institute,2019,356(12): 5993-6014.
[9]戴寶林,龔俊,李翠明. 帶遺忘因子迭代學習控制最優(yōu)增益研究 [J]. 西北工業(yè)大學學報,2019,37(5): 1077-1084. (Dai Baolin,Gong Jun,Li Cuiming. Optimal gains of iterative learning control with forgetting factor [J]. Journal of Northwestern Polytechnical University,2019,37(5): 1007-1084.)
[10]張長勝,馬澤楠,李寬,等. 改進狼群算法的SCARA機械臂自適應迭代學習控制 [J]. 機械科學與技術,2020,39(8): 1177-1183. (Zhang Changsheng,Ma Zenan,Li Kuan,et al. Adaptive iterative learning control of SCARA manipulator with improved wolf pack algorithm [J]. Mechanical Science and Technology for Aerospace Engineering,2020,39(8): 1177-1183.)
[11]安欣,高峰,楊巧玉,等. 基于前饋補償的振動臺粒子群迭代學習控制算法 [J]. 振動與沖擊,2022,41(1): 213-220. (An Xin,Gao Feng,Yang Qiaoyu,et al. PSO iterative learning control algorithm for shaking table based on feedforward compensation [J]. Journal of Vibration and Shock,2022,41(1): 213-220.)
[12]Doan B,lmez T. A new metaheuristic for numerical function optimization: vortex search algorithm [J]. Information Sciences,2015,293: 125-145.
[13]王文東,肖孟涵,孔德智,等. 基于人機耦合模型的上肢康復外骨骼閉環(huán)PD迭代控制方法 [J]. 機械工程學報,2021,57(21): 11-21. (Wang Wendong,Xiao Menghan,Kong Dezhi,et al. Closed-loop PD iterative control method for upper limb rehabilitation exoskeleton based on human-robot coupling model [J]. Journal of Mechanical Engineering,2021,57(21): 11-21.)
[14]陳強,陳凱杰,施卉輝,等. 機械臂變長度誤差跟蹤迭代學習控制 [J]. 自動化學報,2023,49(12): 1-11. (Chen Qiang,Chen Kaijie,Shi Huihui,et al. Error tracking iterative learning control for robot manipulators with varying iterative lengths [J]. Acta Automatica Sinica,2023,49(12): 1-11.)
[15]Li Xuefang,Shen Dong. Two novel iterative learning control schemes for systems with randomly varying trial lengths [J]. Systems & Control Letters,2017,107: 9-16.
[16]Wu Chenxi,Zhu Min,Tan Qinyang,et al. A comprehensive study of non-adaptive and residual-based adaptive sampling for physics-informed neural networks [J]. Computer Methods in Applied Mechanics and Engineering,2023,403: 115671.
[17]Wang Wenchuan,Xu Lei,Chau K,et al. Cε-LDE: a lightweight va-riant of differential evolution algorithm with combined ε constrained method and Lévy flight for constrained optimization problems [J]. Expert Systems with Applications,2023,211: 118644.
[18]Liu Jingsen,Li Haoran,Li Yu,et al. An enhanced vortex search algorithm based on fluid particle density transfer for global and engineering optimization [J]. Applied Soft Computing,2023,135: 110024.
[19]Gao Yong,Zhang Hao,Duan Yingying,et al. A novel hybrid PSO based on levy flight and wavelet mutation for global optimization [J]. PLoS One,2023,18(1): e0279572.
[20]李學貴,郭遠濤,李盼池,等. 基于改進渦流搜索算法的支持向量機分類模型 [J]. 吉林大學學報: 信息科學版,2020,38(3): 312-318. (Li Xuegui,Guo Yuantao,Li Panchi,et al. Classification model of support vector machine based on modified vortex search algorithm [J]. Journal of Jilin University: Information Science Edition,2020,38(3): 312-318.)
[21]Toz M. Chaos-based vortex search algorithm for solving inverse kinematics problem of serial robot manipulators with offset wrist [J]. Applied Soft Computing,2020,89: 106074.
[22]Gharehchopogh F S,Maleki I,Dizaji Z A. Chaotic vortex search algorithm: metaheuristic algorithm for feature selection [J]. Evolutionary Intelligence,2022,15(3): 1777-1808.
[23]Dong Jian,He Bin,Zhang Chenghong,et al. Open-closed-loop PD ite-rative learning control with a variable forgetting factor for a two-wheeled self-balancing mobile robot [J]. Complexity,2019,2019: 5705126.
[24]Ai Qingsong,Ke Da,Zuo Jie,et al. High-order model-free adaptive iterative learning control of pneumatic artificial muscle with enhanced convergence [J]. IEEE Trans on Industrial Electronics,2019,67(11): 9548-9559.