亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大腦情感學習的四輪驅(qū)動機器人速度補償控制

        2013-11-26 01:19:20陳建平王建彬楊宜民
        智能系統(tǒng)學報 2013年4期
        關鍵詞:輪子移動機器人軌跡

        陳建平,王建彬,楊宜民

        (1.肇慶學院計算機學院,廣東 肇慶526061;2.廣東工業(yè)大學自動化學院,廣東 廣州510090)

        全向移動機器人具有全方位移動的功能,可以在不改變位姿的情況下向任意方向運動,憑借獨特的運動優(yōu)勢,在國內(nèi)外中型組機器人大賽中,得到了大力的推廣和發(fā)展,但其復雜的輪系分布給機器人的控制帶來了難度[1].機器人受到堵轉、摩擦、打滑及各種擾動因素的影響,導致機器人的運動能力變差而偏離目標點,控制精度不高[2].因此,大多數(shù)研究是從如何改善各個輪的驅(qū)動控制環(huán)的動態(tài)性能出發(fā),通過各種先進的控制與補償技術提高對每個輪驅(qū)動電機的控制精度,然而這種方法沒有考慮機器人整體的速度跟蹤誤差[3-7].

        文獻[8]依據(jù)交叉耦合思想設計了2輪差動機器人的速度補償控制器,但是難以應用到相對復雜的全向移動機器人運動控制中.文獻[9]為提高機器人靈巧手基關節(jié)的軌跡跟蹤精度,提出了包含同步誤差和位置誤差反饋項及平滑魯棒非線性反饋補償項的交叉耦合同步控制策略,由于該方法需要復雜的計算求解,導致很難滿足全向移動機器人運動控制的實時性要求.文獻[10]基于模糊控制與PD控制理論設計了一種速度補償控制器,對機器人4個輪子的速度進行補償,由于控制規(guī)則要靠經(jīng)驗確定,參數(shù)變化缺乏自適應和自學習能力,控制過程中存在死區(qū),導致機器人在速度較大時控制偏差變大而得不到及時調(diào)整,甚至出現(xiàn)失控現(xiàn)象.

        針對上述方法的不足,本文提出了一種基于大腦情感學習的4輪驅(qū)動機器人速度補償控制方法.利用大腦情感學習能力強、計算簡單的特點[11-12],對機器人整體的速度誤差設計合理的誤差補償器,在不改變機器人內(nèi)部控制結構的情況下,為機器人4個輪子提供附加的補償控制量,進而提高機器人整體的運動控制精度.

        1 全方位移動機器人運動學模型

        建立4輪全方位移動機器人的輪系分布系統(tǒng),如圖1所示[13].由于所用比賽足球機器人的射門機構的增加,導致4個全向輪不是對稱分布,而是前2輪夾角為120°,后2輪夾角為90°.

        圖1 機器人運動學模型Fig.1 Kinetic model of the robot

        根據(jù)圖1所示,建立機器人運動坐標系,XOY為世界坐標系,xoy為以機器人中心為原點的局部坐標系,得到機器人運動學方程為

        式中:θ為機器人的運動方向;vθ為機器人的角速度,逆時針方向為正;v1、v2、v3、v4分別為4 個車輪的線速度;δ1和δ2為各輪與x軸的夾角;L為車體中心到輪子中心的距離.

        車輪的線速度和角速度之間的關系如式(2):

        式中:R 為輪子半徑;ω1、ω2、ω3、ω4為輪子角速度,逆時針方向為正.

        2 四輪驅(qū)動機器人的速度補償控制系統(tǒng)

        根據(jù)機器人足球比賽的實際需要,設計4輪驅(qū)動足球機器人的速度補償控制系統(tǒng),其結構框圖如圖2所示.

        圖2 機器人的速度補償控制系統(tǒng)結構Fig.2 Structure of velocity compensation controller for the robot

        由圖2可知,將實際測得的機器人整體的實際速度與其參考速度進行比較,經(jīng)過速度補償控制器處理后得到4個輪子關于機器人整體速度誤差的額外補償量.從而在不改變各輪子內(nèi)環(huán)控制結構的前提下,實現(xiàn)了對機器人整體速度的有效補償,提高了系統(tǒng)運動控制的精度.

        3 基于大腦情感學習的速度補償控制

        3.1 大腦情感學習計算模型

        Moren等于2000年提出了基于神經(jīng)生理學的大腦情感學習(brain emotional learning,BEL)計算模型[11],該模型在不完全模仿杏仁核、眶額皮質(zhì)等生理結構的基礎上,將大腦情感學習模型劃分為兩大組成部分,即分別對應杏仁核和眶額皮質(zhì).大腦情感學習模型的基本工作原理及結構如圖3所示.

        圖3 大腦情感學習模型的基本結構Fig.3 Structure of brain emotional learning model

        由圖3可知,感官輸入信號SI的最大值通過丘腦傳遞給杏仁體,則有Ath=max(SI).

        1)對于每一個刺激信號,杏仁體內(nèi)均有一個對應節(jié)點Ai來接收,該刺激信號包括感官輸入信號SI、獎勵信號REW以及丘腦信號Ath,則杏仁體的輸出為

        式中:m為刺激信號的數(shù)目,Vi為各節(jié)點的權值,其調(diào)節(jié)律為:

        式中:α為學習率,它影響杏仁體的學習速度;ΔVi的單調(diào)性與SIi的符號保持一致.

        2)對于刺激信號,眶額皮質(zhì)內(nèi)也有節(jié)點接收,它的刺激信號為感官皮質(zhì)信號(即感官輸入信號)和來自杏仁體的信號,而對丘腦的信號不產(chǎn)生刺激.它的輸出為

        式中:Wi為各節(jié)點的權值,它的調(diào)節(jié)律為

        式中:β為學習率,且β>0,E'為不含丘腦信號刺激下的杏仁體的輸出,可表示為

        由式(3)~(8)可以看出,ΔWi可取正值也可取負值,即眶額皮質(zhì)能抑制或增強杏仁體的學習過程,通過消除獎勵信號REW與杏仁體輸出E'之間的差值,使杏仁體向著期望值學習.

        3.2 基于大腦情感學習的速度補償控制器

        BEL模型與實際系統(tǒng)相結合,必須事先確定感官輸入信號SI和獎勵信號REW的函數(shù)形式,分別稱之為感官輸入函數(shù)和情感暗示函數(shù),它們?yōu)橄到y(tǒng)的輸入與輸出、控制量以及跟蹤誤差等因素的函數(shù).因為A-O組織中的可調(diào)權值較多,其節(jié)點個數(shù)通常設置為多個,因此,感官輸入函數(shù)通常為向量形式.

        由于全向移動機器人的角速度可以單獨進行規(guī)劃,此處只討論機器人的線速度補償控制器.又由于機器人在局部坐標系的x和y方向上有相似的運動特性,因此本文以x方向上的線速度為例設計補償控制器.基于大腦情感學習的速度補償控制器結構如圖4所示.

        圖4 基于大腦情感學習的速度補償控制器Fig.4 Velocity compensation controller based on brain emotional learning

        設x方向機器人的線速度誤差為e,為了便于與文獻[10]中的方法進行比較,選取感官輸入函數(shù)為PID控制器的形式,則有感官輸入函數(shù)為

        以刺激學習的獎勵信號REW為目標函數(shù)的情感暗示函數(shù)為

        則有BEL模型的輸出為

        式中:k1、k2、k3、k4、r1、r2、r3分別為權重調(diào)節(jié)系數(shù),r1、r2、r3為對象誤差減小的期望.k1~k4的調(diào)節(jié)律為:

        式中:SIi表示SI中的各個向量元素.

        通常,神經(jīng)網(wǎng)絡學習需要利用系統(tǒng)的導數(shù)信息,按照梯度下降的思想進行權值的更新迭代,易受到初始取值的影響,計算效率低;而由權值調(diào)節(jié)式(4)、(5)和(7)可知,本文設計的控制器在運行時,不需要具體的導數(shù)信息就能夠?qū)崿F(xiàn)各個權值系數(shù)的迭代更新,對初始值的選取不敏感,計算效率高,這也是該方法與神經(jīng)網(wǎng)絡學習的本質(zhì)區(qū)別.同時,該控制器直接以誤差的PID控制函數(shù)形式作為獎勵信號函數(shù),從而保證了控制系統(tǒng)的穩(wěn)定性.

        4 仿真實驗及結果分析

        為驗證本文所提方法的有效性,進行了機器人路徑跟蹤仿真實驗,令機器人跟蹤x方向的直線路徑.實驗過程中,分別采用無速度補償控制(NVCC)、模糊 PD 速度補償控制(FUPD)[10]以及本文方法(BELVC)進行仿真.

        以實驗室的“太極隊”中型組足球機器人作為研究對象進行仿真實驗研究,機器人輪子直流電機的具體性能參數(shù)設置情況詳見文獻[13].BEL控制器的基本參數(shù)初始值設定為k1=10、k2=0.5、k3=0.01、r1=1 300、r2=25 000、r3=10.

        4.1 學習率對系統(tǒng)的影響

        當學習率α、β取不同的數(shù)值情況時(分別為方案1:α =0.001,β =0.02;方案 2:α =0.001,β =0.035;方案 3:α =0.005,β =0.015;方案 4:α=0.000 5,β =0.001),系統(tǒng)的階躍響應如圖 5 所示.

        圖5 不同學習率情況下的系統(tǒng)響應Fig.5 System response in different learning rate situations

        由圖5可知,當BEL控制器的基本參數(shù)不變時,權值學習率α、β的選取對控制器響應結果的影響非常明顯.當α的值恒定時,β的值越大,系統(tǒng)響應越快,但是系統(tǒng)的振蕩幅度越大,系統(tǒng)達到穩(wěn)定狀態(tài)的時間越長;當α、β的取值同時減小時,系統(tǒng)的振蕩幅度也減小,當α、β的取值繼續(xù)減小時,則系統(tǒng)達到穩(wěn)定狀態(tài)需要更長的時間.

        4.2 機器人速度與軌跡跟蹤

        實驗中,選取第1組學習率參數(shù)方案進行控制,即取 α =0.001、β=0.02.為了更好地研究BEL 控制器的優(yōu)越性,當t=2 s時,在給定的輸入信號中加入擾動,所得到的機器人1號輪子(由于本實驗室所用4輪機器人的4個電機參數(shù)相同,因此在進行仿真時僅給出了1號輪子的仿真曲線,其他3個輪子與之相似,故作省略)的速度跟蹤曲線以及機器人整體的軌跡跟蹤結果分別如圖6~8所示.

        圖6 1號電機無擾動時的速度跟蹤曲線Fig.6 Velocity tracking curve of the No.1 motor without interference

        圖7 1號電機有擾動時的速度跟蹤曲線Fig.7 Velocity tracking curve of the No.1 motor with interference

        圖8 機器人整體的軌跡跟蹤曲線Fig.8 Trajectory tracking curve of the robot

        表1所示為采用不同控制方法時,機器人軌跡跟蹤的最大偏差與平均偏差的對比統(tǒng)計情況.

        表1 機器人軌跡跟蹤偏差比較Table 1 Comparison of trajectory tracking error m

        由圖6~8可以看出,在機器人未采用速度交叉耦合補償時,由于場地材料不同、4個輪子裝配上存在誤差、輪子與場地之間摩擦力不一致、4個驅(qū)動電機存在機械差異等原因,使得機器人在加速過程中4個輪子的加速程度不一致,同時也使得4個輪子的轉速與其期望值之間存在較大偏差,機器人很難跟蹤預先期望的運行軌跡;當采用模糊PD控制方法時,由于模糊規(guī)則建立的主觀性,參數(shù)變化缺乏自適應和自學習能力,控制過程中容易出現(xiàn)控制死區(qū)的現(xiàn)象,導致機器人在速度較大時控制偏差變大而得不到及時調(diào)整,機器人4個輪子的轉速出現(xiàn)較大幅度的波動,跟蹤軌跡的精度變差,并且當機器人的速度越大時,軌跡跟蹤的偏差也越大,甚至會出現(xiàn)失控的現(xiàn)象;當采用本文所設計的方法BELVC進行控制時,4個輪子速度跟蹤的波動明顯減小,從而使得機器人的運行軌跡更加接近期望軌跡.

        由圖7可知,當系統(tǒng)出現(xiàn)外界擾動的情況下,BEL控制器的反應比模糊PD控制器的反應更快,輸出響應曲線更平滑,系統(tǒng)更穩(wěn)定,減小了外界擾動對系統(tǒng)的影響,從而使控制系統(tǒng)呈現(xiàn)出良好的魯棒性.同時,由表1可知,在進行軌跡跟蹤時,采用本文設計方法BELVC的情況下,機器人軌跡跟蹤的最大偏差和平均偏差均小于其他2種方法.由此,進一步驗證了本文設計方法BELVC確實提高了機器人軌跡跟蹤的精度.

        5 結束語

        由于全向移動機器人復雜的機械結構,其4個輪子之間存在著耦合關系,即使單個電機的控制參數(shù)達到最優(yōu),整個機器人的控制效果也未必理想.同時,由于4個驅(qū)動電機的參數(shù)不一致、負載的擾動、各個輪子安裝時的機械差異等種種因素的影響,不可避免地將會導致機器人在運動過程中,其實際位姿和期望位姿之間存在偏差.引入本文的基于大腦情感學習的4輪驅(qū)動機器人速度補償控制器以后,將機器人整體的速度誤差轉換為4個輪子轉速的額外補償量,在不改變機器人內(nèi)環(huán)電機轉速控制結構的情況下,通過大腦情感學習模型內(nèi)部各節(jié)點權值的在線學習,及時地調(diào)整4個輪子的轉速,有效地減小了機器人整體的速度誤差,進一步提高了其軌跡跟蹤的精度,從而改善了機器人的運動性能.然而,本文中BEL控制器各相關參數(shù)的選取主要是在仿真環(huán)境下采用試湊法獲得的,有關算法的收斂性以及學習率取值的定量分析等問題將在今后工作中做進一步研究.

        [1]EFENDI M S,MOHAMED R,SAZALI Y.Designing omnidirectional mobile robot with mecanum wheel[J].American Journal of Applied Sciences,2006,3(5):1831-1835.

        [2]BAHAA I K,ALI H H,MUSTAFA M M.Modified vector field histogram with a neural network learning model for mobile robot path planning and obstacle avoidance[J].International Jouranl of Advancements in Computing Technology,2010,2(5):166-173.

        [3]ALI H H,F(xiàn)ATIMA B I.Path lanning of mobile robot based on modification of vector field histogram using neuro-fuzzy algorithm[J].International Journal of Advancements in Computing Technology,2010,2(3):129-138.

        [4]MARYAM R,MOHAMMAD H K,MOHAMMAD A N,et al.Designing the fuzzy controller in mobile robot navigation with the presence of unknown obstacles[J].International Journal of Intelligent Information Processing,2012,3(1):45-62.

        [5]ALBERTO V,CARL T,BENGT L,et al.Modeling and optimization of energy consumption in cooperative multi-robot systems[J].IEEE Transactions on Automation Science and Engineering,2012,9(2):423-428.

        [6]ELEFTHERIA S S,GEORGE S S,ANASTASIOS D P.Optimal robot speed trajectory by minimization of the actuator motor electromechanical losses[J].Journal of Intelligent and Robotic Systems,2002,33:187-207.

        [7]熊蓉,張翮,褚健,等.四輪全方位移動機器人的建模和最優(yōu)控制[J].控制理論與應用,2006,23(1):96-98.XIONG Rong,ZHANG He,CHU Jian,et al.Modeling and optimal control of omni-directional mobile robots[J].Control Theory and Applications,2006,23(1):96-98.

        [8]曹洋,徐心和.一種基于交叉耦合的速度控制器[J].東北大學學報,2003,24(5):420-423.CAO Yang,XU Xinhe.Cross-coupling speed controller[J].Journal of Northeastern University,2003,24(5):420-423.

        [9]蘭天,劉伊威,陳養(yǎng)彬,等.機器人靈巧手基關節(jié)交叉耦合同步控制[J].機器人,2010,32(2):150-156.LAN Tian,LIU Yiwei,CHEN Yangbin,et al.Synchronized cross-coupled control for base joint of dexterous robot hand[J].Robot,2010,32(2):150-156.

        [10]匡建輝,楊宜民.基于模糊PD控制的四輪驅(qū)動全向移動機器人速度補償控制器研究[J].計算技術與自動化,2011,30(1):21-25.KUANG Jianhui,YANG Yimin.Velocity compensate controller of four-wheel drive omni-directional mobile robots based on fuzzy-PD control method[J].Computing Technology and Automation,2011,30(1):21-25.

        [11]LUCAS C,SHAHMIRZADI D,SHEIKHOLESLAMI N.Introducing BELBIC:brain emotional learning based intelligent controller[J].International Journal of Intelligent Automation and Soft Computing,2004,10(1):11-22.

        [12]MEHRABIAN A R,LUCAS C.Emotional learning based intelligent robust adaptive controller for stable uncertain nonlinear systems[J].International Journal of Computational Intelligence,2005,2(4):1304-4508.

        [13]CHEN J P,WANG J B,YANG Y M.A motion control method of four-wheel drive omni-directional mobile robots based on multi points preview control[J].Journal of Theoretical and Applied Information Technology,2012,45(1):278-284.

        猜你喜歡
        輪子移動機器人軌跡
        移動機器人自主動態(tài)避障方法
        兩個輪子“走路”
        軌跡
        軌跡
        沒有輪子的挖挖
        幼兒園(2020年22期)2020-03-29 02:17:54
        讀北島:一只輪子,尋找另一只輪子
        中學語文(2019年31期)2019-12-05 04:54:10
        軌跡
        基于Twincat的移動機器人制孔系統(tǒng)
        進化的軌跡(一)——進化,無盡的適應
        中國三峽(2017年2期)2017-06-09 08:15:29
        自由轉動
        亚洲一区二区精品在线| 超薄肉色丝袜一区二区| 中文字幕一区二区三区乱码不卡| 成人做爰视频www| 亚洲欧美另类精品久久久| 精品国产一区二区三广区| 漂亮丰满人妻被中出中文字幕| 久久久亚洲av成人网站 | 国产在线视频网友自拍| 国产午夜av秒播在线观看| aaa级久久久精品无码片| 一区二区韩国福利网站 | 丰满少妇被啪啪到高潮迷轩| 久久久无码精品亚洲日韩蜜臀浪潮 | 老肥熟女老女人野外免费区| 亚洲丰满熟女一区二亚洲亚洲| 狠狠的干性视频| 欧洲女人性开放免费网站| 中文毛片无遮挡高潮| 国产一区二区三区乱码在线| 黄色av一区二区在线观看| 九九久久精品无码专区| 国产精品视频一区日韩丝袜| 日韩精品视频中文字幕播放| 天天做天天爱夜夜爽毛片毛片 | 偷拍av一区二区三区| 一区二区三区日本视频| 女人下边被添全过视频| 桃花影院理论片在线| 国产精品亚洲A∨天堂| 久久精品国产亚洲不卡| 亚洲精品一区久久久久一品av | 亚洲国产aⅴ成人精品无吗| 波多野结衣免费一区视频| 成人国产在线播放自拍| 亚洲国产熟女精品传媒| 国产电影无码午夜在线播放| 亚洲精品自产拍在线观看| 亚洲国产精品免费一区| 午夜视频一区二区三区四区| 亚洲av一二三四区四色婷婷|