亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于學(xué)習(xí)自動(dòng)機(jī)的移動(dòng)機(jī)器人導(dǎo)航行為協(xié)調(diào)控制

        2015-02-21 08:10:07郝大鵬傅衛(wèi)平王雯
        關(guān)鍵詞:趨向自動(dòng)機(jī)移動(dòng)機(jī)器人

        郝大鵬,傅衛(wèi)平,王雯

        (1.西安理工大學(xué) 機(jī)械與精密儀器工程學(xué)院,陜西 西安 710048;2.西安航空學(xué)院 理學(xué)院,陜西 西安 710077)

        基于學(xué)習(xí)自動(dòng)機(jī)的移動(dòng)機(jī)器人導(dǎo)航行為協(xié)調(diào)控制

        郝大鵬1,2,傅衛(wèi)平1,王雯1

        (1.西安理工大學(xué) 機(jī)械與精密儀器工程學(xué)院,陜西 西安 710048;2.西安航空學(xué)院 理學(xué)院,陜西 西安 710077)

        針對(duì)移動(dòng)機(jī)器人導(dǎo)航控制中的行為協(xié)調(diào)問題,提出了一種學(xué)習(xí)速率可控的學(xué)習(xí)自動(dòng)機(jī)。該方法將機(jī)器人與障礙物之間的接觸時(shí)間變化作為獎(jiǎng)懲信號(hào),通過主動(dòng)控制機(jī)器人線速度來調(diào)節(jié)學(xué)習(xí)決策時(shí)間,根據(jù)環(huán)境動(dòng)態(tài)特性調(diào)整行為動(dòng)機(jī),并通過學(xué)習(xí)決策時(shí)間和行為動(dòng)機(jī)控制共同控制學(xué)習(xí)速率,保證機(jī)器人在學(xué)習(xí)決策時(shí)間內(nèi)完成導(dǎo)航行為的協(xié)調(diào)執(zhí)行。仿真證實(shí)提出的學(xué)習(xí)自動(dòng)機(jī)應(yīng)用于移動(dòng)機(jī)器人導(dǎo)航控制是可行的,與動(dòng)力學(xué)分岔控制方法對(duì)比,在未知?jiǎng)討B(tài)環(huán)境中進(jìn)行導(dǎo)航行為協(xié)調(diào)控制,提出方法的安全性更高。

        移動(dòng)機(jī)器人; 行為動(dòng)力學(xué)方法; 行為協(xié)調(diào); 學(xué)習(xí)自動(dòng)機(jī)

        行為動(dòng)力學(xué)導(dǎo)航方法是一種基于行為的移動(dòng)機(jī)器人導(dǎo)航方法,具有很高的自治性和魯棒性[1-2],該方法已取得了一些研究成果,例如,郝大鵬[3]提出跟隨吸引子控制律解決線速度受限問題;Monteiro[4]利用該方法實(shí)現(xiàn)了多機(jī)器人編隊(duì)問題;雷艷敏[5]、郝大鵬[6-7]等分別針對(duì)該方法在動(dòng)態(tài)未知環(huán)境中導(dǎo)航安全問題提出了解決方案。

        經(jīng)典行為動(dòng)力學(xué)方法[1]通過線性疊加方式完成整體行為輸出。線性疊加存在行為相互抵消的問題,針對(duì)該問題,Large[8]和Ijspeert[9]分別提出了動(dòng)力學(xué)分岔控制方法調(diào)節(jié)行為競(jìng)爭(zhēng)輸出,但這些方法都沒有融入學(xué)習(xí)策略,不能很好地適應(yīng)動(dòng)態(tài)未知環(huán)境。

        本文針對(duì)行為動(dòng)力學(xué)導(dǎo)航方法,提出一種帶有行為動(dòng)機(jī)機(jī)制的學(xué)習(xí)自動(dòng)機(jī),可以動(dòng)態(tài)調(diào)節(jié)學(xué)習(xí)自動(dòng)機(jī)的學(xué)習(xí)速率,完成避障行為之間的協(xié)調(diào)輸出,避免避障行為之間相互抵消。仿真結(jié)果表明本文方法在動(dòng)態(tài)未知環(huán)境下進(jìn)行導(dǎo)航控制比Large[8]提出的動(dòng)力學(xué)分岔控制方法更加安全。

        1 行為動(dòng)力學(xué)導(dǎo)航行為

        行為動(dòng)力學(xué)導(dǎo)航方法通過航向角和線速度控制移動(dòng)機(jī)器人導(dǎo)航,根據(jù)文獻(xiàn)[1,6-7],給出航向角和線速度控制的描述方法。

        航向角控制包括趨向目標(biāo)行為和避障行為,趨向目標(biāo)行為表示為:

        (1)

        式中,θ為機(jī)器人的航向角,θ0為目標(biāo)和機(jī)器人連線與x軸的夾角,λ0為航向角控制強(qiáng)度。

        避障行為表示為:

        (2)

        (3)

        其中i∈N+(正自然數(shù)),ψi是障礙物i和機(jī)器人連線與x軸的夾角,Δψi是障礙物i遮蔽機(jī)器人視野產(chǎn)生的角度,Rrobot為機(jī)器人的半徑,di為機(jī)器人與障礙物i的距離。

        以上變量的幾何表示如圖1所示。

        線速度控制表示為:

        當(dāng)未感知到障礙物時(shí),

        dv/dt=-γ0(v-V0)

        (4)

        當(dāng)感知到障礙物時(shí),

        (5)

        2 帶有行為動(dòng)機(jī)機(jī)制的學(xué)習(xí)自動(dòng)機(jī)

        學(xué)習(xí)自動(dòng)機(jī)[10](Learning automata,LA)是一種重要的基于學(xué)習(xí)策略的行為選擇方法。該方法具有計(jì)算復(fù)雜度低、通用性強(qiáng)等特點(diǎn),已被廣泛地應(yīng)用于無線認(rèn)知網(wǎng)絡(luò)控制[11]、能源控制[12]、股票投資[13]等領(lǐng)域。但經(jīng)典學(xué)習(xí)自動(dòng)機(jī)存在行為收斂速度慢等問題,本文提出一種學(xué)習(xí)速率可控的學(xué)習(xí)自動(dòng)機(jī),可以根據(jù)環(huán)境變化動(dòng)態(tài)調(diào)節(jié)學(xué)習(xí)自動(dòng)機(jī)的學(xué)習(xí)速率,改善了學(xué)習(xí)自動(dòng)機(jī)實(shí)時(shí)控制能力。

        2.1 學(xué)習(xí)自動(dòng)機(jī)框架

        行為動(dòng)力學(xué)方法設(shè)計(jì)的導(dǎo)航行為包括趨向目標(biāo)行為和避障行為,學(xué)習(xí)自動(dòng)機(jī)可以作為導(dǎo)航行為協(xié)調(diào)選擇控制器。

        初始時(shí)刻,學(xué)習(xí)自動(dòng)機(jī)選擇趨向目標(biāo)行為控制機(jī)器人奔向目標(biāo);當(dāng)機(jī)器人感知環(huán)境中障礙物時(shí),學(xué)習(xí)自動(dòng)機(jī)根據(jù)機(jī)器人與環(huán)境的交互信息選擇恰當(dāng)避障行為;當(dāng)危險(xiǎn)解除時(shí),學(xué)習(xí)自動(dòng)機(jī)將選擇趨向目標(biāo)行為控制機(jī)器人繼續(xù)奔向目標(biāo)。

        選擇恰當(dāng)?shù)谋苷闲袨槭窃O(shè)計(jì)學(xué)習(xí)自動(dòng)機(jī)的重點(diǎn)。在學(xué)習(xí)自動(dòng)機(jī)選擇避障行為時(shí)應(yīng)該注意:第一,時(shí)間控制,即學(xué)習(xí)自動(dòng)機(jī)必須在機(jī)器人陷入不可避免碰撞狀態(tài)前完成避障行為選擇;第二,潛在危險(xiǎn)控制,即學(xué)習(xí)自動(dòng)機(jī)在選擇瞬時(shí)最佳行為更新執(zhí)行概率的同時(shí),應(yīng)注意潛在危險(xiǎn)。

        根據(jù)以上分析,本文提出的學(xué)習(xí)自動(dòng)機(jī)相對(duì)于經(jīng)典學(xué)習(xí)自動(dòng)機(jī)增加了決策時(shí)間控制和行為動(dòng)機(jī)控制(潛在危險(xiǎn)控制),如圖2所示。學(xué)習(xí)策略在學(xué)習(xí)自動(dòng)機(jī)與環(huán)境交互過程中,首先計(jì)算行為選擇所需時(shí)間限制,根據(jù)環(huán)境的動(dòng)態(tài)變化更新行為動(dòng)機(jī),確定學(xué)習(xí)自動(dòng)機(jī)當(dāng)前學(xué)習(xí)速率,之后更新行為執(zhí)行的概率。

        2.2 學(xué)習(xí)自動(dòng)機(jī)建模

        學(xué)習(xí)自動(dòng)機(jī)一般可以定義為六元組,其中I為環(huán)境感知,A為行為集,S為行為狀態(tài)集,O為行為執(zhí)行函數(shù),R為獎(jiǎng)懲信息,ξ為狀態(tài)過渡函數(shù)。

        環(huán)境感知I存儲(chǔ)著環(huán)境反饋信息,是行為選擇的依據(jù)。針對(duì)導(dǎo)航問題,本文將機(jī)器人與障礙物的接觸時(shí)間[7]作為導(dǎo)航環(huán)境信息,用于描述障礙物危險(xiǎn)程度。觀察圖1,第t次采樣時(shí)刻機(jī)器人與障礙物i的接觸時(shí)間Ti(t)為:

        (6)

        式中vi為障礙物i的瞬時(shí)速度。

        利用式(6)計(jì)算時(shí),存在Ti(t)=∞的情況,表示障礙物i對(duì)于機(jī)器人不存在危險(xiǎn)。

        環(huán)境感知I表示為:

        (7)

        向量I[t,·],t∈{1,…,m}為環(huán)境感知I的行向量,存儲(chǔ)著第t次采樣時(shí)所有障礙物的接觸時(shí)間,Ti(t)為I[t,·]的第i個(gè)分量,i∈{1,…,n},是第t次采樣時(shí)刻機(jī)器人與障礙物i的接觸時(shí)間。I[·,i]為環(huán)境感知I的列向量,存儲(chǔ)著障礙物i的接觸時(shí)間歷史。

        存在第t次采樣時(shí),首次感知到障礙物i的情況,此時(shí)環(huán)境感知I增加新列,并規(guī)定:[Ti(1),…,Ti(t-1)]=∞,表示第1到第t-1次采樣時(shí)障礙物i不存在危險(xiǎn)。

        為了避免環(huán)境感知矩陣I的列無限增長(zhǎng),規(guī)定當(dāng)某個(gè)障礙物持續(xù)一定時(shí)間(該時(shí)間為常值)對(duì)機(jī)器人不存在危險(xiǎn)時(shí),I[·,i]將從環(huán)境感知I中剔除。

        行為集A[a0,a1,a2,…,an]為機(jī)器人導(dǎo)航行為,包括始終存在的趨向目標(biāo)行為a0及避障行為a1~an,行為由上節(jié)提出行為動(dòng)力學(xué)導(dǎo)航方法實(shí)現(xiàn)。

        當(dāng)行為執(zhí)行概率為1時(shí),該行為將被執(zhí)行,可以定義行為執(zhí)行函數(shù)O為:

        (8)

        學(xué)習(xí)自動(dòng)機(jī)根據(jù)環(huán)境給予的瞬時(shí)獎(jiǎng)懲信息完成行為狀態(tài)過渡,本文采用P型環(huán)境,即獎(jiǎng)懲為離散值0或1,其中1為獎(jiǎng)勵(lì),0為懲罰。

        獎(jiǎng)懲信息向量R[0,…,n]為行為的瞬時(shí)獎(jiǎng)懲信息,其中R(0)為趨向目標(biāo)行為的瞬時(shí)獎(jiǎng)懲信息,R(i),i∈{1,…,n}為避障行為的瞬時(shí)獎(jiǎng)懲信息。

        趨向目標(biāo)行為與避障行為的特點(diǎn)不同,獎(jiǎng)懲方式也不同。對(duì)于趨向目標(biāo)行為而言:

        (9)

        式(9)表示在第t次采樣時(shí)刻,如果任意障礙物i對(duì)機(jī)器人危險(xiǎn)解除時(shí),趨向目標(biāo)行為獲得獎(jiǎng)勵(lì)。

        對(duì)于避障行為而言:

        (10)

        D(t)=argmin(I(t,·))

        (11)

        (12)

        式中i∈{1,…,n},D(t)為第t次采樣時(shí)刻接觸時(shí)間最小的障礙物編號(hào);V(t)是最小的接觸時(shí)間。式(10)表示在第t次采樣時(shí)刻,最危險(xiǎn)的障礙物獲得獎(jiǎng)勵(lì)。

        行為狀態(tài)S[P0,P1,…,Pn]根據(jù)獎(jiǎng)懲信息向量R[0,…,n]的變化而改變。任意采樣時(shí)刻,首先更新趨向目標(biāo)行為的行為狀態(tài),之后再更新避障行為的行為狀態(tài)。提出的狀態(tài)過渡函數(shù)ξ為:

        當(dāng)R0(t)=1時(shí),

        (13)

        式中k∈{1,…,n},且Tk(t-1)≠∞,Tk(t)=∞。

        當(dāng)R0(t)=0時(shí),

        (14)

        式(13)和(14)描述了趨向目標(biāo)行為狀態(tài)的更新方式,即在障礙物危險(xiǎn)解除時(shí),該行為的執(zhí)行概率立即分配給趨向目標(biāo)行為,保證趨向目標(biāo)行為狀態(tài)可以獲得更新。

        對(duì)于避障行為狀態(tài)的更新,采取傳統(tǒng)學(xué)習(xí)自動(dòng)機(jī)的追擊學(xué)習(xí)(pursuit learning)策略[14]實(shí)現(xiàn),該算法可以保證行為選擇是ε最優(yōu)(ε-optimality)的。

        當(dāng)Ri(t)=1時(shí),

        (15)

        當(dāng)Ri(t)=0時(shí),

        (16)

        其中i∈{1,…,n},且i≠k,Pi(t-1)≠0,κ是學(xué)習(xí)速率。

        2.3 決策時(shí)間及行為動(dòng)機(jī)控制

        狀態(tài)過渡函數(shù)ξ的核心部分是避障行為狀態(tài)更新。學(xué)習(xí)自動(dòng)機(jī)必須在機(jī)器人與障礙物發(fā)生碰撞前完成行為選擇。本文提出決策時(shí)間和行為動(dòng)機(jī)控制動(dòng)態(tài)調(diào)節(jié)學(xué)習(xí)自動(dòng)機(jī)的學(xué)習(xí)速率κ,保證學(xué)習(xí)自動(dòng)機(jī)的實(shí)時(shí)性。

        決策時(shí)間控制實(shí)時(shí)計(jì)算學(xué)習(xí)自動(dòng)機(jī)的決策時(shí)間范圍。首先,環(huán)境中存在接觸時(shí)間較大障礙物,此障礙物對(duì)機(jī)器人的危險(xiǎn)較小,根據(jù)環(huán)境需要設(shè)定一時(shí)間Tallowable作為允許接觸時(shí)間,當(dāng)障礙物的接觸時(shí)間大于Tallowable時(shí),認(rèn)為該障礙物不存在危險(xiǎn)。

        其次,學(xué)習(xí)自動(dòng)機(jī)必須在機(jī)器人陷入不可避免碰撞狀態(tài)[14-15]之前完成避障行為的選擇。

        (17)

        (18)

        行為動(dòng)機(jī)控制目標(biāo)是評(píng)價(jià)環(huán)境中障礙物危險(xiǎn)的動(dòng)態(tài)變化。

        觀察環(huán)境感知?dú)v史I[·,i],存在接觸時(shí)間加速變化的情況,可以利用行為動(dòng)機(jī)描述危險(xiǎn)的動(dòng)態(tài)變化。

        當(dāng)?shù)趖次采樣時(shí)刻,Ti(t)≠∞,且接觸時(shí)間歷史I[·,i]中第t次采樣之前的k次接觸時(shí)間都不為無窮大時(shí),k≥1,即:

        Ti(t)=Ti(t-1)=…=Tk(t-k)=∞

        表示連續(xù)k+1次傳感器采樣,障礙物i都存在危險(xiǎn),則行為動(dòng)機(jī)M可以表示為:

        (19)

        式(15)表示如果第t次采樣之前障礙物存在連續(xù)危險(xiǎn)時(shí),行為動(dòng)機(jī)累積接觸時(shí)間的變化率。

        學(xué)習(xí)速率κ可以通過提出的決策時(shí)間控制和行為動(dòng)機(jī)控制共同調(diào)節(jié),即:

        (20)

        當(dāng)障礙物i獲得獎(jiǎng)勵(lì),則根據(jù)式(20)計(jì)算κi(t),作為此刻式(15)、(16)行為狀態(tài)更新的瞬時(shí)學(xué)習(xí)速率。圖3是學(xué)習(xí)速率κi(t)隨決策時(shí)間和行為動(dòng)機(jī)變化的示意圖。

        根據(jù)以上分析,給出本文提出的學(xué)習(xí)自動(dòng)機(jī)主體算法。

        ALGORITHM

        初始化:

        t=0

        A=[a0],初始時(shí)僅有趨向目標(biāo)行為

        S=[p0=1],初始時(shí)趨向目標(biāo)行為狀態(tài)為1

        Loop

        利用式(8)執(zhí)行行為

        傳感器感知環(huán)境

        IF感知障礙物

        對(duì)感知的n個(gè)障礙物編號(hào)

        利用式(6)計(jì)算Ti

        利用式(7)更新環(huán)境感知I

        A=[a0]+[a1,…,an]

        End IF

        利用式(9)和式(10)計(jì)算環(huán)境獎(jiǎng)懲信息R

        利用式(13)和(14)更新行為狀態(tài)

        利用式(17)計(jì)算行為決策時(shí)間

        利用式(19)計(jì)算行為動(dòng)機(jī)M

        利用式(20)計(jì)算瞬時(shí)學(xué)習(xí)速率κ

        利用式(15)、(16)更新行為狀態(tài)

        t=t+1

        End Loop,直到機(jī)器人到達(dá)目標(biāo)

        END ALGORITHM

        3 仿 真

        仿真環(huán)境為50 m×50 m的正方形平面。環(huán)境中包括4個(gè)障礙物,圓形靜態(tài)障礙物1初始位置為(20 m,20 m),半徑為2 m;圓形靜態(tài)障礙物2初始位置為(30 m,28 m),半徑為2 m。圓形動(dòng)態(tài)障礙物1位于(28 m,35 m),半徑為2 m,線速度為2 m/s,運(yùn)動(dòng)方向?yàn)?90°;圓形動(dòng)態(tài)障礙物2位于(35 m,40 m),半徑為2 m,線速度為1 m/s,運(yùn)動(dòng)方向?yàn)?20°。圓形目標(biāo)位于(40 m,35 m),半徑為2 m。圓形機(jī)器人初始位置為(10 m,5 m),半徑為2 m,初始航向角為120°,初始線速度為3 m/s。行為動(dòng)力學(xué)導(dǎo)航模型參數(shù)包括λ0=0.5,λi=1,γ0=0.4,γi=1.2。本文提出方法仿真機(jī)器人運(yùn)動(dòng)軌跡如圖4所示,參考文獻(xiàn)[8]仿真機(jī)器人運(yùn)動(dòng)軌跡圖5所示,圖6給出了本文提出方法與參考文獻(xiàn)方法行為協(xié)調(diào)的時(shí)間序列圖。

        [8]在利用行為動(dòng)力學(xué)方法導(dǎo)航時(shí)并未增加線速度控制,本文在仿真時(shí)為其增加了與本文相同的行為動(dòng)力學(xué)速度控制。

        觀察圖4,本文提出的學(xué)習(xí)自動(dòng)機(jī)在避開動(dòng)態(tài)障礙物1和2時(shí),由于動(dòng)態(tài)障礙物1和2的線速度不同,對(duì)機(jī)器人的威脅不同,對(duì)動(dòng)態(tài)障礙物1的行為動(dòng)機(jī)快速增大,使得學(xué)習(xí)自動(dòng)機(jī)的學(xué)習(xí)速率也快速增大,促使機(jī)器人在距離動(dòng)態(tài)障礙物1較遠(yuǎn)的位置便開始執(zhí)行對(duì)該障礙物的避障行為,而對(duì)動(dòng)態(tài)障礙物2的學(xué)習(xí)速率增長(zhǎng)得很慢,該行為的執(zhí)行概率始終未達(dá)到1,所以并未執(zhí)行避障行為,而執(zhí)行的是趨向目標(biāo)行為,機(jī)器人保持3 m/s的線速度越過動(dòng)態(tài)障礙物2。觀察圖5,參考文獻(xiàn)[8]提出的方法在動(dòng)態(tài)障礙物1和2相遇時(shí),避障行為競(jìng)爭(zhēng)輸出最大,始終未選擇合適障礙物避障,最終與障礙物1發(fā)生碰撞。

        4 結(jié) 論

        本文提出的學(xué)習(xí)自動(dòng)機(jī)與經(jīng)典學(xué)習(xí)自動(dòng)機(jī)[10]相比,增加了決策時(shí)間及行為動(dòng)機(jī)控制,并利用它們調(diào)節(jié)學(xué)習(xí)自動(dòng)機(jī)的學(xué)習(xí)速率,通過仿真證實(shí)提出的方法可以應(yīng)用于實(shí)時(shí)性較強(qiáng)的未知環(huán)境移動(dòng)機(jī)器人動(dòng)態(tài)導(dǎo)航控制。但在未知環(huán)境中障礙物的運(yùn)動(dòng)通常是任意的,故而在本文提出的學(xué)習(xí)自動(dòng)機(jī)基礎(chǔ)上增加障礙物運(yùn)動(dòng)模式識(shí)別是進(jìn)一步研究的方向。

        參考文獻(xiàn):

        [1]Bicho E, Mallet P, Sch?ner G. Target representation on an autonomous vehicle with low-level sensors [J]. The International Journal of Robotics Research, 2000, 19(5):424-447.

        [2]Warren W H. The dynamics of perception and action [J]. Psychological Review, 2006,113(2):358-389.

        [3]郝大鵬, 傅衛(wèi)平, 楊世強(qiáng). 移動(dòng)機(jī)器人行為動(dòng)力學(xué)導(dǎo)航方法研究 [J]. 機(jī)械科學(xué)與技術(shù), 2013, 32(10): 1488-1491. Hao Dapeng, Fu Weiping, Yang Shiqiang. Study on the navigation method of behavior dynamics in mobile robot [J]. Mechanical Science and Techonolgy for Aerospace Engineering, 2013, 32(10): 1488-1491.

        [4]Monteiro S, Bicho E. Attractor dynamics approach to formation control: theory and application [J]. Autonomous Robots, 2010,29(3):331-355.

        [5]雷艷敏, 朱齊丹, 馮志彬. 基于速度障礙和行為動(dòng)力學(xué)的動(dòng)態(tài)路徑規(guī)劃 [J]. 華中科技大學(xué)學(xué)報(bào): 自然科學(xué)版, 2011, 39(4): 15-19. Lei Yanmin, Zhu Qidan, Feng Zhibin. Dynamic path planning using velocity obstacles and behavior dynamics.[J]. Journal of Huazhong University of Science and Technology(Natural Science Edition), 2011, 39(4): 15-19.

        [6]郝大鵬, 傅衛(wèi)平, 王雯. 基于行為動(dòng)力學(xué)的移動(dòng)機(jī)器人安全導(dǎo)航方法 [J]. 系統(tǒng)工程與電子技術(shù), 2014, 36(1): 136-142. Hao Dapeng, Fu Weiping, Wang Wen. Mobile robot safe navigation base on behavior dynamics [J]. Systems Engineering and Electronics, 2014, 36(1): 136-142.

        [7]郝大鵬, 傅衛(wèi)平, 王雯. 基于接觸時(shí)間的移動(dòng)機(jī)器人安全導(dǎo)航 [J]. 計(jì)算機(jī)應(yīng)用, 2014, 34(4): 1209-1212. Hao Dapeng, Fu Weiping, Wang Wen. Mobile robot safety navigation based on time to cantact [J]. Journal of Computer Applications, 2014, 34(4): 1209-1212.

        [8]Large E W, Christensen H I, Bajcsy R. Scaling the dynamic approach to path planning and control: competition among behavioral constraints [J]. The International Journal of Robotics Research, 1999, 18(1): 37-58.

        [9]Ijspeert A J, Nakanishi J, Hoffmann H, et al. Dynamical movement primitives: learning attractor models for motor behaviors [J]. Neural Computation, 2013, 25(2): 328-373.

        [10]Thathachar M. Learning systems: stochastic automata models [J]. Defence Science Journal, 1985, 35(3): 361-366.

        [11]Golestanian M, Iranmanesh S, Ghazizadeh R, et al. A learning automata based spectrum prediction technique for cognitive radio networks [J]. Science and Education, 2014, 2(3): 93-97.

        [12]Zhu J, Jiang P, Gu W, et al. Finite action-set learning automata for economic dispatch considering electric vehicles and renewable energy sources [J]. Energies, 2014, 7(7): 4629-4647.

        [13]Mozafari M, Alizadeh R. A cellular learning automata model of investment behavior in the stock market [J]. Neurocomputing, 2013, (122): 470-479.

        [14]Lefèvre S, Vasquez D, Laugier C. A survey on motion prediction and risk assessment for intelligent vehicles [J]. Robomech Journal, 2014, 1(1): 1-14.

        [15]Fraichard T, Kuffner J J. Guaranteeing motion safety for robots [J]. Autonomous Robots, 2012, 32(3): 173-175.

        (責(zé)任編輯 王衛(wèi)勛)

        Behavior coordination control based on mobile robot navigation of learning automata

        HAO Dapeng1,2,FU Weiping1,WANG Wen1

        (1.Faculty of Mechanical and Precision Instrument Engineering, Xi’an University of Technology, Xi’an 710048, China; 2.School of Science, Xi’an Aeronautical University, Xi’an 710077, China)

        With an aim at behavior coordination problem in the mobile robot navigation control, this paper suggests a kind of learning automata with the controllable rate. The learning automata uses the contact time variation between the robot and obstacles as the reward and penalty signals to regulate the learning and decision time through the active control over robot linear velocity and to adjust the behavior intension in terms of environ dynamic behaviors and to control over the shared management learning rate through the learning decision time and the behavior intension control, whereby ensuring that the robot can complete the coordination implementation of navigation behaviors within the learning decision time. The simulation results indicate that the learning automata suggested in this paper in applying to the navigation control by mobile robot is feasible, and in comparison with the dynamic bifurcation control method, its safety in unknown dynamic environ to carry out navigation behavior coordination control is much higher.

        mobile robot; behavior dynamics method; behavior coordination; learning automata

        1006-4710(2015)03-0310-06

        2014-11-28

        國(guó)家自然科學(xué)基金資助項(xiàng)目(10872160,51275407,51475365);陜西省自然科學(xué)基礎(chǔ)研究計(jì)劃重點(diǎn)資助項(xiàng)目(2011JZ012)。

        郝大鵬,男,博士生,講師,研究方向?yàn)闄C(jī)器人行為動(dòng)力學(xué)導(dǎo)航控制。E-mail:haodpwork@163.com。

        傅衛(wèi)平,男,博士,教授,主要研究方向?yàn)橹悄軝C(jī)器人控制、現(xiàn)代物流系統(tǒng)工程與技術(shù)、智能車輛控制理論與技術(shù)。E-mail:weipingf@xaut.edu.cn。

        TP24

        A

        猜你喜歡
        趨向自動(dòng)機(jī)移動(dòng)機(jī)器人
        移動(dòng)機(jī)器人自主動(dòng)態(tài)避障方法
        實(shí)用趨向
        {1,3,5}-{1,4,5}問題與鄰居自動(dòng)機(jī)
        論西夏語動(dòng)詞第二類趨向前綴
        西夏學(xué)(2020年2期)2020-01-24 07:43:38
        一種基于模糊細(xì)胞自動(dòng)機(jī)的新型疏散模型
        網(wǎng)絡(luò)文學(xué)趨向“一本正經(jīng)”
        廣義標(biāo)準(zhǔn)自動(dòng)機(jī)及其商自動(dòng)機(jī)
        基于Twincat的移動(dòng)機(jī)器人制孔系統(tǒng)
        “NP V累了NP”動(dòng)結(jié)式的補(bǔ)語趨向解讀
        極坐標(biāo)系下移動(dòng)機(jī)器人的點(diǎn)鎮(zhèn)定
        国产国产人免费人成免费视频 | 日韩女优一区二区在线观看| 精品人妻一区二区三区久久| 老少配老妇老熟女中文普通话 | 国产农村三片免费网站| 亚洲无av高清一区不卡| 亚洲av免费手机在线观看| 日韩欧群交p片内射中文| 美国黄色片一区二区三区| 日本一级二级三级在线| 插插射啊爱视频日a级| 少妇被猛男粗大的猛进出| 国产成人亚洲综合无码精品| 白色白色在线视频播放平台| 色欲色香天天天综合网www| 日本免费一区二区三区| 在线无码国产精品亚洲а∨| 日韩一区二区三区人妻中文字幕| 欧美精品欧美人与动人物牲交| 午夜亚洲av永久无码精品| 91精品国产91久久久无码色戒| 亚洲免费在线视频播放| 偷国产乱人伦偷精品视频| 国产一品道av在线一二三区| 啪啪视频免费看一区二区| 男人的天堂一区二av| 国产在线精品一区二区在线看| 亚洲另类激情综合偷自拍图| 久久青青草原一区网站| 成人免费无码大片a毛片| 最新亚洲人成无码网站| 国产亚洲精品成人av在线| 青青草成人在线免费视频| 成人区人妻精品一熟女 | 日本在线免费一区二区三区| 欧美性色欧美a在线播放| 性xxxx视频播放免费| 天堂网av在线| 伊人久久大香线蕉av五月| 日本道精品一区二区三区| 亚洲综合伦理|