沈陽(yáng)理工大學(xué)自動(dòng)化與電氣工程學(xué)院 中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室 楊小菊中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室 張 偉沈陽(yáng)理工大學(xué)自動(dòng)化與電氣工程學(xué)院 高宏偉 米海山
基于模糊神經(jīng)網(wǎng)絡(luò)的移動(dòng)機(jī)器人避障研究
沈陽(yáng)理工大學(xué)自動(dòng)化與電氣工程學(xué)院 中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室 楊小菊
中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室 張 偉
沈陽(yáng)理工大學(xué)自動(dòng)化與電氣工程學(xué)院 高宏偉 米海山
移動(dòng)機(jī)器人在復(fù)雜環(huán)境自主運(yùn)行就必須具有較高的智能性。模糊神經(jīng)網(wǎng)絡(luò)技術(shù)結(jié)合了模糊邏輯與神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),充分發(fā)揮模糊控制的推理及神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)機(jī)制以增強(qiáng)機(jī)器人系統(tǒng)的智能性。本文采用超聲波紅外以及電子羅盤傳感器采集未知環(huán)境的信息,通過(guò)模糊神經(jīng)網(wǎng)絡(luò)信息融合實(shí)現(xiàn)機(jī)器人的自主避障。經(jīng)過(guò)仿真實(shí)驗(yàn)驗(yàn)證了該方法的有效性。
模糊神經(jīng)網(wǎng)絡(luò);信息融合;移動(dòng)機(jī)器人;避障
移動(dòng)機(jī)器人是通過(guò)傳感器感知環(huán)境和自身位姿,在復(fù)雜環(huán)境自主決策,完成預(yù)期任務(wù)的機(jī)器人系統(tǒng)[1]。
避障不僅是移動(dòng)機(jī)器執(zhí)行其他任務(wù)的前提與保障也是其智能化的重要標(biāo)志。傳感器是增強(qiáng)移動(dòng)機(jī)器人智能性的途徑,傳感器信息融合技術(shù)就發(fā)揮人大腦的作用,協(xié)調(diào)各個(gè)傳感器信息,充分利用多傳感器資源,以一定的優(yōu)化準(zhǔn)則進(jìn)行分析、評(píng)估與決策[2]。隨著國(guó)內(nèi)外學(xué)者對(duì)避障技術(shù)的重視,不斷提出多種避障融合算法,例如模糊控制、人工勢(shì)場(chǎng)發(fā)、神經(jīng)網(wǎng)絡(luò)等。每一種算法都有其獨(dú)有的特點(diǎn),然而也具有局限性和適用性。
模糊控制模擬人的思維,對(duì)環(huán)境信息進(jìn)行綜合分析,通過(guò)模糊理論總結(jié)出模糊控制規(guī)則。但模糊控制沒(méi)有自學(xué)習(xí)與自適應(yīng)能力,并且要求設(shè)計(jì)者充分了解被控系統(tǒng)的物理特性,預(yù)定義有效的被控規(guī)則[3]。隨著系統(tǒng)不斷趨于復(fù)雜,模糊控制規(guī)則不但具有主觀性而且難于全面設(shè)計(jì)。人工神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)機(jī)制,從傳感器采集的輸入輸出數(shù)據(jù)進(jìn)行學(xué)習(xí)、訓(xùn)練,以增強(qiáng)系統(tǒng)的容錯(cuò)性[4]。然而神經(jīng)網(wǎng)絡(luò)不適于表示規(guī)則也難于確定網(wǎng)絡(luò)的初始值,增加訓(xùn)練時(shí)間。因此將模糊控制與神經(jīng)網(wǎng)絡(luò)相結(jié)合,將模糊系統(tǒng)構(gòu)造神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練以提高系統(tǒng)的自適應(yīng)性。
為使移動(dòng)機(jī)器人安全、自主避開(kāi)障礙物,首先,傳感器的布局必須合理,本系統(tǒng)的傳感器布局如圖1所示,采用超聲波及紅外傳感器獲取機(jī)器人左、前、右的障礙物距離信息,電子羅盤采集目標(biāo)位置的方位信息。
將圖2 中的1號(hào)與2號(hào)超聲波的最小距離作為機(jī)器人左方障礙物信息,3號(hào)與4號(hào)超聲波最小距離為前方障礙物信息,5號(hào)與6號(hào)超聲波最小距離作為組右方距離信息。在超聲波的測(cè)量盲區(qū)以紅外傳感器為補(bǔ)充。
移動(dòng)機(jī)器人的周圍環(huán)境分布雜亂,按照機(jī)器人的運(yùn)行環(huán)境可以整理8中情形,如圖2所示。其中紅色小球表示障礙物,機(jī)器人周圍的虛線表示傳感器測(cè)距范圍。
圖1 傳感器的布局系統(tǒng)圖
圖2 障礙物的環(huán)境分類
移動(dòng)機(jī)器人避障的決策與環(huán)境中障礙物的分布密切相關(guān)。將機(jī)器人本體正前方劃分為左、前與右三個(gè)目標(biāo)方向,幫助機(jī)器人理解環(huán)境以作出避障決策。圖3為目標(biāo)方向分區(qū)圖。
圖3 目標(biāo)方向
為使移動(dòng)機(jī)器人自主達(dá)目標(biāo)位置。首先對(duì)超聲波與紅外傳感器獲取的環(huán)境信息分組預(yù)處理,然后和電子羅盤獲取的目標(biāo)角度信息送入模糊神經(jīng)網(wǎng)絡(luò)控制器,融合出機(jī)器人周圍的環(huán)境信息。然后控制器發(fā)出控制決策指導(dǎo)機(jī)器人實(shí)時(shí)動(dòng)作。完成避障任務(wù)。移動(dòng)機(jī)器人避障控制結(jié)構(gòu)如圖4所示:
圖4 移動(dòng)機(jī)器人避障的模糊神經(jīng)網(wǎng)絡(luò)控制結(jié)構(gòu)
Takagi-Sugeno 模型的模糊神經(jīng)網(wǎng)絡(luò)具有局部逼近的功能,不僅具有模糊推理的能力而且也有神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的特性[5]。根據(jù) T-S 模糊標(biāo)準(zhǔn)模型,可以構(gòu)造如圖5的多輸入多輸出模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。
模糊神經(jīng)網(wǎng)絡(luò)的各層的節(jié)點(diǎn)函數(shù)如下:
由于本文的初始隸屬度采用標(biāo)準(zhǔn)型函數(shù)而與實(shí)際環(huán)境有所差別,因此要對(duì)采集的不同環(huán)境信息進(jìn)行學(xué)習(xí)。為保證機(jī)器人的實(shí)時(shí)性,選擇離散訓(xùn)練方式對(duì)初始網(wǎng)絡(luò)進(jìn)行修正。并將改善后的結(jié)果存儲(chǔ)與表格中,移動(dòng)機(jī)器人在實(shí)際環(huán)境已查表的形式進(jìn)行決策。離散訓(xùn)練如圖6所示。
結(jié)合機(jī)器人的運(yùn)行環(huán)境與避障特性,將輸入障礙物距離以及目標(biāo)方向的模糊分割數(shù)定為3 ,即{"N","M","F"}={"近", "中","遠(yuǎn)"},對(duì)應(yīng)的論域[0~2m]。{"L"、"F"、"R"}= {"左","前","右"},對(duì)應(yīng)的論域?yàn)閇0,180°]。
依據(jù)機(jī)器人所處的環(huán)境的情形,構(gòu)造機(jī)器人的訓(xùn)練樣本與測(cè)試樣本。利用模糊工具箱將訓(xùn)練集生產(chǎn)初始網(wǎng)絡(luò)系統(tǒng),采用誤差反向傳播以及最小二乘法進(jìn)行離散訓(xùn)練。依據(jù)設(shè)定的控制參數(shù)作為終止離散訓(xùn)練條件。整個(gè)系統(tǒng)的框圖如圖7所示。
圖5 模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
圖6 模糊神經(jīng)網(wǎng)絡(luò)訓(xùn)練
圖7 模糊神經(jīng)網(wǎng)絡(luò)系統(tǒng)結(jié)構(gòu)
通過(guò)不斷調(diào)整網(wǎng)絡(luò)參數(shù),將學(xué)習(xí)步長(zhǎng)設(shè)定為0.01,通過(guò)58步訓(xùn)練,誤差穩(wěn)定在設(shè)定值的范圍內(nèi)。圖8為訓(xùn)練的均方差變化曲線。
圖8 訓(xùn)練的均方誤差變化曲線
為了驗(yàn)證訓(xùn)練后的模糊神經(jīng)網(wǎng)絡(luò)與移動(dòng)機(jī)器人避障模型是否一致,構(gòu)造30組測(cè)試樣本對(duì)網(wǎng)絡(luò)進(jìn)行檢測(cè),檢驗(yàn)效果如圖9所示。
圖9 訓(xùn)練檢測(cè)結(jié)果
圖10 模糊神經(jīng)網(wǎng)絡(luò)的避障仿真
圖9 中橫坐標(biāo)表示為30組測(cè)試樣本序列,縱坐標(biāo)表示為機(jī)器人的左右速度。檢測(cè)數(shù)據(jù)以藍(lán)色"+"表示,網(wǎng)絡(luò)輸出以紅色"*"表示。已從檢驗(yàn)效果可以看出,訓(xùn)練后的模糊神經(jīng)網(wǎng)絡(luò)很好地捕著到機(jī)器人避障模型,表明模糊神經(jīng)網(wǎng)絡(luò)融合融合了傳感器采集的數(shù)據(jù),實(shí)現(xiàn)機(jī)器人的避障功能。
在Matlab環(huán)境中設(shè)定初始位置為(0,0),并以菱形表示。目標(biāo)位置(10,10),以三角形表示。環(huán)境中的障礙物以紅色小圓圈及正方形表示。移動(dòng)機(jī)器人的避障軌跡藍(lán)色小點(diǎn)表示,避障的仿真如圖10所示。
從移動(dòng)機(jī)器人的避障結(jié)果可以看出模糊神經(jīng)網(wǎng)絡(luò)能有效地融合超聲波、紅外傳感器以及電子羅盤的數(shù)據(jù),使機(jī)器人在外界環(huán)境自主避障,驗(yàn)證了模糊控制與神經(jīng)網(wǎng)絡(luò)結(jié)合的有效性。
由于外界環(huán)境的未知性以及機(jī)器人避障模型的非線性因素,要提高機(jī)器人的避障精度,傳感器的配置以及融合算法的改進(jìn)經(jīng)將是進(jìn)一步深入研究的重點(diǎn)。
[1]倪小雷,卜佳俊。自主移動(dòng)機(jī)器人混合式體系結(jié)構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)[J]。計(jì)算機(jī)測(cè)量與控制,2006,14(11):1526-1528.
[2]潘泉,于昕,程詠梅,張洪才。信息融合理論的基本方法與進(jìn)展[J]。自動(dòng)化學(xué)報(bào),2004,29(4):599-615
[3]李國(guó)勇。智能控制及其MATLAB實(shí)現(xiàn)[M]。北京:電子工業(yè)出版社,2005.261-280.
[4]楊娟,孫華,吳林。模糊神經(jīng)網(wǎng)絡(luò)信息融合方法在機(jī)器人避障中的應(yīng)用[J]。控制理論與應(yīng)用,20052,4(2):22-24.
[5]孫增坼,徐紅兵?;赥-S模型的模糊神經(jīng)網(wǎng)絡(luò)[J]。清華大學(xué)學(xué)報(bào)(自然科學(xué)版),1997,37(3):18-26.
楊小菊(1989-),女,陜西漢中人,碩士研究生學(xué)歷,主要研究方向?yàn)橐苿?dòng)機(jī)器人的多傳感器信息融合方法。
張偉
工業(yè)機(jī)器人機(jī)構(gòu)設(shè)計(jì)與性能分析研究,項(xiàng)目編號(hào):2013020054.