賈松敏, 王成富, 徐 濤, 張 鵬
(1.北京工業(yè)大學 電子信息與控制工程學院,北京 100124;
2.北京工業(yè)大學 計算智能與智能系統(tǒng)北京市重點實驗室,北京 100124;
3.北京工業(yè)大學 數(shù)字社區(qū)教育部工程研究中心,北京 100124)
基于模糊貝葉斯網(wǎng)絡算法的智能輪椅避障
賈松敏1,2,3,王成富1,2,3,徐濤1,2,3, 張鵬1,2,3
(1.北京工業(yè)大學電子信息與控制工程學院,北京100124;
2.北京工業(yè)大學計算智能與智能系統(tǒng)北京市重點實驗室,北京100124;
3.北京工業(yè)大學數(shù)字社區(qū)教育部工程研究中心,北京100124)
對傳統(tǒng)BP神經(jīng)網(wǎng)絡模糊邏輯的智能輪椅避障方法在訓練過程中存在的過擬合和避障路徑不夠優(yōu)化的問題,提出了一種模糊貝葉斯網(wǎng)絡避障算法以降低神經(jīng)網(wǎng)絡的復雜度;該算法利用模糊神經(jīng)網(wǎng)絡對隸屬度函數(shù)的參數(shù)進行自主學習調(diào)整,同時為增強神經(jīng)網(wǎng)絡的泛化能力和計算能力,在網(wǎng)絡目標函數(shù)中加入權衰減項,利用貝葉斯原理優(yōu)化神經(jīng)網(wǎng)絡的結構和權值;仿真和實機實驗表明,該算法在訓練結果和避障效果上均優(yōu)于傳統(tǒng)BP神經(jīng)網(wǎng)絡,提高了智能輪椅避障的實時性,優(yōu)化了避障路徑,可滿足用戶對智能輪椅安全性和舒適性的需求。
智能輪椅;貝葉斯網(wǎng)絡;避障;超聲波傳感器
為提高殘障人士和老年人生活質量,多功能智能輪椅的社會需求日益增長[1]。在智能輪椅的設計中,自主避障起著非常重要的作用,它保障了輪椅運行中的安全性。對于老年人和殘疾人,他們活動的區(qū)域多為醫(yī)院等未知環(huán)境,輪椅在需要避開周圍環(huán)境中的障礙物的同時還需要接近目標。作為人類運動的一種輔助系統(tǒng),智能輪椅在運動過程中,其運行路徑應該是平滑的,運行過程應該滿足舒適性的要求。智能輪椅實質是一種特殊的機器人系統(tǒng),其控制算法的優(yōu)良及智能化程度決定著乘用者的安全性,智能輪椅避障的研究時該領域的熱點問題[2]。
近年來,很多學者均對輪椅避障的問題展開了研究。Bourhis[3]采用全局路徑規(guī)劃的方法導航避障。Parikh[4]在機器人運動過程中利用人工勢場法避障。MengWang[5]在機器人導航中把柵格地圖和模糊邏輯相結合,利用最小危險性評價的標準,改善了路徑規(guī)劃的效果。文獻[6]提出的利用動態(tài)變化權重的避障算法對移動機器人避障,利用動態(tài)改變子行為函數(shù)的優(yōu)先級與權重的方法實時獲取當前時刻最有效路徑,改善避障導航中的安全性和平滑性。文獻[7]將生存理論應用于輪式移動機器人的反應式避障控制,提高了輪式機器人高速避障控制的有效性。文獻[8]中利用模糊神經(jīng)網(wǎng)絡對智能輪椅路徑進行規(guī)劃,同時利用仲裁機制和命令融合機制的算法,提高了智能輪椅控制精度。文獻[9]利用遺傳理論算法對其建立的BP神經(jīng)網(wǎng)絡結構優(yōu)化,對局部極小值的問題改進,以到達避障的目的。文獻[10-11]利用神經(jīng)網(wǎng)絡的學習功能對模糊神經(jīng)網(wǎng)絡的參數(shù)進行學習,改善了模糊控制系統(tǒng)的性能和機器人的避障效果。文獻[12]提出基于速度修正項的機械臂避障路徑規(guī)劃方法,保證機械臂在特定時刻到達指定構型的前提下能夠順利實現(xiàn)障礙回避。文獻[13]對無人駕駛車輛在路徑生成過程中增加誤差影響,用通行區(qū)域代替原有不具有寬度的規(guī)劃路徑進行避障,展現(xiàn)了較好的避障能力。
上述研究所提導航避障算法通常針對采用普通雙輪差動輪的智能輪椅,同時對傳統(tǒng)BP神經(jīng)網(wǎng)絡在訓練過程中存在過擬合等問題未能提出較好的解決方案。本文采用的基于麥克納姆全向輪的智能輪椅,以實現(xiàn)前行、橫移、斜行、旋轉及其組合等運動方式。當障礙物在乘坐者視野外時也可以利用超聲波傳
感器采集外界障礙物的距離信息,從而使智能輪椅實現(xiàn)安全平穩(wěn)避障。利用模糊神經(jīng)網(wǎng)絡的學習功能對隸屬度函數(shù)的參數(shù)進行學習調(diào)整,將表示網(wǎng)絡結構復雜性的懲罰項引入到網(wǎng)絡目標函數(shù)中,并利用貝葉斯方法對神經(jīng)網(wǎng)絡的權值和網(wǎng)絡模型進行優(yōu)化從而降低網(wǎng)絡訓練過程中的復雜性,避免網(wǎng)絡訓練過程中過擬合的問題,提高神經(jīng)網(wǎng)絡的泛化能力以及全向智能輪椅的避障效果。
一種改進的神經(jīng)網(wǎng)絡的結構如圖1所示,表示一組輸入變量和輸出變量之間的非線性功能映射。該網(wǎng)絡共3層,分別為輸入層、隱藏層和輸出層,層與層間的連接方式采用全互接,即某層中的每一個神經(jīng)元都與相鄰層所有神經(jīng)元存在連接關系。
第1層為神經(jīng)網(wǎng)絡的輸入層,該層的作用是對網(wǎng)絡外部的信息接收。5維輸入變量U={dl,df,dr,θ,v},其中u1=dl,u2=df,u3=dr,u4=θ,u5=v,分別表示左側、中間、右側障礙物距離值,輪椅速度的方向角和輪椅速度的大小,共有5維輸入量,節(jié)點數(shù)為5。
圖1 神經(jīng)網(wǎng)絡結構示意圖
神經(jīng)網(wǎng)絡的泛化能力與網(wǎng)絡結構和訓練樣本的特性密切相關,可利用合適的訓練策略和對網(wǎng)絡結構優(yōu)化提高神經(jīng)網(wǎng)絡的泛化能力[14]。貝葉斯方法可對輸入樣本信息作出推斷,對正規(guī)化系統(tǒng)的和數(shù)據(jù)的選擇提供了較為客觀的方法。本文針對傳統(tǒng)BP神經(jīng)網(wǎng)絡訓練過程中的過擬合、網(wǎng)絡泛化能力不強的問題,利用貝葉斯方法對神經(jīng)網(wǎng)絡參數(shù)進行優(yōu)化。
2.1網(wǎng)絡權值的貝葉斯學習
貝葉斯方法是滿足一致性的有效歸納推理方法,它著眼于在整個權空間中權值的概率分布。在缺乏數(shù)據(jù)樣本時,它的分布為一個先驗分布p(ω),其中ω=(ω1,ω2,...ωW),W為網(wǎng)絡權值(包括閾值)的總個數(shù)。有數(shù)據(jù)樣本D后的分布是后驗分布p(ω|D),根據(jù)貝葉斯規(guī)則有
其中,p(D|ω)為似然函數(shù),分母p(D)是一個歸一化因子,即
特別地,觀測到訓練數(shù)據(jù)D后,在網(wǎng)絡結構H中,權值ω的后驗分布可通過貝葉斯定理來計算。
訓練樣本所包含的信息內(nèi)容通常不夠充分地由自身唯一地重構出未知的輸入輸出映射,在學習中會出現(xiàn)過擬合的問題,本文采用正則化方法來對所建立的神經(jīng)網(wǎng)絡模型優(yōu)化,它是對神經(jīng)網(wǎng)絡的訓練性能函數(shù)進行修正來提高其泛化能力。
神經(jīng)網(wǎng)絡的總誤差函數(shù):F(W)=αJW+βJD(4)
其中:JD是網(wǎng)絡的誤差函數(shù),JW是權衰減項,α和β、分別為超參數(shù),控制著其他參數(shù)(權及閾值)的分布形式,其值的大小對神經(jīng)網(wǎng)絡的訓練目標起決定作用。
采用貝葉斯方法實現(xiàn)超參數(shù)的選擇,超參數(shù)α,β的后驗概率分布為:
式中,p(α,β|D,H)為超參數(shù)的先驗概率;p(D|H)是歸一化因子;p(D|α,β,H)為顯著度。
求解時,對α和β分別求偏導,以求出具有最大顯著度時超參數(shù)的值。
式中,γ的取值范圍為0至W,表示網(wǎng)絡中可以降低性能指標函數(shù)的參數(shù)個數(shù);而WMP是在總誤差函數(shù)F(W)最小時對應的權值和閾值組。如果樣本數(shù)N很大,滿足N?W ,可認為γ =W。
在實際應用時,需要找到αMP,βMP的最優(yōu)值以及最優(yōu)的權值WMP,本文中用迭代訓練法求WMP,并且周期性地更新αMP和βMP,更新公式為
求出使顯著度p(D|α,β,H)最大的α,β后,用高斯分布來近似P(D|α,β,H)的分布形式,在這里用lnα,lnβ代替α,β,且α,β不相關。對于β
可得出此分布的方差為
同理對于α,可求出對lnα分布的方差為
用貝葉斯方法求出網(wǎng)絡的最優(yōu)權值,估計網(wǎng)絡的最可能輸出及相應誤差范圍,從而對神經(jīng)網(wǎng)絡的權值進行優(yōu)化。
2.2貝葉斯模型的選擇
假定神經(jīng)網(wǎng)絡由一組模型Hi,由貝葉斯定理可得給定數(shù)據(jù)后模型的后驗概率
其中:p(Hi)為模型Hi的先驗概率,p(D|Hi)稱為模型的顯著度,為求出它的最大值,可以先將p(D|Hi)寫成下式:
p(D|Hi)=?p(D|α,β,Hi)p(α,β|Hi)dαdβ(13)
用高斯分布近似p(D|α,β,Hi),對α,β進行積分處理后,為方便求解,對p(D|Hi)取對數(shù)得
其中A是網(wǎng)絡誤差F(W)的Hessian陣,M為網(wǎng)絡的隱單元數(shù),由于網(wǎng)絡的對稱性,可能有2MM!個不同權的組合會產(chǎn)生同一結果。
考慮到一些非等價的局部最小點,其后驗分布用一組中心位于各極小點的互不交疊高斯分布的組合代表,權的后驗分布為
p(ω|D)=∑ip(mi,ω|D)=∑i
p(ω|miD)p(mi|D)
(15)
其中,mi代表各不同極小點及其對稱的等價點。這樣,一組網(wǎng)絡的平均輸出為
其中,x是給定輸入向量,Γi是權空間中包圍i局部極小點的權區(qū)域,是第i網(wǎng)絡在該區(qū)域的平均輸出,由上式可知總輸出是各網(wǎng)絡輸出的線性組合,加權值是各中心的后驗概率。
上述結論可擴展到不同模型Hi的組合,各模型可以是不同結構的網(wǎng)絡,各單個模型輸出的線性組合為網(wǎng)絡的輸出。本文是根據(jù)后驗概率的大小選擇最可能的輸出作為結果。
下面給出用貝葉斯方法確定網(wǎng)絡權值和選擇網(wǎng)絡模型的步驟:
①對超參數(shù)α與β的初始值選擇,根據(jù)先驗分布對網(wǎng)絡的權賦初值。
②用BP算法訓練網(wǎng)絡以使總誤差函數(shù)最小。
③訓練中更新α與β的值,并計算γ的值。
④對不同起始權值重復①~③步,以發(fā)現(xiàn)有差別的極小點。
⑤對不同模型重復①~④步,檢驗模型的顯著度。
利用貝葉斯方法分別對網(wǎng)絡權值和網(wǎng)絡模型進行優(yōu)化,降低訓練過程中的復雜性,增強了網(wǎng)絡的泛化能力。
為了驗證本文算法在智能輪椅避障中的有效性,本文分別在仿真平臺和真實環(huán)境中進行了實驗。
3.1網(wǎng)絡訓練結果
利用提出的算法對模糊神經(jīng)網(wǎng)絡進行訓練,采集并選取典型環(huán)境下的400個樣本對神經(jīng)網(wǎng)絡進行訓練,經(jīng)過模糊貝葉斯神經(jīng)網(wǎng)絡和利用傳統(tǒng)BP網(wǎng)絡對數(shù)據(jù)訓練的結果如圖2所示。由圖可知,利用貝葉斯神經(jīng)網(wǎng)絡算法后能提高神經(jīng)網(wǎng)絡訓練過程的計算效率,減少計算時間。樣本數(shù)據(jù)處理后,模型誤差值經(jīng)過89次迭代收斂0.78,利用傳統(tǒng)BP神經(jīng)網(wǎng)絡處理的原始數(shù)據(jù)則經(jīng)過350次迭代后模型誤差值趨于收斂至1.52。由實驗數(shù)據(jù)可知,無論是求解精度還是收斂速度上,采用貝葉斯網(wǎng)絡處理后的算法均優(yōu)于原始算法。
圖2 兩種方法訓練對比
表1是在相同的網(wǎng)絡拓撲結構和學習參數(shù)下,用BP網(wǎng)絡和模糊貝葉斯網(wǎng)絡對同樣的訓練樣本和測試樣本的識別結果。表1中數(shù)據(jù)表明,對于不同的樣本模糊貝葉斯網(wǎng)絡的訓練誤差均小于BP網(wǎng)絡。樣本在一定數(shù)目變化時,模糊貝葉斯網(wǎng)絡能獲得比較高的精度,同時在網(wǎng)絡性能函數(shù)中利用正則化理論增加表示網(wǎng)絡復雜度的網(wǎng)絡權值平方和項和有效參數(shù),對網(wǎng)絡泛化能力有所提高。
表1 均方誤差對比
對不同樣本數(shù)的訓練時間,傳統(tǒng)BP神經(jīng)網(wǎng)絡與貝葉斯網(wǎng)絡也有比較大差別。在訓練樣本數(shù)為30個時,兩者算法求解時間相近。當樣本數(shù)達到100后,在訓練時間上,貝葉斯網(wǎng)絡算法的性能優(yōu)勢體現(xiàn)較為明顯,隨著樣本數(shù)的繼續(xù)增加,貝葉斯網(wǎng)絡的性能優(yōu)勢體現(xiàn)更加明顯。具體訓練時間對比如表2。
表2 訓練時間對比
3.2仿真結果
本文在三維機器人仿真平臺Webots上面對所提算法進行避障仿真,如圖3所示。其中圓柱體、長方體等為設定的障礙物。
3.3實機實驗結果
為了驗證模糊貝葉斯神經(jīng)網(wǎng)絡在全向輪椅避障中的應用,在真實環(huán)境中進行了實驗,如圖4所示。實驗環(huán)境中選取如圖4所示路錐和紙箱作為智能輪椅運動過程中的障礙物。
圖3 仿真避障實驗結果對比
圖4 真實環(huán)境中的避障實驗結果對比
本文針對傳統(tǒng)的BP神經(jīng)網(wǎng)絡算法在訓練過程中出現(xiàn)的過擬合等問題,提出一種基于模糊貝葉斯神經(jīng)網(wǎng)絡的算法。與傳統(tǒng)的BP神經(jīng)網(wǎng)絡相比較,模糊貝葉斯神經(jīng)網(wǎng)絡結合了模糊神經(jīng)網(wǎng)絡和貝葉斯網(wǎng)絡的優(yōu)點,具有神經(jīng)網(wǎng)絡良好的非線性逼近能力和貝葉斯后驗概率的真實性,減少了計算成本,提高了系統(tǒng)的穩(wěn)定性。實驗結果表明,模糊貝葉斯神經(jīng)網(wǎng)絡應用于全向智能輪椅避障中,對避障的效果有顯著改善,優(yōu)化了避障路徑,提高了全向智能輪椅避障的實時性,滿足用戶的舒適性和安全性的要求,可廣泛用于了智能輪椅避障中。
[1]Roziana Ramli,Hamzah Arof,F(xiàn)atimah Ibrahim and etc.Using finite state machine and a hybrid of EEG signal and EOG artifacts for an asynchronous wheelchair navigation[J].Expert Systems with Applications,2015,42:2451-2463.
[2]Simpson R C.Smart wheelchair:a literature review[J].Journal of Rehabilitation Research&Development,2005,42(4):423-436.
[3]Bourhis G,Horn O,Habert O,et al.An autonomous vehicle for people with motor disabilities[J].IEEE Robotics and Automation Magazine,2001,8(1):20-28.
[4]Parikh S P,Grassi V,Kumar V and etc.Integrating human inputs with autonomous behaviors on an intelligent wheelchair platform[J].IEEE Intelligent System,2007,22(2):33-41.
[5]Meng Wang,James N K.Liu.Fuzzy logic-based real-time robot navigation in unknown environment with dead ends[J].Robotics and Autonomous Systems,2008,56:625-643.
[6]楊晶東,楊敬輝,蔡則蘇.基于多目標優(yōu)化的移動機器人避障算法[J].上海交通大學學報,2012,2(2):213-216.
[7]劉磊,高巖,吳越鵬.基于生存理論的非完整約束輪式機器人高速避障控制[J].控制與決策,2014,29(9):1623-1627.
[8]蒲興成,張軍,張毅.基于神經(jīng)網(wǎng)絡的改進行為協(xié)調(diào)控制及其在智能輪椅路徑規(guī)劃中的應用 [ J].智能系統(tǒng)學報,2011,6(5):456-463.
[9]李鵬英,馮雅麗,張文明,等.基于GA-BP神經(jīng)網(wǎng)絡的深海集礦機避障系統(tǒng)[J].中南大學學報(自然科學版),2010,41(4):1374-1378.
[10]Mohanty,Prases K,Parhi,Dayal R.Navigation of autonomous mobile robot using adaptive network based fuzzy inference system[J].Journal of Mechanical Science and Technology,2014,28:2861-2868.
[11]Meng Joo ER,Chang Deng.Obstacle avoidance of a mobile robot using hybrid learning approach[J].IEEE Transactions on Industrial Electronics,2005,52(3):898-905.
[12]陳鋼,葉佩昌,賈慶軒,等.基于速度修正項的機械臂避障路徑規(guī)劃[J].控制與決策,2015,30(1):156-160.
[13]姜巖,王琦,龔建偉,等.無人駕駛車輛局部路徑規(guī)劃的時間一致性與魯棒性研究[J].自動化學報,2015,41(3):518-527.
[14]馬湧,孫彥廣.貝葉斯神經(jīng)網(wǎng)絡在蒸氣管網(wǎng)預測中的應用 [J].中國冶金,2014,24(6):53-57.
Obstacle Avoidance System for Intelligent Wheelchair Based on Fuzzy Bayesian Neural Network
Jia Songmin1,2,3,Wang Chengfu1,2,3,XuTao1,2,3,Zhang Peng1,2,3
(1.College of Electronic and Control Engineering,Beijing University of Technology,Beijing100124,China;2.Beijing Key Laboratory of Computational Intelligence and Intelligent System,Beijing100124,China;3.Engineering Research Center of Digital Community,Ministry of Education,Beijing100124,China)
To solve the over-fitting problem caused by traditional obstacle avoidance method of intelligent wheelchair based on fuzzy logic during training process and the obstacle avoidance path is not optimized,we propose a new obstacle avoidance algorithm to reduce the complexity of the neural network in the training process with fuzzy Bayesian network.Fuzzy neural network is utilized to adjust parameters of membership functions.In order to obtain the ability of good generalization and accurate computing,a penalty term is introduced to the objective function to optimize the structure and the weights of neural networks using Bayesian method.Simulation and physical experiments show that this algorithm is better than the traditional BP network in the training process and the obstacle avoidance path is optimized to meet the users'needs of the comfort and security better.
intelligent wheelchair;Bayesian neural network;obstacle avoidance;ultrasonic sensors
1671-4598(2016)05-0153-03
10.16526/j.cnki.11-4762/tp.2016.05.044
TP242
A
2015-10-28;
2015-12-04。
國家自然科學基金項目(61175087)。
賈松敏(1964-),女,北京人,教授,主要從事模式識別和智能系統(tǒng)方向的研究。