李亞秋 吳超仲 馬曉鳳 黃 珍 張 暉
(武漢理工大學智能運輸系統(tǒng)研究中心1) 武漢 430063) (水路公路交通安全控制與裝備教育部工程研究中心2) 武漢 430063) (武漢理工大學自動化學院3) 武漢 430063)
據文獻[1]數(shù)據顯示,高速公路上追尾導致的事故占所有事故發(fā)生量的9.16%,因此,如何有效的減少追尾事故的問題具有很高的研究價值.隨著車路協(xié)同技術的高速發(fā)展,周圍車輛可以相對容易的感知主車的駕駛意圖,從而避免追尾事故.本研究通過對本車換道意圖的識別來為周圍車輛感知本車駕駛意圖提供可能性.本車換道意圖的識別和行為預測就是根據實時采集來的車輛狀態(tài)和駕駛人操作信號,來辨識本車駕駛意圖和預測駕駛人在下一時間段的駕駛行為[2].因此,在車路協(xié)同環(huán)境下,基于車輛狀態(tài)和駕駛人操作信號,建立實時準確的車輛換道意圖識別模型,可以有效的避免追尾事故.
當前,已經有關于換道意圖識別的相關研究.Liu等[3]提出了用動態(tài)隱馬爾科夫方法提取和檢測換道行為序列,并用模擬駕駛數(shù)據驗證了模型的可靠性.Kuge[4]使用隱馬爾科夫方法建立了模擬器換道意圖識別模型,以轉向盤轉角,轉向盤轉角向量值,以及方向盤轉動轉矩作為模型輸入.Pentland等[5]使用隱馬爾科夫鏈建立了基于狀態(tài)序列的駕駛行為預測模型,并用模擬數(shù)據驗證.Oliver[6]使用雙層隱馬爾科夫方法識別了7種駕駛意圖,并用實車實驗數(shù)據驗證,此研究中,首次將駕駛人眼球運動數(shù)據作為駕駛意圖辨識模型的輸入之一.C.Joel等[7]使用稀疏貝葉斯方法建立了車輛行駛過程中數(shù)據采集和換道意圖識別系統(tǒng),并用實車實驗數(shù)據驗證,車輛數(shù)據,車道偏離量和駕駛人頭部數(shù)據作為模型輸入.
然而,神經網絡作為比較經典的模式識別方法之一,具有很強的自學習能力,識別結果更為可靠,并且具有良好的識別特性,模型參數(shù)可調,相比較于以上幾種建模方法,具有更廣的適用性.考慮到神經網絡需要大樣本數(shù)據作為訓練樣本,本研究基于中國高速公路實車試驗數(shù)據,采用神經網絡方法來建立換道意圖識別模型.同時,考慮到神經網絡更新權值算法可能會有不收斂的現(xiàn)象出現(xiàn),因此,采用基于Kalman濾波算法的BP神經網絡來實現(xiàn)換道意圖識別.此方法在其他領域已經有 部 分 應 用,R.S.Scalero 等[8-10]提 出 了 基 于Kalman濾波算法的神經網絡快速學習算法,提高了前向神經網絡的學習速度,學習參數(shù)有很高的魯棒性.曲春曉等實現(xiàn)了卡爾曼濾波算法在飛行器姿態(tài)獲取系統(tǒng)中的實現(xiàn),仿真結果顯示,卡爾曼濾波器的快速收斂速度和平滑的估計值曲線有很好的應用價值.張良力等[11]提出了駕駛意圖研究在機動車安全預警中有重要作用,快速準確的識別駕駛意圖可以很好的保證道路交通安全.因此,本研究提出了一種使用基于EKF(extended kalman filter)學習方法的BP神經網絡換道意圖識別模型,來識別駕駛人的換道意圖,并使用高速公路實車實驗的數(shù)據來驗證了本模型的可靠性,模型框架見圖1.由于在換道過程中,比較典型的駕駛行為特征是前方車頭時距,方向盤轉角,駕駛人眼球水平位置移動,以及車輛的車道偏離量,因此,本模型采用以上4類駕駛行為特征數(shù)據作為模型輸入,采用基于EKF學習方法的BP神經網絡進行學習和訓練,最終實現(xiàn)換道意圖識別.
圖1 換道意圖識別模型框架
參加實驗的20名駕駛人招募于湖北省武漢市出租車集團.駕駛人選拔的條件包括:(1)考慮到安全因素,選擇年齡在45~55歲之間,身體健康狀況良好的駕駛人,包括10名男性駕駛人和10名女性駕駛人;(2)駕齡在(20±5)a之間,并且年行駛里程在1 000km以上;(3)駕駛人視力正常,無佩戴眼鏡情況;(4)參與實驗前1d晚上,要保證8h的睡眠時間;(5)參加實驗前,被試人員會被告知實驗所需了解的注意事項.
本次實車實驗是從2012年11月~2012年12月,共計2個月.地點是在武漢西北部的漢十高速.每組實驗上午09:00從武漢理工大學固定地點出發(fā),沿漢十高速方向,中途在隨州服務區(qū)休息,隨后返回.本次實驗分析數(shù)據的提取路段為府河收費站到隨州服務區(qū),以及隨州服務區(qū)返回府河收費站之間.
本次實車實驗所用數(shù)據采集設備有車載CAN總線,Biosemi ActiveTwo測量系統(tǒng)(只針對研究),以及 Mobileye C2-270系統(tǒng).車載CAN總線主要采集了行駛過程中車輛的轉向盤轉角數(shù)據;Biosemi ActiveTwo測量系統(tǒng)可以采集駕駛人的眼球水平運動位置數(shù)據,從而得出駕駛人的視線移動值;Mobileye C2-270系統(tǒng)主要采集了前方車頭時距(2.5s以內)和車道偏離量,作為模型輸入的一部分.
由于神經網絡具有很好的模式識別功能,其映射逼近能力和自學習能力適用于很多非線性問題.神經網絡雖然不需要系統(tǒng)確切的數(shù)學模型,但需要大量的學習樣本(或者訓練樣本),當樣本具有噪聲時會導致學習結果具有較大錯誤甚至不能收斂,致使神經網絡失效.同時,神經網絡學習速度慢,泛化能力不強等問題限制了其在工程上的應用.而Kalman濾波必須有系統(tǒng)確切的數(shù)學模型,以及噪聲信息的概率特性,擴展Kalman濾波器(extended kalman filter,EKF)是一種非線性的狀態(tài)估計方法,可以用來對未知狀態(tài)進行參數(shù)估計.多層神經網絡是一種非線性的分層結構系統(tǒng),其學習算法實際上是對本系統(tǒng)的參數(shù)估計過程.由于EKF學習算法可以給出最小的連接權重方差估計,在快速下降效果中收斂性也比后向誤差最小算法好,而且,并沒有包括對于收斂性能比較重要的調節(jié)參數(shù),因此,基于EKF學習算法的神經網絡模型具有很高的應用價值.本文將神經網絡和Kalman濾波結合,利用了神經網絡的非線性能力與Kalman濾波的離線更新特點,克服了神經網絡收斂慢的缺點.
EKF濾波器的基本過程見圖2.其中,ut,wt,vt分別為t時刻控制輸入,過程噪聲和觀測噪聲.K為Kalman濾波增益為t時刻先驗估計值為t時刻后驗估計值,f(t,0)和h(t,0)分別為狀態(tài)更新方程和測量更新方程為t時刻系統(tǒng)均方差,zt為t時刻系統(tǒng)輸出測量值.Kalman濾波器的算法分為兩個循環(huán)往復的步驟:時間更新和測量更新.時間更新,主要指將系統(tǒng)的時間向前移動一格,依據前一時刻的后驗估計給出后一時刻的先驗估計.該模塊包括以下過程.
測量更新,主要是將新時間點的實際測量值加入到算法中,隨著卡爾曼系數(shù)的不斷修正,給出此時刻的后驗估計.該模塊包括以下過程.
圖2 EKF方法基本原理圖
張友民等通過非線性系統(tǒng)建模與辨識的仿真計算結果證明,基于EKF濾波估計的BP神經網絡算法,學習收斂速度快,數(shù)值穩(wěn)定性好,所需的學習次數(shù)和隱節(jié)點數(shù)少,調整參數(shù)少,便于工程應用.相比較于單純的BP神經網絡學習算法,本模型克服了神經網絡的固有缺陷,如收斂速度慢,容易陷入局部最小,數(shù)值穩(wěn)定性差等缺點.
將EKF學習算法和神經網絡結合使EKF算法所需的矩陣都大大簡化,具體流程:(1)輸入神經網絡,得到預測;(2)用預測值與實際值的比較進行Kalman濾波的更新;(3)將更新后的權值送回神經網絡;(4)下一輪的更新實現(xiàn)Kalman濾波和神經網絡結合.把神經網絡的權值閾值取出來作為狀態(tài)估計,網絡輸出作為Kalman濾波的觀測,Kalman的狀態(tài)方程就大大簡化.
在一個3層前向網絡中,假設輸入層,隱層和輸出層神經元數(shù)分別為I,L和O,則連接權值組成的狀態(tài)向量W=[WijWjk](i=1,2,…,I;j=1,2,…,L;k=1,2,…,O).式子中,狀態(tài)向量W中元素數(shù)目為
式中:x(t)為 Kalman濾波權值;e(t)為系統(tǒng)輸出的誤差;h()函數(shù)為神經網絡的輸出層函數(shù),本模型神經網絡傳遞函數(shù)采用sigmoid函數(shù),即:
式中:Xij為前一層神經元j與本層神經元i之間的連接權值;u為神經網絡輸入;bi為神經元閾值.
駕駛人實施換道意圖主要有如下步驟:首先,發(fā)現(xiàn)前方有車,阻礙本車正常行車速度,產生換道想法;其次,駕駛人向左或向右觀測后視鏡,權衡是否能成功換道,這是換道意圖決策過程;最后,駕駛人轉動轉向盤,本車向左車道或者右車道偏離,以完成換道過程.因此,換道行為序列見圖3.圖中數(shù)據表示一次向左換道行為的操作序列,模型輸入數(shù)據包括前方車頭時距,駕駛人向右或者向左觀察后視鏡,車輛的轉向盤轉角以及車道偏離量.從前方有車,到駕駛人轉動頭部觀察后視鏡,以及車道偏離量的變化可以反映出駕駛人的換道意圖.提取換道前此序列數(shù)據作為神經網絡模型輸入,建立非線性模型后,使用EKF方法優(yōu)化權值,從而得出本研究中換道意圖識別模型.
本研究分別對基于BP神經網絡的換道意圖識別模型和基于EKF濾波算法的BP神經網絡換道意圖識別模型進行訓練,訓練結果對應的誤差均方根曲線見圖4~5.從圖中可以看出,在1 000次迭代訓練之后,EKF濾波算法明顯比BP算法收斂速度快,誤差小,需要較少的訓練迭代次數(shù)即可達到模型所需精度要求,所需調整的參數(shù)少.經過1 000次迭代之后,前者最終達到訓練誤差為0.024,高于后者的0.017.本次學習選擇的訓練樣本為200組,測試樣本為20組,識別樣本為100組,每組數(shù)據都包括前方車頭時距,轉向盤轉角,駕駛人頭部偏移量和車道偏離量,從檢測到前方車輛到換道實施之前,經過數(shù)據剔除和篩選,每組樣本數(shù)據輸入向量具有相同的維度,都是708維.學習之后在識別準確率和模型魯棒性方面,兩者并無很大差異,均達到了96%.
多次訓練之后的分析結果表明,基于EKF學習方法的BP神經網絡在相同的迭代次數(shù)下以更快的速率逼近期望的識別效果.
圖3 換道行為序列
圖4 BP神經網絡換道意圖識別模型訓練速率圖
圖5 基于EKF濾波算法的BP神經網絡換道意圖識別模型訓練速率
本研究結果表明,使用基于EKF學習方法的BP神經網絡模型可以很好的識別駕駛人的換道意圖,識別效率較高,因此,本研究提出的模型可以減少識別的時間延遲,提高安全預警系統(tǒng)的穩(wěn)定性.本研究還存在很多不足之處,由于本次研究主要是用離線數(shù)據來驗證模型的可靠性,進一步工作可以考慮面向實時在線數(shù)據來驗證模型的可靠性,從而實現(xiàn)駕駛人的在線換道意圖識別,在車路協(xié)同技術中可以較好的保障行車安全.
[1]公安部交通管理局.中華人民共和國道路交通事故統(tǒng)計年報(2011)[M].北京:人民交通出版社,2011.
[2]王 暢.基于隱形馬爾科夫模型的駕駛員意圖辨識方法研究[D].長春:吉林大學,2011.
[3]LIU A,PENTLAND A.Towards real-time recognition of driver intentions[C]∥Proceedings of the 1997 IEEE Intelligent Transportation Systems Conference,Boston,MA,Nov.9-12,1997.
[4]KUGE N,YAMAMURA T,SHIMOYAMA O,et al.A driver behavior recognition method based on a driver model framework[J].Society of Automotive Engineers,Inc,1998.
[5]PENTLAND A,LIU A.Modeling and prediction of human behavior[J].Neural Computation,1999(11):229-242.
[6]OLIVER N,PENTLAND A.Graphical models for driver behavior recognition in a smart car[C]∥In-Proc.IEEE International Conference,Intelligent Vehicle,Oct,2000:7-12.
[7]JOEL C,DAVID P,MOHAN M,et al.Lane change intent analysis using robust operators and sparse bayesian learning[J].IEEE Transactions on Intelligent Transportation Systems,2007,8(3):431-440.
[8]SCALERO R S,TEPEDELENLIOGLU N.A fast algorithm training feedforward neural networks[J].IEEE Trans.On Signal Processing,1992,40(1):202-210.
[9]張友民,戴冠中,張洪才,等.一種前饋神經網絡的卡爾曼濾波學習方法[J].信息與控制,1994,23(2):55-58.
[10]曲春曉,陳 偉.卡爾曼濾波在飛行器姿態(tài)獲取系統(tǒng)中的實現(xiàn)[J].交通信息與安全,2011,29 (6):139-142.
[11]張良力,吳超仲,黃 珍,等.面向安全預警的機動車駕駛意圖研究現(xiàn)狀與展望[J].交通信息與安全,2012,30(3):87-92.