江浩斌, 俞 越, 李傲雪
(江蘇大學(xué) 汽車與交通工程學(xué)院, 江蘇 鎮(zhèn)江 212013)
隨著傳感器和人工智能技術(shù)的發(fā)展,智能汽車受到了廣泛的關(guān)注,學(xué)習(xí)和模仿人類駕駛員行為成為智能駕駛研究的重要思路之一[1].此外,彎道作為事故頻發(fā)路段,彎道駕駛是智能駕駛功能驗(yàn)證的一個(gè)關(guān)鍵場(chǎng)景.
駕駛員模型是模擬人類駕駛行為的數(shù)學(xué)表示,被廣泛應(yīng)用于車輛仿真、高級(jí)駕駛輔助系統(tǒng)和智能汽車系統(tǒng)的開發(fā).根據(jù)模型輸入是否涉及前視行為,駕駛員模型可分為補(bǔ)償跟蹤模型和預(yù)瞄跟蹤模型.相比于前者,加入預(yù)瞄信息的模型更接近于真實(shí)的駕駛員行為.關(guān)于駕駛員建模的方法主要有3種:① 基于傳遞函數(shù)的經(jīng)典控制,如比例-積分-微分(proportion integral differential, PID)控制[2];② 基于狀態(tài)空間模型的現(xiàn)代控制,如線性二次調(diào)節(jié)器(linear quadratic regulator,LQR)[3-4]和模型預(yù)測(cè)控制(model predictive control,MPC)[5];③ 基于模仿人類智能行為的智能控制,如模糊邏輯(fuzzy logic,F(xiàn)L)[6]和神經(jīng)網(wǎng)絡(luò)(neural networks,NN)[7].經(jīng)典控制方法一般適用于單輸入單輸出系統(tǒng),不適用于具有時(shí)變和非線性的車輛控制系統(tǒng).現(xiàn)代控制方法很大程度上依賴于精確的數(shù)學(xué)模型.而駕駛汽車作為一種人類復(fù)雜的、高度動(dòng)態(tài)的行為,駕駛員神經(jīng)肌肉動(dòng)力學(xué)和感覺動(dòng)力學(xué)的很多參數(shù)具有不確定性,且難以進(jìn)行準(zhǔn)確的系統(tǒng)辨識(shí).相比之下,模糊邏輯和神經(jīng)網(wǎng)絡(luò)作為智能控制中的2種重要方法,適用于非線性和多變量復(fù)雜系統(tǒng)的建模和控制,前者模仿了人腦的模糊性概念描述和邏輯思維方式,后者模仿了人腦神經(jīng)系統(tǒng)結(jié)構(gòu)和功能,具有自學(xué)習(xí)能力.而自適應(yīng)神經(jīng)模糊推理系統(tǒng)(adaptive neuro-fuzzy inference system,ANFIS)是2種方法的融合,可實(shí)現(xiàn)兩者的優(yōu)勢(shì)互補(bǔ).
基于此,筆者在分析人類駕駛員視覺和轉(zhuǎn)向行為的基礎(chǔ)上,從視覺感知和轉(zhuǎn)角決策層面,提出一種用于彎道駕駛的仿人駕駛員模型.基于駕駛員在環(huán)仿真試驗(yàn)平臺(tái),采集不同車速下的人類彎道駕駛數(shù)據(jù),為模型的建立和驗(yàn)證提供訓(xùn)練樣本和評(píng)價(jià)依據(jù).仿人駕駛員模型包含視覺感知和轉(zhuǎn)向盤轉(zhuǎn)角決策2部分.視覺感知模塊借鑒人類彎道駕駛視覺行為的研究結(jié)果,從車輛運(yùn)動(dòng)狀態(tài)和道路環(huán)境提取用于轉(zhuǎn)向決策的信息;轉(zhuǎn)向盤轉(zhuǎn)角模塊采用ANFIS方法從人類駕駛數(shù)據(jù)中學(xué)習(xí)和抽取控制規(guī)則,構(gòu)建視覺參數(shù)輸入與轉(zhuǎn)向盤轉(zhuǎn)角輸出之間的映射關(guān)系.
獲取人類駕駛數(shù)據(jù)的方法主要有實(shí)車試驗(yàn)和駕駛仿真試驗(yàn).駕駛仿真試驗(yàn)不如現(xiàn)場(chǎng)實(shí)車試驗(yàn)真實(shí),但是其不需要顧慮行車安全性問題,控制變量、采集數(shù)據(jù)更容易,同時(shí)可以設(shè)置多種駕駛工況用于獲取較為全面的大樣本數(shù)據(jù).因此,基于上述便利、高效、安全、低成本等諸多優(yōu)勢(shì),采用駕駛仿真試驗(yàn)的方式進(jìn)行人類駕駛數(shù)據(jù)采集.
所搭建的駕駛員在環(huán)仿真試驗(yàn)平臺(tái)如圖1所示.硬件設(shè)備主要包括電腦、曲面顯示屏、駕駛座椅、羅技G29力反饋轉(zhuǎn)向盤、剎車/油門/離合器踏板及排擋系列組件.使用的軟件為PreScan 8.4.0和MATLAB 2018a.
圖1 駕駛員在環(huán)仿真試驗(yàn)平臺(tái)
仿真過程中,基于PreScan搭建的駕駛場(chǎng)景通過3D可視化查看器顯示并被投影在顯示屏上.駕駛員通過顯示屏畫面觀察道路環(huán)境及車輛行駛動(dòng)態(tài),對(duì)羅技G29轉(zhuǎn)向盤、油門或剎車進(jìn)行操縱.Simulink讀取作用于羅技G29組件上的駕駛員輸入信號(hào),傳輸給車輛動(dòng)力學(xué)模型.車輛的運(yùn)動(dòng)狀態(tài)發(fā)送至PreScan虛擬車輛模型并在駕駛場(chǎng)景中實(shí)時(shí)響應(yīng).如此往復(fù),形成人-車-路閉環(huán)控制系統(tǒng),便可實(shí)現(xiàn)駕駛員在環(huán)駕駛仿真試驗(yàn).
試驗(yàn)道路A是在水平面上的一條曲率連續(xù)變化的四車道彎曲道路.每條車道的寬度為3.5 m.該道路由直線路段、回旋線路段和圓曲線路段連接而成,道路總長(zhǎng)2 395.5 m.其中,有10個(gè)曲率半徑不同的圓曲線彎道,其半徑覆蓋在80~500 m.圖2中標(biāo)注了每條圓曲線路段的詳細(xì)信息,如A1(100, 110)表示圓曲線路段1的曲率半徑為100 m,長(zhǎng)度為110 m.該道路上分2條行駛路線進(jìn)行駕駛仿真試驗(yàn):當(dāng)以SP1為行駛路線起點(diǎn)時(shí),則有7個(gè)右轉(zhuǎn)彎和3個(gè)左轉(zhuǎn)彎;當(dāng)以SP2為行駛路線起點(diǎn)時(shí),則有3個(gè)右轉(zhuǎn)彎和7個(gè)左轉(zhuǎn)彎.SP1、SP2處箭頭指向?yàn)樾旭偡较?,駕駛路線以直線路段為駕駛起點(diǎn).
圖2 試驗(yàn)道路A
試驗(yàn)道路B是在水平面上的一條四車道彎曲道路,每條車道寬度為3.5 m,如圖3所示,該道路由1個(gè)直線路段和8個(gè)圓曲線路段連接而成,8個(gè)圓曲線路段的曲率半徑與試驗(yàn)道路A的皆不相同.
圖3 試驗(yàn)道路B
基于上述2條試驗(yàn)道路進(jìn)行駕駛仿真試驗(yàn)和人類駕駛數(shù)據(jù)采集.試驗(yàn)道路A的數(shù)據(jù)用于建立和驗(yàn)證仿人駕駛員模型;試驗(yàn)道路B的數(shù)據(jù)用于驗(yàn)證模型在其他駕駛工況下的適用性.
共有3名人類駕駛員進(jìn)行彎道駕駛仿真試驗(yàn).LI A. X.等[8]研究表明,在反復(fù)數(shù)次駕駛后,人類駕駛員的駕駛行為逐漸趨于穩(wěn)定,即使是新手駕駛員也能像經(jīng)驗(yàn)豐富的駕駛員一樣表現(xiàn)良好.因此,為了保證數(shù)據(jù)采集的合適性,數(shù)據(jù)采集前,要求每位駕駛員進(jìn)行多次練習(xí),以適應(yīng)所搭建的駕駛仿真平臺(tái).試驗(yàn)過程中不考慮車輛的縱向控制,采用PID控制算法使車輛保持在指定車速左右.人類駕駛員只需通過顯示屏畫面感知車輛的運(yùn)動(dòng)和道路的幾何形狀操縱轉(zhuǎn)向盤,從而控制車輛的橫向運(yùn)動(dòng).
試驗(yàn)道路A的指定車速分別為20、30、40、50、60 km·h-1,為了減少意外誤差和獲取更多彎道行駛的轉(zhuǎn)向情況,每條行駛路線上各個(gè)車速下重復(fù)試驗(yàn)20次.而試驗(yàn)道路B的指定車速分別為36、54 km·h-1,考慮到人類駕駛行為的不確定和多變性,各個(gè)車速下重復(fù)試驗(yàn)10次.
采集的數(shù)據(jù)可分為3類:① 車輛運(yùn)動(dòng)狀態(tài),如車速、軌跡、航向等;② 道路信息,如車道線坐標(biāo)、曲率等;③ 駕駛員操縱信號(hào),主要為轉(zhuǎn)向盤轉(zhuǎn)角.
在實(shí)際駕駛過程中,駕駛員通過各種感覺器官感知車輛運(yùn)動(dòng)、道路環(huán)境等信息,利用大腦進(jìn)行推斷與決策,對(duì)轉(zhuǎn)向、加速及制動(dòng)等相關(guān)動(dòng)作進(jìn)行操縱.也就是說,在人-車-路閉環(huán)系統(tǒng)中,駕駛員既是道路環(huán)境的感知環(huán)節(jié),又是車輛操縱的決策環(huán)節(jié).
人類駕駛主要用到視覺、前庭和軀體感覺系統(tǒng),其中視覺感知在實(shí)際駕駛過程中起主要作用[9].因此,僅考慮視覺系統(tǒng)能夠感知到的信息對(duì)駕駛員轉(zhuǎn)向行為的影響.在彎道駕駛中,車道標(biāo)記線不僅起到空間約束的作用,還起到視覺引導(dǎo)的作用.駕駛員中高速駕駛時(shí)的決策信息主要來自車輛前方遠(yuǎn)、近2處[10].視覺信息提取如圖4所示,其中:Df為駕駛員隨著車輛位置狀態(tài)與道路曲率變化能夠看到前方道路較遠(yuǎn)處的距離;Dn為駕駛員通過車輛前擋風(fēng)玻璃能夠看到前方道路較近處的距離;DL為車輛航向與前方6 m處左車道線的距離;DR為車輛航向與前方6 m處右車道線的距離;VP為車輛質(zhì)心;NP為車輛質(zhì)心沿車輛航向方向6 m處的點(diǎn);u為車輛的縱向速度;θt為車輛航向與點(diǎn)VP、TP連線之間的夾角;θf為車輛航向與點(diǎn)VP、FP′連線之間的夾角.
圖4 視覺信息提取
關(guān)于駕駛預(yù)瞄點(diǎn)的假設(shè)主要有2種[11]:駕駛員視線與前方道路內(nèi)沿的切點(diǎn)(TP);前方道路中心線上的點(diǎn)(FP).而駕駛員的預(yù)瞄時(shí)間受道路線形(即道路曲率)的影響很大,彎道路段上的預(yù)瞄時(shí)間一般為1.5~2.5 s[12].此外,駕駛員在駕駛過程中一般以掃視—注視—掃視的模式進(jìn)行信息選擇和整合[13].基于以上人類駕駛員彎道駕駛視覺注意機(jī)制和行為的分析和理解,建立視覺感知模塊,從車輛的運(yùn)動(dòng)狀態(tài)和前方遠(yuǎn)近道路的信息提取用于轉(zhuǎn)向決策的視覺輸入?yún)?shù).
1) 車輛縱向速度u是除道路曲率外影響駕駛員轉(zhuǎn)向行為的最顯著因素.
2) 近區(qū)橫向偏差el反映了車輛相對(duì)于前方近處道路的橫向位置.該值根據(jù)車輛航向和前方可見車道線之間的關(guān)系推導(dǎo)得到,計(jì)算公式為
(1)
3) 遠(yuǎn)區(qū)航向角偏差eθ在某種程度上可以反映車輛前方遠(yuǎn)處的道路曲率信息以及道路幾何形狀對(duì)駕駛員預(yù)瞄距離的影響.遠(yuǎn)區(qū)定義為車輛前方10~30 m的道路范圍,eθ的選取方法如下:
(2)
對(duì)上述可感知的視覺輸入?yún)?shù)進(jìn)行篩選、計(jì)算和獲取的過程稱為視覺感知模塊.該模塊的輸入為車輛運(yùn)動(dòng)狀態(tài)和道路信息.該模塊提取了人類駕駛員可獲得的視覺信息,是駕駛員模型的感知環(huán)節(jié).
采用基于0階T-S模型的自適應(yīng)神經(jīng)模糊推理系統(tǒng)來獲取視覺參數(shù)輸入與轉(zhuǎn)向盤轉(zhuǎn)角輸出之間的映射關(guān)系,完成轉(zhuǎn)向盤轉(zhuǎn)角模塊的構(gòu)建.
ANFIS網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示,輸入向量Xin=(x1,x2,x3)T經(jīng)過5層前饋神經(jīng)網(wǎng)絡(luò)的傳輸與處理,得到模糊系統(tǒng)的輸出值f.此處,輸入變量x1、x2、x3即為視覺模塊的輸出參數(shù)u、el、eθ,輸出值f即為轉(zhuǎn)向盤轉(zhuǎn)角δsw.
圖5 3輸入1輸出的ANFIS網(wǎng)絡(luò)結(jié)構(gòu)
圖5中方框表示該節(jié)點(diǎn)處的相關(guān)參數(shù)可通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法進(jìn)行自適應(yīng)調(diào)整,圓圈表示該節(jié)點(diǎn)處的參數(shù)不能進(jìn)行自適應(yīng)調(diào)整.第1層為模糊化層,對(duì)輸入變量進(jìn)行模糊化處理.3個(gè)輸入變量分別定義5個(gè)語言變量值,每個(gè)節(jié)點(diǎn)代表1個(gè)語言變量值.計(jì)算并輸出每個(gè)輸入變量屬于各語言變量值模糊集合的隸屬度,即
(3)
i=1,2,3,j=1,2,…,5,
(4)
式中:aij、bij、cij為前件參數(shù),其值決定相應(yīng)隸屬函數(shù)的形狀.
第2層為規(guī)則強(qiáng)度層,每個(gè)節(jié)點(diǎn)代表1條模糊規(guī)則,共生成53=125條模糊規(guī)則,通過將第1層輸出的隸屬度相乘,用于輸出第k條規(guī)則的激活強(qiáng)度ωk,計(jì)算公式為
i=1,2,3,k=1,2,…,125.
(5)
(6)
第4層為模糊規(guī)則輸出層,每個(gè)節(jié)點(diǎn)將每條模糊規(guī)則的量綱一化激活強(qiáng)度和相應(yīng)規(guī)則輸出值相乘,獲得第k條規(guī)則的輸出結(jié)果,計(jì)算公式為
(7)
式中:pk為后件參數(shù).
第5層為求和層,只有1個(gè)節(jié)點(diǎn),通過對(duì)第4層的所有規(guī)則輸出求和計(jì)算得到ANFIS的最終輸出,即
(8)
以上已經(jīng)確定了用于轉(zhuǎn)向盤轉(zhuǎn)角決策的自適應(yīng)神經(jīng)模糊推理系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu),通過給定的樣本數(shù)據(jù),學(xué)習(xí)算法需要對(duì)ANFIS中的前件參數(shù)aij、bij、cij和后件參數(shù)pk進(jìn)行調(diào)整.ANFIS結(jié)構(gòu)和學(xué)習(xí)算法等設(shè)置基于MATLAB中的Neuro Fuzzy Designer工具箱進(jìn)行設(shè)計(jì),加載數(shù)據(jù)集,通過訓(xùn)練便可得到基于ANFIS的轉(zhuǎn)向盤轉(zhuǎn)角決策模塊.
將2.1中的視覺感知模塊和2.2中的轉(zhuǎn)向盤轉(zhuǎn)角決策模塊相結(jié)合,即可得到如圖6所示的從視覺感知到轉(zhuǎn)向盤轉(zhuǎn)角決策的仿人駕駛員模型.
圖6 仿人駕駛員模型
圖6中:X、Y、φ分別為大地坐標(biāo)系下車輛的橫坐標(biāo)、縱坐標(biāo)和航向角;Xln、Yln、Cln分別為左車道線第n個(gè)點(diǎn)的橫坐標(biāo)、縱坐標(biāo)和該點(diǎn)處的曲率值;Xrn、Yrn、Crn分別為右車道線第n個(gè)點(diǎn)的橫坐標(biāo)、縱坐標(biāo)和該點(diǎn)處的曲率值.
視覺感知模塊用于提取人類駕駛員可感知的信息,如通過外圍視覺感知到的車輛速度、車輛在車道內(nèi)的橫向位置信息,以及通過注視行為獲取的前方道路的預(yù)覽信息.轉(zhuǎn)角決策模塊采用ANFIS模仿人的模糊描述和推理機(jī)制,基于數(shù)據(jù)驅(qū)動(dòng)的方式構(gòu)建了由視覺輸入?yún)?shù)(u,el,eθ)到轉(zhuǎn)向盤轉(zhuǎn)角δsw的非線性映射關(guān)系.
基于PreScan/Simulink聯(lián)合仿真環(huán)境,將所建立的仿人駕駛員模型作為車輛的橫向控制算法,分別在不同道路場(chǎng)景和車速下進(jìn)行仿真分析.
不同于評(píng)價(jià)軌跡跟蹤的準(zhǔn)確性,在保證安全駕駛的情況下,主要以轉(zhuǎn)向行為的相似性對(duì)模型進(jìn)行評(píng)價(jià).為了定量分析,皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient,PCC)、均方根誤差(root mean squared error,RMSE)和平均絕對(duì)誤差(mean absolute error,MAE)被用作轉(zhuǎn)向相似性的評(píng)價(jià)指標(biāo),計(jì)算公式如下:
(9)
(10)
(11)
PCC用于衡量2組數(shù)據(jù)之間變化趨勢(shì)的相似性,PCC越接近1,說明2組數(shù)據(jù)的變化趨勢(shì)越相似;RMSE和MAE用于衡量2組數(shù)據(jù)之間數(shù)值的偏差,RMSE和MAE越小,說明2組數(shù)據(jù)之間的數(shù)值偏差越小.
車輛的橫向位置定義為車輛當(dāng)前軌跡點(diǎn)到車道虛擬中心線的距離(橫向偏差),當(dāng)車輛質(zhì)心在其右側(cè)時(shí)為正值,當(dāng)車輛質(zhì)心在其左側(cè)時(shí)為負(fù)值.所提出的仿人轉(zhuǎn)向駕駛員模型在2條試驗(yàn)道路上的車輛橫向位置仿真結(jié)果如圖7所示.
圖7 橫向位置仿真結(jié)果
從圖7可以看出:在2條試驗(yàn)道路上,車輛在不同速度下的橫向位置的范圍為-0.6~0.6 m,說明整個(gè)仿真過程中車輛一直被控制在車道內(nèi)行駛.這說明將該模型應(yīng)用于車輛的橫向控制時(shí),被控制的車輛不存在與其他車道上的車輛發(fā)生碰撞的風(fēng)險(xiǎn),可以保證行車安全.
人類駕駛員的轉(zhuǎn)向盤轉(zhuǎn)角數(shù)據(jù)與模型仿真的轉(zhuǎn)向盤轉(zhuǎn)角數(shù)據(jù)對(duì)比曲線如圖8所示.其中:圖8a為試驗(yàn)道路A上5種車速下的轉(zhuǎn)向盤轉(zhuǎn)角曲線對(duì)比;圖8b為試驗(yàn)道路B上其他2種車速下的轉(zhuǎn)向盤轉(zhuǎn)角曲線對(duì)比.總體來看,模型的轉(zhuǎn)向盤轉(zhuǎn)角數(shù)據(jù)與人類駕駛員的轉(zhuǎn)向盤轉(zhuǎn)角數(shù)據(jù)具有一致的變化趨勢(shì),并且兩者在數(shù)值上也基本重合.事實(shí)上,轉(zhuǎn)向盤轉(zhuǎn)角曲線的形狀與道路曲率的形狀相對(duì)應(yīng),由于車輛略微不足的轉(zhuǎn)向特性,轉(zhuǎn)向盤轉(zhuǎn)角的幅值隨著車速的增加而增大.
圖8 轉(zhuǎn)向盤轉(zhuǎn)角曲線對(duì)比
對(duì)于人類駕駛員來說,在整個(gè)轉(zhuǎn)彎過程中,并不是一個(gè)單一的完美轉(zhuǎn)向動(dòng)作,而是存在著一些轉(zhuǎn)向盤轉(zhuǎn)角的微調(diào),尤其是在入彎時(shí)轉(zhuǎn)向盤轉(zhuǎn)角有超調(diào)的現(xiàn)象.需要特別注意的是,人類駕駛員的所有轉(zhuǎn)向行為并不都是值得模仿的.模型生成的轉(zhuǎn)向盤轉(zhuǎn)角的變化有時(shí)比人類駕駛員的轉(zhuǎn)角數(shù)據(jù)變化更頻繁,但是其波動(dòng)幅度比人類駕駛員的波動(dòng)幅度更小,沒有明顯的超調(diào),整體上變化平穩(wěn),在不同車速和彎道下均能夠保持較為一致、良好的轉(zhuǎn)向效果.
不同道路場(chǎng)景和車速下的仿人轉(zhuǎn)向特性評(píng)價(jià)指標(biāo)計(jì)算結(jié)果如表1所示.
表1 仿人轉(zhuǎn)向特性評(píng)價(jià)結(jié)果
為了進(jìn)一步分析,在此進(jìn)行了經(jīng)典的單點(diǎn)預(yù)瞄最優(yōu)曲率模型[14]的仿真并增加了數(shù)據(jù)對(duì)比.從大多數(shù)情況和平均值可以看出:與單點(diǎn)預(yù)瞄最優(yōu)曲率模型相比,所提出的仿人駕駛員模型生成的轉(zhuǎn)向盤轉(zhuǎn)角與人類駕駛員的轉(zhuǎn)向盤轉(zhuǎn)角數(shù)據(jù)的相關(guān)性更高,偏差更小,具有更好的仿人轉(zhuǎn)向操縱特性.
從視覺感知和轉(zhuǎn)向決策2個(gè)層面,基于人類彎道駕駛視覺行為的相關(guān)研究結(jié)果和具有仿人智能的ANFIS算法,提出了仿人駕駛員模型.仿真結(jié)果表明:所建立的仿人駕駛員模型具有基本的道路跟隨和過彎能力,與人類駕駛員具有較高的轉(zhuǎn)向相似性,轉(zhuǎn)向平穩(wěn),能夠反映人類駕駛員彎道駕駛過程中普遍的轉(zhuǎn)向行為,在其他彎曲道路和車速下具有一定的適用性.