馮樹民,黃秋菊,張宇,趙琥
(1.哈爾濱工業(yè)大學,交通科學與工程學院,哈爾濱150010;2.哈爾濱職業(yè)技術學院,汽車學院,哈爾濱150081)
近年來對于汽車主要操控者行為的描述、理解和深入研究已成為國內外學者關注的重點[1]。已有研究表明,應用數(shù)學模型對駕駛人的駕駛操控行為過程進行準確模擬和刻畫,并體現(xiàn)該過程中駕駛人的經(jīng)驗和自身特征,是研發(fā)更先進的智能化駕駛輔助系統(tǒng)和自動駕駛技術,推動智能網(wǎng)聯(lián)交通發(fā)展的重要手段之一[2]。1981年,REDDY等[3]開始駕駛人行為建模研究,并提出一種駕駛人行為模型。經(jīng)過近40年的發(fā)展,對駕駛人行為的建模主要歸納為4種方法:基于傳遞函數(shù)的駕駛人行為建模[4],基于最優(yōu)控制的駕駛人行為建模[5],基于數(shù)據(jù)的駕駛人行為建模[6],基于模型預測控制的駕駛人行為建模[7]。
已有研究更多是從方向盤轉角、預瞄路徑等建立描述駕駛行為的模型,缺少對駕駛行為過程隨機性和動態(tài)性的考慮。為此,本文采用隨機模型預測控制方法,基于HMM 提出駕駛人“感知-決策-操控”行為模型,使模型預測更符合真實駕駛狀態(tài)。另外,已有研究大多采用間接計算獲得的車頭時距等確定模型參數(shù),本文利用直接觀測的自然駕駛數(shù)據(jù),實現(xiàn)對模型有效性和準確性的驗證。
隱馬爾可夫模型(Hidden Markov Model,HMM)是馬爾可夫理論模型中常見的一種,通常用模型中可觀測的參數(shù)計算并確定模型中未知和不容易觀測的參數(shù)。如圖1所示。
圖1 隱馬爾可夫模型圖示Fig.1 Diagram of hidden Markov model
圖1中,狀態(tài)xi為HMM 中不容易直接觀測到的隱含狀態(tài),但可以通過可觀測的輸出狀態(tài)yj確定,這些狀態(tài)之間滿足馬爾可夫性質;aij表示隱含狀態(tài)之間的轉移概率;bij表示隱含狀態(tài)與輸出狀態(tài)之間的轉移概率。
駕駛人的感知過程通常是不確定的、動態(tài)的,且隨時間變化,說明駕駛人決策過程和操縱過程具有隨機性。因此,用服從馬爾可夫鏈的隨機過程來描繪駕駛行為是科學有效的。雖然,駕駛員的感知過程、決策過程和操縱過程是不容易觀測的隱含狀態(tài),但是可以通過可觀測的輸出信息,例如車頭時距或車間時距等體現(xiàn)。如果通過計算間接獲得輸出信息,會影響模型的準確性和精度。本文以車間距作為HMM中的可觀測輸出,采用雷達測距傳感器測量實時車間距,保證可觀測輸出層的準確性,提高模型預測的準確性。利用隱馬爾可夫理論,以最常見的跟車行駛為例,對駕駛人駕駛操控行為建模。前后兩車車間距離示意如圖2所示。
圖2 前后兩車車間距離示意Fig.2 Schematic diagram of workshop distance between front and rear cars
駕駛人“感知-決策-操控”行為模型框架如圖3所示。
圖3 駕駛人“感知-決策-操控”行為模型框架Fig.3 Driver perception-decision-manipulation behavior model framework
如圖3所示,在基于HMM 的駕駛人“感知-決策-操控”行為建??蚣苤?,基于HMM的駕駛人駕駛意愿模型模擬駕駛人感知過程,即獲得期望的車間距;預測模塊模擬駕駛人根據(jù)交通環(huán)境和自身生理、心理狀態(tài)預測未來車輛行駛路徑,即決策過程;優(yōu)化模塊模擬駕駛人為實現(xiàn)預測車間距對期望車間距的追蹤,而采取的措施和動作,即操控車輛加速、減速等。3 個模塊的滾動優(yōu)化過程實現(xiàn)對駕駛人跟車行為的模擬和描繪。
2.2.1 駕駛人駕駛意愿的數(shù)學描述
車輛行駛過程中,駕駛人根據(jù)感知到的信息產生駕駛意愿操縱車輛運行,車速是駕駛意愿的主要直觀體現(xiàn),因此,可以用每秒鐘的速度變化量ΔV(ΔV >0,ΔV <0,ΔV=0)來描述駕駛人的駕駛意愿,即加速、減速或勻速。假設車輛行駛過程中縱向速度變化所在區(qū)間為[ΔVmin,ΔVmax] ,將其平均分割成NX份,其中,ΔVmin和ΔVmax分別表示速度變化量最小值和最大值,X等于HMM中隱含狀態(tài)的個數(shù)。
2.2.2 駕駛人駕駛意愿模型構建
如圖3所示,在駕駛過程中,駕駛人的駕駛意愿具有較強的隨機性。因此,按照隨機過程的定義,駕駛人的駕駛意愿可以用隨機過程{Xt,t∈[ 0 ,+∞)}來描述。假設其概率分布列Π=(pi)為
式中:pi表示隨機狀態(tài)的概率,p1+p2+…+pNX=1。于是,駕駛意愿即隨機過程{Xt,t∈[ 0 ,+∞)}具有馬爾可夫性質。用概率轉移矩陣A表示駕駛意愿各狀態(tài)之間的轉移概率為
式中:aij=P(Xt+1=j|Xt=i),1 ≤i,j≤NX表示t時 刻ΔV位于第i個區(qū)間[ ΔVxi-1,ΔVxi),而在t+1 時刻ΔV位于第j個區(qū)間[ ΔVxj-1,ΔVxj)的概率為aij。
在駕駛操控行為過程中,駕駛意愿即HMM 中的隱含狀態(tài)可由兩車的車間距離來體現(xiàn)。試驗中借助雷達模塊實時測量與前車的車間距。將車間距所在的區(qū)間[Smin,Smax] 分割為NY個子區(qū)間,這里Smin、Smax分別表示車間距最小值和最大值,NY個子區(qū)間數(shù)目即為HMM 中可觀測的輸出狀態(tài)數(shù)目。當m時刻期望的車間距Sm位于第i個子區(qū)間[Smi-1,Smi)時,即表示對應的輸出狀態(tài)為Y=i。
根據(jù)圖3分析可知,駕駛操控行為的可觀測輸出狀態(tài),即車間距的取值主要取決于駕駛人多通道感知信息后產生的駕駛意愿,因此,可以用條件概率bij=P(Yt=j|Xt=i),1 ≤i,j≤NY表示兩者之間的關系。該條件概率bij表示當HMM的隱含狀態(tài),即駕駛人的駕駛意愿位于第i個子區(qū)間[ΔVxi-1,ΔVxi)時,可觀測輸出狀態(tài),即車間距位于第j個子區(qū)間[Smj-1,Smj)的概率為bij。可觀測輸出狀態(tài)概率轉移矩陣B為
于是,利用隱馬爾可夫模型λ=(A,B,Π)實現(xiàn)圖3中駕駛人感知過程的模擬,即駕駛意愿模型為
式中:Xk為HMM 中的隱含狀態(tài),即車輛每秒縱向速度變化量ΔV;Yk為可觀測的輸出狀態(tài),即車間距S;k表示時刻。
在駕駛操縱過程中,駕駛人基于自身當時的生理、心理狀態(tài)及駕駛經(jīng)驗和習慣,通過視覺、聽覺、觸覺、空間運動感知等綜合感知車內外的狀態(tài),將多通道獲得的多源信息進行融合處理,獲得期望的車間距序列[Smj(k+1),Smj(k+2),…,Smj(k+Np)],其中,Np為駕駛人感知的安全車間距的狀態(tài)數(shù),p表示個數(shù)。同時,駕駛員根據(jù)當前車輛狀態(tài),在不與他車駕駛意愿沖突的條件下,對下一時刻車輛狀態(tài)進行預測。根據(jù)式(2)和車輛當前狀態(tài),可以得到預測輸出序列為
式中:Ypk+i=BAiXk,i=1,2,…,Np。
駕駛人通過對車輛的操控,實現(xiàn)預測車間距對期望車間距的跟蹤,即獲得隱含狀態(tài)序列。在已建立的隱馬爾可夫模型λ=()A,B,Π情況下,借助MATLAB 采用維特比算法(Viterbi algorithm)實現(xiàn)駕駛人駕駛意愿序列的產生,即完成預測車間距對期望車間距的跟蹤。因此,駕駛人“感知-決策-操縱”行為模型為
式中:X(k)為待優(yōu)化的駕駛人意愿序列,即車輛的控制輸入序列,X(k)=(Xk+1,Xk+2,…,Xk+Np)T;Yd(k)為期望的輸出序列。 為實現(xiàn)優(yōu)化,Yd(k)=(Ydk+1,Ydk+2,…,Ydk+Np)T。根據(jù)貝葉斯公式
在輸出序列Yd(k)已知情況下,條件概率P[X(k)|Yd(k)]的取值與P[Yd(k)]的取值無關。因此,條件概率P[X(k)|Yd(k)]的最大值,即如下函數(shù)的最大值。
具體優(yōu)化過程如下:
當Np=1時,
當Np=2 時,
以此類推,當Np=Np時,
因此,
將上述遞推過程歸納為:
Step 1 將控制時域Np輸入,并輸入狀態(tài)概率分布列Π,隱含狀態(tài)概率轉移矩陣A和可觀測輸出概率轉移矩陣B。
Step 2 輸入期望的觀測序列Yd(k)=(Ydk+1,Ydk+2,…,Ydk+Np)T。
Step 3 初始化Vk=0。
Step 4 根據(jù)迭代公式Vk+i=P(Ydk+i|Xk+i)P(Xk+i|Xk+i-1)Vk+i-1,i=1,2,…,Np,計算待優(yōu)化函數(shù)值。
Step 5 計算控制輸入序列X(k)。
Step 6 將X(k)的第一個元素作用于系統(tǒng)。
Step 7 在k+1 時,有可觀測序列Yd(k+1),令k=k+1,回到Step 2。
MATLAB 中具有實現(xiàn)維特比計算方法的求解功能,故借助MATLAB完成計算。
數(shù)據(jù)為項目研究人員于2019年5月-12月在哈爾濱市城市道路所收集的共5591 km、6840 min的自然駕駛數(shù)據(jù)。其中,2019年12月16日-23日,分別于早6:35-7:35,晚16:00-17:00,通過雷達測距,傳感器以0.1 s為步長記錄10臺不同試驗車輛與前車的車間距,并借助手機APP同步測量并記錄試驗車輛的運行數(shù)據(jù),包括:實時速度,縱向位移,最高速度,累計行駛公里數(shù)等信息。采用對稱指數(shù)平均濾波算法對16 段時間所記錄的數(shù)據(jù)進行選取,得到2178457+1853781=4032238組數(shù)據(jù)。
為獲得模擬駕駛人“感知-決策-操控”行為過程的HMM模型,需要辨識模型中狀態(tài)概率分布列Π,狀態(tài)概率轉移矩陣A和輸出概率轉移矩陣B。對濾波后的車間距數(shù)據(jù)計算并統(tǒng)計。車間距小于1.5 m 和大于16.5 m 的數(shù)據(jù)量較少,僅占數(shù)據(jù)量的11.13%,不作為重點研究內容。為更好地體現(xiàn)數(shù)據(jù)的統(tǒng)計規(guī)律性,具體刻畫和描繪駕駛人不同交通流狀態(tài)下駕駛操控行為,按照車間距間隔6 m進行分類,獲得[1 .5,7.5)m,[ 7.5,13.5)m,[1 3.5,19.5)m 這3 個車間距區(qū)間,各自對應數(shù)據(jù)量如表1所示。
表1 按照車間距劃分后的統(tǒng)計數(shù)據(jù)Table 1 Statistical data table by vehicle spacing
為獲得HMM 模型中隱含狀態(tài)的概率分布列,即ΔV的概率分布列,先將車輛速度變化所在區(qū)間[ΔVmin,ΔVmax]劃分為NX個子區(qū)間,依據(jù)大樣本量情況下頻率近似概率思想,獲得車輛速度變化量位于每個區(qū)間的概率,即
式中:nΠi為車輛的速度變化量位于區(qū)間[ ΔVxi-1,ΔVxi)的樣本點的數(shù)量;nΠ為研究區(qū)間(車間距區(qū)間)內樣本點的總數(shù);pi為車速變化量位于[ ΔVxi-1,ΔVxi)區(qū)間的頻率。取NX分別為8、10 和8,計算獲得車間距[1 .5,7.5)m ,[ 7 .5,13.5)m ,[1 3.5,19.5)m 這3 個區(qū)間上,車輛速度變化量的概率分布列,如表2所示。
表2 車輛速度變化量概率分布列ΠTable 2 Probability distribution of vehicle speed variation Π
同理,分別將車輛速度變化量區(qū)間[ΔVmin,ΔVmax]劃分為NX個子區(qū)間,將輸出車間距變化區(qū)間[Smin,Smax] 劃分為NY個子區(qū)間。采用大樣本量下頻率近似概率的方法,通過式(15)和式(16)計算獲得車輛速度變化的概率轉移矩陣A=[aij]及輸出概率轉移矩陣B=[bij]。
式中:nAij為車輛的速度變化量位于區(qū)間[ ΔVxi-1,ΔVxi)的樣本點的數(shù)量;nAi為研究區(qū)間內樣本點的總數(shù);nBij為車輛的速度變化量位于區(qū)間[ ΔVxi-1,ΔVxi),車間距位于區(qū)間[Smj-1,Smj)的樣本點的數(shù)量;nBi為研究區(qū)間內樣本點的總數(shù)。
取不同的NX和NY,計算獲得車間距[1 .5,7.5)m,[ 7 .5,13.5)m,[1 3.5,19.5)m 這3 個區(qū)間上車輛速度變化的概率轉移矩陣A=[aij]及輸出概率轉移矩陣B=[bij] 。以車間距[1 .5,7.5)m 為例,結果如表3和表4所示。
通過計算結果可以看出,表3和表4中的行最大值有7/10 位于對角線上;同理,發(fā)現(xiàn)另外兩個車間距區(qū)間下概率轉移矩陣計算表中的行最大值分別有8/10 和7/10 位于對角線上。這表明車輛速度變化量在下一時刻有73.3%向自身所在的區(qū)間轉移,即速度變化呈現(xiàn)平穩(wěn)狀態(tài)。通過計算還可以看出,每行的次最大值有82.14%向自身所在區(qū)間的相鄰區(qū)間進行轉移。說明駕駛人在短時間內傾向于操控車輛平穩(wěn)運行,沒有急加速或急減速的駕駛決策和行為。這與大多數(shù)駕駛人的駕駛操控行為特性相吻合。說明模型可以實現(xiàn)對駕駛人“感知-決策-操控”行為過程的模擬和預測。
表3 車速變化量概率轉移矩陣ATable 3 Probability transfer matrix A of vehicle speed variation
表4 輸出車間距概率轉移矩陣BTable 4 Probability transfer matrix B of output vehicle spacing
重新選取編號為006號、008號和019號的3輛車作為研究算例,分別采集3輛車15 min的自然駕駛數(shù)據(jù),如表5所示。
表5 隱含狀態(tài)車輛速度變化量區(qū)間劃分Table 5 Interval division of vehicle speed variation in hidden state
通過辨識獲得Π、A和B,使用MATLAB 中HMM 工具箱中的命令multinomial-prob 和viterbipath實現(xiàn)維特比優(yōu)化方法,得到待優(yōu)化的駕駛人決策序列,如表6所示。
表6 輸出狀態(tài)車間距區(qū)間劃分Table 6 Interval division of output state
根據(jù)優(yōu)化算法得到3輛車的閉環(huán)響應曲線,如圖4~圖6所示。可以看出:模型仿真與實際車間距的總體趨勢一致,整體近似效果較好;比較實際車間距和模型仿真后獲得車間距,模型預測的車間距平均誤差僅為1.47%;樣本量越大,隱含狀態(tài)和輸出狀態(tài)區(qū)間劃分越細致,仿真效果與實際數(shù)據(jù)一致性越好,模型的預測準確性越高。表明:所建立的基于HMM駕駛人“感知-決策-操控”行為模型,克服了傳統(tǒng)模型應用時對交通場景的限定及缺乏對駕駛行為過程隨機性和動態(tài)性考慮的問題,可以更好地模擬和描述駕駛人跟車駕駛行為。
圖5 編號008車輛的模型仿真與實際車間距對比圖Fig.5 Comparison between model simulation and actual vehicle spacing of vehicle No.008
圖6 編號019車輛的模型仿真與實際車間距對比圖Fig.6 Comparison between model simulation and actual vehicle spacing of 019 vehicle
對于駕駛行為的準確模擬是實現(xiàn)自動駕駛技術的重要前提,而駕駛行為存在隨機性和不確定性,本文提出一種HMM結合隨機模型預測控制的駕駛人跟車行為建模方法。建立駕駛人“感知-決策-操控”行為模型并應用多源數(shù)據(jù)采集和融合方法,利用自然駕駛數(shù)據(jù)實現(xiàn)HMM參數(shù)的辨識。自然駕駛數(shù)據(jù)表明:模型預測的車間距平均誤差僅為1.47%。模型的建立為更好地滿足智能網(wǎng)聯(lián)環(huán)境下對于駕駛行為預測準確性和精確性的要求,為自動駕駛技術研發(fā)提供支持。
本文基于大樣本量情況下頻率近似概率的思想求解模型中狀態(tài)概率分布列,因此,模型更適用于大數(shù)據(jù)采集下的交通場景。由于模型是對跟車行為進行模擬,模型應用時需將轉向和換道行為車輛數(shù)據(jù)進行濾波處理,確保模型應用的準確性。