馬 雷,陳 珂,王明露,曲 瑞
(燕山大學車輛與能源學院,秦皇島 066004)
人是交通系統(tǒng)的主體,而駕駛行為識別是智能交通和智能車輛決策的基礎,其準確性將進一步增強決策的可靠性。國內外學者對駕駛行為識別進行了較為深入的研究,駕駛員模型研究取得了很多成果。如:(1)基于人—車—環(huán)境閉環(huán)系統(tǒng)車輛操縱穩(wěn)定性的駕駛員模型,其主要運用于人—車—環(huán)境這類封閉系統(tǒng)車輛穩(wěn)定性控制的分析和評估,及車輛主動安全操控和智能車輛研發(fā)[1-3],該模型僅基于汽車穩(wěn)定行駛狀態(tài)建立,未考慮路況、車況影響,及汽車接近失穩(wěn)該臨界狀態(tài)下的駕駛行為特性;(2)基于智能交通系統(tǒng)的駕駛員行為模型,該模型表現了駕駛員在智能交通系統(tǒng)中對汽車的控制,跟馳和換道模型是該模型的主要模型[4-6],其考慮了車輛密集程度、車道數、車輛模型等外部因素,但未考慮汽車動力學特性,不以汽車行駛穩(wěn)定性控制為目標;(3)基于交通安全的駕駛員疲勞模型,該模型是反映駕駛員操縱關系與駕駛員疲勞狀況的模型[7],但目前還未建立能夠清楚地表示出駕駛員疲勞狀態(tài)和其具體行為關系的駕駛員疲勞模型。
基于車路協同環(huán)境及駕駛模型的分析,提出了一種介于車輛操縱穩(wěn)定性和智能交通系統(tǒng)的駕駛員行為識別方法,該識別方法結合了兩者的優(yōu)點,更加符合人們對駕駛行為狀態(tài)的描述。本文中主要利用車路協同環(huán)境獲取道路上各行駛車輛的位置、速度等信息,但由于條件有限,選取微觀仿真軟件獲取道路上行駛車輛的位置、速度等信息,根據汽車動力學完成基本行駛參數到行駛狀態(tài)參數的轉化。具體識別過程為:首先運用鄰域粗糙集來對樣本數據特征約簡;再將EEMD和樣本熵融合,完成特征提取及聚類特征向量構建;然后運用模糊聚類對駕駛員行為進行分類識別;最后利用微觀交通軟件和UC-Win/Road駕駛模擬器仿真得到的樣本,采用最小平均貼近度擇近原則進行檢測分析驗證,并根據最大貼近度和次最大貼近度計算待測樣本屬于某類駕駛行為的隸屬度。實驗證明該方法取得了良好的識別效果。
利用交通微觀仿真軟件建立城市和高速工況下的路網模型,仿真獲取本車及周邊車輛的速度、位置等信息,再結合汽車動力學獲得車輛動力學信息,為后續(xù)處理提供樣本數據。
通過預設軟件中跟車和換道兩個駕駛員模塊參數來預先設置駕駛員行為。樣本獲取:首先,選擇合適的高速和城市交通區(qū)域,根據調查的交通路網實際運行情況建立路網;然后,預先設置駕駛員行為,仿真獲取基本樣本。
駕駛員模塊參數設置:根據VISSIM用戶手冊和文獻[8]中跟車和換道模型中城市和高速模型各參數與駕駛行為的關系及文獻[9]中駕駛員反應時間,分析得到跟車和換道模型中對駕駛員行為影響較大的參數,并將駕駛員行為分為良好、普通、危險3類,分別用A,B,C表示。再結合正交實驗法得到城市和高速駕駛員行為分類結果,具體結果見表1,其中bxadd和bxmult分別為城市跟車安全距離附加部分和安全距離倍數部分,CC1為高速跟車期望保持的車頭時距,amax1,amax2,a′max1和 a′max2分別為換道超車和被超車最大減速度和可接受最大減速度,d和b分別為換道最小車頭空距和協調制動最大減速度。
表1 跟車和換道模型組合下的駕駛行為分類
從表1中3類駕駛員行為各選取一組參數進行仿真,得到各車輛在各路段各車道中各時間點的速度和車頭車尾世界坐標系(Xf,Yf),(Xr,Yr)。 文中后續(xù)均以該3類駕駛行為類別為準。
駕駛員行為用本車及本車周邊車輛位置和速度安全信息間接反映,某時刻本車與預換道車道周邊車輛狀態(tài)分析如圖1所示,其中若無換道則用與本車相鄰的任意一車道代替預換道車道。
根據圖1所示的本車與周邊車輛行駛狀態(tài),初步選取各車輛本車與同車道前后鄰近車輛的相對縱向車間距、相對縱向車速(ΔS1,ΔV1,ΔS2,ΔV2),本車與換道前換道車道前后鄰近車輛的相對縱向車間距、相對縱向車速(ΔS3,ΔV3,ΔS4,ΔV4),本車與換道前換道車道前鄰近車輛的相對橫向車間距、相對橫向車速(ΔS5和ΔV5),及各車輛的橫擺角速度和質心側偏角12個參數作為判斷駕駛員行為狀態(tài)的特征參數,參數轉化如下。
圖1 周邊車輛行駛狀態(tài)示意圖
由2自由度汽車模型運動[10]分析,可得車輛在大地坐標系與車輛坐標系下轉化公式:
式中:vx,vy分別為車輛在大地坐標下的縱向速度和橫向速度,由車輛車頭車尾坐標(Xf,Yf),(Xr,Yr)得到;v,uc分別為汽車在車輛坐標系下的橫向速度和縱向速度;γ為車輛的位置角。
由2自由度汽車模型運動分析及實際運動中側向加速度v·很小常常忽略,得汽車的質心側偏角β和橫擺角速度ω分別為
式中:ay為汽車質心絕對加速度在oy方向分量。
為減少駕駛員行為特征值的冗余性,提高運算速度及識別準確性,在經典粗糙集和傳統(tǒng)鄰域粗糙集基礎上,提出了一種改進鄰域粗糙集算法,約簡得到對駕駛員行為影響較大的特征屬性。再利用EEMD和樣本熵相結合對樣本數據進行數據挖掘,為聚類提供了數據來源。
采用基于改進鄰域粗糙集屬性約簡算法是在經典鄰域粗糙集前向貪心算法的基礎上,將原來的單一鄰域半徑改成了一個數組形式的鄰域半徑,然后以空集為起點,逐步向約簡集合添加新屬性并計算每次全部剩余屬性的重要度,將重要度大于設定重要度下限的屬性依次添加到約簡集合,通過反復迭代,直至最后剩余屬性重要度全部小于設定的重要度下限為止。
已知鄰域決策系統(tǒng)(U,C∪D),其中 U={t1,t2,…,tn},C,D分別為條件和決策屬性集合,?B∈C,?ti∈U,ti的 B 鄰域為
由于在改進鄰域粗糙集的屬性約簡算法中,標準差是反映數據在平均值附近平均波動大小的特性,采用標準差作為鄰域半徑的選取標準,彌補了經典鄰域粗糙集屬性約簡算法中各條件屬性鄰域半徑設定為同一單一值帶來的較大誤差[11]。其中,鄰域半徑計算公式為
式中:δ(ti)為條件屬性;ti為鄰域半徑;Std(ti)為所有樣本條件屬性ti全部數據的標準差;λ為鄰域半徑計算參數。
式(5)中,λ是控制鄰域半徑δ的關鍵參數。選取λ的范圍為[2,4][12],0.1為步長,從2到4對λ進行賦值。屬性約簡步驟:首先通過設置改進的前向貪心鄰域粗糙集算法中λ值,不斷修正條件屬性的鄰域半徑,再將計算得到各λ值下的各條件屬性重要度與重要下限0.05和0.001比較,選取條件屬性重要度大于給定重要度下限作為屬性約簡后的條件屬性;然后再應用分類精度較高的決策樹算法(C4.5)和分類性能較穩(wěn)定的樸素貝葉斯NB(Naive Bayesian)進行分類,計算兩種分類器分類精度的平均值(AVG);最后再根據分類精度和屬性約簡后的屬性個數,比較確定最佳λ參數值及最終約簡后的屬性。
在城市和高速公路工況選取各250個樣本,根據文中1.2部分設定條件屬性為12個,根據文中1.1部分決策類別為3種,分別為A,B和C。以城市為例,圖2和圖3為各λ參數在0.05和0.001重要度下限約簡前后兩種分類算法的平均分類精度和各屬性約簡個數結果。
圖2中1,3和4線分別為約簡后C4.5,AVG和NB,2線為約簡前 AVG。圖 3中 1線為 0.001和0.05約簡前,2線為0.001約簡后,3線為0.05約簡后。由圖2和圖3可見,當λ=[2.6,3]時,分類精度高,選取λ=2.8和重要下限0.05時,分類精度的均值和剩余約簡屬性達到最優(yōu),此時分類精度為86.8%,剩余6個屬性:本車與同車道前近鄰車相對縱向車間距、相對縱向車速,本車與換道前換道車道前近鄰車相對縱向車間距、相對縱向車速,及各自本車橫擺角速度和質心側偏角。其中,λ=2.8時得到各條件屬性的重要度如表2所示。由表2可見,0.05重要度下限下剩余6個屬性,上述約簡正確。類似地以相同方法約簡高速各樣本屬性最終得到相同剩余約簡屬性,不再論述。
圖2 0.05和0.001重要度下限的分類
圖3 0.05和0.001重要度下限下約簡前后的屬性個數
表2 城市道路λ=2.8時各條件屬性重要度
EEMD是基于EMD在原始信號中加入高斯白噪聲產生的,其應用白噪聲頻域頻率均勻分布及零均值特性,使信號分解既保留了EMD的優(yōu)點且抑制了EMD的模式混淆現象,使原始信號分解精度有效提高[13-14]。EEMD具體算法如下:
(1)確定平均運算次數M與將要加入的高斯白噪聲的幅值,將白噪聲加入原始信號x(t),得到新信號xi(t),其中i為添加白噪聲次數;
(2)將xi(t)EMD分解,得到一組IMF分量;
(3)將上述IMF分量從x(t)中剔除,得到新信號。
重復以上步驟,直至得到x(t)所有分量為止,將得到的對應IMF總體求均值,得到最終IMF和一個剩余殘余量rn(t)。
式中cij(t)為第i次加入白噪聲后,經EEMD分解得到的第j個IMF分量。
根據EEMD算法,設定本次實驗白噪聲幅值為0.1,運算次數100,以城市3類駕駛員中一組橫擺角速度EEMD分解為例,結果如圖4所示。圖中各曲線表示各類駕駛行為下各自橫擺角速度信號分解得到的初始數據信號的固有模態(tài)函數(即IMF分量)。城市3類駕駛行為各特征相關系數與閾值見表3。
由表3可見,IMF1和IMF2相關系數相對其余IMF分量較大,則上述城市3類駕駛行為車輛的真實分量為IMF1和IMF2。采用上述相同方法,處理城市和高速中各樣本數據,得到大多數特征真實分量均在 IMF1~IMF2之間。因此,最終取 IMF1~IMF2作為所有特征的真實分量。
樣本熵是一種度量時間序列復雜度的方法,反映了原時間序列維數改變時產生新模式的概率及模式間自我相似度,具有良好的一致性和抗數據丟失能力。再將上述篩選出的各特征IMF真實分量的樣本熵值作為駕駛員行為識別特征向量,會相應提高駕駛員行為識別準確率。
時間序列{c(t)|1≤t≤M}樣本熵算法如下:
(1)構造m維矢量 c(k)=[c(k),c(k+1),…c(k+m-1)],(1≤k≤M-m+1);
(2)計算c(k)和c(j)間對應元素的最大值d[c(k),c(j)];
(3)計算小于給定相似容限r的d[c(k),c(j)]的數目與矢量總數M-m的比值的均值Bm(r);
圖4 城市道路3類駕駛行為橫擺角速度EEMD分解
(4)將模式維數m加1,重復步驟(2)和步驟(3)得到Bm+1(r)。當M有限時,可計算得到時間序列樣本熵SampEn(m,r,M)的估計值。
參數m和r影響樣本熵的計算精度,經分析,選取m=2,r=0.1ε(ε為原始數據的標準差)時,樣本熵統(tǒng)計特性相對較理想。以城市道路3類駕駛行為為例,根據上述EEMD分解、特征篩選和樣本熵計算,部分樣本熵如表4所示,并將計算所得樣本熵值構成特征向量作為聚類的數據來源。
表3 城市3類駕駛行為各特征相關系數與閾值
基于GG聚類優(yōu)點:它是基于數學統(tǒng)計的模糊估計聚類法;GG聚類曲線呈不規(guī)則形,擴張了其應用范圍,對大小、密度、形狀均不同的樣本集合也可實施聚類分析。因此選GG聚類運用于駕駛員行為識別[15],GG聚類算法如下。
假設聚類樣本集合 X={x1,x2,…,xn},對任意樣本xi(0≤i≤n)均有 s個特性指標,即:xi={xi1,xi2,…,xis},現將該集合劃分為 c類(2≤c≤n);設其隸屬度矩陣和聚類中心分別為 U=[μjk]c×n和 V=[v1,v2,K,vc]T,其中 μjk為第 k 個樣本元素對于第 j類的隸屬度且μjk∈[0,1]。該聚類原則是經過多次迭代來調整(U,V)使目標函數J(U,V)取最小,目標函數為
表4 城市道路3類駕駛行為剩余屬性的樣本熵(部分)
式中:m為模糊指數,m的值越大各聚類重疊的越多,即劃分的越模糊,一般選取m=2;Dij為引入模糊最大似然估計的距離測度。
GG聚類具體運算步驟如下:
(1)設定聚類分類數目c,模糊指數m,初始化模糊劃分矩陣U;
(2)計算聚類中心vj,其中L為迭代次數
(3)引入模糊最大似然估計距離測度
式中:pj為聚類中第j類被選中的先驗概率;Bj為聚類中第j類的協方差矩陣;Djk為引入模糊最大似然估計的距離測度。
(4)更新隸屬度矩陣U
至滿足‖U(L+1)-U(L)‖<σ,(σ 為?正數),否則繼續(xù)迭代,重復(2),至滿足更新終止條件。
應用GG算法聚類,聚類數目c=3,模糊指數m=2,容差τ=0.0001,將上述章節(jié)獲取的樣本熵看作GG聚類的輸入特征矩陣。選取1 250組樣本數據,運行GG聚類不斷迭代更新聚類中心,得到聚類結果如圖5所示,其中“o”是樣本的聚類中心。
向量X根據同屬于一個類別駕駛行為的不同樣本數據享有相似性,經GG聚類,其將會圍繞在同一個聚類中心附近。從圖5可以看出,城市和高速各形成3個聚類中心,其中各類中的樣本點分別緊湊地分布在各類聚類中心周圍,表明GG聚類算法達到了良好的聚類效果。
應用分類系數法和平均模糊熵法檢驗GG聚類效果,結果如表5所示。
表5 GG聚類效果檢驗
依據原則:分類系數F的值越靠近于1,同時平均模糊熵H的值越靠近于0,則其聚類效果越好。所以由表5可知,GG聚類適合用于駕駛行為識別中,且效果較好。
圖5 城市和高速下3種駕駛行為狀態(tài)GG聚類
選取20人次通過UC-Win/Road 3自由度駕駛模擬器模擬3類不同駕駛行為,獲取 20組待測樣本,其余待測樣本通過微觀仿真軟件仿真獲取,最終共獲得200組待測樣本。駕駛模擬器如圖6所示。將實驗樣本經過EEMD和樣本熵處理得到的數據作為待識別樣本,以GG聚類的聚類中心為標準樣本,標準樣本見表6和表7。
圖6 駕駛模擬器
表6 城市道路下標準樣本
表7 高速道路下標準樣本
對數據進行標準化處理,然后根據最小平均貼近度公式:
其中0≤Z(t)≤1
分別計算其和各自標準樣本最小平均貼近度,對樣本進行診斷識別,根據最大貼近度原理上述200組樣本部分診斷結果如表8所示。
統(tǒng)計以上200個樣本識別結果,計算得到城市和高速駕駛員行為診斷正確率分別為92%和93%。且根據表9可知,出現分類錯誤的幾個樣本其最大貼近度與次貼近度大小相近,說明上述GG聚類分類器是可靠和有效的。圖7為3類駕駛員行為各樣本最大貼近度與次貼近度圖。其中橫坐標取各類樣本總數間隔分之一。
如圖7(a)所示,次貼近度曲線代表A類樣本與B類樣本的貼近程度,圖中左側距離B類聚類中心較遠,說明這些樣本駕駛行為更加良好,而右側靠近B類樣本中心,說明這些樣本駕駛行為逐步向B類靠攏;圖7(b)次貼近度曲線左右兩側分別于A類和C類的貼近程度;圖7(c)與圖7(a)情況相似。貼近度表征兩模糊子集間的相近程度,貼近度越趨近于1表明兩子集越接近。如表8中組號1和2兩個樣本,3個貼近度之和不相等,且不為一,其原因是聚類中心為12維,因此其分類邊界是復雜的,不能將最大貼近度作為該樣本屬于該類的隸屬度。根據式(14)可知,貼近度計算已對數據進行標準化處理,即實現對數據的歸一化,同時可以認為1-δi表征到3個聚類中心距離。而駕駛員行為是漸進變化的,因此設直線上有A,B和C 3點分別表示與3類貼近度為1的點,在直線上選取兩點m和n,分別屬于A和B兩類,如圖8所示。
圖8中Lij表示點i到j的距離。m點代表圖7(a)中左側樣本,與圖7(c)右側樣本類似;n點代表其它樣本。計算m和n點樣本隸屬度分布如式(15)~式(17)所示,圖9為樣本隸屬度計算結果。
表8 不同駕駛員行為類型診斷結果(部分)
圖7 各類樣本最大貼近度與次貼近度關系
圖8 隸屬度計算示意圖
圖9 樣本隸屬度圖
如圖9所示,A,B和C分別為3類的中心值,從分布上看基本與模糊控制中的三角形分布相類似。表8中組號3和4兩個樣本屬于A類的隸屬度分別為0.894和0.825。雖然組號3的隸屬度大于組號4,但是組號4的樣本位于A類中心的左側,而組號3位于A類中心的右側,說明其駕駛行為相對于樣本3更加良好,說明隸屬度更有利于對駕駛行為的評價。表9為分類誤判樣本的隸屬度。
表9 誤判樣本隸屬度表
根據表9可知,誤判樣本的隸屬度都在0.4和0.6之間,位于圖9中兩類隸屬度交叉處,說明即使在識別不準確的情況下,隸屬度也基本可描述該樣本的駕駛行為。
(1)給出基于本車車輛動力學信息與周邊車輛的位置、速度等信息的駕駛員行為評價方法。該方法是介于車輛操縱穩(wěn)定性與智能交通系統(tǒng)的駕駛員行為評價方法,結合了兩者的優(yōu)勢,更加符合實際人們對駕駛行為狀態(tài)的描述。
(2)運用粗糙集理論實現對識別特征的屬性約簡,使識別特征屬性由12個約簡為6個,有效地避免了模式識別中的維數災難問題,提高了方法的可用性。利用EEMD對約簡后特征進行數據挖掘,可以從大量歷史數據中自動搜索隱藏于其中的特殊關系性,利于發(fā)現識別特征有益于模式識別的內在屬性,提高識別的可靠性。
(3)采用GG聚類方法,應用最小平均貼近度擇近原則實現了不同駕駛行為的識別。根據最大貼近度和次最大貼近度計算待測樣本屬于某類駕駛行為的隸屬度,即使在識別不準確的情況下,該隸屬度也基本可描述樣本的駕駛行為。