(3)頻繁加減速行為。
頻繁加減速行為的出現(xiàn)是由于交通環(huán)境的復(fù)雜,需要頻繁加速減速進行速度控制規(guī)避風(fēng)險,另一種則發(fā)生在交通流擁擠時需要保證與前車有足夠的安全間距而不斷變速。首先根據(jù)a>1.2 m/s2或a<-2 m/s2對加速度進行判斷,如式(1)所示,n用來標(biāo)記是否滿足判定條件,為更簡約地統(tǒng)計符合閾值的個數(shù),將a>1.2 m/s2的數(shù)據(jù)標(biāo)記為1,將a<-2 m/s2的數(shù)據(jù)標(biāo)記為-1,其余的標(biāo)記為0,然后對60 s內(nèi)的1與-1進行計數(shù),計數(shù)總數(shù)超過3個的時間區(qū)間認為公交車出現(xiàn)頻繁加減速的行為。
(1)
(4)急轉(zhuǎn)彎行為。
在行駛過程中速度偏高時容易發(fā)生急轉(zhuǎn)彎行為,急轉(zhuǎn)彎時橫向加速度較大,乘客容易出現(xiàn)失去平衡的情況,因此急轉(zhuǎn)彎行為也是影響公交車運行安全的因素。本文根據(jù)已有研究得出,急轉(zhuǎn)彎行為根據(jù)行駛平均速度及方向角變化值進行判定,以窗口長度為5的滑動窗口對數(shù)據(jù)進行遍歷,當(dāng)窗口內(nèi)的v>20 km/h且ω>90°時認為公交車出現(xiàn)急轉(zhuǎn)彎行為。轉(zhuǎn)向角計算公式如式(2)所示。
(2)
轉(zhuǎn)向角值判斷如式(3)所示,其中status表示是否滿足ω>90°這一判定條件,滿足時status為1,反之,status為0。
(3)
1.3 數(shù)據(jù)空間連接
首先,通過Python將交叉口、路段的起終點構(gòu)造線要素,利用公交站、風(fēng)險點位坐標(biāo)構(gòu)造點要素。其次,生成交叉口、路段和公交站的緩沖區(qū),交叉口緩沖半徑設(shè)為20 m,公交站緩沖半徑設(shè)為30 m,路段緩沖半徑設(shè)為15 m。最后,完成空間連接,以風(fēng)險點位數(shù)據(jù)為基準(zhǔn),運用sjoin函數(shù)完成對不良駕駛行為數(shù)據(jù)及dms報警數(shù)據(jù)與道路信息數(shù)據(jù)的空間連接,得到發(fā)生風(fēng)險駕駛行為的空間位置(交叉口、公交站或路段)。
1.4 指標(biāo)選取
本文共選取了10個常見指標(biāo),分別為平均加速度及加速度標(biāo)準(zhǔn)差、平均減速度和減速度標(biāo)準(zhǔn)差、不良駕駛行為次數(shù)和持續(xù)時間、異常駕駛行為指數(shù)、年齡、駕齡和參與工作時間。由于在不同等級道路上,公交車運行速度限制不同,故不將速度作為劃分駕駛員類別的指標(biāo)。
2 畫像標(biāo)簽提取
本文采用因子分析中的主成分分析進行指標(biāo)降維,通過因子可行性驗證,主成分分析后得出KMO值為0.810,表明各指標(biāo)之間有較強的相關(guān)性。
通過SPSS降維中的因子分析功能,選擇主因子分析并描述其系數(shù)相關(guān)性矩陣及KMO和巴特利特球形度檢驗,利用最大方差法進行因子旋轉(zhuǎn)得出其旋轉(zhuǎn)后的解,并輸出旋轉(zhuǎn)后的成分矩陣如表1所示。

表1 旋轉(zhuǎn)后的成分矩陣
根據(jù)載荷絕對值越大的因子與變量越接近的規(guī)則,特征變量共分為3類,成分1與平均加速度、平均減速度、加速度標(biāo)準(zhǔn)差及減速度標(biāo)準(zhǔn)差較為靠近,這類速度皆與速度相關(guān)參數(shù)相關(guān),故將這一類參數(shù)構(gòu)成的特征變量命名為駕駛風(fēng)格偏好特征變量;成分2與年齡、駕齡、不良駕駛行為持續(xù)時間及不良駕駛行為總數(shù)較為密切,不良駕駛行為多與駕駛員的自身特征相關(guān),故將此類命名為駕駛員個體偏好特征變量;成分3與異常駕駛行為指數(shù)及參與工作時間相關(guān),2個指標(biāo)代表了駕駛員的安全態(tài)度及駕駛經(jīng)驗,故將此類命名為違規(guī)偏好特征變量。
3 聚類分析
聚類方法采用K-means聚類,對數(shù)據(jù)進行歸一化處理后,通過確定的3類特征變量及相關(guān)指標(biāo)分別進行聚類,并結(jié)合手肘法對最優(yōu)聚類數(shù)進行判斷。
3.1 數(shù)據(jù)歸一化
為統(tǒng)一不同數(shù)據(jù)指標(biāo)的量綱,需要對數(shù)據(jù)進行歸一化處理,方便對比每個指標(biāo)之間的關(guān)系,研究中的歸一化計算公式如式(4)所示[9]。
(4)
其中,x為指標(biāo)單一樣本的觀測值,μ為研究樣本中某一指標(biāo)的總體平均值,σ為研究樣本某一指標(biāo)的總體標(biāo)準(zhǔn)差。
3.2 K-means聚類原理
K-means聚類是一種典型的無監(jiān)督學(xué)習(xí)的算法,SPSS自動設(shè)置初始中心點并把所有樣本值分到各中心點所在的類中,針對每一個類別里的所有點,計算所有點的平均值,生成新的中心點,并不斷重復(fù)迭代直至收斂。其目標(biāo)函數(shù)如式(5)所示。
(5)
其中,n為數(shù)據(jù)集中點的總數(shù)目,K為聚類數(shù),mi為簇中心位置,對于riK,當(dāng)xi屬于第K個類時,riK=1否則riK=0。最終的目的是要求解mi和riK。
3.3 手肘法原理
手肘法中運用SSE的趨勢變化拐點來判斷最優(yōu)的聚類數(shù)(即K值),確認最優(yōu)K值。需要利用Python進行計算,SSE值公式如式(6)所示。
(6)
其中,SSE為誤差總平方和,K為最優(yōu)K均值聚類數(shù),Ci為第i簇,wp為Ci中的一個觀測值,mi為簇中心即聚類中心位置。
3.4 駕駛員駕駛行為聚類過程
通過SPSS軟件分類功能中的K-均值聚類,選擇樣本收斂準(zhǔn)則為0,并選擇輸出聚類中心、與聚類中心的距離,從2次開始調(diào)整聚類數(shù)進行聚類,與最優(yōu)K值進行比較,最終選定聚類效果好且解釋性好的K值,并對聚類結(jié)果中的類別進行命名,確定每個類別的風(fēng)險程度排名。
3.4.1 駕駛風(fēng)格偏好
手肘法及聚類結(jié)果如圖1(a)所示,在K=4時斜率明顯減小,故駕駛風(fēng)格偏好中將駕駛員個體聚成4類,結(jié)果如表2所示,4個聚類簇中包含的個案數(shù)目較為均衡,聚類效果較好。如圖1(b)所示,平均加速度與加速度標(biāo)準(zhǔn)差成正相關(guān),平均加速度升高則其速度標(biāo)準(zhǔn)差相應(yīng)升高,同樣平均加速度與減速度成負相關(guān)。

圖1 駕駛風(fēng)格偏好特征結(jié)果
對聚類結(jié)果進行分析可以看出,如表(3)所示,聚類共得出4個類別,根據(jù)其聚類中心偏離0的程度可以判斷其駕駛行為的激進與否,分為激進型、較激進型及平穩(wěn)型3大類。故將各類別命名如表3所示,其中激進型駕駛員其加速度相關(guān)指標(biāo)的風(fēng)險程度大,需要對其加速度指標(biāo)進行持續(xù)監(jiān)控并進行督促、改進,并加強駕駛技能和駕駛平穩(wěn)性的培訓(xùn),而平穩(wěn)型駕駛員的相對風(fēng)險程度較小。
3.4.2 駕駛員個體偏好
通過手肘法判斷如圖2(a)所示,斜率突變發(fā)生在K=4時,故將K=4作為最優(yōu)K值,并將其可視化為散點圖,如圖2(b)所示,駕齡與不良駕駛行為數(shù)及不良駕駛行為持續(xù)時間呈負相關(guān),不良駕駛行為次數(shù)越多其持續(xù)時間越長,聚類后分類較為明顯,結(jié)合表4,聚類后的個案在每個類別中分布均勻,聚類效果較好。

圖2 駕駛員個體特征結(jié)果

表4 駕駛員個體偏好聚類各類別數(shù)量
如表5所示,對聚類中心進行分析可以看出年齡及駕齡中類別3最高、類別4最低,據(jù)此依照年齡將駕駛員分為年長駕駛員、中年駕駛員及年輕駕駛員3類,根據(jù)駕齡將駕駛員分為成熟型、進階型及新手型3類,并根據(jù)不良駕駛情況將駕駛員分為平穩(wěn)駕駛型、較平穩(wěn)駕駛型、較風(fēng)險駕駛型及風(fēng)險駕駛型,故將各類別命名如表5所示,其中年輕新手風(fēng)險型駕駛員在駕駛員中風(fēng)險程度更大,而年長成熟平穩(wěn)型駕駛員的不良駕駛行為最低,即風(fēng)險程度小于其他3類駕駛員。
3.4.3 違規(guī)偏好
違規(guī)偏好是以駕駛員產(chǎn)生異常駕駛行為等分散駕駛員注意力的危險行為為指標(biāo)進行聚類,找出其參與工作時間與其違規(guī)偏好的規(guī)律。手肘法結(jié)果如圖3(a)所示,其在K=3和K=6時均出現(xiàn)斜率突變的拐點,為了更清晰簡潔地解釋聚類結(jié)果,最終確定以K=3作為最優(yōu)得到K值。如散點圖3(b)所示,參加工作時間與異常駕駛行不具有正負相關(guān)性,如表6所示,聚類后的3個類別的分類明顯,聚類效果較好。

表6 違規(guī)偏好聚類各類別數(shù)量
對聚類中心進行分析,如表7所示,3類可分為工作時間短且異常駕駛行為少、工作時間長且異常駕駛行為少及工作時間短且異常駕駛行為多的3類駕駛員,第二類駕駛員的異常駕駛行為指數(shù)高于平均值,解釋為參與工作時間越久的駕駛員經(jīng)驗豐富,對自己的能力非常自信,使得其安全意識有所下降。本文對這3類駕駛員的類別進行命名,其中危險型駕駛員需要進行密切關(guān)注,風(fēng)險程度明顯高于其他2類,安全型駕駛員的風(fēng)險程度在3個類別中最低。

表7 違規(guī)偏好最終聚類中心
3.5 駕駛員風(fēng)險駕駛行為畫像
根據(jù)每個特征變量的聚類結(jié)果,每個特征劃分了3或4個類別,均存在風(fēng)險程度高低的變化,能夠從中判斷出需要特別關(guān)注的公交駕駛員個體及群體。對結(jié)果中每個駕駛員在各個特征中的類別劃分進行排列組合,將包含嚴(yán)重風(fēng)險的駕駛員歸為一類,具體劃分標(biāo)準(zhǔn)為:若駕駛員在某一個特征中出現(xiàn)在風(fēng)險嚴(yán)重程度最高的類別,則將其劃分為高風(fēng)險人群;若駕駛員在多項特征中皆為風(fēng)險程度排名中間的類別,則將其劃分為中風(fēng)險人群;其余駕駛員則劃分為低風(fēng)險駕駛員。最后將駕駛員劃分為3類風(fēng)險等級,劃分結(jié)果如表8所示。

表8 駕駛員風(fēng)險類型劃分
將畫像后的3類駕駛員的3個特征變量制作成箱線圖,如圖4所示,通過分布可以看出當(dāng)駕駛員風(fēng)險等級升高時,整體加速度分布都不斷升高,中低風(fēng)險的數(shù)據(jù)更加集中,高風(fēng)險駕駛員的數(shù)據(jù)較為分散,可解釋為部分駕駛員在某一特征中的風(fēng)險程度較大,極具危險性,因此被劃入高風(fēng)險駕駛員人群。

圖4 各風(fēng)險等級駕駛員不同特征下的箱線圖
3.6 高風(fēng)險駕駛員風(fēng)險駕駛行為畫像
上文所識別的不良駕駛行為數(shù)量較多,經(jīng)對比,頻繁加減速行為數(shù)量明顯高于其他行為,且樣本量大,故對其進行進一步研究。
如圖5所示,速度主要分布區(qū)間為14 km/h~28 km/h,分布較為集中,在公交站位置的頻繁加減速行為最多,與公交車進出站的行為相匹配;而路段位置的速度分布曲線相較于公交站和交叉口更偏于高速。對比加速度,加速度分布多大于0,僅有少部分點位于-2.5 m/s2附近,3個不同位置的加速度中值。

圖5 頻繁加速和減速行為不同指標(biāo)分布
異常駕駛行為中接打電話報警及駕駛員異常報警樣本量過低,故未考慮這2類報警類型。下文將通過分神駕駛及疲勞駕駛報警2個類型,進一步探究高風(fēng)險駕駛員人群在各報警類型中的特征。
如圖6和圖7所示,疲勞駕駛行為的速度分布更加分散,公交站位置分布在0~40 km/h,交叉口及路段位置分布在0~50 km/h,而分神駕駛行為在公交站及交叉口處的分布相近,為8~15 km/h,路段位置速度集中在0~30 km/h。疲勞駕駛行為的分布區(qū)間上限均高于分神駕駛行為,具有更大的風(fēng)險性。

圖6 疲勞駕駛行為速度相關(guān)指標(biāo)分布
加速度分布中,疲勞駕駛行為出現(xiàn)多個峰值,公交站位置中,加速度值在±3 m/s2附近出現(xiàn)了較明顯的峰值,而路段位置主要集中在0附近。分神駕駛行為的加速度范圍明顯低于疲勞駕駛行為,公交站位置分別在3 m/s2和0附近出現(xiàn)明顯峰值,在路段中,加速度小于0的分布在-1.4 m/s2附近,在負值范圍內(nèi)相較于公交站和交叉口出現(xiàn)更大減速度值。故高風(fēng)險駕駛員在疲勞駕駛和分神駕駛中擁有更大的加速度絕對值,且疲勞駕駛的加速度和減速度具有更大的風(fēng)險性。
如圖8和圖9所示,從提取到異常駕駛行為發(fā)生時的實際運營里程(距離包含了加氣和充電環(huán)節(jié))可以看出,出現(xiàn)疲勞駕駛頻數(shù)最高的實際里程分布在13.3 km、15.5 km、17.6 km附近,在路段位置的發(fā)生里程在27 km附近出現(xiàn)了較高頻率,而分神駕駛的發(fā)生實際運營里程主要集中在15 km附近,與疲勞駕駛較為相似。5條公交線路的長度為15~25 km,從圖中可以看出疲勞駕駛及分神駕駛多出現(xiàn)在運營路線的后半程中。

圖8 疲勞駕駛行為運營里程指標(biāo)分布

圖9 分神駕駛行為運營里程指標(biāo)分布
綜上所述,在以上3個最常發(fā)生的風(fēng)險駕駛行為中,高風(fēng)險駕駛員在公交站和路段上出現(xiàn)了更多的風(fēng)險駕駛行為,且在速度和加速度2個指標(biāo)中的分布范圍更加更廣,存在風(fēng)險較高的值,在實際運營里程方面,分布相似且主要集中于15~17 km。
4 結(jié)語
本文對公交車駕駛員進行風(fēng)險駕駛行為聚類,并對高風(fēng)險駕駛員在特定時空場景下的風(fēng)險駕駛行為進行特征畫像。本文采用了K-means聚類算法對115名公交車駕駛員進行駕駛行為聚類分析,根據(jù)聚類結(jié)果的風(fēng)險程度進行統(tǒng)計分析,將駕駛員劃分為低風(fēng)險型、中風(fēng)險型及高風(fēng)險型。高風(fēng)險駕駛員速度偏好特征中各項指標(biāo)高于平均值,駕駛更激進;駕駛員個體特征中不良駕駛行為次數(shù)高于均值,駕駛習(xí)慣較差;違規(guī)偏好特征中,異常駕駛行為的次數(shù)和嚴(yán)重程度綜合指標(biāo)高于均值。
本文對判別出的高風(fēng)險駕駛員的風(fēng)險駕駛行為進行群體畫像,進一步研究了這類駕駛員在不同空間位置、不同時段中的風(fēng)險駕駛速度、加速度或運營里程分布特征,得出其在部分空間位置場景下的特征規(guī)律。研究發(fā)現(xiàn)駕駛員在公交站及路段中更具風(fēng)險性,同時在對公交車運行安全監(jiān)管的過程中,需要加強對運營路線中后段的監(jiān)管力度。
通過對高風(fēng)險駕駛員群體的特定場景下的風(fēng)險駕駛行為特征畫像,可以為公交企業(yè)的駕駛安全意識培訓(xùn)及操作技能訓(xùn)練評估提供方向,對特定場景集中監(jiān)管,提高公交駕駛員的安全駕駛意識,培養(yǎng)駕駛員群體安全運行車輛的操作習(xí)慣,最終提升公交運行的安全性和經(jīng)濟性。