李婷婷
(河北省石家莊鐵道大學,河北 石家莊 050043)
結合K-means聚類和決策樹模型,對車輛行駛數(shù)據(jù)進行分析,建立一個駕駛員駕駛狀態(tài)模型。根據(jù)司機駕駛過程中產生的各種數(shù)據(jù),結合不同的環(huán)境情況進行分析,可以判別當前車輛的駕駛狀態(tài)。
近年來交通事故越來越多,給人生安全造成極大威脅,很大程度上制約了經濟發(fā)展和社會進步。導致事故發(fā)生的因素來自方方面面,司機不正確的駕駛操作、異常監(jiān)測設備的落后等。對于司機的駕駛狀態(tài)分析,目前還有所不足。例如車載監(jiān)測設備可以發(fā)現(xiàn)司機疑似疲勞駕駛的行為,但還不能夠分析司機是否存在超長怠速、急變道等不當操作。
建立模型對司機的駕駛狀態(tài)進行分析,有利于對其不良行為監(jiān)測并及時提醒,從而在源頭上減小交通事故的風險。
結合采集的行車軌跡,包括車牌號、設備號、方向角度、經緯度、點火狀態(tài)、轉向燈狀態(tài)、手剎腳剎以及采集時間等信息進行分析。
根據(jù)車輛在一段運輸路線上的數(shù)據(jù)進行聚類分析,區(qū)別安全行為和不良駕駛行為。對于找出的不良駕駛行為,利用隨機森林對其進行類別分析,其中所有不良駕駛行為分為狀態(tài)類和閾值類,閾值類包括急加、急減速、超速、急變道等,其特點在于當速度、加速度或者方向變化等達到一定閾值,便認為駕駛員存在不良駕駛行為;其余為狀態(tài)類,對于怠速預熱、超長怠速、熄火滑行等根據(jù)各項指標達到指定要求則判斷為不良駕駛行為。
選取某輛車的某條線路作為研究數(shù)據(jù)輸入,分析其速度-加速度散點圖可知,除了有少量突變性較高的數(shù)據(jù)外,速度-加速度點主要集中在低加速區(qū)域,而且隨著速度增加,高加速點在逐漸地減少;速度-加速度點聚集性較強,采取K-means聚類進行安全駕駛行為和異常駕駛行為的區(qū)分。
決策樹模型可以根據(jù)多組判斷條件的設置,形成一系列的分支,從而將輸入數(shù)據(jù)分成不同輸出結果。對于判斷條件的順序需要結合不同類別的差異性設置,將具有明顯差異的區(qū)分條件放在前面的順序;對于差別不大的判斷條件可以進行微調。
選擇C4.5算法作為屬性選擇度量算法,使其能夠完成對連續(xù)屬性的離散化處理并對不完整數(shù)據(jù)進行處理。
根據(jù)預處理后所選取的4種主要屬性集:{速度,加速度,點火狀態(tài),方向改變值,駕駛時間}和最終分類結果集{急加,急減,怠速預熱,超長怠速,熄火滑行,超速}。
構造樹型時,需結合信息增益比,選取比值大的因素作為根節(jié)點,逐層遞進,對于比值差異不大的因素可以進行微調。
將這些異常駕駛行為分為閾值類和狀態(tài)類2大類。
狀態(tài)類如下:
①怠速預熱:分類依據(jù)為車輛是否處于點火狀態(tài)為開啟且速度為0的駕駛情況。
②超長怠速:分類依據(jù)為車輛點火狀態(tài)開啟且速度為0的狀態(tài)是否持續(xù)20分鐘以上。
③熄火滑行:分類依據(jù)為車輛是 否處于點火狀態(tài)為0且速度不為0的駕駛情況。
閾值類如下:
④急加速和急減速:分類依據(jù)為車輛加速度的絕對值是否超過問題一所述閾值。
⑤超速:分類依據(jù)為車輛瞬時速度是否超過所行使路況的規(guī)定車速。
⑥急變道:分類依據(jù)為車輛方向角變化幅度是否大于某一閾值且小于90度,即是否出現(xiàn)短時間方向突變情況。
數(shù)據(jù)預處理中,對于一輛車的不同路段采用時間間隔進行分段,閾值設置5min,10min,30min,60min分別分析,最后選擇60min作為路段閾值,避免了等紅燈、司機休息等其他情況對路段分割造成影響。
對于不同類別的不良駕駛行為,按照特點分為狀態(tài)類和閾值類,其中急加速和急減速、超速、急變道屬于閾值類,表現(xiàn)在于當某一指標或者其變化超過特定閾值時,便是某種類別的不良駕駛行為;對于其他的狀態(tài)類,則通過狀態(tài)轉移方程描述狀態(tài)變化情況,當狀態(tài)趨于平穩(wěn),則考慮是否出現(xiàn)某些不良駕駛行為,效果較為靈敏。
隨著數(shù)據(jù)分析與智能化的發(fā)展,對于駕駛行為發(fā)面的分析、評價和預測還有待進一步的完善。在真實場景下,算法的應用除了要求其準確率之外,還需要考慮適用性與易用性,這樣才能更加有助于算法與工業(yè)界的結合。