劉 杰, 徐 敏
(1.重慶工程職業(yè)技術學院 智能制造與交通學院, 重慶 402260;2。重慶公共運輸職業(yè)學院 運輸貿易系,重慶 402247)
隨著城市軌道交通的迅猛發(fā)展,列車自動駕駛系統(tǒng)(以下簡稱:ATO系統(tǒng))技術也廣泛應用在城市軌道交通日常運營中,盡管ATO技術已經相當成熟,但仍不能完全替代人工駕駛。司機駕駛的主要目的是當控制系統(tǒng)出現故障或發(fā)生突發(fā)事件時,可由人工駕駛列車完成運營任務,否則會造成列車滯留區(qū)間或車站,從而阻塞整個線路。多數地鐵公司規(guī)定晚8點后全部正線列車切換為人工駕駛模式。在人工駕駛模式下,對乘客提供的服務水平質量完全由司機駕駛水平決定。隨著大數據和人工智能時代的到來,基于數據趨動的城市軌道交通智能化管理將成為未來發(fā)展方向,而司機駕駛水平管理將會成為其中重要的一部分,因此設計以列車數據為基礎的司機駕駛水平評價模型,不僅可以提高運營風險抵御能力,而且可以作為司機崗位管理的重要依據。
司機駕駛水平的好壞可以從安全、準點、舒適和節(jié)能4個指標來評判,列車行車記錄系統(tǒng)記錄的時間速度時序是最能體現上述4個指標的數據,而且數據較易獲得[1]。人工駕駛和ATO時間速度數據繪制成坐標曲線的形式如圖1、圖2所示。
圖1 人工駕駛過程
圖2 ATO自動駕駛過程
從圖1和圖2可看出,時間速度曲線分為人工駕駛和ATO 2種。根據經驗,ATO駕駛水平普遍高于人工駕駛。以ATO自動駕駛時序數據為標準,研究如何對人工駕駛時序數據等級評價的問題。具體方法是:利用程序從行車系統(tǒng)導出的文件中抽取原始數據,再用數據挖掘技術提取原始數據特征信息得到特征時序,再用降維技術降低數據復雜度得到樣本集,然后構建聚類算法和模糊綜合評價混合模型對樣本集做出評價,最后分析評價結果。
直接采用行車記錄系統(tǒng)提取的原始數據作為樣本會產生2個問題。一是特征信息量不夠導致聚類效果不明顯;二是維度不一致導致數據無法統(tǒng)一處理。采用python語言編寫的tsfresh包提取時序數據特征,tsfresh能夠提取出超過64種特征,這樣既能挖掘原始數據潛在特征信息,又能統(tǒng)一所有時序數據維度[2]。原始序列表達式如下
(1)
經過特征提取后的時序表達式如下
(2)
(3)
(4)
式中,f為tsfresh特征提取作用函數;D為原始時序集;M為樣本總數;S′為特征提取后的時序集。
采用聚類算法對時序數據進行等級劃分,而聚類的效果很大程度取決于樣本的維度,特征提取后的樣本維度通常較高,如果直接聚類不僅效果不佳,模型復雜度也顯著增加,影響算法效率,因此需要對特征提取后的樣本降維??紤]到高維空間可能存在的流形結構 ,采用非線性t-sne降維算法[3],表達式如下
(5)
S={x1,x2,…,xM}
(6)
式中,xi為樣本;g為t-sne降維算法作用函數;S為樣本集。
規(guī)定評價等級為5級,分別為優(yōu)、良、一般、及格、差。模型分為3個階段,第一階段用一種聚類算法將樣本集按規(guī)定等級數量聚為5類,模型表達公式如下
(7)
(8)
(9)
每一種聚類算法都有其應用局限性,并且不同聚類算法對相同樣本集都會有不同聚類結果,因此采用單一聚類算法其結果可靠性不高。為了解決這一問題,模型第二階段將多種聚類算法的結果用模糊綜合評價算法處理,最后確定樣本等級,公式表達如下
(10)
式中,φ為模糊綜合評價算法作用函數。
具體算法如下[4]:
步驟1。確定評價因素集U={u1,u2,…,uK},這里的因素集元素就等同于聚類算法,確定評語集V={0,1,2,3,4}。
步驟2。確定評價因素權重向量W=[w1,w2,…,wk…,wK],wk由聚類算法本身效果決定。無標簽聚類算法效果評價指標主要有SC(Silhouette Coefficient),CH(Calinski-Harabasz Index),DB(Davies-Bouldin Index)3種,其中,SC、CH值越大表明效果越好,而DB值越接近于0效果越好,綜合3個指標的信息給出權重公式如下[5]
(11)
(12)
(13)
(14)
Akv為第k種聚類算法對第v等級隸屬度
(15)
由模型第一和第二階段得出的ri是一次實驗結果,因為各種聚類算法內部隨機因素的存在,導致每次實驗結果會有所不同,因此考慮到模型的穩(wěn)定性,在模型第三階段采用多次實驗取眾數的方法最終確定評價結果,公式表達如下
(16)
(17)
因為司機的整個駕駛過程由若干條人工駕駛樣本組成,所以形成一條評價等級序列,再利用模糊綜合評價算法對該等級序列進行處理,得到司機駕駛水平評價等級結果。
(18)
這里算法和模型第二階段類似,唯一改變的是評價因素權重向量W的計算方法
(19)
隨機抽取某地鐵6號線17個車運行記錄數據為研究對象,采用python3.6編程抽取得到4 219條時序原始數據,即M=4 219,其中,ATO自動駕駛3 407條,人工駕駛812條。經過tsfresh特征提取后每條時序數據維度統(tǒng)一為794維,再用t-sne算法將其降至2維。所有人工駕駛樣本屬于8位司機,即N=8。聚類算法選擇K-means[6]、層次聚類[8]、譜聚類[7]和高斯混合聚類[9],即K=4。運用提出模型計算得到4種聚類算法一次實驗結果見圖3[10-11]。
圖3 一次聚類實驗結果
從圖3可看出,4種聚類算法的聚類效果都很明顯。再設H=1 000, 8位司機駕駛過程等級變化情況見圖4。
圖4 8位司機駕駛過程等級變化情況
最終司機的評價等級如表1所示。
表1 司機駕駛水平評價等級
多種聚類算法和模糊綜合評價混合模型可以規(guī)避單一聚類算法自身缺點,同時能定量給出最終評價結果。從結果來看,抽樣的8位司機當中3位處于中等水平以下,3位中等水平,2位中上水平,沒有優(yōu)秀。這說明司機駕駛水平整體偏低,平時的訓練力度不夠。從每個司機駕駛過程來看,其波動性普遍較大,等級評價為良的2位司機其駕駛波動性也較高,這說明司機的駕駛不穩(wěn)定,起伏較大。由于人的主觀評價波動性更加復雜,因此結論的實際驗證是很困難的,但從總體上而言,以上結論得到了司機管理部門人員的認可。針對上述情況給出如下建議:
(1)購買模擬駕駛仿真設備,加強司機技能訓練力度。
(2)制定合理的獎懲措施,激勵司機提高其駕駛水平。
(3)加強司機的心理疏導,緩解工作壓力。