梁 科,陳華晟,潘明章,葉 宇
(1.廣西大學(xué) 機(jī)械工程學(xué)院,南寧 530004;2.廣西玉柴機(jī)器股份有限公司 玉柴工程研究院,南寧 530007)
駕駛風(fēng)格作為一個廣義的概念,由駕駛能力和駕駛行為組成。駕駛員不同的駕駛風(fēng)格對車輛的操控會產(chǎn)生不同的影響。一般來說,駕駛能力被描述為駕駛員控制車輛的總體能力,這與駕駛員的心理健康和知識以及他們的技能和經(jīng)驗(yàn)有關(guān)。駕駛員的駕駛能力根據(jù)他們的駕駛經(jīng)驗(yàn)而有所不同。駕駛行為與道路環(huán)境、實(shí)時交通狀況等因素在相互關(guān)系[1-2]。通過確定駕駛行為,可以提高安全意識水平,提高燃油經(jīng)濟(jì)性和乘員舒適度。
在駕駛風(fēng)格識別研究方面,早期多采用問卷調(diào)查的形式,設(shè)計對應(yīng)的駕駛行為調(diào)查問卷及設(shè)計駕駛風(fēng)格量化表對駕駛風(fēng)格進(jìn)行評估[3]。該方法高度依賴駕駛員的主觀表現(xiàn),準(zhǔn)確性欠佳。隨著車聯(lián)網(wǎng)技術(shù)和機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,利用自然駕駛數(shù)據(jù)進(jìn)行駕駛風(fēng)格識別模型的構(gòu)建成為越來越多學(xué)者采用的方式。Ma等[4]將K-means 應(yīng)用于駕駛行為聚類,并在將道路類型分類為高速公路和城市地區(qū)后,計算風(fēng)險指數(shù)以識別駕駛員的駕駛風(fēng)格。此外,Wang等[5]開發(fā)了一種稱為半監(jiān)督支持向量機(jī)(S3VM)的半監(jiān)督機(jī)器學(xué)習(xí)方法,以采用部分標(biāo)記的數(shù)據(jù)點(diǎn)識別駕駛風(fēng)格的差異。將機(jī)器學(xué)習(xí)應(yīng)用于駕駛風(fēng)格識別提高了區(qū)分駕駛風(fēng)格的效率,相較于傳統(tǒng)問卷調(diào)查的形式也提高了準(zhǔn)確率和可信度。但大量數(shù)據(jù)會影響模型的計算和精度,故可以采用特征選擇的方法提高模型的效率。
來自于車聯(lián)網(wǎng)收集的駕駛數(shù)據(jù)種類繁多,規(guī)模巨大。大量的數(shù)據(jù)對駕駛風(fēng)格識別模型的準(zhǔn)確度和識別效率具有巨大影響,故而利用特征選擇的方法選擇與駕駛風(fēng)格模型相關(guān)基本特征,有助于降低數(shù)據(jù)集的復(fù)雜性,同時保留隱藏在其中的信息。為了找出對油耗影響最大的特征,F?rster 等[6]提出的駕駛風(fēng)格特征必須反映不同加速、減速和巡航情況下的駕駛環(huán)境和駕駛員侵略性的影響。主成分分析法(principal component analysis,PCA)是用于特征選擇的典型方法。Xia等[7]使用PCA,根據(jù)區(qū)間百分比從383個維度的駕駛數(shù)組中提取特征,篩選出其中累積貢獻(xiàn)率超過85%的前35個主成分,作為駕駛風(fēng)格的分類依據(jù)。
綜上所述,國內(nèi)外研究針對駕駛風(fēng)格的分析在大量數(shù)據(jù)條件下的機(jī)器學(xué)習(xí)效率不高,成本較大,在實(shí)際應(yīng)用方面較為薄弱。自然行駛數(shù)據(jù)是一種連續(xù)時間序列數(shù)據(jù),駕駛員的駕駛風(fēng)格在當(dāng)前時刻的狀態(tài)與前后時刻狀態(tài)有關(guān)。為此,提出了采用自編碼器雙向LSTM的駕駛風(fēng)格譜聚類識別方法,該方法首先將清洗后的數(shù)據(jù)利用K-means確定原始標(biāo)簽,此后采用鯨魚優(yōu)化算法與Sigmoid 函數(shù)相結(jié)合以壓縮數(shù)據(jù)集的大小并用于特征選擇,將選擇的特征輸入至具有雙向LSTM的自動編碼器來學(xué)習(xí)譜嵌入所需的特征值和特征向量,并利用譜聚類來確定駕駛風(fēng)格。為了進(jìn)一步驗(yàn)證提出方法的可靠性,將本文中所提出的方法與SOM及LSTM-譜聚類進(jìn)行聚類效果對比,并利用半掛車的行駛數(shù)據(jù)進(jìn)行了數(shù)據(jù)分析和駕駛風(fēng)格識別。
無監(jiān)督機(jī)器學(xué)習(xí)的K-means方法已廣泛應(yīng)用于數(shù)據(jù)挖掘和聚類分析。該算法旨在使簇間盡可能不同,同時保持簇內(nèi)點(diǎn)盡可能相似。在此方法中,將數(shù)據(jù)點(diǎn)分配給聚類,使每個聚類的質(zhì)心與數(shù)據(jù)點(diǎn)之間的歐氏距離是它們之間的最短距離。
在本文中,K-means用于創(chuàng)建駕駛數(shù)據(jù)原始標(biāo)簽,并將其作為特征選擇的輸入。利用CH值(calinski-harabasz score)對K-means聚類的效果進(jìn)行評價[8],其核心計算方法如式(1)。CH值是通過評估簇之間方差和簇內(nèi)方差來計算得分,其值越大,效果越好。
(1)
式中:Bk為簇間協(xié)方差矩陣;Wk為簇內(nèi)部協(xié)方差矩陣;tr為對應(yīng)矩陣的跡;m為樣本數(shù);k為簇數(shù)目。
特征選擇是機(jī)器學(xué)習(xí)中的一個預(yù)處理過程。對于龐大而復(fù)雜的數(shù)據(jù)集來說,選擇最優(yōu)特征子集是特征選擇中最重要的部分。搜索特征子集的方法主要包括全局搜索算法、隨機(jī)搜索算法及元啟發(fā)式搜索算法。全局搜索算法考慮了特征子集的所有可能組合,但其復(fù)雜度將指數(shù)級增長(2N,N為特征數(shù)量),故其計算速度慢,難以適用于大規(guī)模數(shù)據(jù)集。對于隨機(jī)搜索算法,其可在早期搜索到最優(yōu)子集,但其在最壞的情況下可能發(fā)展為完全搜索。而元啟發(fā)式搜索算法包含的局部搜索和啟發(fā)式過程能夠有效對鄰域進(jìn)行搜索,其目標(biāo)是獲得近似最優(yōu)解,能避免算法得到局部最優(yōu)結(jié)果[9]。
鯨魚優(yōu)化算法(the whale optimization algorithm,WOA)作為元啟發(fā)式算法其參數(shù)較少,具有良好的跳出局部最優(yōu)的能力,適用于特征選擇。該算法可以分為包圍獵物、氣泡網(wǎng)攻擊和搜索獵物3個階段。對于完成與駕駛風(fēng)格相關(guān)的特征選擇,連續(xù)WOA必須轉(zhuǎn)換為其相應(yīng)的二進(jìn)制空間[0,1],采用Sigmoid傳遞函數(shù)可以迫使搜索代理在二進(jìn)制空間中移動[9],從而對鯨魚優(yōu)化算法進(jìn)行改進(jìn),以滿足駕駛風(fēng)格特征選擇的需要。其方程定義如式(2)所示。
(2)
式中:ΔXt表示搜索空間在t處的步進(jìn)向量。此后當(dāng)前搜索代理采用式(3)完成位置更新。
(3)
式中:rand表示(0,1)中的隨機(jī)數(shù)。
特征選擇的目標(biāo)是找出最小的特征選擇數(shù)量,并獲得最大的分類精度。在此基礎(chǔ)上,同時聚合2個目標(biāo)并轉(zhuǎn)化為單目標(biāo)問題(如式(4)),將最小適應(yīng)度值(fitness value)確定為最小分類錯誤率與最小選擇特征數(shù)之和。
(4)
式中:Er為分類錯誤率;Sl、Fl分別為所選特征子集的長度和所有特征的個數(shù);λ、η分別為分類精度和特征子集長度的重要性程度,且λ+η=1,本文中取λ=0.99。在迭代過程中不斷計算每個解的適應(yīng)度值,并將最小適應(yīng)度值的子集當(dāng)作最優(yōu)解,基于此,計算分類精確度如式(5)。
Accurancy=1-Er
(5)
為避免與駕駛風(fēng)格高度相關(guān)的特征可能會導(dǎo)致后續(xù)計算過擬合,本文采用皮爾遜相關(guān)系數(shù)(pearson correlation)衡量2個變量之間的線性相關(guān)關(guān)系,以識別和刪除數(shù)據(jù)集中高度相關(guān)的特征,使得模型可以專注于信息量最大的特征,從而提高泛化能力和性能。其計算方法如式(6)。
(6)
遞歸神經(jīng)網(wǎng)絡(luò)(RNN)是一種特殊類型的神經(jīng)網(wǎng)絡(luò),常用于處理序列數(shù)據(jù)。先前的信息被存儲并應(yīng)用于當(dāng)前輸出。然而,考慮到RNN對先前信息的長距離依賴使其學(xué)習(xí)能力隨著時間的推移而下降,導(dǎo)致訓(xùn)練結(jié)果與預(yù)期目標(biāo)產(chǎn)生嚴(yán)重差異。在長短期記憶模型[10](long short-term memory,LSTM)中,隱藏層采用包括輸入門、輸出門和遺忘門在內(nèi)的存儲模塊以規(guī)避RNN保留大量的輸入信息。因此,該模型能夠在較長一段時間內(nèi)存儲和傳輸信息。在 LSTM 的門控單元中,遺忘門控制需要丟棄的信息,而輸入門控制應(yīng)更新和存儲的新信息。輸出門確定過濾掉的信息并進(jìn)行結(jié)果輸出。各個門中的計算如式(7)—式(9)。
ft=σ(Wf·[ht-1,xt]+bf)
(7)
it=σ(Wi·[ht-1,xt]+bi)
(8)
Ot=σ(Wo·[ht-1,xt]+bo)
(9)
式中:xt為當(dāng)前層的輸入值;ht-1為上一層的輸出;Wf、Wi、Wo分別為遺忘門、輸入門和輸出門的權(quán)重矩陣;σ為Sigmoid函數(shù),bf、bi、bo分別為遺忘門、輸入門和輸出門的偏置項(xiàng)。
式(10)—式(11)描述了存儲在門中的信息并更新當(dāng)前單元的狀態(tài)。
(10)
(11)
輸出門產(chǎn)生輸出候選和當(dāng)前單元狀態(tài)之間的結(jié)果如式(12)。
ht=Ot×tanh(Ct)
(12)
駕駛風(fēng)格在駕駛過程中是與當(dāng)前和前后駕駛狀態(tài)相關(guān)的表征,而LSTM只能存儲和利用單向信息,缺少反映反向信息的能力。雙向LSTM[11](Bidirectional LSTM,Bi-LSTM)能存儲包括前向序列和后向序列的相關(guān)信息。雙向LSTM內(nèi)部包括從過去到未來的前向?qū)雍蛷奈磥淼竭^去的反向?qū)?。這種方法與LSTM的不同之處在于,當(dāng)它在后向?qū)舆\(yùn)行時,來自未來的信息被保留。在結(jié)合2個LSTM隱藏層的狀態(tài)下,可以在任何時間點(diǎn)保留過去和未來的信息。
自動編碼器模型主要由編碼器和解碼器組成,輔以深度神經(jīng)網(wǎng)絡(luò)的非線性特征提取能力,其目的是將輸入轉(zhuǎn)換為中間變量,將這些變量轉(zhuǎn)換為輸出。在比較輸入和輸出中使輸入和輸出無限接近。本文中所采用的雙向LSTM的自編碼器模型如圖1所示,在自編碼器的結(jié)構(gòu)中增加雙向LSTM以提取數(shù)據(jù)特征。
圖1 基于自編碼器的雙向LSTM模型示意圖
譜聚類算法源自圖論,譜聚類的本質(zhì)是利用圖的最優(yōu)劃分思想來解決聚類問題,解決與高維特征向量相關(guān)的奇異問題,參與譜聚類的數(shù)據(jù)集規(guī)模是其唯一的決定因素,而數(shù)據(jù)集的維數(shù)不起作用。針對本文中所采用的降維后的車輛駕駛數(shù)據(jù),其數(shù)據(jù)規(guī)模仍保留,采用譜聚類方法能夠?qū)︸{駛風(fēng)格進(jìn)行良好的區(qū)分。在n個樣本點(diǎn)的集合X={x1,x2,…,xn},和指定聚類數(shù)k的情況中,其主要計算流程如下。
1) 利用高斯相似度函數(shù)(Gaussian similarity function)計算相似度矩陣W:
(13)
式中,σ通過歐幾里得距離衡量。
2) 根據(jù)相似度矩陣W,計算每一行元素之和,組成度矩陣D={d1,d2,…,di},
(14)
3) 計算隨機(jī)游走拉普拉斯矩陣Lrw:
Lrw=D-1L=D-1(D-W)=
E-D-1W
(15)
4) 計算Lrw的特征值,并將其升序排列,取前k個特征值對應(yīng)的特征向量并組成矩陣U:
U={u1,u2,…,uk},U∈Rn×k
(16)
5) 取自于U的第i行向量yi∈Rk,其中i=1,2,…,n組成樣本集Y={y1,y2,…,yn},并用于K-means聚類,得到簇C={C1,C2,…,Ck}。
6) 輸出簇A1,A2,…,Ak為譜聚類結(jié)果,其中Ai={j∣yj∈Ci}。
本文中提出的采用雙向LSTM自編碼器的駕駛風(fēng)格譜聚類識別模型算法流程如圖2所示。
圖2 采用雙向LSTM自編碼器的駕駛風(fēng)格譜聚類識別模型算法流程框圖
以5輛半掛車為對象進(jìn)行研究,為減少車輛性能和行駛路段對駕駛操作的影響,該批車輛具有相同的發(fā)動機(jī)參數(shù)(如表1所示),并在廣昆高速G80相同的實(shí)驗(yàn)路段行駛(如圖3所示)。所有車輛的駕駛員均為經(jīng)驗(yàn)豐富的駕駛員,在實(shí)驗(yàn)過程中并未以任何方式告知駕駛員,以避免駕駛員心理狀態(tài)對實(shí)驗(yàn)的影響。
表1 發(fā)動機(jī)參數(shù)
圖3 實(shí)驗(yàn)路段示意圖
實(shí)驗(yàn)過程中,自然駕駛數(shù)據(jù)通過實(shí)驗(yàn)車上安裝的車載診斷系統(tǒng)(on board diagnostics,OBD)對與駕駛風(fēng)格相關(guān)的數(shù)據(jù)字段進(jìn)行采集,其對應(yīng)的單位及定義如表2所示,采樣頻率為1 Hz。車輛在實(shí)驗(yàn)路段結(jié)束行程后從中提取相關(guān)數(shù)據(jù)字段,并通過CAN總線將數(shù)據(jù)上傳,完成采集。以47號駕駛員所駕車輛為例,采集的部分自然駕駛數(shù)據(jù)如圖4所示。
表2 駕駛風(fēng)格特征參數(shù)定義及取值范圍
圖4 部分真實(shí)駕駛數(shù)據(jù)
采用插值法解決由于傳感器存在不穩(wěn)定性而產(chǎn)生的原始數(shù)據(jù)異?;騺G失的問題。為進(jìn)一步提高數(shù)據(jù)的質(zhì)量,選用箱型圖法[12]進(jìn)行數(shù)據(jù)清洗。此外,考慮到連續(xù)長時間停車于駕駛風(fēng)格劃分無益,在數(shù)據(jù)清洗過程中一并剔除。
以47號駕駛員所駕車輛為例,本文中使用K-means 方法來初始化原始數(shù)據(jù)的標(biāo)記。不同的學(xué)者對駕駛風(fēng)格的定義有一定差異,通常將其劃分為2—4類[13-14]。通過計算所得數(shù)據(jù)對應(yīng)的CH值(如圖5所示),考慮到駕駛風(fēng)格的實(shí)際意義,將聚類結(jié)果分為3類。
圖5 K-means 聚類效果評價
將從K-means獲得的具有初始標(biāo)簽的數(shù)據(jù)導(dǎo)入到鯨魚優(yōu)化算法中進(jìn)行特征篩選,通過多次測試及參數(shù)調(diào)整,將其中的搜索代理個數(shù)和迭代次數(shù)分別設(shè)為16和70。根據(jù)本文所采用的適應(yīng)度函數(shù),計算得特征選擇準(zhǔn)確率為97.34%。此后,為驗(yàn)證所選特征的相關(guān)性,采用皮爾遜相關(guān)系數(shù)法進(jìn)行相關(guān)性判斷,發(fā)現(xiàn)油門開度和循環(huán)噴油量的相關(guān)性系數(shù)達(dá)到0.97。綜合考慮各個特征間關(guān)聯(lián),剔除了油門開度這一特征。其余特征相關(guān)性判斷結(jié)果如圖6所示,表明所選特征較為獨(dú)立,可用于分析對駕駛風(fēng)格的影響。
圖6 WOA特征選擇結(jié)果相關(guān)性判斷
為了避免自編碼器中層數(shù)過多導(dǎo)致的過擬合問題,在自編碼器中使用了2個具有32個單元的Bi-LSTM層作為編碼器和解碼器。并將所選特征作為輸入應(yīng)用于自編碼器。根據(jù)對模型多次測試,使用Tensorflow分別訓(xùn)練80個epoch和32個batch的模型能夠在保證精度的同時提高模型的訓(xùn)練效率。最終,將通過訓(xùn)練得到的權(quán)重矩陣應(yīng)用于譜嵌入的特征值和特征向量計算,獲得駕駛風(fēng)格識別結(jié)果。
為驗(yàn)證采用Bi-LSTM對譜聚類進(jìn)行參數(shù)計算的駕駛風(fēng)格分類結(jié)果的準(zhǔn)確性,利用廣泛使用的無監(jiān)督神經(jīng)網(wǎng)絡(luò)自組織映射[15](self-organizing map,SOM)及基于LSTM的譜聚類模型與本文中所提出的模型進(jìn)行CH值聚類效果評價。為使SOM模型聚類結(jié)果對駕駛風(fēng)格聚類具有可用性價值,避免空聚類產(chǎn)生,采用1×3、1×2、1×4、1×5、2×2五種SOM拓?fù)浣Y(jié)構(gòu)。評價結(jié)果如表3所示。
表3 不同模型聚類準(zhǔn)確性評價
實(shí)驗(yàn)結(jié)果表明,其聚類準(zhǔn)確率顯著低于后兩者。基于LSTM的譜聚類模型其聚類效果與本文中所提方法相近,故可以認(rèn)為本文中所提出的方法對不同神經(jīng)網(wǎng)絡(luò)的適應(yīng)性較強(qiáng),在更換計算譜嵌入的方法時仍能保持較高的區(qū)分度。此外,雙向LSTM能夠利用歷史的駕駛數(shù)據(jù),這對于連續(xù)的駕駛行為中駕駛風(fēng)格劃分是有益的,故采用雙向LSTM對譜嵌入進(jìn)行計算。
采用本文中所提出的雙向LSTM自編碼器的駕駛風(fēng)格譜聚類識別模型對5位駕駛員的各個駕駛風(fēng)格識別結(jié)果如表4所示。結(jié)果表明,在駕駛過程中,駕駛員的駕駛風(fēng)格會隨著當(dāng)前駕駛行為產(chǎn)生變化。
表4 駕駛員駕駛風(fēng)格識別結(jié)果占比 %
圖7反映了5輛半掛車在實(shí)驗(yàn)路段的扭矩、進(jìn)氣壓力、油門開度、剎車開關(guān)狀態(tài)、環(huán)境壓力、環(huán)境溫度、風(fēng)扇轉(zhuǎn)速、發(fā)動機(jī)轉(zhuǎn)速、循環(huán)噴油量、車速和擋位的平均值分布。
圖7 實(shí)驗(yàn)車輛各項(xiàng)特征分布
其中,扭矩、進(jìn)氣壓力、循環(huán)噴油量分布具有明顯的大小關(guān)系,而油門開度與循環(huán)噴油量高度相關(guān),故亦有相同的變化趨勢。即上述各個特征的值均表現(xiàn)為駕駛風(fēng)格1最大,駕駛風(fēng)格3最小,該差異對駕駛風(fēng)格劃分產(chǎn)生了重要的影響。對于剎車開關(guān)狀態(tài),其平均值越高則代表剎車次數(shù)越多,對于35、47號實(shí)驗(yàn)車輛兩者分布相似,均有駕駛風(fēng)格3所代表的值最大而駕駛風(fēng)格1所代表的值最小。總體來看,剎車開關(guān)狀態(tài)分布比較分散,且剎車行為在高速公路的行駛表現(xiàn)中包含正常的剎車減速行為,相比于其他特征剎車開關(guān)狀態(tài)在不同的駕駛風(fēng)格中差異較小,對駕駛風(fēng)格影響有限。對于環(huán)境壓力,由于所選車輛的實(shí)驗(yàn)路線相同,其海拔高度變化相對穩(wěn)定,對駕駛風(fēng)格識別結(jié)果影響有限。此外,由于環(huán)境溫度傳感器安裝位置靠近水箱,故環(huán)境溫度變化與風(fēng)扇轉(zhuǎn)速變化有關(guān)。同一駕駛風(fēng)格的環(huán)境溫度與風(fēng)扇轉(zhuǎn)速變化一致,故環(huán)境溫度或風(fēng)扇轉(zhuǎn)速對駕駛風(fēng)格識別結(jié)果影響有限。對于發(fā)動機(jī)轉(zhuǎn)速,駕駛風(fēng)格間的差異有限,且發(fā)動機(jī)轉(zhuǎn)速與車輛的擋位有關(guān),結(jié)合擋位及車速分布圖可知,車輛在該路段上以高擋位行駛為主,其發(fā)動機(jī)轉(zhuǎn)速和車速間差異較小,對駕駛風(fēng)格影響有限。
綜上,在數(shù)值方面,扭矩、進(jìn)氣壓力、油門開度、循環(huán)噴油量均表現(xiàn)出明顯差異且該特征與駕駛員行為特征相關(guān),并且反映了車輛燃料消耗情況,根據(jù)其大小情況將駕駛風(fēng)格1對應(yīng)為激進(jìn)型,駕駛風(fēng)格2對應(yīng)為溫和型,駕駛風(fēng)格3對應(yīng)為冷靜型。
為了驗(yàn)證所定義駕駛風(fēng)格,選取其中47號駕駛員所屬車輛的3個已被標(biāo)記的典型片段區(qū)間連續(xù)140個采樣點(diǎn)以探究各個駕駛風(fēng)格間的差異??紤]到數(shù)據(jù)在基于自編碼器的Bi-LSTM中的傳遞特性,駕駛風(fēng)格劃分無法保持連續(xù)一致性,故所選取的3個典型區(qū)間分別以激進(jìn)型、溫和型和冷靜型為主的駕駛風(fēng)格劃分,如圖8所示。
圖8 47號實(shí)驗(yàn)車輛區(qū)間采樣曲線
總體來看,隨著駕駛員對擋位和油門操作的變化,車輛對應(yīng)的車速、扭矩、進(jìn)氣壓力及循環(huán)噴油量產(chǎn)生對應(yīng)的快速變化。結(jié)合表5來看,即使溫和型駕駛風(fēng)格下指標(biāo)數(shù)值較大,但其變化率較低,說明駕駛員在駕駛過程中保持相對穩(wěn)定的駕駛狀態(tài)。對于平靜型駕駛風(fēng)格的情況,駕駛員未對油門及擋位進(jìn)行操作,但車輛仍能保持前進(jìn)狀態(tài),可以認(rèn)為車輛正在下坡,車輛狀態(tài)未有明顯的突變。
表5 各個駕駛風(fēng)格對應(yīng)所選特征平均變化率
表5展示了上述變量的變化率。從表5可以看出,在對應(yīng)的駕駛風(fēng)格區(qū)間內(nèi),扭矩、進(jìn)氣壓力、循環(huán)噴油量的變化率具有一定的相似性。根據(jù)特征選擇的情況,即使扭矩和進(jìn)氣壓力未在所選特征內(nèi),但特征選擇及駕駛風(fēng)格識別結(jié)果能反映兩者的變化規(guī)律。
提出了一種采用雙向LSTM自編碼器的譜聚類模型,并用于駕駛員駕駛風(fēng)格識別?;谡鎸?shí)數(shù)據(jù)實(shí)驗(yàn),利用改進(jìn)的鯨魚優(yōu)化算法將扭矩、進(jìn)氣壓力、油門開度和循環(huán)噴油量作為區(qū)分不同駕駛風(fēng)格的主要特征,并通過采用雙向LSTM自編碼器的譜聚類模型將駕駛風(fēng)格分別識別為激進(jìn)型、溫和型和冷靜型。分析結(jié)果表明,所選特征能夠反應(yīng)駕駛員的駕駛行為特征,對于駕駛風(fēng)格劃分具有良好的識別效果。通過探索更準(zhǔn)確的方法來初始化數(shù)據(jù)的原始標(biāo)簽,并實(shí)驗(yàn)不同的道路條件(如城市和鄉(xiāng)村地區(qū))以及更多的車輛類型,可以進(jìn)一步提高算法的適用性。