摘" 要:為了使自動駕駛汽車準確地預(yù)測其周圍車輛的換道意圖,提出了一種基于長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)-多頭混合注意力的可解釋換道意圖預(yù)測模型。該模型可以充分提取目標車輛與其周圍車輛之間的時空交互關(guān)系,并且提出了一種基于最大熵的Shapley加性解釋方法(SHAP)來解釋各個特征在特定時間步對模型輸出的影響程度,在HighD數(shù)據(jù)集上進行了實驗。并通過SHAP值的可視化,直觀解釋了換道預(yù)測模型在特定時刻的目標車輛的換道行為。結(jié)果表明:該換道預(yù)測模型在換道前3 s的綜合準確率,分別比LSTM、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、多頭注意力高出4.03%、9.51%、5.16%,這證明了模型在長時域預(yù)測的有效性;錯誤預(yù)測樣本歸因于模型缺陷或樣本稀疏。該換道預(yù)測模型可為用戶進行模型優(yōu)化提供指導(dǎo)。
關(guān)鍵詞:自動駕駛汽車;換道意圖預(yù)測;注意力機制;長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM);Shapley加性解釋方法(SHAP)
Explainable lane change intention prediction based on LSTM- multi-head mixed attention
Abstract: An interpretable lane change intention prediction model was proposed to enable the autonomous vehicle to accurately predict the lane change intention of the vehicles around them. This model based on the Long Short-Term Memory (LSTM) and the multi-head mixed attention, which can fully extract the spatiotemporal interaction between the target vehicle and its surrounding vehicles. A Shapley additive interpretation method (SHAP) based on maximum entropy was proposed to explain the degree of influence of each feature on the model output at a specific time step, and experiments on the HighD dataset were carried out. The results show that the comprehensive accuracy of the proposed model is 4.03%, 9.51%, and 5.16% higher than that of the LSTM, the Convolutional Neural Network (CNN), and the multi-head attention, respectively, before lane change, which fully proves the validity of the model in the long time horizon. And the wrong prediction samples can be attributed to model defects or sparse samples on the other hand, guiding users to optimize the model.
Key words: autonomous driving vehicles; lane change intention prediction; attention mechanism; long short- term memory (LSTM); Shapley additive explanations (SHAP)
隨著汽車自動駕駛技術(shù)的發(fā)展,交通擁堵和交通事故將得到進一步的緩解,但是當(dāng)自動駕駛汽車處于復(fù)雜多變的交通環(huán)境時仍然面臨許多挑戰(zhàn)。其中一個常見的危險場景就是當(dāng)自動駕駛汽車跟車行駛時,相鄰車道車輛突然的換道行為[1]。如果自動駕駛汽車能夠提前預(yù)測出周圍車輛的換道意圖,便可以提前對行駛路徑進行規(guī)劃,從而大大提高行駛的安全性和效率。
換道意圖預(yù)測作為車輛行為預(yù)測的一個分支,近年來得到了廣泛的研究。目前,換道意圖預(yù)測方法主要分為 2 大類,分別是傳統(tǒng)方法與深度學(xué)習(xí)方法。傳統(tǒng)的換道預(yù)測方法在建模時不需要大量的數(shù)據(jù),且模型的解釋性較好,但是其需要手動設(shè)計和提取特征,這種依賴人工特征工程的過程可能會導(dǎo)致特征選擇不準確或不完備,從而影響模型的性能。
為了解決傳統(tǒng)方法的局限性,近年來深度學(xué)習(xí)方法被廣泛用于行為意圖預(yù)測,其預(yù)測性能通常優(yōu)于其他方法。文獻 [2] 使用單個卷積神經(jīng)網(wǎng)絡(luò)進行實時端到端 3D 檢測、跟蹤和運動預(yù)測,在保證預(yù)測精度的同時大大提高了推理的實時性。文獻 [3] 提出了一種基于圖結(jié)構(gòu)與長短期記憶神經(jīng)網(wǎng)絡(luò) (long short term memory, LSTM) 的軌跡預(yù)測模型,并基于強化學(xué)習(xí)構(gòu)建行為決策模型,有效地改善了自動駕駛汽車的安全性。
文獻 [4] 提出了一種 Social-LSTM-Attention 算法,創(chuàng)新性地引入目標車輛社交特征并通過卷積神經(jīng)網(wǎng)絡(luò)提取 , 建立了基于深度學(xué)習(xí)的車輛行為識別模型 , 應(yīng)用注意力機制來捕捉行為時窗中的多時步信息 , 實現(xiàn)了周邊車輛行為準確識別。深度學(xué)習(xí)模型擁有強大的建模能力,這使得其能夠理解復(fù)雜的換道模式。然而,這些模型在提取時空交互依賴性方面的不足阻礙了其在長期換道預(yù)測中的應(yīng)用。此外,深度學(xué)習(xí)模型通常以黑盒的形式呈現(xiàn),很難解釋模型預(yù)測的原因,這在某些應(yīng)用場景下可能會導(dǎo)致難以預(yù)料的風(fēng)險。
關(guān)于自動駕駛系統(tǒng)的可解釋性研究,文獻 [5] 主要關(guān)注自動駕駛汽車的場景理解,突出輸入圖像中可能導(dǎo)致危險的顯著對象,除了識別危險對象之外,還產(chǎn)生了一系列簡短的解釋,從而有助于促進人們對決策算法的理解。文獻 [6] 通過修改后的反卷積和逐像素的 Grad-CAM 的結(jié)合,突出顯示有助于特定預(yù)測的重要輸入特征,但是,這種顯著性圖方法無法完全考慮全局信息與交互信息,僅適用于卷積神經(jīng)網(wǎng)絡(luò),在面對多標簽分類的復(fù)雜任務(wù)時,可能無法區(qū)分不同目標之間的重要性,從而無法生成準確的解釋結(jié)果。
文獻[7]使用Shapley加性解釋(Shapley additive explanations,SHAP)方法計算了基于機器學(xué)習(xí)的自動駕駛汽車縱向控制模型的特征貢獻,仿真結(jié)果表明, SHAP算法有利于理解縱向控制。文獻[8]提出了一種結(jié)合SHAP和隨機森林(random forest,RF)的解釋方法,并將其應(yīng)用于一種基于深度Q網(wǎng)絡(luò)(deep Q network,DQN)的車輛跟隨模型,其利用SHAP分析模型的特征重要性,然后利用可解釋的RF算法對DQN模型進行模仿學(xué)習(xí),從而實現(xiàn)更透明的決策。文獻[9]將Xgboost模型用于換道決策,并用改進的SHAP算法對特征進行解釋,并通過解釋結(jié)果對錯誤決策樣本進行歸因,為模型的優(yōu)化提供了指導(dǎo),但是該工作僅用單幀數(shù)據(jù)進行采樣,僅采用單幀數(shù)據(jù)而忽視過去時間步的信息,可能存在導(dǎo)致決策結(jié)果不可靠等問題,其未在時空維度上對特征進行解釋,基于傳統(tǒng)的樹模型對決策問題進行建模,決策精度較深度學(xué)習(xí)模型存在差距。
本文提出了一種可解釋換道意圖預(yù)測模型。針對輸入特征(橫向相對位置,周圍車輛交互信息)能夠利用LSTM 特有的門控機制選擇性地遺忘或記住過去的信息,從而有效地捕捉和處理其各自在時間維度上的長期依賴關(guān)系。基于多頭混合注意力可以將不同類型的特征進行融合,以充分捕獲目標車輛信息與其周圍車輛信息的時空交互關(guān)系,有助于深入理解車輛之間的潛在交互模式。最后基于SHAP 算法,在時空維度上對換道預(yù)測模型進行了全面的可解釋分析,定量衡量各個特征在特定時間步對換道意圖預(yù)測結(jié)果的影響程度,通過可視化和錯誤樣本歸因,有助于用戶深入了解自動駕駛汽車預(yù)測模型背后的決策動機。
1"" 數(shù)據(jù)預(yù)處理
HighD 數(shù)據(jù)集是德國高速公路大規(guī)模自然車輛軌跡數(shù)據(jù)集[10]。該數(shù)據(jù)集采樣頻率為 25 Hz,包含 6 個地點的 11 萬輛車輛行駛數(shù)據(jù),總時長為16.5 h。
目標車輛的換道意圖不僅依賴其歷史軌跡,通常受其周圍車輛的影響,為了充分捕獲目標車輛與其周圍車輛的交互信息,本文挑選了包括目標車輛在內(nèi)的 6 輛車作為特征提取對象,如圖 1 所示。本文將周圍環(huán)境信息以及目標車輛的橫向相對位置特征作為模型的輸入,對于 HighD 數(shù)據(jù)集,采集路段是一組雙向車道,因此為了避免數(shù)值差異對網(wǎng)絡(luò)訓(xùn)練產(chǎn)生影響,利用式 (1)對橫向位置特征進行相應(yīng)處理。其中ΔX 表示目標車輛處于 t 時間戳的橫向相對位置,X 是目標車輛的初始橫向位置,X 為目標車輛處于 t 時間戳的橫向位置。
ΔXt = Xt - X1." " (1)
當(dāng)周圍車輛數(shù)量不足5輛時,考慮對相應(yīng)位置使用虛擬車輛代替,這是換道特征提取的常用做法[11]。若虛擬車輛位于目標車輛左前方,則將車輛的虛擬相對速度設(shè)定為vlf = 0 m/s,與目標車輛的虛擬絕對距離設(shè)Dlf = 0 m。假設(shè)虛擬車輛位于目標車輛左后方,則設(shè) vlb = 0 m/s, Dlr = 0 m?!?em>D”表示指定車與目標車的絕對距離;“v”表示指定車與目標車的相對速度;“Δ X ”表示目標車的橫向位置;角標中正體的f、b、l、r分別表示前、后、左、右。
在本文中,車輛的換道預(yù)測問題被表述為基于觀測到的目標車輛橫向相對位置以及與周圍車輛交互信息,預(yù)測目標車輛的換道意圖。形式上,設(shè)Xt = {x1, x2, … , xN,}為 t 時間步下N個特征的狀態(tài)值,模型的輸入由過去T個時間步的數(shù)據(jù)X = {x1, x2, x3, … , xT}組成,模型的輸出分別是左換道、不換道、右換道的概率分布。換道時間點定義為車輛所在車道發(fā)生變化,預(yù)測時預(yù)R為變道點之前的時間。駕駛員的反應(yīng)時間為0.30~1.35 s,制動系統(tǒng)的動作時間約為0.15 s [12]。因此,為了保證系統(tǒng)有足夠的反應(yīng)時間和制動時間,選擇不同的R (R = 1, 2, 3 s)來評估所提模型的性能。對于HighD數(shù)據(jù)集,有4 152個左換道樣本,4 152個不換道樣本和4 152個右換道樣本,在所有類別中總共有12 456個樣本。隨機選取所有篩選樣本中的80%作為訓(xùn)練集,20%作為測試集。
如圖 2 整體框架所示,模型的輸入為目標車輛的橫向相對位置信息、周圍車輛交互信息,輸出為不同機動意圖的概率分布。本節(jié)將詳細介紹算法的整體框架以及各個模塊。首先,基于LSTM 對橫向相對位置信息與周圍車輛交互信息分別進行有用信息的提取并將其映射至高維空間方便進行后處理,同時基于多頭混合注意力可以更好地捕獲 2 種不同特征的交互關(guān)系,更廣泛地對特征進行信息集成,將 2 種模型進行結(jié)合有利于捕獲交互表征序列中的長期時間依賴,以此加強特征之間的時空耦合關(guān)系。最后,針對深度學(xué)習(xí)模型可解釋性差這一缺陷,基于一種可解釋性算法 (SHAP)進一步分析模型在特征層面的推理機制,有助于分析不同換道機動下預(yù)測模型的決策機制。
長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)
LSTM在處理序列數(shù)據(jù)和長期依賴性方面具有優(yōu)勢,適用于許多自然語言處理和時間序列分析任務(wù)。換道意圖預(yù)測任務(wù)基于時間序列數(shù)據(jù)進行建模,LSTM能夠通過其門控機制自適應(yīng)地選擇性地記憶和遺忘輸入序列中的信息,在時間維度上可以處理序列數(shù)據(jù)的長期依賴性。
2.2"" 多頭混合注意力
人類視覺系統(tǒng)可以快速地發(fā)現(xiàn)復(fù)雜場景中的顯著區(qū)域,采用更仔細的識別方法來獲取更有效的詳細信息,通過選擇性感知機制減少數(shù)據(jù)量并抑制其他不重要的信息。受此啟發(fā),注意力機制的核心思想是模仿人類視覺系統(tǒng)的選擇性感知機制,動態(tài)調(diào)整輸入數(shù)據(jù)的特征權(quán)重,將注意力集中在輸入最重要的區(qū)域,抑制不相關(guān)的區(qū)域 [13]。類似于深度學(xué)習(xí)中的最大池化和門控機制,將更合適的部分傳遞到下一步 [14],允許模型從不同角度根據(jù)輸入序列的不同部分調(diào)整其關(guān)注度,從而更好地捕獲重要信息。多頭混合注意力是基于多頭注意力機制的改進,其變體在自動駕駛目標跟蹤等任務(wù)中取得了良好的效果 [15]。在本文中,目標車輛的橫向相對位置信息與周圍車輛交互信息是兩種不同類型的特征,但是兩者彼此聯(lián)系,共同影響意圖預(yù)測的結(jié)果。基于該機制,不僅可以有效地提取過去一段時間內(nèi)的換道表征信息,同時大大增強了加強兩者的時空耦合關(guān)系。下面對其計算進行描述。
每個多頭注意模塊由縮放點積注意力進行計算??s放點擊注意力是查詢矩陣 Q 和鍵矩陣 K 通過縮放后的轉(zhuǎn)置點積,以此計算 2 個矩陣中所有向量的相關(guān)性,dk 縮放 Q 和 K,以減少量綱變化對點積值的影響,然后使用softmax 函數(shù)將值映射到[0,1],最后,利用 softmax 得到的輸出對 V 的輸出進行加權(quán)。多頭注意模塊可以計算序列中任意位置的相關(guān)性,由于其有多個頭部,所以可以融合不同頭部的特征。與縮放點積注意力相比,多頭關(guān)注模塊可以更加有效地關(guān)注序列的全局信息,更好地處理長序列數(shù)據(jù)。具體來說,它是輸入矩陣的線性投影, 生成的 Q、K 和 V 被送入縮放點積注意力模塊中,此過程重復(fù) h 次。最后,通過 Concatenate 層進行拼接,得到全局自關(guān)注特征映射,如式 (4)、(5)、(6) 所示 :
由上文可知,目標的車輛的橫向相對位置信息以及周圍環(huán)境信息分別經(jīng)過數(shù)個單元的LSTM形成高維特征信息,為了實現(xiàn)局部上下文的非線性建模,充分加強兩者之間的耦合關(guān)系,基于一維卷積神經(jīng)網(wǎng)絡(luò)分別對兩者進行投影分別得到(Qp,Kp,Vp)與(Qe,Ke,Ve)。Attention(Qp,Kp, Vp)和Attention(Qe, Ke, Ve )分別是橫向位置信息和周圍車輛交互信息的注意力分數(shù),它既包含自注意,也包含混合注意,將特征提取和信息集成相結(jié)合。最后,將目標車輛的橫向相對位置信息和周圍車輛的高維交互信息連接起來,并通過全連接層進行線性投影處理。具體計算過程如式(7)—(16)所示。
對于訓(xùn)練損失函數(shù),三分類問題通常采用交叉熵損失函數(shù),如式(17) 所示。
2.3"" 基于SHAP 的可解釋性算法
受到博弈論的啟發(fā),Lunberg 等提出的一種專門用于解釋模型輸出的工具,稱為 SHAP [16]。SHAP 能夠提供每個特征對模型輸出的具體貢獻程度。當(dāng)樣本輸入到模型時,每個特征都對這個樣本的預(yù)測結(jié)果擁有一個貢獻,這個貢獻值就稱為這個特征的 SHAP 值,將所有的特征 SHAP 值累加即得到模型對樣本的預(yù)測結(jié)果,具體為:
其中:n為所有特征的集合,S表示去除第i個特征后得到的特征子集,Z表示該特征的值,φi表示第i 個特征的貢獻,M表示輸入特征的數(shù)量。
從式 (19) 可以看出:第 i 個特征的SHAP 值 φi 即為這個特征對預(yù)測結(jié)果的貢獻。若 φi 大于 0,表示這個特征對模型起到了正向作用,提升了預(yù)測值;反之,則該特征起到了反向作用,降低了預(yù)測值。對比傳統(tǒng)樹模型的特征重要性排序,SHAP 算法不僅可以對各個特征影響模型預(yù)測的重要性進行排序,還能夠反映特征如何影響模型結(jié)果,即反映每個樣本中特征具體的影響程度,以及該影響是正向的還是反向的。
實""" 驗
本節(jié)將對提出的模型與現(xiàn)有模型進行比較,并對結(jié)果進行定量分析,通過解釋性算法對不同換道行為進行深入分析。所提模型基于tensorf low2.4.0,keras2.4.3框架下進行訓(xùn)練。實驗運行的硬件環(huán)境為Core(TM) i5- 9300H CPU@2.40GHz and NVIDIA GTX1650。
評價指標
準確率(Accuracy):指預(yù)測正確的樣本數(shù)占測試集樣本數(shù)的比例。如式 (20) 所示。
精確率(Precision)也叫做查準率,表示預(yù)測為正例的樣本中有多少實際是正例,如式 (21) 所示。
召回率(Recall)也稱查全率,指分類正確的正例占全部正例的比例。如式 (22) 所示。
F1 分數(shù)是精確率和召回率的調(diào)和平均數(shù),如式 (23)所示。
其中:TP 為預(yù)測到車輛要換道,實際車輛換道的樣本數(shù);FP 為預(yù)測到車輛要換道,但實際沒換道的樣本數(shù); TN 為預(yù)測到車輛不換道,實際車輛沒換道的樣本數(shù); FN 為預(yù)測車輛不換道,實際車輛換道的樣本數(shù)。
由于本文研究的問題是多分類問題,為了方便比較,對于整個模型,計算其不同換道機動的平均準確率、平均 F1 分數(shù)、平均召回率。
實驗參數(shù)設(shè)置
對模型進行參數(shù)調(diào)優(yōu)后,具體參數(shù)如下:LST M模塊隱藏單元數(shù)為16,一維卷積核個數(shù)為8,卷積核大小為2,dmodel = 160, h = 5,dk = dv = dmodel / h = 32,優(yōu)化器為Adam optimizer,學(xué)習(xí)率lr = 10-4,批大小batch_ size = 500,epoch = 30。
換道意圖預(yù)測性能分析
LSTM 模塊隱藏單元數(shù)設(shè)置
隱藏單元數(shù)是 LSTM 模型中隱藏層的單元數(shù)或神經(jīng)元數(shù)。更多的隱藏單元通常意味著模型能夠?qū)W習(xí)更復(fù)雜的模式,但也可能導(dǎo)致過擬合,可以調(diào)整此參數(shù)平衡模型的復(fù)雜度和性能。通過記錄驗證集最后 5 個輪回(epoch) 的平均準確率、平均損失、訓(xùn)練時間來選擇 LSTM 模塊中合適的隱藏單元。如表 1 所示,當(dāng)隱藏單元數(shù)為16 時,模型驗證集的平均準確率最高,平均損失最小,訓(xùn)練時間隨著隱藏單元數(shù)的增多相應(yīng)變長。因此將 LSTM 隱藏單元數(shù)設(shè)置為16。
3.3.2 意圖預(yù)測結(jié)果分析
為了驗證本文模型的有效性,在HighD數(shù)據(jù)集上比較了所提模型與LSTM、CNN、多頭注意力在左換道、不換道、右換道3種機動下的預(yù)測準確率、召回率、F1分數(shù)。如表2所示,LLC為左換道,RLC為右換道、LK為不換道,所提模型幾乎在所有預(yù)測時域都優(yōu)于其他模型,且越靠近換道時刻,預(yù)測模型的效果越好。單獨針對平均預(yù)測準確率進行分析,在R = 2、3 s時,與LSTM相比,本文模型分別提升了1.93%、4.01%。雖然在換道前1 s時,本文模型平均預(yù)測精度略低于LSTM,這可能是越靠近換道點,車輛的橫向位置信息變化越接近真實變道模式,各模型的預(yù)測效果差異不大。而在換道前3 s,車輛還未做出明顯橫向移動,本文模型能夠充分發(fā)揮其時空信息的提取能力。與CNN相比,分別提升了2.09%、 9.5%、9.51%。越遠離換道點,模型性能提升越大,說明越遠離換道點,模型不僅僅依賴橫向相對位置信息等單一特征,而是特征之間的時空交互模式。因此,相比傳統(tǒng)的CNN,本文更加能夠提取隱藏在復(fù)雜交通環(huán)境下的車輛交互模式。與多頭注意力相比分別提升了4.67%、 5.79%、5.16%,模型的性能提升相比其他模型更大。這說明,單獨采用注意力機制難以捕獲車輛換道過程中的長期時間依賴,需要充分發(fā)揮LSTM模型在時間序列領(lǐng)域信息提取的能力。
換道意圖預(yù)測的可解釋性
在本研究中,駕駛員的反應(yīng)時間為 0.3~1.35 s,制動系統(tǒng)的動作時間約為 0.15 s,兩者最高 1.4 s,為了詳盡分析不同時間步下的特征對換道預(yù)測模型的影響,并且為其預(yù)留一定的反應(yīng)時間,將目標車輛換道前 2 s時刻作為自動駕駛車輛的換道預(yù)測點,針對左右換道類型(不換道通常不會影響自動駕駛汽車的行車安全),提取其換道前 2 s 的行駛數(shù)據(jù),根據(jù)上述數(shù)據(jù)集劃分比例對模型進行訓(xùn)練測試,并基于 SHAP 對其當(dāng)前時刻及其過去時刻的特征進行可解釋性分析。在本研究中SHAP 值可以在特定時間步提供對換道預(yù)測分類模型的理解。基于 SHAP 的可解釋性分析分為全局解釋和局部解釋,針對全局解釋提供 SHAP 匯總圖和散點圖,針對局部解釋可以使用力圖進行描述。
全局解釋
使用SHAP 匯總圖和散點圖可以在全局角度下提供所有特征SHAP 值的分布以及相應(yīng)趨勢。SHAP 散點圖 y 軸上的位置決定了特征的降序排序 ( 重要性從高到低),每個特征對模型的正負影響方向由 x 軸SHAP值決定;特征的 SAHP 值為正則代表其與目標輸出正相關(guān),反之亦然,圖中紅色表示特征值較高,藍色表示特征值較低,鋸齒狀的重疊點說明了分布的意義。圖3 代表左換道預(yù)測點時刻、預(yù)測點前 1 s 時刻、預(yù)測點前 2 s 時刻各特征的全局解釋。
由圖 3a 可知:在預(yù)測點時刻,也就是目標車輛換道前 2 s 時刻,目標車輛與其周圍車輛的絕對距離占據(jù)了主要影響,而其相對速度占據(jù)了次要影響,而目標車輛的相對位置幾乎沒有影響,由此可知,目標車輛在換道前 2 s 時刻,駕駛員已經(jīng)將周圍環(huán)境信息納入執(zhí)行換道的關(guān)鍵考量因素,同時,由于在高速公路上,駕駛員對距離的感知更加敏感,難以對周圍車輛的速度做出較為精確的判斷,且在換道前 2 s 時刻,目標車輛自身還沒有向其目標車道發(fā)生明顯的位置偏移,因此在早期的換道預(yù)測中,考慮目標車輛的周圍環(huán)境信息是非常重要的。
由圖 3b 可知:當(dāng)模型預(yù)測目標車輛向左進行換道時,目標車輛與其左后方車輛的絕對距離影響是最大的,其值越大,正面影響越大,反之亦然。其次是目標車輛與其右前方車輛的絕對距離,其值越大,對其左換道的負面影響越大,這是因為目標車輛在考慮換道時會充分考慮其相鄰車道上車輛的狀態(tài)信息,因此在產(chǎn)生左換道意圖之前,也會相應(yīng)考慮右側(cè)車道上的車流情況,其越符合換道條件,則會對模型的左換道預(yù)測產(chǎn)生負面影響。
圖 3c、圖 3d,其與預(yù)測點時刻的分布大體一致。圖 3e、圖 3f,與預(yù)測點時刻不同,可見,目標車輛與其右前方車輛的絕對距離已經(jīng)占據(jù)了主要因素,其次是與其左前方車輛的絕對距離,這說明,越遠離換道點,駕駛員的換道意圖對于周圍環(huán)境信息這一考量因素會越復(fù)雜。
圖4代表右換道預(yù)測點時刻、預(yù)測點前1 s時刻、預(yù)測點前2 s時刻各特征的全局解釋,其分布意義與圖3類似。從圖3與圖4中的匯總圖可以看出,對比其他時刻,預(yù)測點前1 s時刻的特征的平均影響程度是最大的,這說明,在預(yù)測點前1 s時刻,模型對其信息的提取更加充分,因此,也更能夠反映目標車輛在換道過程中更加真實的綜合考慮因素。因此,在下一節(jié)的局部解釋中,將預(yù)測點前1 s時刻的特征作為重點解釋對象進行分析。
3.4.2" 局部解釋
局部解釋是給定樣本的預(yù)測值與其基值的差值,如式(19)所示,具體表現(xiàn)為各個特征在特定時間步對模型預(yù)測輸出的影響程度。在本節(jié)中,將預(yù)測點前1 s時刻的特征作為局部解釋對象進行深入分析。如圖5所示的換道樣本,模型預(yù)測其左換道的概率為0.80,右換道的概率為0.20,因此最終做出的預(yù)測為左換道,其中D = 61 m與D = 32 m分別是貢獻為0.154、-0.061的最關(guān)鍵特征,根據(jù)直覺來說,當(dāng)車輛所在與前車距離較近時會考慮變道,變道時首先觀察目標車道周圍環(huán)境信息,此時Df = 25 m,為了提高行車效率,決定執(zhí)行換道, Dlb = 61 m,左后方安全距離較大,同時Drb = 32 m,表明右后方安全距離也滿足向右換道的條件,但是由于Dlb帶來的安全距離是最大的,故它是模型預(yù)測其向左換道正面貢獻最大的特征,Drb對模型的最終預(yù)測產(chǎn)生了干擾,因此它對左換道的預(yù)測輸出產(chǎn)生最大的負面貢獻,這些結(jié)果均與人類駕駛員的直覺一致。
圖 5 中的人機界面設(shè)計可以幫助人類用戶及時了解自動駕駛預(yù)測模型如何進行推理,將極大地增強人們對自動駕駛系統(tǒng)的信任。另一方面,局部解釋可以幫助用戶分析錯誤預(yù)測的樣本,將模型錯誤預(yù)測歸因于模型缺陷或者樣本稀疏,這也是可解釋性分析的重要部分" 。如圖 6a 所示的左換道樣本 ,模型將左換道預(yù)測成了右換道,可以看出 D = 209 m,D = 34 m,D = 0m,Dlb = 0 m, 且 Dlf 與 Drf 同時產(chǎn)生了較大的正面貢獻,這代表目標車輛左側(cè)車道較為通暢,右側(cè)車道也同時滿足換道條件,按照直覺來說向左換道更能夠提升行駛效率,但是模型將其預(yù)測成了右換道,結(jié)果說明了該樣本的稀疏性,即樣本數(shù)量不足,導(dǎo)致模型面對該類樣本的泛化能力不足,將此類錯誤預(yù)測歸因于樣本稀疏,如表 4 所示。
根據(jù)圖6b所示的右換道樣本,模型將右換道預(yù)測成了左換道,可以看出Dlf = 6 m,Dlb = 156 m,Drb = 23 m, Drf = 127 m,Dlf 被認為有較大的正面貢獻,事實上目標車輛很難會左換道,因為目標車輛與左前方車輛的絕對距離很近,很容易造成追尾,且目標車輛右前方的交通環(huán)境更加順暢,但是模型卻將其預(yù)測成左換道,這種不一致可能是深度學(xué)習(xí)模型的局限性所在,將其定義為模型缺陷,如表4所示。
總之,上述 2 種錯誤預(yù)測的歸因?qū)橛脩艉脱芯咳藛T優(yōu)化模型提供指導(dǎo)。
4"" 結(jié)""" 論
本文提出了一種基于LSTM-多頭混合注意力的可解釋車輛換道意圖預(yù)測方法,并且選取最能代表車輛換道意圖的關(guān)鍵特征作為模型輸入,即目標車輛的橫向相對位置信息和周圍車輛交互信息。該模型相比其他模型能夠充分提取目標車輛軌跡信息與其周圍車輛交互特征的深層交互關(guān)系,在HighD數(shù)據(jù)上進行實驗表明,該模型相比其他模型分別高出4.03%、9.51%、5.16%。
針對深度學(xué)習(xí)可解釋性差、推理機制模糊等特點,提出了一種基于 SHAP 的可解釋性框架,對換道預(yù)測模型利用全局解釋、局部解釋進行了全面的可解釋性分析,可視化局部解釋結(jié)果可以考慮作為人機交互的途徑之一,將大大提高人類對自動駕駛系統(tǒng)的信任。此外,針對單個樣本的局部解釋結(jié)果有助于研究人員洞察預(yù)測模塊的關(guān)鍵依據(jù),為換道預(yù)測模型的診斷、優(yōu)化等提供思路。
可解釋的人工智能能夠真正幫助用戶理解換道預(yù)測模型的推理過程,未來的工作可以基于解釋結(jié)果考慮對現(xiàn)有特征工程和模型結(jié)構(gòu)進行優(yōu)化,在保證解釋性的同時,進一步提高模型的預(yù)測精度。