陳漸偉,于傳強,劉志浩,唐圣金,張志浩,舒洪斌
(火箭軍工程大學,陜西 西安 710025)
多軸特種車輛通常行駛在惡劣的工況下,加上車輛自身結構復雜,因此多軸特種車輛的模型具有較強的非線性特征,難以準確建模。然而,準確的車輛動力學模型在車輛控制、狀態(tài)估計以及決策規(guī)劃中都具有極其重要的意義[1-4]。面向車輛動力學建模是一個將車輛的動力學表現(xiàn)抽象為數(shù)學方程的過程。按照認知車輛動力學角度的不同,模型可以劃分為物理模型和數(shù)據(jù)模型。
大多數(shù)車輛建模是基于第一性原理的物理建模方法。車輛動力學的特征行為被統(tǒng)一建立在牛頓力學體系中,模型的高保真度依賴動力學方程以及物理參數(shù)的準確程度。然而,完整的車輛動力學系統(tǒng)是一個復雜的強非線性系統(tǒng)。例如在對車輛輪胎建模時,模型的準確性更加依賴經驗模型中的實驗參數(shù),這一過程需要專有的實驗平臺在特定的實驗工況下進行測試[5-8]。因此,在對車輛進行物理建模時,研究人員想獲取關于車輛完備的參數(shù)非常困難且成本高昂。基于物理模型的車輛動力學建模不得不根據(jù)應用需求和已知模型參數(shù)的限制,對車輛動力學模型做簡化處理[9-10],進行不同程度的線性化假設,使得物理模型難以準確反饋出真實的車輛動力學。
近年來深度學習發(fā)展迅速,神經網絡通過離線訓練,可以從數(shù)據(jù)中挖掘潛在的自然規(guī)律[11-13]。車輛在行駛過程中,車載傳感器能夠提供豐富的車輛狀態(tài)信息,為建立車輛動力學神經網絡模型提供了可學習的數(shù)據(jù)集,因此一些學者開始采用神經網絡對車輛動力學建模。
Pan 等[14]采用神經網絡建立車輛縱向動力學模型,網絡輸入為車輛縱向速度和前輪扭矩,輸出為車輛剎車距離。通過與Carsim 仿真測試的結果相比較,仿真結果顯示網絡模型能夠準確預測車輛縱向速度和行駛距離,模型能夠應用于車輛實時仿真和控制。DA LIO 等[15]提出一種結構化網絡模型對車輛縱向動力學進行了建模。網絡輸入為縱向速度、質心高度、油門踏板和擋位,依據(jù)車輛縱向力的組成結構對輸入信息進行分類,構建出結構化網絡,仿真結果顯示采用結構化網絡模型具有更好的泛化性,提高了數(shù)據(jù)建模的保真度。Rutherford 等[16]采用神經網絡建立車輛動力學模型,并詳細分析了網絡初始化權值與網絡大小對網絡模型泛化能力的影響,研究發(fā)現(xiàn)網絡權重初始化影響網絡訓練的最終結果,隨著網絡尺度增大,有助于提高網絡收斂水平。Cao 等[17]構建了一種分層網絡用于建立車輛橫向動力學模型。網絡模型分為兩個網絡,第1 層用于預測車輛橫擺角速度,第2 層結合第1 層的結果預測質心側偏角。然而,由于網絡整體呈開環(huán)結構,模型需要輸入轉向指令、縱向加速度、速度和歷史橫擺角速度等。對于網絡預測的狀態(tài)信息,同時也要求實測過程可以采集到,否則網絡無法被驅動。
為減少網絡的輸入數(shù)據(jù)需求,使網絡模型能夠遞歸更新,Hermansdorffer 等[18]在測試過程中利用網絡的輸出不斷更新輸入,使得網絡模型可以像物理模型一樣驅動。雖然網絡模型在測試過程中實現(xiàn)了閉環(huán)結構,但是在訓練網絡時仍然是基于開環(huán)的網絡結構,網絡的輸入全部采用采集的數(shù)據(jù)?;陂_環(huán)結構訓練得到的網絡參數(shù),雖然能夠部署在網絡模塊中并用于閉環(huán)測試,但是由于網絡結構和輸入數(shù)據(jù)的來源發(fā)生了變化,模型在測試過程中的保真度較低。
為提高車輛動力學數(shù)據(jù)建模的保真度,本文針對某型特種五軸車輛的橫向動力學行為,基于閉環(huán)結構的網絡模型進行數(shù)據(jù)建模;構建了一種在閉環(huán)條件下的網絡訓練方法,提高了閉環(huán)網絡模型的預測準確度。
單軌模型是一種常用的簡化車輛動力學模型,如圖1 所示。圖1 中,F(xiàn)i為第i 軸(i=1~5) 的輪胎橫向力,vx、vy分別為車輛的縱向速度和橫向速度,γ 為車輛橫擺角速度,Li為軸心至質心的縱向距離,δi為第i 軸的輪胎轉向角。
圖1 單軌模型Fig.1 Single track model
在對車輛進行受力分析后,建立車輛橫向動力學模型如式(1) 和式(2) 所示:
式中:m 為整車質量;Iz為轉動慣量。
對輪胎模型進行線性化處理,在側偏角較小的時候,輪胎模型與側偏角近似線性的關系如式(3)所示:
式中:Ci為第i 軸的輪胎側向剛度。在計算各個輪胎的轉向角時,通常認為車輛轉彎時各個輪胎轉向角符合阿克曼轉向關系,各個車輪僅有一個轉向中心,當轉彎角度較小時,可對計算過程做線性化處理。計算結果如式(6)~式(10) 所示。車輛第三車軸通過機械鎖死,三軸車輪轉向角始終為0°,其余輪胎均可自由轉向,方向盤轉角δ 與一軸車輪轉角的傳動比為η。車輛行駛過程中各個車輪的轉向角為
因此單軌模型中,車輪各個轉向角均可以用方向盤轉角δ 計算。將式(3)~式(10) 代入式(1) 和式(2) 中,進行歐拉前向展開,可得離散化的橫向動力學模型,結構如式(11) 所示(詳細參數(shù)見附錄A) :
式中:X 為車輛狀態(tài)變量;A、B 分別為狀態(tài)方程的參數(shù)矩陣;U 為控制變量。
通過式(11) 可以發(fā)現(xiàn)物理模型是遞歸模型,遞歸過程如圖2 所示,通過初始化模型預測變量,向模型輸入控制信號和必要的系統(tǒng)變量,模型能夠不斷更新預測車輛的狀態(tài)變量。在橫向動力學模型中,方向盤轉角δ 和縱向速度vx是輸入到模型的控制信號和系統(tǒng)狀態(tài)變量,橫向速度vy和橫擺角速度γ是模型可預測的狀態(tài)變量。
圖2 物理模型更新過程Fig.2 Update process of the physical model
為實現(xiàn)物理模型中遞歸更新的功能,搭建了圖3 所示閉環(huán)結構網絡模型,以映射車輛的橫向動力學行為。在閉環(huán)網絡模型中,模型結構首尾相連,網絡輸出的狀態(tài)信息分別是橫向速度vy和橫擺角速度γ,同時也作為網絡的輸入信息與車輛方向盤轉角δ 和縱向速度vx信息一起組成新的輸入序列x,以驅動網絡模塊對下一時刻的車輛狀態(tài)信息進行預測。圖3 中,h0表示GRU 模塊的初始狀態(tài),通常設置為一組為0 的序列。
圖3 閉環(huán)網絡模型Fig.3 Closed-loop network model
為便于對比分析訓練方法對閉環(huán)網絡模型準確性的影響,參照文獻[18]設置閉環(huán)網絡模塊由一個遞歸網絡GRU 和一個前饋網絡FNN 組成。網絡模塊的主要參數(shù)如表1 和表2 所示。
表1 GRU 模塊參數(shù)Table 1 GRU module parameters
表2 FNN 模塊參數(shù)Table 2 FNN module parameters
數(shù)據(jù)建模依賴于大數(shù)據(jù)集,然而實驗獲取數(shù)據(jù)的成本較為高昂,因此通過Trucksim 搭建目標車輛的仿真模型以生成數(shù)據(jù)集。Trucksim 是一種參數(shù)化的車輛建模軟件,通過導入輪胎模型等關鍵實驗數(shù)據(jù),實現(xiàn)精細化的車輛建模。為測試仿真模型的準確性,采用一段實車轉彎工況進行驗證,實驗平臺如圖4 所示。方向盤轉角傳感器采用UX-2D 型號轉向盤轉動量轉矩檢測儀;Speedbox-mini 用于采集車輛行駛過程縱向車速、縱向加速度、橫向加速度等信息;GPS、INS 用來測量車輛姿態(tài)角和角速度等信息。傳感器信號通過CAN 總線輸出至數(shù)據(jù)采集系統(tǒng),并使用Race Technology 和DEWEsoft-X3 對實驗數(shù)據(jù)進行后處理。
圖4 實驗平臺Fig.4 Experimental platform
實驗路徑如圖5 所示,車輛行駛速度為20~40 km/h 之間變化。在可采集的狀態(tài)信息中,選擇側向加速度和橫擺角速度作為驗證Trucksim 模型準確性的指標。驗證方法為將圖6 和圖7 所示的車輛縱向速度信息和方向盤轉角信息輸入Trucksim中。將側向加速度、橫擺角速度仿真結果與實驗數(shù)據(jù)進行比較,對比結果如圖8 和圖9 所示,可見實驗數(shù)據(jù)與仿真數(shù)據(jù)基本吻合。
圖5 實驗路徑Fig.5 Experimental path
圖6 實驗縱向速度Fig.6 Experimental longitudinal velocity
圖7 實驗方向盤轉角Fig.7 The experimental steering wheel angle
圖8 側向加速度驗證Fig.8 Lateral acceleration verification
對圖8 和圖9 的對比結果做進一步分析。實驗測試數(shù)據(jù)與Trucksim 模型輸出數(shù)據(jù)誤差對比結果如表3 所示,側向加速度均方根誤差為0.002 3,最大誤差為0.073 5 g。橫擺角速度的均方根誤差為0.035 9,最大誤差為0.360 6 °/s。由此可見,仿真數(shù)據(jù)與實驗數(shù)據(jù)基本一致,驗證了Trucksim 中搭建的仿真模型在反映車輛橫向動力學特征時具有較好的保真度,仿真模型的主要物理參數(shù)如表4 所示。
表3 Trucksim 模型誤差Table 3 Trucksim model error
表4 Trucksim 仿真車輛參數(shù)Table 4 Trucksim simulated vehicle parameters
圖9 橫擺角速度驗證Fig.9 Yaw rate verification
訓練集被用于離線訓練網絡模型,網絡模型的泛化能力和模型準確性與數(shù)據(jù)集密切相關。在制作數(shù)據(jù)集時,設置了一段隨機的行駛路線,如圖10 所示。車輛初始位置為圖10 中黑色原點位置,沿曲線伸展方向前進,車輛縱向速度在30~40 km/h 間變化,縱向速度曲線如圖11 所示。將數(shù)據(jù)集拆分為兩部分,其中藍色路徑用于制作訓練集,紅色部分用于制作測試集。數(shù)據(jù)信息包含車輛縱向速度、方向盤轉角、橫擺角速度以及車輛橫向速度,采樣頻率設置為100 Hz。
圖10 數(shù)據(jù)集行駛路線Fig.10 Driving path in dataset
圖11 數(shù)據(jù)集行駛速度Fig.11 Longitudinal velocity in Dataset
在深度學習中對訓練數(shù)據(jù)進行歸一化處理,可以提高訓練的收斂速度和模型精度,使網絡在訓練過程中避免梯度爆炸,同時有利于確保每個輸入信息對于網絡最終輸出結果的影響是相等的[19]。常用的歸一化方法有Max-Min 歸一化等。為減少訓練集與測試集中最大值、最小值差異帶來的影響,在對數(shù)據(jù)預處理時采用Standard 歸一化。針對網絡的每一類輸入數(shù)據(jù),分別計算其訓練集中的樣本均值μ和樣本標準差S,再依據(jù)式(12) 進行轉換。由于網絡在訓練過程中對數(shù)據(jù)進行了歸一化處理,在與仿真數(shù)據(jù)對比時,網絡輸出的數(shù)據(jù)需要再經過式(13)進行逆歸一化,以映射出實際的狀態(tài)信息。
損失函數(shù)是度量網絡模型泛化能力的標準。為避免網絡模型在訓練過程中出現(xiàn)過擬合導致模型泛化能力降低的現(xiàn)象,在損失函數(shù)中增加網絡權重正則化函數(shù)是一種常用的避免過擬合技術。在訓練網絡時,采用均方誤差作為度量網絡輸出與實際標簽之間差異的損失函數(shù),并添加L2 正則化函數(shù)以限制權重保持在小數(shù)值范圍,通過調節(jié)超參數(shù)λ 的大小可以改變正則化項對網絡的影響,使得網絡具有更好的泛化能力[20],整個網絡的損失函數(shù)如式(14)所示:
式中:J 表示網絡損失函數(shù);m 為單次輸入網絡中的樣本數(shù)據(jù)個數(shù);為網絡模型的輸出;Y為網絡輸出的標簽值;λ 為正則化項的懲罰系數(shù)為0.001;W 表示網絡權重。
在網絡反向傳播過程,采用RMSprop 自適應優(yōu)化器用于計算更新模型參數(shù),參數(shù)更新流程如圖12[21]所示。首先初對參數(shù)進行初始化,如全局學習率ε、衰減率ρ 和小常數(shù)ξ,其中小常數(shù)ξ 的作用是在計算Δθn時,避免累計平方梯度為0 導致參數(shù)更新過程發(fā)散。RMSprop 作為一種自適應優(yōu)化器,在計算梯度時采用超參數(shù)衰減率ρ 以弱化累計梯度的影響,使得參數(shù)更新過程時不因為循環(huán)次數(shù)的增大而減小,通過設置合理的超參數(shù)ρ 可以避免網絡訓練過程中出現(xiàn)梯度消失的情況。
圖12 RMSprop 優(yōu)化器更新策略Fig.12 RMSprop optimizer update strategy
隨著訓練循環(huán)次數(shù)的增加,不斷縮減全局學習率可以使得網絡達到更好的訓練效果。因此在RMSprop 的基礎上,對于全局學習率采用動態(tài)調整的策略,網絡每訓練100 個循環(huán)全局學習率縮減為原來0.6 倍,全局學習率動態(tài)更新的偽代碼如圖13 所示。
對照組患者采用傳統(tǒng)的護理干預,主要為患者入院后,協(xié)助其進行常規(guī)檢查,并對臨床治療方式進行講解,同時對病情進行觀察。研究組患者采用以人為本的護理理念進行干預,主要包括改善護理理念、打造人性化護理環(huán)境、加大臨床服務意識、人性化心理干預等。
圖13 全局學習率動態(tài)更新策略Fig.13 Dynamic update strategy of global learning rate
通常網絡訓練流程以及網絡模型的結構呈開環(huán)結構,網絡輸入與輸出無閉環(huán)連接,輸入數(shù)據(jù)均來自于采集的樣本數(shù)據(jù)。訓練過程如圖14 藍色部分所示,此時網絡模型呈開環(huán)結構。
圖14 閉環(huán)訓練Fig.14 Training in closed structure
為減少數(shù)據(jù)建模過程中模型對于輸入數(shù)據(jù)的需求,使數(shù)據(jù)模型能夠像物理模型一樣驅動,需要建立閉環(huán)結構的網絡模型,以實現(xiàn)數(shù)據(jù)模型遞歸更新的能力。然而,如果仍然按照開環(huán)的方式訓練模型參數(shù),就必須破壞網絡結構,使得網絡呈開環(huán)條件下進行訓練。
為構建適應于閉環(huán)網絡的訓練方法,在網絡的輸入過程中不再提供狀態(tài)變量橫向速度和橫擺角速度的數(shù)據(jù)信息,而是在訓練網絡模型中引入中間狀態(tài)進行替代。在網絡迭代之前,對中間狀態(tài)變量橫向速度和橫擺角速度進行0 值初始化,聯(lián)合采集的縱向速度和方向盤轉角信息一起輸入至網絡中,數(shù)據(jù)標簽為采集的橫擺角速度和橫向速度。當開始訓練時,再依次經過前向傳播,損失函數(shù)計算和反向更新參數(shù),同時將網絡前向傳播預測的狀態(tài)信息用于更新中間狀態(tài)變量,再聯(lián)合數(shù)據(jù)集中的縱向速度和方向轉角信息作為新的輸入序列,用于下一時刻的預測。
與文獻[18]開環(huán)訓練方法相對比,兩組訓練方法下?lián)p失函數(shù)數(shù)值變化趨勢如圖15 所示。在500 次循環(huán)訓練后,兩組方法均能使得網絡收斂至平穩(wěn)水平。在開環(huán)訓練條件下,損失函數(shù)最終收斂至0.000 53。相比于閉環(huán)條件下,損失函數(shù)收斂至更低的水平。
圖15 損失函數(shù)變化對比Fig.15 Comparison of loss function changes
在模型泛化性對比分析中,對比對象分別選擇基于開環(huán)訓練方法得到的閉環(huán)網絡模型和無精確先驗信息下的線性化橫向模型,并以Trucksim 仿真數(shù)據(jù)作為標準參考值。
橫向速度的預測結果如圖16 所示,3 組模型預測結果的變化趨勢基本一致。通過輸出預測結果的絕對值誤差曲線,線性化橫向模型的誤差曲線顯著高于網絡模型,結果如圖17 所示。為進一步分析模型之間的相對誤差,對橫向速度的絕對值誤差曲線進行統(tǒng)計分析,分別計算標準差、最大值和平均值3 個統(tǒng)計量,結果如表5 所示,不同模型之間的相對誤差如圖18 所示。在3 組橫向速度的誤差統(tǒng)計分析中,線性化物理模型的誤差最大,誤差統(tǒng)計結果分別為0.035、0.233 km/h 和0.061 km/h。對比圖18中的統(tǒng)計量的變化趨勢,結果證明模型誤差按照線性化橫向模型、開環(huán)訓練模型和閉環(huán)訓練模型的順序遞減。其中,閉環(huán)訓練模型誤差的最大值為0.079 km/h,平均值為0.006 km/h,標準差為0.007,相比于開環(huán)訓練結果降低了58.40%、64.71%和41.67%。閉環(huán)訓練結果顯著提高了橫向速度預測的精度。
圖16 橫向速度預測結果對比Fig.16 Comparison of lateral velocity prediction results
圖17 橫向速度絕對值誤差Fig.17 Absolute value error of lateral velocity
表5 橫向速度誤差統(tǒng)計分析Table 5 Statistical analysis of lateral velocity
圖18 橫向速度相對誤差分析Fig.18 Relative error analysis of lateral velocity
圖19 橫擺角速度預測結果對比Fig.19 Comparison of lateral velocity prediction results
圖20 橫擺角速度絕對值誤差Fig.20 Absolute value error of lateral velocity
圖21 橫擺角速度誤差對比分析圖Fig.21 Relative error analysis of yaw rate
表6 橫擺角速度誤差統(tǒng)計分析Table 6 Statistical analysis of yaw rate error
通過對測試集中橫向速度和橫擺角速度的預測誤差進行分析可知:相對數(shù)據(jù)建模,線性化橫向模型保真度較低;對于閉環(huán)網絡模型,采用閉環(huán)訓練能夠使得網絡具有更高的保真度。盡管在網絡訓練階段,文獻[18]中的開環(huán)訓練方法能夠使得損失函數(shù)降至更低的水平,這是因為網絡在訓練過程呈開環(huán)的結構,網絡的輸入全部來自于采集的數(shù)據(jù),輸入信息貼近系統(tǒng)真實狀態(tài)。然而,在測試階段為實現(xiàn)網絡遞歸更新的能力,直接將網絡輸出數(shù)據(jù)用于下一時刻的輸入。由于模型結構發(fā)生了變化,網絡輸入數(shù)據(jù)的來源與訓練階段不一致。當預測的結果與實際狀態(tài)不一致時,再聯(lián)合采集的數(shù)據(jù)輸入至網絡就等同于向網絡輸入了錯誤的數(shù)據(jù),因此使得模型保真度降低。
閉環(huán)訓練方法,通過引入中間狀態(tài)變量,使得網絡在訓練時仍然呈閉環(huán)結構,網絡能夠在僅輸入縱向速度和方向盤轉角的條件下進行訓練。保證了閉環(huán)網絡模型在訓練階段和測試階段模型結構與輸入數(shù)據(jù)來源的一致性。因此,閉環(huán)訓練能夠使得閉環(huán)網絡具有更好的保真度。
本文在無先驗物理參數(shù)信息和車輛動力學函數(shù)關系條件下,針對某型五軸特種車輛的橫向動力學行為特性,基于數(shù)據(jù)建模的方法搭建了閉環(huán)結構的網絡模型以表征車輛橫向動力學,并設計了一種閉環(huán)的訓練方法。通過對比分析得出以下主要結論:
1) 在無精確物理參數(shù)信息和動力學函數(shù)關系條件下,簡化的物理模型難以準確預測車輛的運動狀態(tài),數(shù)據(jù)模型具有更好的保真度。在物理模型遞歸特性的啟發(fā)下,搭建的閉環(huán)網絡模型減少了輸入數(shù)據(jù)的需求,網絡輸入數(shù)據(jù)僅需縱向速度和方向盤轉角即可預測車輛橫向動力學運動狀態(tài),網絡模型可以像物理模型一樣驅動。
2) 在訓練閉環(huán)結構的網絡模型時,設計了一種閉環(huán)的訓練方法。網絡在訓練過程中不斷迭代更新中間狀態(tài)變量,使得模型在訓練過程時,網絡的輸入信息僅包含縱向速度和方向盤轉角,模型始終保持閉環(huán)的結構。相比于開環(huán)訓練的方法,閉環(huán)訓練有效提高了網絡模型的精度。在相同的網絡模塊下,橫向速度和橫擺角速度的預測誤差最大值降低了58.40% 和49.48%,平均值降低了64.71%和61.11%,標準差降低了41.67%和43.83%。
3) 相比物理建模,閉環(huán)網絡模型無需額外的輸入數(shù)據(jù),模型只需利用車輛狀態(tài)信息即可訓練出高保真度的動力學模型。因此,閉環(huán)結構模型可以較好地應用在自動駕駛車輛模擬測試、軌跡規(guī)劃和控制領域。
附錄
A 離散化橫向動力學模型
五軸特種車輛的離散橫向動力學模型如式(A-1) 至式(A-5) 所示:
式中:vy(k) 和γ(k) 為k 時刻動力模型預測的橫向速度和橫擺角速度;vx(k) 為k 時刻采集的車輛縱向速度;δ(k) 為k 時刻控制信號方向盤轉角;Ci,lat表示第i 軸輪胎的側偏剛度;Li表示第i 軸到質心的距離;m 表示整車質量;Iz表示轉動慣量;η 表示方向盤轉角與一軸輪胎轉向角的傳動比;T 表示離散時間間隔。模型參數(shù)如表A-1 所示。