姜森浩,孫鵬飛,金 波,張佳輝
(西南交通大學電氣工程學院,成都 611756)
國家鐵路局印發(fā)的“十四五”鐵路科技創(chuàng)新規(guī)劃指出,我國需進一步強化先進載運裝備技術(shù)研發(fā),推動重載列車成熟運用,實現(xiàn)大宗貨物重載化、快捷貨運高速化。重載列車編組長、行車密度高、牽引質(zhì)量大,且貨運線路具備跨越路程長,山區(qū)多的線路特征,起伏的坡道上會形成復雜的線-車耦合關(guān)系,增加了司機人工駕駛的操縱難度與風險。列車輔助駕駛技術(shù)(drive advisory system,DAS)會幫助指導司機行車,實現(xiàn)安全、節(jié)能、正時和平穩(wěn)的運行,輔助駕駛的核心技術(shù)之一即是列車的速度曲線規(guī)劃。二次規(guī)劃模型是通過重載列車模型分析的一種代表性的速度曲線規(guī)劃方法,其優(yōu)點是解算速度快,求解質(zhì)量高,但二次最高項的限制使得模型難以進一步精細化。二次規(guī)劃的目標函數(shù)是一個基于節(jié)能、正時和平穩(wěn)的線性加權(quán)函數(shù),權(quán)重的不合理分配會導致列車中途停車,達不到多目標優(yōu)化的目的。文獻[5]提出了一種動態(tài)分配的權(quán)重分配算法,但這種方法適用于線路環(huán)境平緩的高鐵或路程站間距短小的地鐵,對于重載列車這類復雜模型的多目標優(yōu)化,卻缺乏相應(yīng)的權(quán)重對多目標量化影響的具體研究。
數(shù)據(jù)驅(qū)動方法從整體上可分為兩種,一種是基于數(shù)理統(tǒng)計,如回歸、擬合模型、貝葉斯模型等;第二種則基于機器學習,如神經(jīng)網(wǎng)絡(luò)、支持向量機等。數(shù)據(jù)驅(qū)動更關(guān)注于輸入輸出的關(guān)系,中間的建模過程趨于統(tǒng)一,如神經(jīng)網(wǎng)路結(jié)構(gòu)、多元線性回歸等模型內(nèi)部結(jié)構(gòu)和參數(shù)設(shè)計一致,但可解決不同領(lǐng)域的問題。列車速度曲線建模的復雜度隨考量車輛因素的增多而升高,因此數(shù)據(jù)驅(qū)動方式在速度曲線規(guī)劃領(lǐng)域有較多的應(yīng)用。文獻[8]以神經(jīng)網(wǎng)絡(luò)進行速度曲線建模,但模型缺乏靈活性,僅適用于單車特例。文獻[9]搭建了以降低車鉤力和能耗的Q學習網(wǎng)絡(luò)(DSQ-network),實現(xiàn)了穩(wěn)定的收斂速度。為了在多重干擾影響下依舊保持動車組的舒適性和節(jié)能優(yōu)化,文獻[10]提出了一種將專家系統(tǒng)和強化學習融合的規(guī)劃列車運行方法。既有研究已經(jīng)證實機器學習方式能解決列車速度曲線規(guī)劃問題,但面對高復雜度的重載鐵路,數(shù)據(jù)驅(qū)動方式依然有優(yōu)秀樣本不足、學習特征不明顯的弱點。因此以成熟的二次規(guī)劃模型訓練數(shù)據(jù)驅(qū)動模型成為一種有效的解決方案。
綜上,本文旨在以數(shù)據(jù)驅(qū)動的方式解決速度曲線規(guī)劃問題。首先建立基于二次規(guī)劃的重載列車速度曲線多目標優(yōu)化模型,同時提出與多目標優(yōu)化相匹配的權(quán)重回歸解算方法,從提高解算效率和穩(wěn)定性出發(fā),以神經(jīng)網(wǎng)絡(luò)的方式對速度曲線進行優(yōu)化,以達到重載列車節(jié)能、正時、平穩(wěn)運行的目的。
列車運動模型在運行過程中受到牽引力、制動力、基本運行阻力和附加線路阻力的影響。制動力包括氣動制動和電制動。為了區(qū)分制動模式,這些獨立的制動力被單獨考慮。列車的動力學模型可用下式來描述。
其中,,是列車的速度、公里標位置和運行時間。是列車總質(zhì)量,是旋轉(zhuǎn)質(zhì)量系數(shù)。()為列車牽引力,()為列車電制動力,()為列車空氣制動力,這些力可視為由確定的函數(shù)。(,)是由列車速度和列車位置共同決定的列車運行阻力,其中變量的考量基于運行中一直固定作用的坡道、曲線等附加阻力,變量是以基本阻力為主,由與速度項一次相關(guān)的機械阻力和與速度項二次相關(guān)的空氣阻力構(gòu)成。在本文中(,)列車運行阻力由基本運行阻力,曲線附加阻力和坡道附加阻力組成,見下式。
重載列車動力學模型示意圖如圖1所示。重載列車多采用大功率交流異步電機作為傳動動力,因此其受到啟動電機最大電流、電機最大功率和最深磁場削弱等限制。電機的轉(zhuǎn)矩通過傳動裝置最終傳至機車輪對,因此列車的牽引特性也受到動輪和鋼軌的粘著特性影響。機車設(shè)計有構(gòu)造速度的相關(guān)限制,這取決于機車中各個部件的最高限速,如以齒輪箱和電機匹配的最高轉(zhuǎn)速等因素。由于交流電機的可逆性,電制動力也符合機車電牽引力的相關(guān)特性的規(guī)律。列車牽引特性曲線如圖2所示。
圖1 重載列車動力學模型示意圖
圖2 列車牽引特性曲線
綜上所述,重載電力列車的牽引特性表現(xiàn)出明顯的隨速度非線性變化的特征。
可以看出,列車的動力學模型是由連續(xù)的、非線性化的微分方程組成,其多目標函數(shù)存在微分和倒數(shù)形式。復雜形式的方程不利于問題求解和工程應(yīng)用,因此需要對初始模型進行離散化和近似化處理。本文以運行里程作為自變量對各變量進行離散化,離散步長設(shè)置為Δ,根據(jù)運營里程將變量分為段。鑒于后文中速度變量作為一次項無法實現(xiàn)原問題的線性化,因此動能作為速度的替代變量。列車速度曲線模型示意圖如圖3所示。
圖3 貨運列車速度曲線模型示意圖
同理,控制變量牽引力、電制動力和空氣制動力可以按照離散步長疊加成一個(×1)矩陣。
基于重載列車節(jié)能、正時和平穩(wěn)的優(yōu)化目標,列車運行的多目標優(yōu)化函數(shù)可描述如下:
其中、和分別為列車能耗、正時性、平穩(wěn)性對應(yīng)的非負權(quán)重值。
本文采用二次規(guī)劃(quadratic programming,QP)方式對上式進行數(shù)值計算,標準二次規(guī)劃如下式。
事實上,司機正常行駛都可從起始點到終點形成連續(xù)的速度曲線,這些速度曲線對應(yīng)的解雖然均是非優(yōu)于QP模型的最優(yōu)解,但都符合約束條件,因此該算法具有較高的穩(wěn)定性,可較好地用于工程實踐。
為進一步探究實際線路中、、權(quán)重對各目標量的具體影響,本節(jié)基于權(quán)重建立了速度曲線多目標的回歸模型。首先,設(shè)置權(quán)重值的意義在于優(yōu)化問題中平衡多個目標量的標量數(shù)值。例如權(quán)重集合[6,1,2]和權(quán)重集合[3,0.5,1]得出的軌跡曲線是完全相同的。重載列車速度曲線需優(yōu)化三個性能指標,但本質(zhì)上僅有兩個自由度,所以研究權(quán)重更有意義。本文采納的方式是以為基準,為了避免變量冗余,設(shè)置為固定值1,、即可視為完全獨立的權(quán)重變量。QP模型建立后,可將正時運行時間、能耗和列車平穩(wěn)性看作和的函數(shù)。、、分別對應(yīng)運行能耗,運行時間,牽引力變化量Δ,三者的統(tǒng)計分布如圖4所示。
圖4表示了獨立權(quán)重因子、為變量時,對各指標的影響分布圖。從圖4a和圖4b中可以明顯看出,節(jié)能和正時是一對矛盾的變量,其性能指標隨能耗權(quán)重和正時權(quán)重單調(diào)變化,這也驗證了已有的列車速度曲線優(yōu)化理論相關(guān)結(jié)論。從能耗指標來看,其指標分布基本處于線性分布。而列車正時性則完全不具備類似能耗的線性分布趨勢,因為時間的計算具備明顯的非線性因素,呈現(xiàn)“兩頭寬,中間緊”的分布態(tài)勢。當、的其中之一處于較高數(shù)量值時,另一權(quán)重因子在很大的區(qū)間范圍內(nèi)調(diào)整但運行時間變化不大。根據(jù)實際經(jīng)驗比對,人為傾向的曲線一般位于“中間緊”的區(qū)段,即速度時間變化較大的區(qū)間,因為這段區(qū)間不易出現(xiàn)停車的問題,且速度對線路有較好的適應(yīng)性。平穩(wěn)性權(quán)重在上文中設(shè)置為1,在,坐標系下,平穩(wěn)性指標本質(zhì)是處于分母上,在很大程度上受到坡道數(shù)據(jù)的影響,因此充滿了不規(guī)律性。當權(quán)重逐漸提高時,主要呈現(xiàn)出越接近原點平穩(wěn)性指標越好的特征,這也印證了平穩(wěn)性指標本質(zhì)位于分母的設(shè)計。整體來講,權(quán)重對平穩(wěn)性指標的影響呈現(xiàn)的規(guī)律具有不確定性因素。
圖4 統(tǒng)計分布
以上我們總結(jié)了權(quán)重對各指標的影響分布的相關(guān)規(guī)律,這些規(guī)律是我們通過權(quán)重策略因子調(diào)整行車方法的重要基礎(chǔ)和依托,是回歸模型搭建的理論依據(jù),對替代人工手動調(diào)試參數(shù)具有重要意義。
其中為樣本點的個數(shù),為誤差項,且滿足()=0,()=。兩側(cè)進行對數(shù)運算,可得到對能耗的回歸模型。
多元非線性回歸本質(zhì)上可等效成一般的線性回歸方式,能耗模型本質(zhì)上也是多元非線性回歸的一種特例。如下式,是基于自變量權(quán)重的函數(shù)。理論上,采納的回歸函數(shù)數(shù)量、形式越多,其預(yù)測結(jié)果越精準,但在樣本邊緣的采樣點會出現(xiàn)異常的震蕩偏差。因此一般采用方差膨脹因子來評估回歸方程式的共線性程度。
根據(jù)理想坡道的理論推導可知,運行時間的倒數(shù)平方和權(quán)重因子的比例形式成正比,因此回歸方程式采納如下形式。
經(jīng)實驗統(tǒng)計,采用上式的方差膨脹因子為6.87,符合低于10的統(tǒng)計標準。而如采用一般多項式的方式,一般非線性函數(shù)達到4個就會不再滿足共線性標準,且復相關(guān)系數(shù)遠低于上式。
支持向量回歸(support vector regression,SVR)是一種基于支持向量機(support vector machine,SVM)的回歸算法,它基于統(tǒng)計學習中結(jié)構(gòu)風險最小化原則,將經(jīng)驗風險和置信區(qū)間最小化,這種機器學習模型善于處理具有非線性特征的小樣本數(shù)據(jù)。對于低維樣本空間內(nèi)無法線性處理的問題,通過核函數(shù)將樣本數(shù)據(jù)特征映射到高維空間,并在高維空間內(nèi)建立最大間隔分類(回歸)超平面。同時引入了不敏感帶,以對邊界數(shù)據(jù)進行校正,見圖5。
圖5 線性回歸函數(shù)的不敏感帶
優(yōu)化問題可轉(zhuǎn)化為:
為懲罰系數(shù),本質(zhì)上是模型對誤差的懲罰度,起正則化的作用。如果不斷增大,會使得處于敏感帶上的樣本點減少,同時支持向量也會較多,模型會更為復雜,的范數(shù)又會限制模型的復雜度,防止過擬合現(xiàn)象的發(fā)生。
非線性特征映射與核函數(shù)相對應(yīng),它以隱式方式定義了一個從低維到高維的特征映射,并同時具備內(nèi)積相同,即(,)=()()的重要性質(zhì),因此可以不用無窮維特征空間的內(nèi)積。常用的核函數(shù)可以由線性、多項式核函數(shù)、Lapcian函數(shù)、徑向基函數(shù)(Gaussian核函數(shù))和sigmoid函數(shù)等構(gòu)成。最終能耗、正時和平穩(wěn)度基于數(shù)理統(tǒng)計的回歸結(jié)果見表1。
表1 回歸模型結(jié)果對比
人工神經(jīng)網(wǎng)絡(luò)由多個賦有權(quán)重和激勵函數(shù)的神經(jīng)元組成,且彼此間存在一定順序的堆疊和聯(lián)接,通過對大量含標簽的可靠數(shù)據(jù)進行訓練,它可以對數(shù)據(jù)輸入輸出關(guān)系進行學習,以實現(xiàn)對未知函數(shù)的擬合計算。對于沒有傳統(tǒng)規(guī)則和復雜建模的問題,神經(jīng)網(wǎng)絡(luò)可避免復雜的數(shù)學理論推導,具備其獨特的優(yōu)勢。神經(jīng)網(wǎng)絡(luò)僅關(guān)注輸入輸出關(guān)系,善于處理大量的樣本數(shù)據(jù),因此在速度曲線規(guī)劃算法領(lǐng)域具有一定的潛力和優(yōu)勢。
如圖6所示,神經(jīng)網(wǎng)絡(luò)一般由多層組成,通常多層前饋神經(jīng)網(wǎng)絡(luò)是最為基礎(chǔ)的結(jié)構(gòu)組成。網(wǎng)絡(luò)接收外部數(shù)據(jù)的層是輸入層,產(chǎn)生回歸或聚類結(jié)果的層是輸出層,它們之間是隱藏層,主要負責神經(jīng)網(wǎng)絡(luò)模型的計算,其層數(shù)通??梢愿鶕?jù)問題的復雜程度進行調(diào)整。各層之間由多個計算功能的神經(jīng)元組成,各層神經(jīng)元通過權(quán)重向量相互連接,神經(jīng)元接受外輸入后,經(jīng)激活函數(shù)向外部輸出結(jié)果。
圖6 人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
神經(jīng)網(wǎng)絡(luò)規(guī)劃器是本文速度曲線算法的最基本組成單位,其結(jié)構(gòu)組成如圖7所示,輸入-輸出結(jié)構(gòu)具有以下形式:
圖7 神經(jīng)網(wǎng)絡(luò)規(guī)劃器輸入輸出結(jié)構(gòu)組成
其中、為列車實時速度和加速度,、為權(quán)重決策因子,F為未來線路的列車阻力數(shù)組,為列車運行的限速數(shù)組,為列車的追蹤巡航速度數(shù)組。
首先,列車的實時信息模塊由列車實時運行速度和加速度構(gòu)成。列車實時運行速度是神經(jīng)網(wǎng)絡(luò)最為重要的行車參考,加速度的引入基于規(guī)劃器模型對平穩(wěn)性的考量,列車只有獲取當前的加速度,才可以判斷進行實時大制動、大牽引力轉(zhuǎn)換的適度。權(quán)重決策因子模塊決定了列車操縱策略傾向,對列車的正時指標有重要作用。車輛信息模塊的加入是為增強神經(jīng)網(wǎng)絡(luò)規(guī)劃器普適性,由于列車不同,其阻力特性、牽引計算特性也會變化,因此編組信息模塊使得神經(jīng)網(wǎng)絡(luò)模型學習并適應(yīng)不同類型的牽引機車、不同載重和車輛編組情況。未來線路信息是規(guī)劃列車行車的考量依據(jù),如果神經(jīng)網(wǎng)絡(luò)規(guī)劃器缺乏對未來線路的考量,實時輸出的決策變量將會缺乏前瞻性,在面對未來區(qū)段的長大坡道,甚至會出現(xiàn)列車速度觸及安全保護曲線等問題。
為了驗證本文所提控制算法的有效性,選取國內(nèi)1萬噸標準化重載機車編組,分別在虛擬和真實線路環(huán)境下進行仿真驗證,仿真參數(shù)見表2。
表2 重載列車仿真關(guān)鍵參數(shù)
本文2.2節(jié)建立了基于神經(jīng)網(wǎng)絡(luò)的速度軌跡規(guī)劃算法,這一算法的評價方式是計算QP輸出的控制量和神經(jīng)網(wǎng)絡(luò)規(guī)劃器輸出之間的均方誤差。為了驗證神經(jīng)網(wǎng)絡(luò)構(gòu)建的數(shù)學模型的有效性,本文設(shè)置了一段60 km的虛擬線路,區(qū)間內(nèi)包含兩段不同的限速和巡航速度區(qū)間。
圖8為神經(jīng)網(wǎng)絡(luò)規(guī)劃器輸入輸出結(jié)構(gòu)組成,從圖中可以看出,基于神經(jīng)網(wǎng)絡(luò)得到的列車控制量基本相同,控制量均方誤差為0.0013,列車運行速度在安全范圍以內(nèi),速度均方誤差為0.187 m/s,最大速度偏差1.7 m/s,這體現(xiàn)出神經(jīng)網(wǎng)絡(luò)規(guī)劃算法具備QP算法的速度曲線規(guī)劃能力,可實現(xiàn)安全、節(jié)能、較好速度追蹤性和平穩(wěn)性的駕駛目標。同時,為了進一步驗證神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)在實時計算方面的優(yōu)越性,本文設(shè)置了基于QP的速度曲線算法作為實驗控制組,使用Matlab中以內(nèi)點法為原理的Quadprog方法,實驗組基于神經(jīng)網(wǎng)絡(luò)算法建立在Pycharm平臺Python 3.6模型中建立,并采用Keras深度學習框架。計算實驗環(huán)境為2.6 GHz的Intel Core i5-9300H處理器、8 G RAM的計算機。各算法的計算時間見表3。
圖8 神經(jīng)網(wǎng)絡(luò)規(guī)劃器輸入輸出結(jié)構(gòu)組成
表3 算法效率結(jié)果對比
在離散步長較大的情況下,三種方法可以在很短的時間內(nèi)完成速度軌跡規(guī)劃。隨著維數(shù)的增加,基于內(nèi)點法的Quadprog計算時間呈現(xiàn)出單調(diào)上升的趨勢。對照組的速度曲線規(guī)劃時間基本上與需要計算的離散維度成正比。神經(jīng)網(wǎng)絡(luò)的線性結(jié)構(gòu)使算法更加穩(wěn)定可靠,整個實驗中沒有出現(xiàn)異常長時間的計算。
圖9顯示了人工駕駛和神經(jīng)網(wǎng)絡(luò)規(guī)劃的速度曲線對比,可以發(fā)現(xiàn)司機的駕駛經(jīng)驗與神經(jīng)網(wǎng)絡(luò)算法的部分區(qū)段保持一致,司機控制方法也與神經(jīng)網(wǎng)絡(luò)保持一致。例如,270 km處的制動,380 km處的牽引方式兩者具有相同的控制規(guī)律。但在345 km處,人工駕駛方式采納了牽引工況,對前方50 km時速限速卻缺乏考量;而神經(jīng)網(wǎng)絡(luò)規(guī)劃算法則一直維持惰行工況,僅在限速前進行制動。從能量消耗的角度來說,神經(jīng)網(wǎng)絡(luò)規(guī)劃算法減少了牽引走行距離,也因此避免了多余的制動,因此具備節(jié)能的特點。
圖9 人工駕駛運行數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)規(guī)劃算法對比
最后經(jīng)計算得出兩種方式的性能指標結(jié)果,如表4所示?;谏窠?jīng)網(wǎng)絡(luò)規(guī)劃算法的速度曲線與人工駕駛的駕駛速度曲線相比具有較小的波動性,在與人工駕駛接近的區(qū)間運行時間153.7 min情況下,神經(jīng)網(wǎng)絡(luò)規(guī)劃軌跡的能耗為2594.7 kW·h,遠低于人工駕駛的能耗3569.2 kW·h,節(jié)能率約27.3%,且牽引力變化量僅為人工駕駛的三分之一,更能符合列車平穩(wěn)駕駛的要求。
表4 人工駕駛神經(jīng)網(wǎng)絡(luò)與算法性能指標比較
以上幾節(jié)中,基于神經(jīng)網(wǎng)絡(luò)算法的速度曲線規(guī)劃掌握了QP速度曲線的駕駛策略,但其針對的是相同固定策略權(quán)重的軌跡曲線,缺乏相應(yīng)動態(tài)時間約束下的驗證。因此,本文的下一仿真實驗將重點關(guān)注列車重新規(guī)劃致使最優(yōu)權(quán)重因子改變的場景。
重載車運行過程中,由于列控系統(tǒng)的影響,列車可能在區(qū)間信號機前出現(xiàn)臨時停車、臨時限速的情況。如果前車發(fā)生故障,會對后車自動生成臨時限速,這是對速度曲線規(guī)劃的重大干擾,既有的列車速度曲線不再適用。圖10描繪了一個沒有特殊速度限制的路段(固定為每小時75 km)。實線速度剖面是計劃運行時間為11519.7 s的計劃軌跡。列車在0~6 km之間保持正常運行。在6 km處,列車收到遠方10~20 km(距前端4 km)處的臨時限速信號。首先,出于安全考慮,列車速度開始下降,控制變量開始下降,列車惰行一段路程。由于臨時限速,計劃運行時間產(chǎn)生偏差,優(yōu)化計算單元中的權(quán)重選擇模塊開始更新策略系數(shù)。根據(jù)上圖比較,更新策略的速度曲線減少了速度曲線的波動,通過更高的能耗彌補了時間差異。
圖10 臨時限速下的神經(jīng)網(wǎng)絡(luò)規(guī)劃算法結(jié)果(速度-位置)
從速度-時間圖(見圖11)中可明顯推斷出臨時限速造成的時間偏差超過5 min(311.2 s)。列車運行在370 s時接收限速信號,實線曲線作為參照,默認未收到限速信息;長線段曲線收到信號,但維持相同的駕駛策略;點線曲線基于性能指標的回歸方法更新了權(quán)重因子,同時彌補了由于限速導致的時間偏差。仿真結(jié)果表明,實線和點線總運行時間的偏差在30 s以內(nèi),基于性能指標回歸的神經(jīng)網(wǎng)絡(luò)算法可更好地達到節(jié)能、正時和平穩(wěn)的需求,且可以靈活地調(diào)整合適的權(quán)重因子來進行多策略的速度曲線規(guī)劃。
圖11 臨時限速下的神經(jīng)網(wǎng)絡(luò)規(guī)劃算法結(jié)果(速度-時間)
本文以數(shù)據(jù)驅(qū)動的方式實現(xiàn)了重載列車以節(jié)能、正時和平穩(wěn)為目標的速度曲線規(guī)劃,以列車動力學為基礎(chǔ)模型,轉(zhuǎn)化為標準二次規(guī)劃問題,并以數(shù)理回歸統(tǒng)計和神經(jīng)網(wǎng)絡(luò)的方式實現(xiàn)了權(quán)重選擇和高效靈活的多目標速度曲線,得到以下結(jié)論:
(1)優(yōu)化目標回歸模型的建立,使得基于QP的多目標優(yōu)化權(quán)重和速度曲線有了精確、可量化的關(guān)系,同時為基于神經(jīng)網(wǎng)絡(luò)的速度曲線規(guī)劃算法提供了決策因子的相關(guān)理論基礎(chǔ);
(2)神經(jīng)網(wǎng)絡(luò)規(guī)劃模型可以較好地學習QP規(guī)劃的策略,并在節(jié)能性、正時性和平穩(wěn)性上優(yōu)異于司機人工行車;
(3)神經(jīng)網(wǎng)絡(luò)規(guī)劃模型算法效率更高且穩(wěn)定,更適用于精細化建模,且融合的策略因子模塊使得模型針對突發(fā)情況具有更好的靈活性。